2020⼤数据领域⼗⼤必读书籍
相信⾝边有很多应届毕业⽣以及想转⾏⼤数据的,状态⼤多都是:万脸懵逼。
⽼司机教你:看书、写代码、多交流。
2020你看了⼏本书呢?⼩编为⼤家精⼼挑选了⼤数据领域⾥⼗本有价值的书,先⼲掉这⼏本书,再和⽼司机谈⼤数据!不过,像《⼤数据时代》、《数据之巅》等这些经典到“烂⼤街”的书我就不⼀⼀推荐了,很多⼈都看过,没看过的也都听说过。   
⼀、《Presto技术内幕》
Presto是Facebook开发的数据查询引擎,基于Java语⾔开发的,专门为⼤数据实时查询计算⽽设计和开发的产品,更是⼤数据实时查询计算产品的佼佼者,⽐Spark、Impala更加简单、⾼效。
《Presto技术内幕》由浅⼊深地详细介绍了Presto的安装过程、内部运⾏原理机制、功能特性、性能优化⽅法,以及在应⽤过程中常见的问题及解决⽅案等,可⽤于多种数据源混合进⾏实时⼤数据分析计算,使⼀些使⽤其他⼤数据技术不能解决的业务场景有了⼀个全新有效的解决⽅案。
在这⾥我还是要推荐下我⾃⼰建的⼤数据学习交流qq裙:522189307,⾥都是学⼤数据开发的,如果你正在学习⼤数据 ,⼩编欢迎你加⼊,⼤家都是软件开发党,不定期分享⼲货(只有⼤数据开发相关的),包括我⾃⼰整理的⼀份最新的⼤数据进阶资料和⾼级开发教程,欢迎进阶中和进想深⼊⼤数据的⼩伙伴。上述资料加可以领取
在最后的附录部分不仅对 Presto 使⽤过程中出现的各种问题给出了明确的解决⽅案,还对 Presto中的各个配置参数的含义和作⽤进⾏了详细的说明并给出了推荐配置值
作者: JD-Presto 研发团队 ,是京东众多研发团队中的⼀员,在开源软件领域获得多项⼤奖
适读⼈: Presto技术狂热者&攻城狮、对京东技术内幕好奇的⼩伙伴
亮点:
市⾯上第⼀本详细介绍Presto技术的书籍,可单点突破。
浓缩了京东在开源领域深耕多年的实战经验
京东CTO张晨、京东⾸席技术顾问翁志等技术⼤⽜重磅推荐
Presto 使⽤过程中的各种问题都给出明确的解决⽅案
对Presto中各个配置参数的含义和作⽤进⾏详细的说明并给推荐配置值
⼆、《为数据⽽⽣》
读完《为数据⽽⽣》,你会清楚的看到中国在⼤数据道路上所留下的轨迹,主要包括在智慧城市、科技、医疗、教育、商业、⾦融等领域的实践。书中分别阐述在⼤数据1.0、⼤数据2.0和⼤数据3.0时代下,相对应的数据分析需要做到分析、外化、集成:
分析,这⾥作者提供了⼀套基本的⼤数据分析框架:确定问题和指标, 清洗数据, 特征提取和选择, 模型训练, 模型融合。
外化,借助外部数据,将两个看起来毫不相⼲的事物通过数据挖掘建⽴联系。
集成,主要讲企业、政府如何收集数据、标准化数据,以及最后如何商业化。
未来中国的⼤数据发展提供⼀条清晰且可⾏性的路径指南!
简⾔之,看了这本书,不管是企业或者政府,都可以看到⼤数据⽐较清晰且可实现的⼀条路径。
作者:周涛,天才少年,电⼦科技⼤学最年轻教授,中国⼤数据领域的传奇⼈物,创办数之联、数联铭品、国信优易、DataCastle等20多家公司,公司总市值⾼达百亿。
适读⼈:⼤数据爱好者、政府⼈员及苦于转型中的企业管理者
亮点:
⼿把⼿教企业如何蜕变成⼀个真正的⼤数据企业
⼤数据3.0时代究竟要如何应对
为数不多的把实操、理论都讲明⽩的书
三、《智能时代》
《智能时代》回顾了科学研究发展的四个范式,⽤实例证明了数据在科学发现中的位置。这本书作者分七章从不同⾓度对⼤数据进⾏介绍,分别以技术和思维⽅式的改变为主线,从⼯业⾰命这个⾓度嵌⼊,顺理成章的延伸出⼤数据与智能化,但是没有将过多笔墨放在技术的深究上,⽽是选择从应⽤层⾯体现⼤数据的理念。⼤数据应⽤则会渗透到各⾏各业,这正是作者的⽤⼼之处。
作者:吴军,原腾讯副总裁。吴军博⼠是当前Google中⽇韩⽂搜索算法的主要设计者。除了《智能时代》,还著有《数学之美》、《浪潮之巅》和《⽂明之光》。
适读⼈:研究⼤数据应⽤的⼀线实践者、⼈⼯智能爱好者
亮点:
深⼊浅出,⽤吃⽠众都能看懂的语⾔讲⽣涩难懂的⼤数据和⼈⼯智能
逻辑性强,你能想到问题,作者都备好了答案
雷军、罗振宇、涂⼦沛、李善友、邬贺铨院⼠联袂推荐
四、《R语⾔预测实战》
R语⾔横跨了⾦融、⽣物、医学、互联⽹等多个领域,主要⽤于统计、建模及可视化。由于上⼿快、效率⾼,备受技术⼈员青睐。预测是⼤数据挖掘的主要作⽤之⼀,借助R语⾔来做⼤数据预测,可以兼具效率与价值于⼀⾝。
《R语⾔预测实战》主要分为预测基础、预测算法、预测案例三⼤部分。从⼊门级的阐述逐渐过度到深⼊分析,抽丝剥茧般的讲明⽩了⽤R 语⾔预测的诸多问题。
作者:游皓麟,知名⾼级数据分析师
适读⼈:R语⾔数据分析师、R语⾔研究⼤数据预测的⼊门者
亮点:
市⾯上为数不多的系统讲解R语⾔预测专题的书籍
可以get到做R语⾔预测时的基本步骤和⽅法思路,还有更多技术细节
五、《医疗⾰命》
在医学⼤数据时代,数据技术带来了临床医学科研的⾰命性进步。《医疗⾰命》通过对医疗数据挖掘的基本理论的阐述,将现代统计学与数据挖掘技术有机结合,讲述了⼤量的医学数据挖掘的案例,提供了⼤量的医学数据挖掘的实操⽅法。本书以数据挖掘与模式识别的七⼤原理在临床医学中的运⽤案例为切⼊点,系统⽽全⾯地介绍了医学数据挖掘的基本⽅法与原理,对数据分析的常⽤算法进⾏了通俗易懂的讲解。
作者:邵学杰,中国医学⼤数据概念提出的实践者与先⾏者,医学数据挖掘的先⾏者
适读⼈:医疗数据挖掘爱好者、临床研究者、 医疗⼤数据初学者
亮点:
将统计学与医学深度结合,⾸次提出医学数据模式识别的七⼤原理
实操技术与案例分析相结合,起到很好的技术⽰范作⽤数据库学习入门书籍
六、《⼤数据处理之道》
市⾯上流⾏的⼤数据处理技术已经有数⼗种了,从最初的Hadoop到Spark,再到Storm,到底哪个战⽃⼒更强?《⼤数据处理之道》分析⽐较了当下流⾏的⼤数据处理技术的优劣及适⽤场景,包括Hadoop、Spark、Storm、Dremel、Drill等,详细分析了各种技术的应⽤场景和优缺点;同时阐述了⼤数据下的⽇志分析系统,重点讲解了ELK⽇志处理⽅案;最后分析了⼤数据处理技术的发展趋势,重点从各种技术的起源、设计思想、架构等⽅⾯阐述⼤数据处理之道。
在⽇志分析⽅案遍地开花的⼤数据时代,这本书能够帮助你更理性的做出决策。
作者:何⾦池, IBM⾼级软件⼯程师,熟悉⼤数据领域内的各项热门技术,具有多年的⼀线软件研发测试经验
适读⼈:软件开发、⼤数据测试⼈员
亮点:
全。⼏乎涵盖所有的⼤数据处理热门技术
易懂。语⾔诙谐,⼤数据处理技术与应⽤场景并在,初学者好上⼿,专业⼈⼠可系统的扩展知识
预测。对未来新的⼤数据处理技术发展趋势进⾏了预测
七、《⼤数据基础与应⽤》
数据本⾝没有丝毫意义,通过统计、分类、萃取、特征抽取等⼀系列技术⼿段才能实现其价值。⼤数据技术是实践性⽐较强的技术,需要重视⼯具和应⽤⽅法的选择与研究。《⼤数据基础与应⽤》作为⼤数据技术⼊门的参考书,为⼩⽩读者提供了⼀次系统学习⼤数据理论知识的机会。
作者:陈明,中国计算机学会理事、中国⼈⼯智能学会理事。
适读⼈:⼤数据技术⼩⽩
亮点:
基础≠不重要,⼤数据初级必须要掌握的理论知识都在这⾥
各章独⽴阐述,读者可根据⾃⼰的需求,有侧重的加强学习
⼋、《超越⼤数据》
把社交数据、移动数据、位置数据与主数据结合起来, 可以实现与现有客户建⽴更加密切的关系、采⽤合适的产品, 改进寻的定位新客户的⽅法、更加深⼊地了解客户的想法以及对产品的看法等,⽽《超越⼤数据》将教你如何通过社交主数据管理深⼊了解客户。
作者:马丁·奥博欧佛,企业信息架构领域,⾯向全球⼤客户的执⾏架构师
适读⼈:企业决策者、⼤数据架构师
亮点:颠覆了传统的业务数据处理

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。