Hadoop权威指南(中⽂第2版)PDF
基本信息
原书名: : The Definitive Guide,Second Editon
原出版社: O'Reilly Media
作者: (美)Tom White [作译者介绍]
译者: 周敏奇 钱卫宁 ⾦澈清 王晓玲
丛书名: 清华⼤学出版社O'Reilly系列
出版社:清华⼤学出版社
ISBN:9787302257585
上架时间:2011-7-4
出版⽇期:2011 年7⽉
开本:16开
页码:600
版次:2-1
内容介绍:
《Hadoop权威指南(第2版)》从Hadoop的缘起开始,由浅⼊深,结合理论和实践,全⽅位地介绍Hadoop这⼀⾼性能处理海量数据集的理想⼯具。全书共16章,3个附录,涉及的主题包括:haddoop简介;mapreduce简介;Hadoop分布式⽂件系统;Hadoop的i/o、mapreduce应⽤程序开发;mapreduce的⼯作机制;mapreduce的类型和格式;mapreduce的特性;如何构建Hadoop集,如何管理Hadoop;pig简介;hbase简介;hive简介;zookeeper简介;开源⼯具sqoop,最后还提供了丰富的案例分析。
《Hadoop权威指南(第2版)》是Hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运⾏Hadoop集。
google帝国的基⽯是什么?mapreduce算法!开源项⽬Hadoop作为它的⼀个具体实现,可以轻松⽤于构建和维护⼀个可靠性⾼、伸缩性强的分布式系统。
作者tomwhite作为Hadoop的项⽬负责⼈,通过⾃⼰对Hadoop和Hadoop社区的理解,化繁为简,⽤浅显易懂的语⾔介绍了Hadoop 能做什么,怎么做才能充分发挥Hadoop的优势,Hadoop能够和哪些开源⼯具结合使⽤。这是⼀本主题丰富、讲解透彻的权威参考书,可帮助程序员了解分析海量数据集的细枝末节,帮助管理员掌握搭建和运⾏Hadoop集的具体过程。
经过修订和更新的第2版概述了Hadoop的最新动态,例如hive、sqoop和avro等。书中还提供了案例分析来帮助读者了解如何⽤Hadoop来解决具体的问题。如果想充分利⽤数据,从中挖掘出有价值的见解或者观点,毫⽆疑问,这本书将是您不可或缺的重要参考。
使⽤Hadoop分布式⽂件系统(hdfs)来存储⼤型数据集,然后⽤mapreduce对这些数据集执⾏分布式计算
Hadoop的数据和i/o构建块(⽤⼦压缩、数据完整性、序列化和持久处理)
探究mapreducc应⽤开发中常见的陷阱和⾼级特性
设计,构建和管理门adoop专⽤集或在云上运⾏Hadoop
使⽤pig这种⾼级的查询语⾔来进⾏⼤规模数据处理
使⽤hive(Hadoop的数据仓库系统)来分析数据集
使⽤hbase(Hadoop的数据库)来处理结构化数据和半结构化数据
深⼊介绍zookeeper,⼀个⽤⼦构建分布式系统的协作类型⼯具箱
Hadoop权威指南(中⽂第2版)PDF版下载
⽤户名与密码都是
具体下载⽬录在 /2012年资料/7⽉/21⽇/Hadoop权威指南(中⽂第2版)PDF/
>hadoop分布式集搭建
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论