文章吧手机版
Hadoop实战的读后感10篇
日期:2022-05-13 16:13:11 来源:文章吧 阅读:

Hadoop实战的读后感10篇

  《Hadoop实战》是一本由Chuck Lam著作,人民邮电出版社出版的平装图书,本书定价:59.00元,页数:253,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。

  《Hadoop实战》读后感(一):datajoin包有坑

  ☺☻☺☻☺☻☺☻☺☻☺☻☺☻☺☻☺☻☺☻☺☻☺☻够长了吗?

  《Hadoop实战》读后感(二):Hadoop

  《Hadoop实战》读后感(三):满分100:内容70+翻译20 = 90分

  书中主要使用的是hadoop-0.19.1版本

  翻译有些地方还是差强人意,上下文理解起来有时费劲

  书中代码,不用说,在一个低版本上跑,包括自己搭环境,会是一个问题

  个人不太推荐此书作为入门hadoop学习

  整本书涉及的技术点可以说全部都是点到为止,不做深入,读完后,知道相关的技术点概念,实战性东西,靠自己摸索会效率很低

  唯一觉得此书有价值的地方是:第8和10章内容,介于此,读电子版足矣!

  貌似现在纸质的也还比较贵,所以真心不推荐

  《Hadoop实战》读后感(四):跟大象跳舞的入门书籍

  Hadoop的鼎鼎大名无人不知无人不晓,本书作为入门指导再合适不过,但阅读中文版本时总感觉不太通畅,有些专业术语转换成中文后就是有些别扭。

  通过示例来学习Hadopp绝对是最好的方法,但关键是“In Action”,也就是实战,否则看再多的书也没有意义。只有在被复杂的SQL和海量数据大虐特虐后才会明白Hadoop的好,此话不假。

  此书有一个亮点是介绍了如果构建基于AWS的Hadoop平台,可惜只简单提了一下EMS(Elastic Map Reduce),要是能有更详细的介绍就更完美了。

  Hadoop的周边生态越来越眼花缭乱,时刻牢记能满足业务的就是最好的,不要贪多贪大,与君共勉。

  《Hadoop实战》读后感(五):hadoop入门

  1 基本上把mapReduce的思想讲清楚了,hadoop更多是使用方面的。基本上看个前三章,就能对mapreduce和hadoop有基本的理解。

  2 它其实还没有严格来区分mapreduce和hadoop,根据我的理解。mapReduce是一种算法,一种思路。hadoop则实现了这种思路。为了应用这种思路,需要实现很多外围的功能,比如网络传输,任务分配等。这些内容hadoop都已经做好了,所以非常方面用它来实现自己的目的,只需要写自己的mapreduce的应用程序即可。

  3 mapreduce的精髓个人认为是,把数据分布存储,然后用分布的机器各自计算这些存储数据,最后再合并统计。这样就实现了用多台廉价机取代单台昂贵机的目的。

  4 hadoop目前不支持windows,只支持linux和unix,有条件的支持mac os。

  《Hadoop实战》读后感(六):上手还行

  这是一本不是傻瓜类型的上手书,个人一般称傻瓜型的为入门书。

  好吧,第一部分就是傻瓜部分,只要你把前三章看完,你就知道hadoop是什么,hadoop总体结构,hadoop的基本运行原理。至少知道了什么是map reduce, 之前听一个搞数据库的哥们说了两回也没有太清楚。

  第二部分没有细看,粗略翻了翻,看到了久违的Java很亲切,如果想上手搞搞的话,还是不错的行动指南。

  第三部分也很价值,介绍了一些相关的东西,AWS,Pig,Hive这三个是详细介绍的,其它的还有很多提及了,如HBase 、ZooKeeper 、Mahout,案例部分最有价值,能够看到如何来实现一个Hadoop的过程,一般技术书里面提及的比较少。

  所以,如果只要简单知道什么是Hadoop,推荐看看前三章。

  《Hadoop实战》读后感(七):好好攒模板就行啦

  本书和其他in action系列一样,不是官方文档事无巨细的解答,而是帮助你快速创建可用的代码,来解决实际中的问题。而对本书,前提是你要有还不错的Java功底。

  就入门上手这个角度,这本书比hadoop权威指南好太多。也有可能是权威指南太厚了,让人抓不住重点,或者讲了很多有的没的的东西,讲编程模型这个关键部分就显得不出众。总而言之就是,实用性不强。

  吐槽点:代码太老了,还不建议我们用新版api,醉了。

  假如你是初学者,好好理解下面这句话,就够了。

  大多数MapReduce程序的编写都可以简单地依赖于一个模板及其变种。当写一个新的MapReduce程序的时候,我们通常会采用现有的MapReduce程序,并将其修改为我们所希望的样子。(摘自本书4.2节)

  所以你的学习路线可能是这样的:看一些经典问题的源码,比如排序,连接;复制到你能随手可用的地方;看到新的问题,看看是哪个类型的,就把对应的源码捞出来改改。

  后记

  这本书拖拖拉拉地看了四年,倒不是书写的不好,或者书太难。而是新手基本上看看前6章就行了。来不及看后面几章,后面就没怎么写MapReduce了,就转向了Hive/Pig,然后转向Spark/PySpark。唏嘘不已。

  《Hadoop实战》读后感(八):Hadoop实战+超大集群调优_Hadoop集群调优课程

  Hadoop实战+超大集群调优

  课程使用到的软件:

  apache-maven-3.0.5-bin.tar.gz

  eclipse-jee-kepler-R-win32-x86_64

  hadoop-1.1.2.tar.gz

  hadoop-2.5.0-cdh5.2.0-src.tar.gz

  hadoop-2.5.0-cdh5.2.0.tar.gz

  hive-0.13.1-cdh5.2.0.tar.gz

  jdk-7u67-linux-x64.tar.gz

  jdk-7u79-linux-i586.gz

  ieTTY 0.3.26.exe

  rotobuf-2.5.0.tar.gz

  ecureCRT.zip

  VMWare10

  CentOS

  zookeeper-3.4.5-cdh5.2.0.tar.gz

  第一阶段:hadoop入门学习

  第00讲:课程概述

  第1讲:hadoop1入门-HDFS架构

  第2讲:hadoop1入门-HDFS副本存放策略

  第3讲:hadoop1入门-mapreduce架构

  第4讲:hadoop1入门-生产环境分布

  第5讲:hadoop1伪分布搭建(1)

  第6讲:hadoop1伪分布搭建(2)

  第7讲:Mapreduce1运行过程详解

  第三阶段:HDFS API开发和RPC框架介绍

  第19讲:hadoop2伪分布搭建和maven工程搭建

  第20讲:URL操作HDFS

  第21讲: FileSystem操作HDFS(1)

  第22讲:FileSystem操作HDFS(2)

  第23讲:HDFS使用伪装用户

  第24讲:获取HDFS集群信息

  第25讲:HDFS案例演示

  第26讲:RPC例子演示

  第27讲:Namenode源码导读

  第28讲:HDFS读写文件过程总结

  第四阶段:Mapreduce开发

  第29讲:MapReduce-键值对变化

  第30讲:Mapreduce-WordCount例子演示

  第31讲:MapReduce-Shuffle详解

  第32讲:MapReduce-TOOL优化

  第33讲:MapReduce-自定义计数器

  第34讲:MapReduce-Map数和Reduce数设置

  第35讲:MapReduce-最大值算法

  第36讲:MapReduce-combine使用

  第37讲:Mapreduce-TopN算法

  第38讲:Mapreduce-自定义数据类型(手机流量)

  第39讲:Mapreduce-自定义分区(1)

  第40讲:Mapreduce-自定义分区(2)

  第41讲:Mapreduce-二次排序

  第五阶段:超大集群调优

  第42讲:集群时间同步

  第43讲:句柄数设置

  第44讲:HDFS回收站配置

  第45讲:配额管理

  第46讲:Yarn资源配置

  第47讲:日志管理

  第48讲:本地库编译

  第49讲:压缩格式介绍

  第50讲:文件格式介绍

  第51讲:YARN调度器配置

  第52讲:Linux参数配置

  第53讲:HDFS参数配置

  第54讲:Mapreduce参数配置

  第55讲:hadoop3新功能介绍

  《Hadoop架构设计与源码分析第一季》

  2016年最新Hadoop零基础实战视频教程

评价:中立好评差评
【已有2位读者发表了评论】

┃ Hadoop实战的读后感10篇的相关文章

┃ 每日推荐