Designing Data-Intensive Applications读后感摘抄_经典精选

Designing Data-Intensive Applications读后感摘抄

　　《Designing Data-Intensive Applications》是一本由Martin Kleppmann著作，O'Reilly Media出版的Paperback图书，本书定价：USD 44.99，页数：614，特精心从网络上整理的一些读者的读后感，希望对大家能有帮助。

　　《Designing Data-Intensive Applications》精选点评：

　　●用思维导图把part II 中介绍的分布式系统中碰到的各种问题总结、提炼。（想了解一下Spark及Spark ML 里面涉及到的各种基本的ML算法原理，又看到这本讲分布式原理的书，感叹好多要学的啊。）

　　●对数据库及数据类应用有相当完整和全面的介绍，而且深入浅出，对一些自己以为已经理解的常见概念，其实还是有很多不充分的地方，收获很多知识，获益良多。对未来的数据架构很有启发。

　　●第二部分非常精彩。partition replication transaction consistency.讲的很清晰。第三部分streaming关于数据同步模型也讲的很透彻。

　　●全面、深入的大数据系统介绍，不但有how，还有why，建立技术全景。

　　●值得多看几遍，很多细节还是似懂非懂的。

　　●这几年读过最好的技术书了

　　●非常好的一本书，适合开发数据引擎的人看

　　●再读了一次，收获还是不少

　　●一本详实有趣的大数据入门书，能想象的到作者应该是个温柔善良的人

　　●结构很好的一本书。能把一些听起来玄乎的概念（特别是一些翻译成中文后，更加让人困惑的东西）讲得比较清楚，这大概和作者的日常知识积累是分不开的吧。

　　《Designing Data-Intensive Applications》读后感(一)：大数据神书，强烈安利

　　大数据领域的神书，每一次看都有所收获。

　　作者在high level 的层面上讨论了大数据框架工具面临的问题，在这个过程中的每一个讨论点都会举出某个工具是怎样的用的是什么方式。之前工作过程中也用到很多大数据工具，直到读了此书，才有了融会贯通的感觉，对所用的东西有了更深层次的理解。

　　ElasticSearch，MongoDB 中的 shard 和 Kafa 的 partition 其实是一个概念，只是叫法不同而已。

　　事务 2PC 2PL 这些原本难懂的概念，读了作者的例子恍然大明白。

　　《Designing Data-Intensive Applications》读后感(二)：开启优秀程序员职业生涯的书

　　为什么会起这个标题？我在吴军的 <硅谷来信> 中有闻工程师的几个级别. 感兴趣的朋友可以自己去翻来看看. 工作个一两年, 大部分码农都能达到调用API, 写RESTFul API, CRUD特别溜. 但是我经常停下来想, 这些就够了吗？这些就足以支撑一个优秀程序员所具备的素养了吗？直到我有一天在逛知乎, 看到一个亚马逊的程序员兼读书狂魔, 说这本书影响了他后面的职业生涯, 我果断下单开始阅读此书.

　　这是我看的第二本英文原版的技术书. 读第一章开始, 就感觉这个作者功力非同一般. 除了让读者能够很好的理解技术的原理和设计的权衡, 书中富含生动的例子又不让人感到啰嗦. 英语读下来感觉优美却不会晦涩难懂. 平时大部分的工作虽然枯燥, 但是每日定时读一读这本书, 就不觉得自己没有进步了.

　　我读过<高性能mysql>, 读完之后感觉知道了一堆细节, 但是我总感到不满, 因为我不知道这些调优背后的原理是什么, 我为什么要这么做. 让我硬是记住这些调优的细节, 我宁可不去记忆它. 如果能够让我知道它这样设计背后的考量, 以及整个数据库的发展历程, 走过了哪些弯路, 以至于今天使用了哪些技术的缘由, 这些才是我想看的!

　　而这本书就是这样的存在. 数据库的类型, 以及各个类型存在的意义, 数据库存储的设计从零到壹, 分布式数据库都会面临哪些细节上的问题, 以及每一个都如何妥协. 最有意义的是书中每个章节的Reference, 值得你再花时间看一遍, 挑选自己感兴趣的paper.

　　如果你想要更进一步, 开脱程序员的视野, 逐步走上优秀程序员的队列, 这本书将会是一个很好的引路人.

　　《Designing Data-Intensive Applications》读后感(三)：这算是我2018年读的最好的一本书了

　　以前看过一些分布式系统相关的资料，比如《分布系统原理---刘杰》，还有一些关于HDFS、MapReduce、Google 三大经典论文之类的，也去官方看过一些开源项目(Hadoop、Zookeeper)的官方文档，总觉得分布式是很高深的理论知识。看到这本书后，发现它真的是深入浅出，对分布式原理的讲解会配以一些具体的系统实现示例，比如讲Partitioning Secondary Indexes 时阐述了 by Document vs By term，又提到Elasticsearch用的是何种“第二索引”，看完这本书再去看一些分布式系统开源项目官方文档时，就有一些“知其所以然了”。

　　作者对分布系统的存储（第三章：Storage and Regrieval、第五章：Replication、第六章:Partitioning）、通信(第8章：The Trouble with Distributed Systems、第九章：Consistency and Consensus)、计算（第10-11章：Batch Processing、Stream Processing）这三大块的原理讲解循循善诱，读完一遍之后，有些地方我还不能太理解，值得再多读几次把各个点都串接起来；又有些地方，觉得作者“点到为止”（可能这也是有些大神觉得不够深入的地方吧），并在每章末尾抛出一系列参考文献链接，让读者自己去深入研究，更难能可贵的是书中表达的社会责任感，无论是前言扉页写的“This book is dedicated to everyone working toward the good” 抑或是最后一章：The Future of Data Systems，佩服作者的“技术正义感”。无限膜拜作者对各种开源的分布式系统“指点江山”中……小菜鸟我只能慢慢多啃几遍，能够从入门到有所进阶吧。

　　《Designing Data-Intensive Applications》读后感(四)：数据处理行业新晋从业人员必读

　　大概十一放假开始读这本书，中间经历了加班，双十一值班，自己病假，老婆生病请病假，娃生病请病假，断断续续到现在终于算是从头到尾看了一遍，实在是觉得不容易。

　　这本书的作者是少有的从工业界干到学术界的牛人，知识面广得惊人，也善于举一反三，知识之间互相关联，比如有个地方把读路径比作programming language的lazy evaluation而写路径比作eager evaluation，令人拍案。这一本数囊括了几乎所有数据处理相关工作中可能遇到了的内容，而且也有非常棒的实操经验。比如书的一开始，作者反复强调监控中分位数的作用，可以揭示一些被平均数掩盖的事实，我也正好有一个监控从都是监控平均值变成主要监控若干p99分位数的经历，看到这里，不由得掩卷叹息。

　　我做数据处理也就是不到三年，接触过不少相关的工具，可以说Hadoop啊，pig啊，Hive啊，Storm啊，你的确不去了解它们背后的原理理念也可以用，但是真正要整合它们，做一个容错，可扩展，可维护的数据产品，则需要相当的分布式和数据系统的insight。帮助你建立这样的insight的书，应该是比较缺乏的，你可以去刷分布式系统的课程，看paper，但是阅读一本one in all的书，ROI可能是最高的。之前也有人尝试过，比如有国人写的《大数据日知录》，其实写得也算不错，但是不知道是笔力不济还是什么缘故，最后也是沦为技术文档的罗列。

　　这本书循循善诱的写作手法应该是相当高超了，讲解得非常深入浅出，一般照着提出问题 -> 解决方案 -> 这个方案的长处短处 -> 发散到其它方案这个模式讲解，看起来可以说是不知不觉，非常轻松，也没有有些作者的拽文习惯，几乎全部是中学词汇，句子也不复杂，保证非英语母语的人可以流畅阅读，这点可以说是非常良心了。

　　作者在最后一小节还讨论了大数据的伦理问题，尽管现实世界中，金钱利益面前，可能无人理会这些事情，但是这些夫子自道，还是很体现作者情怀。我觉得这是升华整本书的地方。

　　本书references超级多，可能正文内容止于guide，老手可能觉得不过蜻蜓点水，那么看看每章后面的几百个ref，那里可以发现更广阔的世界。

　　《Designing Data-Intensive Applications》读后感(五)：数据密集型应用的设计与开发？这有幅藏宝图了解一下

　　“ 我曾经像你一样，都有过做数据库的梦“。某大龄程序员这么跟我说。但凡是程序员，谁没写过 CRUD 呢。一同事就这么戏称自己是“CRUD程序员”，语气中透露着无奈。

　　但细细想来，如今互联网的应用，最终给客户带来价值的，背后不都是数据的读写吗？

　　有传统的 RDBMS 如 Mysql，亦有 NoSql 的 MongoDB, ES，Redis 。

　　所以哪，互联网程序员逃不了三件事：产品经理，队友，还有数据库。

　　由此，程序员在数据库的修炼也要下点功夫，此书就是藏宝图。

　　打造 Reliable, Scalable, and Maintainable的应用并非易事，然系统的方法论可以助你一臂之力。

　　本书从数据模型入手，以此来警示那些手上有锤子（MySQL），就把所有问题都想成钉子的程序员。

　　关键还是要具体问题具体分析，虽说是老生常谈，但看作者娓娓道来，也是趣事。

　　谈完数据模型的上层建筑，就要看实现细节了。实现细节嘛，无非是读（快）写（慢）的取舍之道。在第三章作者讲了读数据的灵丹妙药：索引。索引就像是缓存，很多时候都会被当成万金油。然而用法不当，也会引火烧身。大家可要小心了！

　　谈及 Scalable，作者就开始数据库分布式之道了。比如备份，分区，事务和一致性，在分布式系统里，每一块都是危机四伏，且看作者如何用十八般武艺一一应对吧！

　　总的来说，十分推荐。适合经验未及架构师，又沉迷于做数据库的中二程序员。

　　以下是目录：

┃ Designing Data-Intensive Applications读后感摘抄的相关文章

┃ 每日推荐