《精通Python网络爬虫:核心技术、框架与项目实战》是一本由韦玮著作,机械工业出版社出版的平装图书,本书定价:69,页数:2017-3,文章吧小编精心整理的一些读者的读后感,希望对大家能有帮助。
《精通Python网络爬虫:核心技术、框架与项目实战》读后感(一):爬虫机器学习专家的沥血之作
这本书比其它同类书籍好在哪里,我总结一下吧,给其他朋友一点参考:
1,全书用python3.x编写,python3比2好在什么地方我就不说了,大家只要看趋势就对了;
2,系统化。学一个东西要是东学一下西学一下是非常不利的,网络上有非常多的零散教程,有些也写得不错,但不能构建完整的知识系统。本书从爬虫入门到框架到反爬到项目实战,可以给到大家一个爬虫工程师的完整知识系统;
3,适合小白和爬虫简单入门的你。为什么这么说呢?适合的才是最好的。爬虫包含的学习系统太广了,从网页到数据库,从单机到分布式,如果想成为高手,那需要对里面的每个知识点都要精通。你一个小白直接给你讲分布式队列你看得懂么?适合的才是最好的;
4,面向实战。本书不是一个纯粹的爬虫教授写得,而是一个具有多年项目开发和实战经验的爬虫机器学习专家写的,作者同时也是51CTO特聘专家,国家专利发明人,韬云教育的大Boss,看完本书后可以直接去面试的。
有些朋友认为本书没有requests,没有pyspider等就觉得本书不好,我只能说hehe了。requests和pyspider就是2个好轮子,只学几个好轮子是成不了优秀虫师的。条条大道通罗马,既然大家都可以到达罗马,又何必非得走一样的路。
《精通Python网络爬虫:核心技术、框架与项目实战》读后感(二):关于本书的质量、部分读者质疑、黑社会有关的几点说明
大家好,我是《精通Python网络爬虫》的图书作者,非常感谢大家对此书的关注。
首先说明一点,我本人很少混豆瓣,偶然间看到豆瓣上居然有这么多人关注本书,观点都比较偏于两极,想想还是统一回复一下大家吧,希望能让大家可以有更客观、更清晰的了解,由于不常混于此,所以回复晚了,抱歉。
本书的定位是Python网络爬虫入门到进阶(其实在书籍的介绍中已经明确地介绍过)。
本书的优势在于:知识点较系统、全书结合项目实战。
本书的不足点在于:出版时间有限,暂时缺乏selenium、phantomJS、分布式爬虫等知识点,但是这些知识点已经通过博文的形式补充。众所周知,书籍的出版时间周期会比较长,而网络爬虫又是变化快之又快的一门技术,所以,我尽可能做到的就是,尽量书中的知识点是通过实际例子,介绍解决问题的技巧与套路,即我更希望的是授之以渔,而非授之以鱼,对于一些其他知识点如果变化太快,我能做到的就是通过博文的形式对书籍的内容进行补充,并且现在已经在这么做了,如下所示,是一些已经写好的关于补充知识点的博文,大家有需要可以看看:
(1)、腾讯动漫爬虫与动态随机加载反爬破解技术实战(主要补充了PhantomJS、Selenium处理动态随机加载反爬问题的知识)
(2)、Fiddler死活抓不了HTTPS包解决办法
(3)、Python网络爬虫反爬破解策略实战
如果大家还有其他希望补充的知识点,直接反馈给我的助理或者邮箱即可,我会定期筛选进行补充的。
以下是对一些相关评论的回复,好评就暂时不回了,总之一句话,感谢。在此回复一些确定不是马甲的真实读者的质疑:
染洛凉:买了这本电子书,理论知识太多,没啥用,实例不够多。学编程侧重的应该就是实践。理论没什么用。不建议大家阅读。作者回复染洛凉同学:这位读者的建议还是比较中肯,但估计您是在看前几章的内容,没有看到后面。是这样:1、书的1-3章全是理论,后面的4-20章全是实战。这本书的重点还是实践,但是在实践之前,需要先了解理论知识,这已经是把理论部分进行最小化的压缩为3章内容了,如果你已经了解,跳过阅读即可,但是还是建议要阅读完的,耐心些嘛。2、建议不要买电子书,建议买纸质的正版,原因慢慢分析。首先,对于读者来说,电子书的排版体验非常不好(因为跟纸质书不是一个排版体系的),并且电子书都是不支持退换的,因为对于平台方来说,他不知道你买了以后阅读了还是没有阅读,所以电子版行情是不支持退换,这便造成了对读者的不友好,而纸质书很多平台都是支持7天无理由退换的,萝卜青菜,各有所爱,不喜欢风格的话,直接退即可。另外,这本书已经重印4次了,还算比较畅销,这里主要想说的是,每次重印都会修订一部分勘误,而电子书中的勘误,是不会更改的,因为平台方不会允许,所以电子书中仍然是大量勘误,而纸质书中的勘误会逐渐减少,所以对于读者来说,纸质书会比电子书好很多,而价格,只差20块钱而已。另外对于作为作者的我来说,你买电子书我是不会有收益的(至少现在一分钱没收到,估计电子书平台方拿得比较多),买纸质书,买一本我还可以有几块钱的收益,当然我也不靠这个养家糊口,我本身是做企业的,重心一直都在企业上,要是靠写书养家糊口,估计我会被饿死的,但是本着对知识尊重的态度,我自然还是希望你买纸质书,有回报就是开心啊,人之常情。
令狐葱:买了这本书随便翻了一下,发现真的是东拼西凑,写的都是一些浮于表面的东西,实在没什么干货可言,于是上豆瓣看了一下评论,韩某某的评论可以说还算客观: 不过豆瓣上还有杨福川老师的解释贴,所以看了之后谁对谁错还真让人困惑了。杨老师一直是让我尊敬的出版人,可以说选书质...作者回复令狐葱:这本书不适合随便翻翻,需要跟着里面的步骤一步一步做来下才会有收获,否则没用的。因为里面的知识点引导性设计得比较强,也就是上一章的内容很多时候你会产生一些问题,这些问题,你会在下一章找到解决答案,所以只有你是跟着做下来的,才会有这个感受,随便翻翻没用的。
所以,如果你确定已经购买了此书,那么请以初学者的角度来再细心地看一下本书(不添加任何感情色彩的),因为这本书就是写给初学者的,如果是高手,一般直接看文档,真的不用看这种书。至于你后面写的水军、刷评论、作者名字情况等问题,将在本篇的后续部分回复。总之,我不知道你的目的是什么,但是看评论比较带有个人感情色彩的,实事求是的反馈我会进行改进的,但如果你本来就对我有意见,显然评论这些没有任何意思,但我想说的是:很多时候,你所看到的,并不是事件的真相,比如你以为我们刷评论了,可是事实上并没有,后续会说到,多辩证地看问题,会更好。
韩某某: 很入门的书 基本没什么用 第一章夸夸其谈 谈到的各种算法 各种类型的爬虫 后面几张章都么有体现 整本书内容就是属于API调包党 很难实现复杂需求 根据作者时常拿出51cto等一些网络培训的截图 基本断定是搞培训赚钱的 好像还培训PHP spark之类的 楼下评论两个五个星的无头像账号初步断定五毛党之类刷分用 买这样的书简直浪...ps:大家可能都看过这篇评论,其实最值得注意的是,这篇评论是在书籍还没有正式上市的时候出现的,经其他学员反馈与作者委托律师取证后发现,其实韩某某是作者的学员,真名叫韩健,并且韩某某确实在学习了作者的课程之后,在刚毕业后成功跳槽到了一家公司做数据分析师的工作,他一直以来潜伏在学员群,时不时搞点小破坏,现在已经被管理清退了,至于韩某某的人品怎么样,在此不进行任何评价,仁者见仁智者见智,至于其技术怎样,包装手段怎样,我想至少还是挺有手段的。作者在当时接到学员的反馈后,就及时地联系了他,以下是部分聊天记录截图:
《精通Python网络爬虫:核心技术、框架与项目实战》读后感(三):关于本书定位、书名和读者质疑的几点说明
尊敬的各位读者和朋友们,我是本书的策划编辑,没想到本书在京东、当当等上架最及时的网络渠道还没有开始销售,就有这么多读者朋友关注这本书,有些意外,在此感谢大家。
我仔细看了一下大家在评论中关心的问题,我在这里做一个统一回复和说明,希望能解答大家的疑惑。
1.读者定位
最初我们和作者策划这本书时,针对的目标受众是初学者,他们有一定的Python语言基础,但是完全不懂网络爬虫。
根据我的经验,初学者对内容有2点要求:
第一,全面且系统,要求基础内容比较全面,知识体系要系统,对内容深度的要求不高。深度的内容,一方面读者短时间难以掌握,一方面会增加书的篇幅,不利于读者学习和出版社操作。
第二,具有一定的实战性,只讲基础理论,不讲实战肯定不行,所以必须要有实战案例,但是由于目标读者水平可能暂时有限,所以案例不能太复杂,主要是授之以渔。
2.关于书名
首先我必须承认,本书的书名确实取得不恰当。从现有的内容来看,读者如果很好地学完本书,从零到完全掌握Python网络爬虫的基础知识和技术是没问题,至于这是否算精通,大家的理解肯定是各不相同。这也是为什么大家抱怨书名与内容不符的主要原因吧。
这个书名是我定的,与作者韦玮老师无关。当初我们定的书名是《Python网络爬虫实战》,但是由于有另外一本书抢在我们之前用了这个名字,我们被迫要换书名。技术类图书的名字,越平实越好,现在的副书名《核心技术、框架与项目实战》其实是最能概括本书内容的,但是这个副书名太长,读者不容记住,所以我们就加了一个主书名《精通Python网络爬虫》。
我个人的考虑不妥,因为书名给大家带来了误解,在这里向大家道歉。
在这里我再次申明,如果您有较好的Python网络爬虫基础,这本书可看可不看。
3.关于本书和网络上的视频教学
图书和视频是两种不同的学习载体和模式,不同的读者偏好不同,为了便于大家学习,所以在本书写作完成以后,我就帮作者联络了几家优秀的做在线教育的公司为以本书内容为蓝本,策划一套教学视频,以便于出版后,让读者朋友们能有更多的选择。
我看到有读者因为这个问题而抱怨,不知道我这个解释是否能解答大家的疑惑。
4.内容的边界
有读者朋友抱怨,本书对框架的原理、爬虫策略、爬虫算法等内容没有涉猎或深度不够,这个评价非常中肯,实事求是。之所以在这些内容方面比较弱,是因为不符合我们面向初学者的读者定位,如果这些都写进这本书里,本书的篇幅很大,而且导致定位模糊,初学者认为这些内容对他们来说暂时没有用,有基础的读者又认为那些基础的内容没有用。
所以,我们为这本书设定了内容边界,这本书只讲必须的基础的内容。
5.关于作者韦玮和“韩某某”的争吵
豆瓣上有一位昵称为“韩某某”的朋友,据我们考证,他是韦玮老师视频教学的学员之一,所以能比较早地知道这本书即将上市的消息。“本书对框架的原理、爬虫策略、爬虫算法等内容没有涉猎或深度不够”就是这位朋友提出的,在此表示感谢。只不过,言辞有些激烈。不过“韩某某”兄现在还很年轻,这样也很正常,我们非常理解。不过,我在这里要澄清一点,韩某某在发这条评论时,网络书店都没有上架,不知道韩某某是通过哪个渠道买到的这本书。欢迎这位兄弟向广大网友出示购书的证据。
据韩某某和作者私下沟通,刚好在此时,发生了一件事情,韩某某的手机接到一些陌生的骚扰电话,韩某某自然地联想到可能是作者或作者的朋友打来的。在这里,我以个人的名誉保证,这绝不是韦玮老师做的,应该只是一个巧合。我和韦玮老师都奉行一个原则:无论读者提出什么意见和批评,我们都表示感谢。其实,这个问题很好解决,接电话问问不就清楚了。
因为受到了骚扰电话,韩某某兄弟对韦玮老师说,打算换号了,但是这个号码里可能还有200元的话费,他提出要韦玮老师帮他支付这200元的话费,韦玮老师拒绝了,于是有了后面的韩某某兄弟找了“dhcn”、“banana537”、“gray”三个马甲来继续攻击,我们查了这三个账号的注册时间和IP,可以确认这是韩某某兄弟的化身。原本,这种做法是比较恶劣的,我们应该与韩某某兄弟进一步交流,但是由于考虑到这位兄弟还年轻,不想与之计较;再者,考虑到时间的关系,我们也不打算深究,事情到这里就算了,毕竟我们每个人的时间都很宝贵。
欢迎所有读过本书的朋友继续为我们提供宝贵的意见,尤其是批评的意见,这对我们来说很重要,感谢大家帮助我们进步。
《精通Python网络爬虫:核心技术、框架与项目实战》读后感(四):代码不坑读者的书就是一本好书
因为对未来大数据的发展感兴趣,我选择了往这条路走。