文章吧手机版
赤裸裸的统计学经典读后感10篇
日期:2018-07-27 05:01:02 来源:文章吧 阅读:

赤裸裸的统计学经典读后感10篇

  《赤裸裸的统计学》是一本由[美]查尔斯·韦兰著作中信出版社出版的平装图书,本书定价:CNY 42.00,页数:308,特精心网络整理的一些读者读后感希望大家能有帮助

  《赤裸裸的统计学》读后感(一):【笔记】用数据说谎容易,但是用数据说出真相却很难

  0p 安德烈斯:用数据说谎容易,但是用数据说出真相却很难。

  3p 无论什么问题,统计学都极少提供唯一“正确方法。但是,基尼系数确实以一种便捷易懂形式为我们提供了一个重要社会现象的一些宝贵信息

  8p 统计学的一个核心功能就是使用手中已有的数据进行合理推测,以回答我们还未掌握所有信息的“大”问题。简言之,我们能够使用“已知世界”的数据来对“未知世界”进行推断。

  8p 统计学存在意义就是简化,因此不可避免地会丢失一些内容细节,任何一个数字工作者对此都要心知肚明。过分依赖会带来误导性的结论或导致不良行为

  11p 概率就像是武器库里的一件武器,需要使用者有较强的判断力。当然,有时候判断和赚断的界限就是那么模糊

  15p 战争是为了与真实存在的敌人作战,而不是与假想敌作战(唐纳德·拉姆斯菲尔德)。学习的意义不是做题和炫耀,而是用来认清我们的生活

  23p 数据越多,事实越模糊。信息过量的表格其实相当于什么都没有告诉我们。因此,我们需要简化。

  59p 百分率不会说谎,但它们会夸大其辞。

  62p 虽然“你无法管理你无法衡量事物”,但你最好要保证你所衡量的,正是你努力想去管理的。

  62p 学生父母教育程度收入会对孩子成绩产生不可忽视的影响

  64p 提供有意义的信息与将这些信息浓缩成一个权威排名完全两码事。在某些时候,统计学的功能仅仅是让数据看上去更顺眼

  68p 利昂·波特斯坦:人们喜欢看到简单答案。什么是最好的?当然是第一名。

  111p 蒙提·霍尔悖论告诉我们,对概率的本能理解有时候会将我们引入歧途。

  117p 金融市场的潜在风险并不像抛硬币那么容易预测,VaR这样的模型所呈现出的“伪精准”会给投资者带来虚幻安全感

  117p 失准的速度表对司机来说比没有车速表更危险:对于失准的测速表的信任或“参考”会忽略其他提示车速的不安全信息;但如果车里压根儿就没有车速表,你反而会小心注意四周,寻找能够告诉你车辆前行使速度的参照物。

  134p 绝大多数的统计学书籍想当然地以为读者使用的都是好数据,就像每一本烹饪食谱都觉得你不会购买不新鲜的肉和腐烂的蔬菜一样。但是,如果基础数据本身就有问题,那么再缜密严谨分析也是徒劳。

  136p 从直觉出发。就像从一锅汤舀出一勺进行品尝,如果之前搅拌得充分均匀,那么这小小的一勺汤足以告诉你整锅汤的味道了。

  144p 发表偏见:无论在医学还是其他领域否定性的发现都显得单调乏味

  150p 如果把统计学比作侦探工作,那么数据就是线索。优质的数据就是好的线索,但首先我们必须熟悉到优质数据,而这要比看上去困难得多。

  218p 并不是那些“权力越大、责任也越大”的压力置你于死地,而是那种等着上司给你布置任务,但自己又没有权力决定怎么完成、何时完成这些任务的压力把人压垮了。换言之,高官们所承受的风险远远小于其秘书,因为这些助理对自己的工作任务“缺乏控制力”。

  218p 回归分析:在控制其他因素前提下,对某个具体变量与特定结果之间的关系进行量化。也就是说,我们能够在保持其他变量效果不变的情况下,将某个变量的效果分离出来。

  239p 样本越小,结果就越分散

  246p 不要用你的研究杀人。

  292p 每一样东西都有一个重要的功能,每一样东西都能让我们的生活变得美好,但每一样东西如果被滥用都会造成严重后果

  《赤裸裸的统计学》读后感(二):书中的一些例子都是驳斥朋友圈无脑必转和反智风潮的所谓专家帖子有力武器

  不错的统计学通俗读物,书中的一些例子都是驳斥朋友圈无脑必转和反智风潮的所谓专家帖子的有力武器。按章节摘录一些案例,以备朋友圈扫盲之用。

  【统计学是大数据时代炙手可热学问

  谷歌首席经济学家范里安在接受《纽约时报采访时曾说,在未来10年内统计学家将会成为“性感职业”。

  loc. 191-192

  盖洛普民意调查和研究机构认为,一个符合统计学方法、包含1000个家庭的样本能够代表整个美国的所有家庭,两者的调查结果基本能够保持一致

  loc. 236-238

  统计学基本上也是干这些事情凌乱无章的数据就像是犯罪现场,统计分析员就是警探,通过对原始数据进行分析和加工得到有意义的结论。

  loc. 297-299

  【描述统计学】

  lt;<<平均

  平均数必须对“异常值”有足够敏感性。

  loc. 440-440

  lt;<<中位数

  一些数量不多的打印机存在大量的质量问题。这些异常值抬高了质量问题的平均数,但没有对其中位数造成影响。从生产角度看,更为重要的一点是,公司无须更新或重组整个生产流程

  生产设备,唯一需要做的就是调查这批问题很多的劣质打印机,找出源头并予以解决

  loc. 464-467

  收入分配数据还可以分为“十分位数”,每组包含10%的数据。如果你的收入属于美国人均收入分配顶层的那10%,那么这意味着你要比90%的美国人挣得都多。

  loc. 471-472

  要评价美国“中间阶级”的经济状况,我们需要了解通货膨胀调整后的)工资中位数在过去几十年中的变化,他们还建议我留意一下处于第25百分位数和第75百分位数人群的工资变化,因

  为这两拨人通常被认为是中产阶级中的高收入和低收入人群。

  loc. 634-637

  lt;<<正态分布

  根据《华尔街日报》的报道,美国人甚至连在购物商场停车都呈现出正态分布,正对着商场入口的地方停车数量最多,也就是正态曲线的“峰值”,在入口左右两侧的停车数量逐渐变少,即

  曲线两端下滑的“尾巴

  loc. 541-542

  【统计数字会撒谎】

  如何评价一个行业是否健康,这一点量化起来似乎并不难,就看我们如何选择了,是选择以产出量还是就业率为衡量标准

  loc. 737-738

  世界各地人民的收入不均衡因为全球化的到来是改善了,还是恶化了?

  一种理解是,全球化只是加剧了现有的收入不均状况,1980年时的富裕国家(以人均国内生产总值为参考)在之后的20年间增长速度超过了贫困国家。富国会变得更富,这说明贸易、外包、外国投资以及其他全球化的组成部分沦为了发达国家扩大经济霸权的工具

  如果换一种分析单位,同样的数据也可以(也应该)以一种完全不同方式解读。我们不关心穷国,我们只关心穷人。恰巧世界上有绝对比例的穷人生活在中国和印度,这两个国家都是人口大国(人口数量均超过10亿),而且在1980年的时候这两个国家都处于相对贫穷发展阶段。但是,在过去的几十年时间里,中国和印度的经济都经历了高速发展,这在很大程度上要归功于它们与世界上其他国家日益加深的经济一体化。《经济学人》这样评价中国和印度:“它们都是‘迅速的全球化者’。”考虑到我们的目的是改善人类本身的穷困,因而在衡量全球化给全世界穷人带来的影响时,将中国(13亿人口)和毛里求斯(130万人口)当成是比重相同的两个国家来看待是不合理的。

  loc. 757-767

  统计学的一个重要角色就是描述数量随着时间推移发生的变化。

  loc. 881-881

  心脏医生肯定会在意他们的“记分卡”。但是对于一个外科医生来说,降低病人死亡率最简单的方法并不是降低病患死亡人数,因为大部分医生在救死扶伤方面已经竭尽全力了。降低死亡

  率最简单易行的方法是拒绝为那些病况最严重的病人动手术。罗彻斯特大学医学与牙医学院的一项调查表明,以服务病人为初衷的记分卡,到头来反而会给病人造成伤害:在参与调查的心脏

  科医生中,有83%的医生表示正是由于公开了死亡率数据,一些本来可以从搭桥手术中获益的病人最终没能被安排进行手术;79%的医生表示收集并公开死亡率数据或多或少地影响了他们的治

  疗决策。这一看似有用的描述性数据存在一个可悲矛盾,而心脏科医生也只能理性地接受并采取自己的对策,就是让那些最需要心脏搭桥的病人远离手术台

  loc. 979-986

  【概率与期望值

  头戴科技耀眼光环的DNA分析,归根结底仍然是一个概率问题。

  loc. 1279-1280

  通过概率的计算,我们还可以得到在所有管理决策的过程中,尤其是在金融领域是最实用的统计工具:期望值。

  loc. 1305-1306

  有时候,针对全美国人口监测如艾滋病这类罕见但严重的疾病是行不通的。假设我们对某种罕见病的检测拥有相当高的准确度,举例来说,每10万人中会有一个人患上某种疾病,检测准确率

  为99.9999%,可以保证在检测过程中不产生一例伪阴性(也就是从不漏过任何一个患上该病的人),但产生伪阳性(也就是一个没有患上该病的健康人被误测为阳性)的概率为万分之一。这

  样就会导致一个棘手的状况,虽然这种疾病的检测准确率非常之高,但绝大部分诊断为阳性(也就是患有该疾病)的人实际根本没有得此病。这会在那些诊断结果为阳性的人群中产生巨

  大恐慌后续的检测和治疗也会浪费有限医疗资源。 如果我们对美国所有成年人,即约1.75亿人口进行检测,决策树形图如图5-5所示。 图5-5 某疾病全美国筛查情况 只有1750位成年

  患有该疾病,他们的检测结果均为阳性。有超过1.74亿成年人未患病,在这部分健康人群中,有99.999%的人得到了正确的检测结果,只有0.01%的人被误检为阳性。但1.74亿的0.01%依然是一

  个非常大的数字,因此在实际操作中平均将会有1.75万健康的人被告知患有该疾病。

  这意味着什么?我们一起来分析一下。总共有19250人的检测结果为阳性,但真正患病的只有9%,而且这

  还是一个准确性非常高、伪阳性非常低的检测。我想不需要作太多解释,大家就能理解为什么在削减医疗开支的过程中,我们该做的不是对健康人群加强疾病筛查,而是减少这类检测。以艾

  滋病为例,公共健康官员总是建议将有限的资源用在“刀刃”上,即用在男同性恋者、采取静脉注射的吸毒分子等高危人群身上。

  loc. 1406-1420

  经营汽车产品及其他零售商品的加拿大轮胎公司有一位“爱好数学的首席执行官”J·P·马丁,他专门研究在面对商品时,哪些人更愿意掏钱消费,而哪些人倾向于转身离开。这是一个非常

  有趣课题,马丁对上一年使用加拿大轮胎联名信用卡消费的每一笔交易数据进行了数据分析,发现在综合考虑收入、信用纪录传统统计指标的基础上,观察消费者购买了什么商品能够准

  确地预测出他们接下来的消费行为。

  loc. 1457-1460

  【黑天鹅事件

  最大的风险从来就不是那些你能看得见、算得出的,而是那些你看不见从而无从估量的,那些看上去似乎远不在正常概率范围内、远远超出你的想象、你认为一辈子都不可能发生的风险,事

  实上,它们的确会发生,而且比你所能想到的要频繁得多。

  loc. 1599-1601

  人们对于随机性的直观感受与概率的相关定律之间存在着鸿沟

  loc. 1678-1678

  伊利诺伊州彩票广告词却深得我心:“总有人会中头彩,那个人有可能就是你。” 为了证明这一相同的论点,我还和我的学生进行过一个实验班级的人数越多,效果越好。我让班上所有

  人都拿出一枚硬币,并从座位上站起来,我们一起抛硬币,硬币正面朝上的学生必须坐下。假设我们一开始有100位学生,在第一次抛硬币结束之后,有大约50人坐下;然后我们开始第二次抛

  硬币,之后还剩下约25位学生站着;然后是第三次、第四次……通常最后总是会剩下一位学生在连续5次或6次得到硬币反面朝上的结果后,依然站在那里,我会在这个时候走到这位同学的身

  边问他“你是怎么做到的?”、“你平时都做些什么特殊训练,可以连续这么多次都做到反面朝上?”、“你是不是吃了什么特别的东西?”等,这些问题惹得全班同学哈哈大笑,因为他们

  目睹了整个过程,他们知道这位抛硬币得到6次都是反面结果的同学并没有什么特殊的技能,一切只是巧合。但如果脱离了这样一个环境,当我们目睹一些异常的事件发生时,我们总是会想:

  “没那么巧吧?背后肯定有什么原因。”但事情偏偏就是这么巧。

  loc. 1688-1697

  概率学告诉我们,跟在异常值—在某个方向上远离平均数的数据—之后的更有可能是那些接近(长期积累得出的)平均数的数据。

  loc. 1716-1717

  【数据与偏见】

  一般来说,我们会要求数据做3件事。第一,在评价某一大数据构成的人口特点时,我们可能会用到一个具有代表性的数据样本。比如,调查某个领导候选人的民意支持率,我们就需要对一组

  潜在的选民进行采访,而且他们应该能够代表所在选区的所有选民(必须明确的是,我们并不需要一个代表所有生活在该区域内的居民的样本,而是代表那些最有可能去投票的选民的样本)

  。统计学最强大的一点就在于,由一个在合理范围内足够大,并且正确抽取的样本推导出来的结论,能够准确地反映整个人口的特点,做到与对全体人口进行普查得到的结果分毫不差。

  loc. 1805-1810

  《纽约时报》曾发表了一篇关于抗抑郁药物药效发表性偏见的文章,第一句话就是:“抗抑郁药百忧解、帕罗西汀等产品的生产商故意不发表更多的药物试验结果,就是为了获得政府许可,

  误导医生和消费者对药物真实效果的看法。”那些证明这些药物对治疗抑郁症有效的研究中有94%都得到了发表,而发现这些药物无效的研究中只有14%被发表在相关刊物上。对于抑郁症患者

  来说,这样的发表性偏见确实会造成误导。如果将所有研究成果进行综合考虑,其实抗抑郁药造成误导的效果只比安慰剂(外观与抗抑郁药相同,给对照组服用,不含任何药物成分)略好。

  loc. 1963-1968

  下面就来说说,它们是如何在没有跑赢市场的情况下“跑赢市场”的。某家大型共同基金公司会同时开放许多只共同基金(有专家专门负责挑选股票,通常会有一个特定的关注点或策略),

  举个例子,假设一家共同基金公司开放了20只新基金,其中每只基金跑赢标准普尔500指数的概率都约为50%(这一假设与长期数据是吻合的)。现在,基础概率学告诉我们,该公司第一年只

  有10只新基金的表现能够打败标准普尔500指数,连续两年打败标准普尔500指数的基金为5只,连续3年打败标准普尔500指数的基金只剩下了2~3只。 最精彩的内容马上就要来了。届时,那

  些相比标准普尔500指数收益率不够理想的共同基金基本上都已经被悄无声息地关闭了(它们的剩余资产都被并入其他现有的基金中)。该公司接下来就可以大肆打广告,宣传这两三只“表现

  始终优于标准普尔500指数”的基金了,而实际上,它们在这3年的良好表现就相当于连续抛3次硬币都得到正面朝上的结果一样。它们接下来的表现很有可能会回归平均值,但此时投资者的钱

  已经被成功地骗进来了。真正能够在相当长一段时间里,对标准普尔500指数保持不败战绩的共同基金或投资专家少得可怜。

  loc. 2013-2023

  【中心极限理论】

  如果抽取的每一个样本与其所代表的群体确实存在相似关系,那么这个群体将总是与其样本保持一致性。(如果孩子与其父母长得很像,那么父母肯定也与孩子长得很像。)

  loc. 2093-2094

  有一个经验是,样本数量必须达到30,中心极限定理才能保证成立

  loc. 2167-2168

  【统计推断与假设检验】

  降低癌症发病率的生活习惯,如少吃红色肉类、定期锻炼、常做身体检查等(这就是前面章节里介绍的“健康用户偏见”)。到底是麸皮饼的功劳,还是因为这群爱吃麸皮饼的人恰好具备的

  其他行为或个人素质?分清楚“相关关系”和“因果关系”将有助于我们更好地理解统计结论。

  loc. 2422-2425

  我们在医学上有多种方法用于初期癌症的筛查,如乳腺图像(乳腺癌)、前列腺特异抗原测试(前列腺癌),甚至全身核磁共振扫描(看看身体哪个部位存在问题)。对于任何一位进行癌症

  筛查的人来说,零假设都是没有患上癌症。筛查的作用就是通过发现可疑结果,进而推翻零假设。按常理,Ⅰ型错误(身体没有任何问题的“假阳性”)总是要优于Ⅱ型错误(癌症没有被诊

  断出来的“假阴性”)。从历史上看,癌症筛查经常站在垃圾邮件过滤的对立面:医生和病人总是愿意容忍一定程度的Ⅰ型错误,而尽力避免出现Ⅱ型错误。最近,美国卫生政策专家开始挑

  战这一观点,这是因为Ⅰ型错误所导致的高费用和副作用。

  loc. 2550-2555

  【回归分析与线性关系】

  其实最危险的一类工作压力来自于对自己的工作任务“缺乏控制力”。

  loc.2855

  【致命的回归错误】

  解释GDP 增长时,在回归方程中加入失业率因素是不合适的,因为失业率很显然会受GDP 增长率的影响。或者换一个角度来看,通过回归分析,发现失业率的下降会促进GDP 的增长,这样的

  结论是可笑的、没有任何意义的,因为为了降低失业率,通常的做法是促进GDP 的增长。

  loc.3287-3289

  无论什么研究,在量化高尔夫球对健康的影响时都必须正确控制“年龄”变量,通常来说,年龄越大,打高尔夫球的时间和机会越多,尤其是在退休之后。在打高尔夫球这个课题上,任何没

  有将年龄作为解释变量的研究都不可避免地遗漏了一个事实,那就是打高尔夫球的人总体上比不打高尔夫球的人年长。因此,杀人的不是高尔夫球,而是衰老。

  loc.3294-3297

  《赤裸裸的统计学》读后感(三):书挺好,但翻译和排印的错误必须批评!

  既然已经有好几篇大作来评论这本《赤裸裸的统计学》了,本人就不再狗尾续貂了。然而关于这本书里翻译或排印的错误,非常有必要罗列在此,以供书友们借鉴。

  1.第100页:第二行的“99.9999%”应为99.999%;且图5-5最左端的“175亿美国成年人”应为1.75亿。

  2.第163页:图9-3上端的“n=100”应为n=20.

  3.第164页:倒数第二段之标准误差公式“SE=s√n"应为SE=s ⁄ √n 。

  4.第205页:倒数第三段末尾之“√(0.52×0.48/2000)=0.1”等式后边的结果错了一个数量级,应为=0.01.

  同样,下一段第二行“在新的0.1的标准误差的前提下”中的0.1也应该是0.01。

  5.第206页:倒数第二行“√(0.45×0.55/2000)=0.1112”结果应该是0.01112。

  作为一本统计分析的入门书,上述数字和细节错误非常要命。译者、责编以及出版社应当认真检讨!

  《赤裸裸的统计学》读后感(四):却在灯火阑珊处

  这是一本很适合我的统计学入门书本。研究生的专业是数据挖掘,常常要用到一些统计的知识,但是由于当时急功近利的不求甚解,只求知道怎么用,不想深究为何用,以至于在这个崇尚大数据的时代,让我不能长时间地深入地全面地忽悠他人。哎,黑发不知勤学早,信口方悔读书迟!

  买这本书是因为专业相关,而且封面很符合我的口味。翻开一读,就像打开了一个新世界的门。

  这个新世界首先很有趣。作者的行文风格属于生活轻幽默(突然想到的一个词)。近年来我已经很少被作家们逗笑了,不知道是见多识广还是麻木不仁,总觉得他们做作刻意。但是本书作者的文字风格确实很逗,常常让我忍俊不禁,也是让我不住读下去的动力所在。

  这个新世界也不难懂。实例丰富、简单,而且引人入胜,通过实例能够很好的理解统计学的概念,然后又通过更好的实例讲解公式原理。这种方法让我很受用,起码我现在很清楚标准差和标准误差之间的区别,当然还有前一段很困扰我的置信区间。甚至还让我解决了我写论文时候存在的一些疑惑(当然这些疑惑没有在论文中体现)。有一种忽如一夜春风来,千树万树梨花开的豁然开朗感觉。

  这个新世界也很广阔。我看这本书的同时,旁边放着一本统计学的专业书籍。每次看到统计学的只是概念,我感兴趣的,就去翻一翻专业书对应的章节,由于作者讲的简单易懂,勾起我的求知欲,让我意犹未尽,于是就要在专业书中把遗憾补回来,读完这本书,专业书竟然也看了不少,惊讶之余,暗暗得意,以后夸夸其谈有资本了。

  遇到这本书,是早就期盼而始终未得的,看完后莫名满足。众里寻他千百度,蓦然回首。

  《赤裸裸的统计学》读后感(五):你以为得并不是以为所得

  你以为得并不是以为所得 ——读《赤裸裸的统计学》有感 我们生活在一个充满数学的世界里,虽然我也和本书作者惠伦一样,不仅在数学上没有天赋也很不喜欢数学,但统计学对我来说不同,它是小池塘的荷叶,虽然与池塘有所联系,但总归是漂浮水面之上。我们从统计学中所得到的东西太多太多,好比经济学,它们总是可以在生活中给你启示,从脱氧核糖核酸检测到买彩票的白痴行为,从考试中的作弊到电视游戏节目中的获胜以及橄榄球比赛的胜负——这也是《少年谢尔顿》里很有意思的一幕。 《赤裸裸的统计学》就是一本以很生活化语言描述统计学的书,作者由事例入手,剖析其中所蕴含的统计学原理,随着章节深入,统计学的知识也渗透的越多,整体结构与《麦肯锡本色》相似,很有意思。即使是外行人看也很容易被吸引,整书看下来,更多的是明白统计学的奇妙之处,懂得一些事件发生的前因后果,说是入门书籍不为过了。不过作者为什么要说是“赤裸裸”的统计学呢,因为统计学也是一把双刃刀,即会给予我们奥秘之钥,也会带来许许多多的陷阱,那么,接下来就是见证统计的时刻! 比如我们最常见人均财富值,大多数人应该也明白,这是因为里面有一个异常值的存在,所谓平均数必须对“异常值”有足够的敏感性。十个人里只要有一个人拥有异常多的财富,那整体的财富均值也会被拉高,尽管原来并不高。我们普通人的光环会被各类巨富大鳄们的光环所掩盖,就像土壤和花朵,花朵总是出色的,虽然听起来很难过,但总要相信,我们也是为人均财富做了努力。不过当按照一定顺序排列后,均值就会有所改变,这就是统计的“赤裸裸”所在之一了。另外,就是一句话的两种说法,即衡量标准,惠伦以教育部对学生的考试为喻体,作了以下类比: “2013年有6成学校的考试成绩低于2012年” “2013年有8成学生的考试成绩高于2012年” 各自衡量标准都不一样,前者以学校为衡量,而每个学校的学生人数和优劣程度都不一样,后者以学生为类比,每年考生个数也不相同,如果一个成绩上升的学生来自一个大规模学校,那么大部分学生成绩在上升而大部分学校又在退步。不同的人看这两句话有不同的想法,媒体便是这样断章取义,告诉你他们想要你们知道的,尽管这样做有失偏颇,但却也不能完全责怪他们。就比如知名的震惊UC部门,虽然大家都在恶搞,但不得不承认他们这个手段很夺人眼球。 还有一个我很喜欢的例子,现代社会里我们都喜欢抽奖或买彩票,亦或是观看类似的节目,我也不例外。由于中过几次奖,我还真对这类事情抱有很大的期望,但是惠伦对这类事情有更多的分析。美国一个电视节目,让选手在三扇门里挑一扇门打开,当你选择其中一扇后,主持人会打开另一扇门(什么也没有),然后问你要不要更换选择来换取赢得大奖的机会。这个时候,只有更换才是明智的选择,奖品会有99%的概率藏在你没有选的那扇门后面,这个例子告诉我们,你对概率的本能理解有时候会把你引入歧途。另一个就是VaR模型,由于看过相关电影和资料,我也对席卷华尔街的灾难有所了解,华尔街灾难发生的凶手也有它的一份。当时很多公司都用这个模型来说明风险和利益大小,大家都不约而同忽视了小概率风险,但这些小概率风险一旦发生,那就势不可挡。正如纳西姆所言:“最大的风险从来就不是那些你能看得见,算得出的,而是那些你看不见从而无从估量的,那些看上去远不在正常概率范围内,远远超出你的想象,你认为一辈子都不可能发生的风险,事实上,它们的确会发生,而且比你所想到的要频繁得多”,比如你觉得闪电击中一个人的概率很小,但一旦击中你就无法逃脱,华尔街的“狼”们看到了眼前的肉块,却忽视了肉块下面的捕兽夹,他们混淆了“精确”和“准确”,测量虽然很精确,但却不是所要的,那不准确,他们忽视了“尾部风险”,就算再不可能出现的事也其实是有可能发生的,总有人会接二连三的中彩票,可能是你也可能是我。 再说说统计学被错误的使用,统计学本身具有数理性,但一些时候是我们使用者自己想当然了,想当然的认为事件之间不存在联系,觉得一个轮子出问题不会影响整辆车的运行,也想当然的认为超常发挥会继续——这就涉及另一个大家生活中常见的现象,回归正常水平。 概率学告诉我们,跟在异常值之后的更有可能是那些接近平均数的数据。以我来看,我曾经在四校联考的文综里以270的分数拿下第一,各科老师都在传述我的佳话,于是他们开始预算我下一次能考多少,可当我下一次考试考了230时,他们就会觉得我退步了太多,但其实230才是我的正常水平。惠伦说,学生的考试成绩基本是由个人的努力和运气所构成的,某次超常发挥其实是运气好了一点,当好运或厄运结束以后,随之而来的表现就会更加接近平均值。再说之前沸沸扬扬的超模奚梦瑶,大家说她自从进了娱乐圈后整个人的水准都下降了,那有没有可能是她在一次走秀的异常发挥让大家都觉得她水准类比驰名模特,但其实她的正常水平却和普通模特差不多? 还有排除法,之前在微博上看到过排除法的花样使用,遇到不知名的东西时网友总会说“我判定这肯定不是我/不是麻辣小龙虾/不是我家狗”,这些话好比废话,相关关系不等于因果关系,甚至可能都没有相关关系。以及说番茄摄入少会引发疾病,那每天一日三餐都吃番茄就会健康长寿吗,我不敢打包票,但我觉得起码99%的人不会,不过会有99%的人去相信,详情可以想想前几年的“绿豆贵如油”,我可没少喝绿豆汤。 看完全书,你会觉得统计学从小事里就可以发现,生活仿佛就是一片镂空的纸,怎么也挡不住统计学的渗入,你要是抓住了这片渗入,那恭喜你,你真的有可能是下一个诺贝尔经济学奖的获得者,比如迪弗洛,他研究了科特迪瓦的经济作物,从而分析了家庭伙食的改善。研究表明,在科特迪瓦的家庭中,当女性的收入提升时,她们会用手里的余钱来改善家庭伙食,这就是2010年的经济学奖。而去年的经济学奖也很熟悉——行为经济学——难道不是每个经济学者的入门吗,只是统计学结果告诉我们,虽然每个人概率相等,但总有人会通过一些努力提升可能性,也可能是那个家伙运气好,我运气差罢了。 现代社会充斥着大数据,动不动就是大数据分析,数字化分析,这就需要我们警惕“赤裸裸”的统计学。对于数据的收集,整理,总结,分析都要谨慎,否则很有可能会误导他人。对数字的运用的确很简单,但运用的恰如其分就需要智慧,需要我们去仔细思考了,从大方面来看,数据化越来越突出,联合化越来越重要,统计学仍然发挥着巨大的作用,我们也仍然需要把握统计学。统计学是一身带刺的铠甲,运用得当,可以抵御攻击,若是滥用,那就会伤害他人,造成严重后果。 所以“从现在开始,好好使用数据”,如惠伦所说。

  《赤裸裸的统计学》读后感(六):不就指望着自己能客观理性点儿吗

  今天路过农村合作银行,看见硕大的广告海报上写着:“2016年存款利率上浮40%”。

  我仔细看了一下,去年的活期存款利率是0.35%,今年是0.49%。相差了仅仅0.14个百分点。

  虽然“增加0.14%”和“上浮40%”都是正确的表达方法,但就广告效果而言孰优孰劣不言自明。

  上面这个例子和书中美国民主党和共和党对减税程度采用的不同说法的例子如出一辙。

  数据都是真实的,但却可以呈现完全不同的表象,使得人们在心理上产生截然相反的反映。

  其实本书的很多内容,都和我上学期上的“社会科学研究导论”这门课有重合之处。对于抽象的社会问题,如何将它们量化为可以比较的数字,寻找到行之有效的试验方法,并得到统计分析结果。

  但人们总是习惯直接吸收结果,也许越耸人听闻,越让人印象深刻。面对一个“打高尔夫球更容易患心脑血管疾病”的新闻标题你甚至不会仔细去看它的全文,哪怕这个结论显然有违常理,也很少有人去看看背后的逻辑链条。更有可能,你会劝说你正在学习高尔夫球的年迈老爸让他改学拳击(也许又有哪个错的离谱的实验会得出“拳击有利于中老年延年益寿”的结论也未可知)

  身处这个大千世界,谁都不想被别人牵着鼻子走,都想成为一个客观理性的人。可是在如此多的信息叙述者试图变着法儿说服你的当下,这似乎已经愈发艰难。

  如果说语言会不自觉的带上情感(就像“幼稚”和“纯真”虽然语义相近但却含不同褒贬色彩),那么冰冷几乎可以说是数字的特质,这也使得人们更愿意相信它,相信通过数字,可以更清楚的看清一个问题,起码是更理性客观的看待一个问题。 而正是这种想当然的相信使得你又掉入了另一个有统计学家或者数据分析师设计的精致陷阱,而你就像所有身处骗局中的人一样,你甚至不觉得自己被骗了。

  如今大家都在谈论大数据,甚至学校的老师都在说:“你要是只是想学个方便找工作的专业,那现在没有比大数据更热门的了”。

  因为数据采集能力的增强,大家又都想着做英明的决策,所以数据分析就理所当然的吃香起来。上到谷歌、亚马逊这样的互联网巨头,小到我妈记账用的手机APP都在使用分析数据。这就使得淘宝啦豆瓣啦知乎啦,总能给你推荐一些戳中你心窝的商品、文章、问答。但每次被他们猜中心思,我又傲娇的难过起来“哎呀他们知道的太多啦”。

  似乎又扯到用户隐私上来。

  扯远了,其实我想说的是:统计和数据就像所有的事物一样,并不是它本身客观理性,而是你看待它的方式才使得它客观理性。

  重要的不是数据,是看数据的你。

  《赤裸裸的统计学》读后感(七):猜猜购买本书的人学过“统计学”吗?

  其实,除了“纯文科”学生,现在几乎所有大学毕业生都应该学过统计学。理工科的教材是“概率与数理统计”,通常比统计学更抽象、更数学一些。而且我最近发现,好像美国中学生就要学一点统计学。所以,这类统计科普书注定会遭到鄙视,因为如果只看它们讲述的内容难度,我认为连教材的课后作业都做不出来。但其实它们还卖得很好,并且层出不穷。

  个人以为,理论联系实际的需要!

  至于本书,算是我看过比较朴实的,所谓深入浅出、寓教于乐,不怕姿势低的不能再低了。比这再低的,可能就是漫画系列统计学之类的,以日本人出的居多,但也很流行。

  不过,由于作者是美国人,很多精心准备的例子其实在我们这里并不接地气,甚至干扰理解。我没有看原著,主观上觉得翻译也不是很舒畅。所以从市场空间上说,我觉得还会有更多这个类型的书出现。和传统的科普不同,这类书的最大价值应该不是用通俗的解释试图诠释量子力学,它之所以存在而且让人乐此不彼的原因是,告诉你学过又还给老师的、或者学过但根本没学会的东西,其实很有趣很有用。

  《赤裸裸的统计学》读后感(八):能力越大,责任越大

  阅读本书,是为了更好掌握“大数据”基础。没想到,作者稍微提及下大数据的划时代好处后,就自顾自的讲起了统计学的使命。我则感觉被乞丐推销《如来神掌》,明明感觉没意义,却舍不得离开。别的不说,能把枯燥的知识讲的如此天花乱坠,作者好有一套!

  质量上,因为是中信出版社,天然有好感。不过书中涉及的公式因为印刷问题确实不太标准,好在都是浅知识,上学时基本都学过。而相比副标题的“数字之美”,我更相信是作者的“有趣语言”吸引我。

  对了,稍微介绍下作者:正常来说,你绝对猜不到他的年纪。语气上看,更是关注当下流行文化(古墓丽影等动作大片的场面描写恢弘异常),略自负(本书实际上向20世纪50年代的经典畅销书《统计数字会撒谎》致敬,作者也期望本书能经典50年)。我确信他能达到,因为作为科普入门类,本书优势实在太大了!

  对了,若不是作者说它1988年去了趟苏联,我还以为他刚三十而立呢~这个1966年生人的有趣的骗纸!

  ————————————————

  谈谈武器发展史:

  我相信目的动机论。每个人都渴望自身价值的体现,于是开始拼搏,进步,乃至夺去,独权。当然,这是战争产生的必然。而本书中,“统计学”就是作者手中武器,天方夜谭般的案例就是诱饵。外加循循善诱的劝导。可以预见,大片读者将沦陷在有趣的统计学里不能自拔。读过本书,我确信将来会用统计学让生活更舒适真实,你们也一样~

  那些有趣的故事:

  初中第一堂政治课,老师提问了3个谜题,并宣布毕业时公布答案。实际上,我早忘记谜面了。类似的,作者在书的开篇就提问许多有趣问题。你该买彩票么?为何商城比家人更早知道你怀孕?哪些人更容易成为恐怖分子?家里电视的多少会影响学习成绩?

  随即,作者标注了这些答案所在的章节,没错,想知道的话只能继续阅读。而当你被通篇公式折腾的发狂时,作者又俏皮来了句“假如你没冲动的把书扔到角落,或者又走过去把书捡回来。你会发现....”没错,我继续读下去了,也确实发现...

  会撒谎的统计学:

  作为一个能让大众明白的学科,统计学对外必须是简单且有说服力的。但影响统计学的因素很多,除了比较大众的说法,还有更多“小技巧”让发布规则的人更加获益。好在书中彻底说明这种骗局是如何瞒过我们的理智勾起欲望的,不过,面对诱惑,我猜自己会再次沦陷。这才是有趣的世界。

  当然,互联网让统计更加便捷外,有些古老的要素也需要被证实。譬如,连续观察药物对人类的持久影响,就需要常年统计特定人群的身体状况。此外,也有许多更高深的概念等我们掌握。但从“入门级”来看,本书的吸引力搓搓有余~

  《赤裸裸的统计学》读后感(九):小笔记

  用数据说谎很容易,用数据说出真相却很难。 1.不要想当然地认为事件之间不存在联系。 2.不要面对两个独立事件时一无所知。(打篮球不存在手感的) 3.很多事情可能就是这么巧(如成群病例的发生) 4.很多看起来很有规律的事情可能只是因为回归了平均数。(如登上知名杂志的球队因为已经达到了顶峰所以接下来的成绩会有所下降等) 以人作为研究对象时,相较于科学研究来说,很难设置对照组,所以“抽样”就成为了重中之重。要小心选择性偏见。 中心极限定理的核心要义:一个大型样本的正确抽样与其所代表的群体存在相似关系。 回归分析寻找的是两个变量之间的最佳拟合线性关系。任意一个回归系数,我们都要考虑:正负、大小和含义。 1.不要用回归方程式来分析非线性关系 2.相关关系不等于因果关系 3.不要因果倒置 4.高度相关的解释变量可能区分不开,可以创造新的综合变量 5.要注意适用范围 6.不要让无关变量过多

  《赤裸裸的统计学》读后感(十):「毕竟,没有人会因为证明某药不能治愈癌症而发财或出名的」

  前些天罗一笑病逝后,我在微博上看到了深圳市儿童医院发布了一个罗一笑医疗救治情况通报,其中一段话是这样的:

  「白血病的发病原因目前并不明确,有证据显示可能与过量的放射线、某些病毒感染和化学物质相关,但装修、饮食等因素能否导致白血病,目前并无定论,孩子个体自身的基因、免疫系统等异常也可能是其中的主要因素。」

  我觉得这段话可以理解为:罗一笑以及其他大多数小朋友为什么会得白血病,我们也不知道。

  以上是一家负责任的医疗机构的官方意见,但似乎人们不太会把“不知道”当回事。就像人类文明初期,对0这个数字的认知要比其他自然数晚一些。0也是数字,“不知道”也一样具有信息量。

  读过新闻专业、知晓传播学规律的媒体人知道“不知道”不会有什么点击率,于是他们又按套路故作姿态,装得什么都明白——给你讲解白血病的发病原因、治疗方法、吃什么不吃什么……

  吃瓜党则站在道德制高点上坚定认为罗一笑的病因就是住进了刚装修的房子。

  各种微信公众号,也是一如既往地没节操没底线,画风基本上就是这样的……

评价:中立好评差评
【已有2位读者发表了评论】

┃ 赤裸裸的统计学经典读后感10篇的相关文章

┃ 每日推荐