《噪声》是一本由[以色列] 丹尼尔·卡尼曼 / [法] 奥利维耶·西博尼 / [著作,浙江教育出版社出版的精装图书,本书定价:139.90元,页数:556,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。
《噪声》读后感(一):十年磨一剑(含福利预告)
10年前 尚在读初中 正逢简中版《思考,快与慢》畅销全国 当时手机都没得 还是在实体书店偶然买到的 大学时代开始用豆瓣和已成为过去式的“晒书房” 给它补打了三星 印象就是鸡汤 没用 理论⋯⋯
前几天回顾了下 竟发现有8.1分 尽管评论区不少吐槽某社的翻译质量 但多少提高了一点对其的印象 因为虚高与否不难看出 再加上缘分延续 让我接解到了这部讲判断缺陷新作 乱七八糟的事儿不少 只能匆匆翻了翻刚收到的无ISBN预读版 值!
那么 我对本书价值的判断从何而来呢?下结论之前是否受到噪声影响呢??前者可参考鄙人“《小王子》版本”相关日记 后者的答案则是肯定的 我所理解的噪声便是影响个人判断的部分或者几乎可以说是消极因素
《噪声》读后感(二):丹尼尔卡尼曼,行为经济学鼻祖,没有之一,因为阿莫斯特沃斯基已故
保罗霍夫曼于1960年创办了俄勒冈研究所,致力于研究“行为科学基础研究中心”,这个研究所就是行为经济学前身。埃德华兹教授也是这个研究生成员之一,他是第一个将贝叶斯规则导入心理学的人,此后再无建树。但是他的一名学生从此载入了行为经济学史册,他叫阿莫斯特沃斯基!
特沃斯基在这个领域里叱咤风云,因为他特别有才也特别能说,有一次在物理学研讨会上他把著名的物理学家忽悠的找不着北,事后别人打听特沃斯基是哪个物理学领域的,人家跟说他只是个心理学家。再后来特沃斯基认识了丹尼尔卡尼曼,那个时候卡尼曼还不是研究这块领域的,他主要研究人眼瞳孔。再后来这两个人就开挂了,行为经济学领域似乎只有他们二人。卡尼曼性格内向,缺乏运动细胞,曾经被同学们嘲笑是“行走的僵尸”,而特沃斯基完全相反,思维敏捷口若悬河,而且特别灵活,一度被人认为有“多动症”。
最更牛逼的事情还在后面,今天他们还在大学上课,第二天就拿起AK47去战场打仗了,据说这在以色列是常态,卡尼曼曾是突击小分队排长,阿莫斯则是步兵指挥官,曾获得以色列最高勇士勋章!打完仗二人继续回来做研究。他们几乎每天形影不离,一起吃饭一起散步一起“睡觉”。当年理查德泰勒是个名不见金钻的小混混,还险些丢了工作,误打误撞后认识了特沃斯基和卡尼曼,泰勒一心想要参合一脚,终于功夫不负有心人,特沃斯基和卡尼曼接受了他,一起研究学术。之后泰勒开创了行为经济学,将自己和他们二人的学术成果正式引入这个领域,泰勒自己在这个领域内也颇有建树,凭借心理账户和禀赋效应拿到了诺贝尔奖,之后终于一雪前耻,不仅拿到了芝加哥大学终身教职,还与芝大头牌大明星尤金法玛平起平坐。泰勒坦言特沃斯基和卡尼曼对他一生的影响是最大的,而且他俩的前景理论是神一样的存在!
特沃斯基和卡尼曼好基友的感情也不是一帆风顺的,此前很长一段时间内整个行业内几乎没人过问丹尼尔卡尼曼,因为所有光环几乎全部套在了阿莫斯特沃斯基一个人身上,这令卡尼曼一度陷入抑郁,后来他们两个都想去哈佛任教,但哈佛明确只能提供一个名额给特沃斯基。普林斯顿大学倒可以提供两个名额,但特沃斯基看不上,一心想去哈佛。后来二人分道扬镳,几乎就不再联系了。卡尼曼心灰意冷,决定自己一个人做研究。特沃斯基失去卡尼曼之后才发现,他再也没有灵感了,回想当年一起走过的岁月,卡尼曼的创意更多,而特沃斯基则负责优化改进,由于对外做宣传演讲的几乎都是特沃斯基,因此卡尼曼的功劳完全被掩盖了,在哈佛独自一人的特沃斯基毫无建树。过了很久很久,卡尼曼突然接到了特沃斯基的电话,这一次是个悲剧,特沃斯基说自己得了恶性黑色素瘤,卡尼曼是第二个知道此消息的人。听到这一切,卡尼曼终于释怀了,彻底摒弃前嫌了,1996年怀着无比悲痛的心情参加了特沃斯基的葬礼,向他一生的挚友道别。
否极泰来,2002年10月9日,在经过一个焦灼的等待之后,卡尼曼接到了一个来自瑞典皇家科学院的电话,他终于被封神了,历史上第一个心理学家拿到诺贝尔经济学奖!卡尼曼在领奖时说,这个荣誉应该是他和阿莫斯特沃斯基两人共同分享。
丹尼尔卡尼曼有四本著作,其中两本是科普读物:《思考快与慢》、《噪声》
另外两本是专业学术论文集:《不确定状况下的判断》、《选择、价值与决策》
只想看结论的可以看前面两本,想知道他们是如何做研究的,可以参考后面两本书。
在认知心理学、进化心理学领域,除了卡尼曼等人,还有一个不得不提的名字:基思斯坦诺维奇!《思考快与慢》中卡尼曼使用的“系统一,系统二”也是借鉴了斯坦诺维奇的“三重心智”。
《噪声》读后感(三):个人投资者如何避免市场噪音
编者按:在颠覆我们对人类决策机制的理解,刷新我们对金钱观念的认知方面,也许没有人能够超过以色列裔美国心理学家丹尼尔·卡尼曼,他的上一本行为经济学著作《思考,快与慢》,让许多人对人类决策过程中的非理性因素醍醐灌顶,并且颠覆了对人类理性的迷信。 《巴伦周刊》中文版主编何刚通过Zoom采访了《噪声》的两位作者丹尼尔·卡尼曼和奥利维耶·西博尼,跟他们探讨了为什么噪声如此重要,它跟偏差有什么不同,以及为什么群体决议反而可能会增加决策中的噪声,如何才能降低决策中的噪声。 何刚:我是来自《财经》杂志和《巴伦周刊》中文版的何刚。几个月前,我们的美国同事采访了您,讨论了《噪声》这本书,现在,它的中文版即将在中国出版,我很高兴继续与您讨论这本书。这是一本非常重要的书,在您出版了著名畅销书《思考,快与慢》之后,为什么会开始关注噪声?噪声对我们决策来说有多重要? 丹尼尔·卡尼曼:是的,我认为我们绝对应该从定义我们所说的“偏差”和“噪声”来开始这次对话。 最简单的方法是从测量的角度来思考,因为我们认为判断也是一种测量,使用的仪器就是人类的大脑。当你在测量某样东西时,例如,用一把很好的直尺来测量一条直线的长度,你会发现两种误差,其中一种误差是偏差(bias),也就是误差的平均值。 如果你在测量一条直线时,没有任何偏差,也就是说平均而言,你的测量是完全正确的,但即使在完全没有偏差的情况下也仍然存在一种误差,因为你所做的每一个测量都与其他的测量略有不同,有一半时间你在正确的长度之上,有一半时间你在正确的长度之下,这种变异性就是噪声(noise)。 偏差是误差的平均值。在我的整个职业生涯中,我一直致力于研究心理偏差,也就是导致人们测量结果过高或者过低的系统性判断误差。有各种各样的原因会导致人们犯下可以预测的系统性误差,比如过度自信、乐观主义、悲观主义和锚定效应等等,这些就是我研究了50年的东西。 几年前我注意到,事实上,几乎没有人关注另一种类型的误差,也就是判断的变异性,而事实证明,判断的变异性也很大。当不同的法官看待同一个被告,或者不同的承保人看待同样的风险时,他们得出的判断也大不相同,这就是噪声,噪声无处不在。 每个人都知道当被告被宣判时,不同的法官会有不同的判决,但是促使我们写这本书的原因并不是法官的判决会有所不同,因为这是人尽皆知的事情,而是法官在判断上的分歧比人们预期的要多得多。在一些研究中,实际结果大约是人们预期的五倍,这是一个很大的数字,也是我们写这本书的原因。 何刚:谢谢卡尼曼教授,我想问问西博尼教授,对于像我这种没有统计学背景的读者来说,我们如何理解偏见和噪声的区别?为什么噪声如此重要? 奥利维耶·西博尼:首先,噪声并非更加重要,它只是和偏差一样重要。正如丹尼尔所说,我们之所以关注这个问题,是因为偏差已经得到了很多关注,而噪声却没有得到任何关注。所以我们试图重新解读这种不平衡。我们并不是说噪声比偏差更重要,我们想说的是,它跟偏差同样重要,但却没有受到太多关注。 接下来,如果你对统计学一无所知,这里有一个例子可以让丹尼尔所描述的情况生动起来。假设早上你踩着浴室磅秤称体重,根据你的经验,你知道,一般来说你的浴室磅秤对你来说有点太大方了,它告诉你的重量比你实际的重量轻了一磅。所以你已经习惯了你的磅秤减少一磅,你知道平均来说,加上一磅才是真实重量。这就是偏差,这是你的浴室秤的平均误差。 如果你在同一个早晨快速连续两次或三次踩上你的体重秤,你会发现读数并不完全一模一样。这种无法解释的变化不是平均误差,平均误差是你所知道减少的那一磅,这就是噪声,它会出现在每一次测量中。 发生在你浴室磅秤上的事情也会发生在我们的判断中,平均误差是偏差,在这种情况下如果还存在着随机误差或瞬态误差,那就是噪声。 何刚:人们可能会说,这是由于人类的局限性,科技和人工智能能够帮助减少我们的偏差和噪声的影响吗? 丹尼尔·卡尼曼:帮助减少噪声的基本原理是纪律,而纪律可以通过不同的方式来产生。 纪律意味着你在做判断或决定时要遵守规则。当你决定是否录取一个学生进入大学时,你要考虑学生的平均成绩,这就是接受了一个纪律规则,它比人们只是跟随他们的主观判断或者印象要减少一些噪声。 在许多领域,更复杂的规则来自人工智能或算法,规则为判断问题和作出决策提供了答案,规则的一个最大优点就是它们没有噪声。如果我向同一个算法提出两次同样的问题,我会得到相同的答案。如果我在不同的场合问同一个人同样的问题,他们可能会给出不同的答案,人类是会受到噪声影响的,而规则不受噪声干扰。 在某些情况下通过用算法代替判断,在另一些情况下通过对判断加强纪律性,用更有组织、更加系统的方式作出判断,我们就可以减少噪声。 何刚:这本书提出了一些试图减少或消除噪声的方法,但在艺术中运用这样的方法是非常困难的,比如像《尤利西斯》这样的小说,您是否同意至少在某些领域,噪声也是有益的? 奥利维耶·西博尼:如果我们以艺术为例,我们不会建议减少艺术中的噪声,因为它不是噪声。我们将噪声定义为人类判断中那些不必要的变化,这里的关键词是“不必要”。我们希望艺术判断具有多样性,我们想要审美判断的变异性,我们希望你们的品位、政治观点以及各种各样的变化都是好的,都是可取的。 我们不希望变异性存在的时候是当你踏上你的浴室磅秤时,你有一个真实的体重,你希望你的浴室磅秤尽可能接近真实的重量。同样,如果你在做预测或者判断时,你希望尽可能接近结果的真实价值。比如如果你正在决定一个候选人是否适合一份工作,你希望尽可能接近这个候选人是否适合你正在招聘职位的正确判断。 我们定义噪声的前提是不需要,在这种情况下,噪声一律是不好的,因为我们想要一致性,我们想尽可能接近我们认为正确的答案。而在生命中的其他事物中,减少变异性是可怕的,实际上,我们并不把这种变异性称之为噪声。 何刚:卡尼曼教授,你在这本书中提到一种非常有趣的现象,也就是所谓的“群体极化”现象,这意味着一个群体在彼此交流之后会变得更加极端,我们如何解决这样的问题?是否应该减少交流以避免更多的噪声? 丹尼尔·卡尼曼:噪声和偏差之间有一个非常重要的区别:当你用尺测量一条线,或者用秤测量你的体重时,你在对多次测量结果进行平均之后,测量结果比单次测量结果的噪声要小。 举个例子,如果我在测量仪器上取了四次平均值,然后我在测量仪器上又取了四次平均值,这两个平均值之间的差值,将会小于任何两个测量值之间的平均差值,正如我们所解释的。 在这里有个非常重要的前提是,测量或者判断是相互独立的。在许多组织中,不同的人来为组织做出判断或决策,比如有许多承保人在评估公司的风险,每一个人都代表着组织。在这种情况下,你绝对不希望有噪声,因为组织希望用一个声音来说话。显然,汇总判断是减少噪声的好方法。 在现在的实践中,我们汇总判断的大多数场合都是在开会讨论的时候,但是召开会议的方式有好有坏,好的方法能够减少噪声,坏的方法则不会减少噪声。主持能够减少噪声会议的更好方法是让每个人提前做出判断,将这些判断汇总起来,然后再开始讨论,让人们重新做出判断,这样得出的平均值将比最初的噪声要小。 会议的通常运作方式是:第一个发言的人会有很大的影响力,说话最大声的人会有很大的影响力,说话最自信的人会有很大的影响力。这意味着你无法获得团队所有成员的意见,因为有些团队成员不会用他们自己的声音说话,他们会受到别人的影响。 你提到的群体极化现象是另一个让事情变得更糟的问题。当群体拥有一个特定立场,如果人们最终能够达成一致,他们往往会倾向于同意一个更加极端的版本。 例如,在西方,我们有陪审团在某些情况下设定损害赔偿或判决。我们发现,如果所有陪审团成员预期评估损害赔偿额大约为平均10000美元,当他们进行讨论时,他们将会评估15000美元的损害赔偿。这个群体的答案往往比最初的平均值更极端,这就是极化现象,它增加了噪声。它通常不会比个体更能够减少噪声,而是会增加噪声,甚至比经过讨论后人们的平均意见增加更多,比你按照正确方式开会情况下要多得多。 何刚:非常有趣。您提到了会议的例子,我们都知道“头脑风暴”这种会议形式,这是否意味着这种做法的无效?西博尼教授,您对这个问题有什么看法? 奥利维耶·西博尼:头脑风暴的问题实际上不是判断力的问题,因为它是一种试图创造多样性的意见和分歧的努力。这个问题与我们正在讨论的噪声问题稍有不同,但我想它们有一些共同点,事实上,也有一些关于让头脑风暴有效方法的研究,主要提出了以下几点建议: 首先,要让人们独立地形成自己的观点,尽可能独立产生自己的想法,因为人们独立思考的时候会比一起思考的时候更有效率,尽管这是违反直觉的,但实际上已经得到了充分的证明;第二,让参会者聚集在一起,讨论建立在彼此独立思考之上的想法,这是头脑风暴的常见部分;第三,拥有一个良好的过程来选择你想要的想法,在你真正产生许多想法之前,不要这样做。 丹尼尔·卡尼曼:我想补充一点。组织中排名最低的人应该首先发言的观点,适用于那些旨在做出判断的会议。这是一个普遍性的规律,它会让群体判断更加接近于独立判断,因为最不重要的人发言不太可能影响下一个人的判断。 如果从最重要的人开始发言,你就得不到太多具有多样性的意见,这实际上会让判断的噪声更大。当群体的判断缺乏多样性时,不同的群体可能根据首先发言者的意见而得出不同的结论,这是一种群体制造噪声的方式。 何刚:让我们深入追问一下辩论与噪声的关系。例如,在美国的总统大选中,辩论非常受欢迎,但在中国,辩论却非常有限。那么,辩论到底是能增加噪声还是减少噪声呢? 奥利维耶·西博尼:这取决于你如何进行辩论。如果辩论是由组织中权威人士发起的,而且人们互相影响,你就会增加噪声,因为群体会在权威人士最初表达的观点上变得更加极端和两极化。 这就是你在社交网络上看到的事情,当人们呆在一个关系紧密、思维方式与他们相似的群体中时,他们的观点就会变得更加极端,他们变得更加两极化,因为他们在团体内部相互加强。 而在一场运作良好的辩论中,你所看到的是人们带着不同的观点来到辩论现场,交换意见,希望能得出一些更为微妙的观点。在社交媒体上,这种辩论要少得多,而在真实的、相互尊重的人之间的对话中,这种辩论更为频繁。 这就是在陪审团中应该发生什么的理想状态。我们从本书描述的实验中可以知道,在一场运行良好的辩论中,我们可以利用这场辩论来减少噪声,而不是放大噪声,虽然这种事并不总是会发生。 何刚:你们都提到了独立判断的重要性,这也许是减少噪声的关键方式。在互联网时代,互联网上有太多的声音和噪声,人们应该如何保持独立思考? 丹尼尔·卡尼曼:首先,我想区分社交媒体上存在的各种对话和我们所说的噪声。我们真正谈及噪声的时候是当不同的人代表组织说话时,我们希望他们用一个声音说话,他们能够彼此同意。当多个人参与决策或者做出判断时,你希望他们彼此独立。我们并不是说独立是人们的一般特征。我们讨论的是对同一个问题的独立判断。 例如,当你在测量噪声的时候,我们称之为“噪声审查”,你会针对各种各样的评判提出同样的问题,然后告诉他们,‘不要相互交谈,直到你对问题有了自己的答案。这也是我们希望的开会方式,判断必须是独立的。我们并不是说人们应该彼此依赖或独立,我们所说的依赖性和独立性是在针对特定问题进行判断之上。 何刚:西博尼教授,这本书中提到有三种类型的噪声,水平噪声,模式噪声和情境噪声,在我们的现实生活中,如何区分这三种不同类型的噪声? 奥利维耶·西博尼:用举例来说明最简单。我们在书中使用的例子是法院里的法官。假设有两个法官,A法官和 B法官,A法官通常比B法官更严厉,B法官是那种当你被分配给他时,你的律师会说,‘哦,我们很幸运我们碰上了B法官’的法官,而A法官是那种你的律师会说,‘哦,我的上帝。真倒霉”的法官。平均来说,A法官更严厉,他作出判决的平均严重程度高于B法官,这就是我们所说的水平噪声。 第二种噪声是情境噪声。我们之前也简要提到过,A法官和B法官都不是恒定不变的,他们跟自己也不一致,他们对环境很敏感。比如,A法官下午会比上午更严厉,或者B法官心情不好时会更严厉,因为他最喜欢的足球队输了比赛。这就是我们所说的情境噪声。每个法官在不同的时候都不完全相同。事实上,他们对那些本不重要的情境特点很敏感。 还有第三种噪声模式噪声,这是最大、最不容易直观理解的,但却最重要的一种噪声。当A法官和B法官审视同一个案件时,他们实际上看到的不是同一件事情。他们透过自己的视角来看每一个案件,他们对每个案例都有自己的看法。 即使A法官平均比B法官更严厉,但也许在某个特定案件中,他会比B法官判决更轻一些,因为他在这个案件中看到的不同于B法官在这个案件中所看到的。每个人都有自己的历史、偏见和偏好,而这些偏好和偏好之间的差异将会在他们的判断模式上产生差异,这就是我们所说的模式噪声。 基本上来说,水平噪声是人们平均的不同,情境噪声是指人们在不同的情境下自己跟自己的不同,而模式噪声是指人们在偏好,或者他们对于什么重要什么不重要排名上的不同。这三者加在一起产生了很多变异性,我们统一称之为噪声或系统噪声。 何刚:西博尼教授,如果我们把这三种噪声应用到投资市场中,那么它们对于投资者来说分别意味着什么? 奥利维耶·西博尼:以这三种噪声为例。例如,如果你总是认为某项投资是好的,或者你总是非常厌恶某类风险,认为某项投资永远是坏的,这就是“水平噪声”,随着时间的推移,你会学会调整自己。 情境噪声则是这样一个事实: 有时候你心情好,一切看起来都像是一个好机会,有时候你心情不好,一切看起来都像是一个愚蠢的想法。限制这种影响的一个好方法就是放慢脚步,在两三个不同的时间点来观察同一个投资机会。如果你仍然认为你在上周看到的投资机会是一个好的投资,那么它就更有机会成为一笔好的投资,反之亦然。 第三种是最难控制的噪声,这就是模式噪声,因为你的判断力——让你接受或者对一项投资敏感的特殊吸引力——正是带来问题的东西。我们的建议是,不妨试着思考一下,除了你之外,其他人对你所看到投资目标的平均判断会是怎样。 先把个人投资者放在一边,假设你是一家专业投资公司的专业投资者。你会期望所有这些专业投资者遵循相同的方法,使用相同的工具,相同的指标,相同的原则,相同的数据,对每个案例都会得出相当接近的判断。 根据我们所做的调查,我们知道事实并非如此。但作为投资者,我们可以尝试减少这种变异性。其中一种方法是问问自己:“我知道我对这家公司的看法,那么我的同事会怎么看这家公司?” 何刚:按照这种方式,我们是否应该只关注指数投资和ETF基金,而不是选择一家特定的公司? 奥利维耶·西博尼:我没有资格提供投资建议,但是如果你问我如何投资我的钱,那正是我所做的,我投资于ETF基金,但我不是在给出投资建议。 何刚:卡尼曼教授的意见是什么,个人投资者如何避免市场的噪声? 丹尼尔·卡尼曼:毫无疑问,当个人做出个人决定时,他们制造的大部分噪声来自于他们认为自己拥有、但事实上却并不拥有的信息。行为经济学家之所以推荐指数基金或ETF基金,有很多原因,但并不是你在上下文中看到的主要原因。 如果人们在判断中引入纪律,就会减少噪声,改善结果。我们不提供投资建议,但如果你问任何行为经济学家,通常的建议都是遵守规则,不要试图做太多具体决定,因为你不会做得很好。 何刚:我们知道降低噪声意味着成本,如何评估降低噪声的成本? 丹尼尔·卡尼曼:我们倾向于通过我们所说的“噪声审查”来评估噪声的大小。噪声审查就是你向多个专业人士做出同样类型的判断,例如,评估投资或者评估风险,或者对不同案件做出判断。为了测量偏差,你通常需要知道正确的答案,而只是为了测量噪声,你不需要正确答案,这是一个非常有用的特性。 噪声审查仅仅能够测量判断的变异性,测量噪声的成本则是一个单独的问题,对此我们没有太多的经验,但是如果真的测量的话,你可能会发现代价高昂。 奥利维耶·西博尼:噪声的代价几乎肯定比你想象的要大,因为噪声比你想象的要多得多。噪声的代价往往被低估,在一个组织中,噪声总是被低估的原因是,组织在隐藏问题方面做得很好,因为这有点令人尴尬,所以他们对问题视而不见。当你发现你所信任的人做出的判断实际上是完全不同的,这有点恼人,当你意识到这一点时,你会显得有点傻。 为了避免这种尴尬,组织会进化出各种各样的防御手段,让他们避免痛苦地意识到自己正在被噪声困扰。例如,他们会按照我们所描述的那种方式开会,也就是说,最高层的人首先发言,然后每个人都倾向于同意最高层的意见,因此我们从来没有真正暴露我们之间的分歧。 因为我们用这种方式来隐藏噪声,我们几乎总是低估它的广泛性,而且我们几乎总是低估它的代价。当你问它的成本有多高时,我们显然无法给你一个数字,但我们可以告诉你,通过运行一个噪声审查,你可能会发现它代价高昂。 何刚:最后一个问题来自《巴伦周刊》的中国读者,他认为许多现代社会的问题来自极端主义,在未来信息仍然是支离破碎的,它会让更多人走向极端,这会让未来更加令人悲观吗? 丹尼尔·卡尼曼:这是一个非常普遍的问题。很明显,任何增加情绪在判断和决策中的作用的事情都可能降低理性在判断和决策中的作用,并导致糟糕的决策。我们能够看到,在某些领域情绪的作用在不断放大,这可能不是一件好事。
《噪声》读后感(四):万维钢解读《噪声》
第一讲:精确理解你的判断
决策卫生(decision hygiene):人在做判断的时候需要有一个卫生的流程。如果你胡乱考虑各种信息、没有套路、稀里糊涂说不清、凭直觉做了决策,就是不讲卫生。
思维要想变得锋利,首先就得把各种概念精确化。
判断(judge):大脑对事物的测量,并且必须形成一个客观结论。
判断的关键特点是要客观。对电影的评分是非常主观的,但是对电影的票房的预测,这是一道判断题。判断跟喜好无关,判断在理论上是可以验证的。
判断不是寻常的观点,而是不带个人立场 的、客观的结论,应该建立在事实和逻辑之上的。
判断的目标不是为了打动人,不是为了表明立场,不是为了说服人,而是为了接近事实真相,避免错误。
1.预测性判断(predictive judgement):说的完全是客观事实,理论上是可以检测的。
2.评价性判断(evaluatiive judgement):带有一些主观成分,跟评判者的价值观有关系。
评价性判断必须是建立在预测性判断的基础之上。应该现有预测性判断,再做评价性判断。如果次序颠倒,就是胡乱决策。这个不能变来变去,应该当做一个客观的限制条件。
如果大家的判断差别非常大,就是有噪声问题。
错误(error)=偏差(bias)+噪声(noise)
偏差是系统性的错误,是一致的行为。
噪声这是判断的分散,是互相之间的不一致。
以射击论,偏差是枪有问题,总往一个方向偏;噪声是打枪的人手不稳,有时候往左偏有时候往右偏。
对错误来说,偏差和招生的贡献是一样大的。
均方误差(MSE)=偏差^2+噪声^2
减少噪声和减少偏差一样,都能减少整个错误。
减少噪声,哪怕结果都是偏的,也比及时偏的又有噪声好一倍。哪怕你不知道偏差有多大,也应该减少噪声。
第二讲:三类偏差
偏差不是毫无规律的错误,而是“可预测的非理性”,是大脑中的思维定势。
我们把一个效应叫偏差,是因为很多人会在这里犯同样的错误,比如:光环效应。大家都喜欢漂亮的包装和漂亮的人,偏差有个一致的方向。
对判断力最重要的偏差分为三大类:
1.替代偏差(substituion):也叫判断启发式,为了回答一个比较难的问题,我们选择了一个简单的问题来替代,并且把这个简单问题的答案,当做那个难题的答案。以偏概全就是一种替代偏差。
2.结论偏差(conclusion biases):先有结论,再去寻找能证明这个结论的证据,确认偏误就是一种结论偏差,是一种预先的判断,是拒绝思考。结论偏差里的结论往往是情感决定的,爱屋及乌也是一种结论偏差,这也是公司一定要维护品牌良好形象的原因。锚定效应、先发影响力也都是结论偏差。
3.过度的连贯性(excessive coherence):接受信息的先后顺序能影响判断,陌生人的第一印象无比重要。光环效应就是一个过度的连贯性偏差,这个效应在招聘中的危害很大。
这三类偏差都是因为我们处理信息的方式有问题:
替代偏差是给了某些容易获得的信息过高的权重,给自己不了解的信息过低的权重。
结论偏差是只采纳自己喜欢的信息,忽略或者扭曲了自己不喜欢的信息。
过度的一致性是让判断受到接受信息持续的影响,放大了初始印象。
所有人面对同样的局面,都会有同样的倾向,被上述偏差往同一个方向引导,偏差的结果是系统性的,所以心理学是一门科学。
如何避免偏差:
1.事后纠正
2.事前影响,也就是助推(nudge)
但是这些方法的作用也是有限的,消除偏差的根本办法,是了解偏差。
决策是一门科学,决策者不仅要学习所在领域的专业知识,更要学习有关决策的知识。
第三讲:稳定发挥出来的波动决策
1.水平噪声(level noise):不同判断者的“人”的区别。这跟每个人的背景、生活经历、政治观点、对世界的偏见都有关系。对于整个系统来说,这些都是噪声。
2.模式噪声(pattern noise):水平噪声之外的系统噪声,都称之为模式噪声。
系统噪声^2=水平噪声^2+模式噪声^2
(1)稳定模式噪声(stable pattern noise)
(2)偶然噪声(occasion noise)
模式噪声^2=稳定模式噪声^2+偶然噪声^2
有部分偶然噪声是可以用客观因素解释的,比如:心情、天气等等。
但更多的偶然噪声是无法解释的,人的行为有个内在的偶然机制,大脑都无法控制,就像每次投篮动作都不可能完全一致。
偶然噪声都是临时发生的,是自己跟自己的争论。消除偶然噪声的最简单办法就是自己过一段时间再做一次判断,然后自己跟自己取一个平均值。
以上三种噪声来源,稳定模式噪声总是其中贡献最大的一项,是最重要的噪声来源。
稳定模式噪声是判断者跟事物之间的相互作用,是代表一个人立体的、全面的、独一无二的思维习惯。
如果想影响一个人的判断,要问他在什么情况下宽松,什么情况下严格,而不是问他是宽松还是严格。一个人的表现,跟他所处的场景是相关的,行为模式非常有规律,性格很稳定,遇到了特定情况,反应永远都是一样的,但是他的模式不是一个词就能概括的。
人的行为和判断,是跟外界互动的产物。不是这个人如何如何,而是这个人面对那样的情况会如何如何。如果你想让一个人做出对你有利的决定,应该研究他在什么情况下会做出那样的决定。
偶然噪声可以用多次测量去平均值的方法消除,水平噪声可以用多找几个人互相平衡的方法消除,可是稳定模式噪声更难消除。
第四讲:判断力的边界
即便有一个判断力系统,能消除所有偏差和噪声,也不可能做出100%正确的判断。因为总有一些事情是不确定的、有一些信息是做判断的时候理论上可以知道但是偏偏不知道的,最好的判断力,也有边界。
客观无知(objective ignorance):未来不确定的变化和我们现在不知道的信息。客观无知不是错误,不是偏差,也不是噪声,而是判断力的边界。
最好的判断力系统也无法消除客观无知。
现实是人们大大低估了客观无知,是的相当一部分客观无知变成了判断中的偏差和噪声。
现实中的决策难度往往由于信息的复杂性,人们面对这样的情况往往会选择其中一方面的信息,弱化或者忽略另一方面的信息,给自己讲一个自洽的、连贯的故事。
大脑会因为一些自己都不一定注意到的因素选定一个判断,剩下的剧情全是脑补,这样的判断过程恰恰是噪声的来源。
人们做这种判断其实并不是真的在追求精确性,而是在追求一种“我得出结论”的愉悦感,结论是对大脑思考的奖励。一个连贯的故事有个结局,这种思考很舒服。这就是为什么人们相信“直觉”:我说不清楚我是怎么判断的,但是我知道判断让我感觉很爽。
这样的判断往往完全没考虑客观无知,往往是过度自信。
做判断千万不能只考虑眼前的信息,必须考虑眼前没有的、外部的信息。
基础比率是个外部信息,光考虑眼前的事情不行,必须同时考虑其他类似的事情才行。基础比率能消除一点无知,但你仍然会低估自己的客观无知。
好消息是原生家庭对人的命运的影响远没有人们想象的大;坏消息是社会心理学并不能准确预测人的命运。剩下的都是客观无知。
事情总是充满不可知的变数,这就是命运,命运总是充满岔路口,这些岔路口跟社会心理学、跟任何理论都没有关系,而是我们必须面对的客观无知。
客观无知是一种统计思维。我们平时使用的、系统1爱用的,是因果思维。
因果思维善于解释。解释没毛病,但只能在事后解释。正因为几乎每次事后我们都能解释,我们会误以为我们对这个世界非常有把握。我们只有遇到事后感觉无法解释的事件,才会调动系统2去努力寻找别的原因。而这就使得我们高估了自己的预测能力,我们会低估意外,我们没考虑到那些是无知。
事后解释的难度远远小于事前预测。
因果思维是自动的,统计思维确是需要努力的。因果思维可以是内部的,统计思维必须是外部的。
因果思维容易在事后理解判断的错误,但是因果思维不能理解噪声,噪声是一种统计思维,必须观察过好几个判断,才能看出来其中有噪声。
要充分考虑客观无知,必须使用统计思维,有一个外部视角。不懂得外部的事物,没有类似的事情的经验或者知识,你就不配做这个判断。不了解历史,不了解外国,就不能判断现代中国。
第五讲:为什么流程比人强
机械预测(merchanical prediction):最基本、最简单而且也是能最有效减少噪声、提高准确率的判断方法。
临床判断(clinical judgement):基于个人经验和直觉的综合判断方法。
临床判断明显不如机械预测,而复杂的机械预测往往并不比简单的机械预测好多少。
“想太多”弊大于利:想太多会大大增加你的判断噪声,通常不如按照几个简单指标、几条简单规则的标准化判断流程。
模型没有喜怒哀乐,用模型判断噪声更少。
用人工智能的机器学习的预测也会比简单模型好,但是并不会好很多,因为机器学习的预测能力也有个上限——客观无知。
机械预测方法:
1.确定若干个评分指标:最好不要超过5个。
2.打分:给每个指标设定一个整数分数区间。
3.计算总分:无需加权平均,简单相加就好。
决策者能接受算法判断,但对算法的容忍度特别低。人类犯错会觉得很正常,可以容忍;如果算法判断错了,就倾向于不再信任。
我们认为犯错是人类的特权,机器没有权利犯错。
我们应该关注判断的过程,而不是判断的结果。我们需要程序正义,只要程序科学合理,判断正确的可能性就可以提高。所以关于决策判断的研究都是在改善程序,而不是保证某次判断的结果正确。
相信过程,走流程,是决策卫生的关键。
第六讲:有谱才能靠谱
所谓靠谱,就是能够以一个客观的尺度,作出量化的、合适的判断。
一惊一乍的重奖重罚是非常土的管理方式,与其说是管理还不如说是老板在享受权力的乐趣。
当我们要不自己的认识、感受、情绪冲动转化为行动的时候,我们常常要决定这个行动的力度应该有多大。而我们非常不善于做这样的量化。
麦当劳天价赔偿不但不代表司法制度的优点,反而反映了司法制度的缺陷。这是噪声。
员工360度绩效评估,有超过70%的噪声,信号几乎都被噪声所掩盖。大多数绩效评级都不能准确反映绩效,凭印象打分这种形式非常不靠谱。
而美国法庭判决的罚款,是没有度数的,有非常大的任意性。美国法律明确禁止想陪审团传达其他案件中惩罚性赔偿金的数额,不让陪审团有参考。这种法律假设了一种人类不具备的能力。
怎么对待量化噪声:
1.给一个尺度,也就是一个“锚”
2.寻求外部观点,找一找基础比率。
3.排序:把要判断的事物放在一起,从高到低排列,然后再打分。
4.给一个共同的的参考框架(common frame of reference):避免了排名,有尽可能让打分客观。缺点是对判断这的要求比较高。
量化判断容易产生很大的噪声,最关键的就是一定要有一个参考尺度。这个尺度可以是主动设定的,可以是类似事物的基础比率,可以是排名决定的,也可以使用一个共同的参考框架。如果没有尺度,判断就会盲目。
一定的模糊性可以给说话的人保留更多的主动性,不过在做判断做决定还是应该尽可能的精确量化。
靠谱,关键得有个谱。
第七讲:集体决策必须讲卫生
集体判断的质量高度依赖判断过程。
信息级联(informational cascades):开始几个人的观点直接影响了后面的人。后发言的人大大高估了前人判断的可信程度,在群体的压力下,更多的是在模仿别人,而不是做好自己的判断。发言顺序不一样,结果可能就完全不一样。想要带节奏,一定要争取先发言。不光是发言顺序,座位、表现是否自信、表情手势等等,都可能影响决议结果。
“人气”有个自我强化的机制。
群体极化(group palarizaiton):一群人讨论,越来越激动,相互鼓励之下,可能达成一个非常极端的决议。讨论,有时候会加大噪声。
如果想要决策卫生,建议:
1.给判断者提供信息,必须严格按照一定的顺序,千万不能给早了。
2.专家应该详细记录自己每一步的判断,严格按照程序顺序进行。
3.第二位专家做判断的时候,不应该知道第一个专家的判断结论。
决策卫生的关键就是信息披露的顺序。做判断并不是知道的越多越好,不该知道的你不知道,反而能做出更客观的判断。有些信息应该在判断做出之后再给,否则就有可能引发信息级联,导致偶然噪声。
德尔菲法(delphi method):把决策进行很多轮,每一轮每个人独立判断,匿名提交判断结果,然后一起公开,大家充分列举自己的判断理由,然后再来下一轮匿名判断。
第八讲:怎样做好重大决策
决策和判断最好分开:最终决策者必须是利益攸关者,但是利益攸关者未必专业,需要有专业团队的支持,参谋团队提供建议,最高指挥官综合多方意见最终拍板。
大多数面试都是非结构化的,导致大多数面试几乎是没有用的,一个重要的原因是客观无知。
面试有心理偏差:第一印象对面试影响非常大,有光环效应。
面试有噪声:最大的噪声来自面试官和应聘者之间的互动。面试者可能会把宝贵的面试时间用在应聘者的弱项,没有给他表现自己强项的机会。面试可能从一开始就跑偏了,这是巨大的偶然噪声。
结构化判断(structuring judgment):
1.分解:需要先想好,应聘者到底哪些指标对我们是重要的。原则是指标总数应该少,各个指标应该考察不一样的东西、尽量避免重复。
比如google最终值设定4个指标:
(1)一般认知能力,也就是智力水平。
(2)领导力
(3)googleyness,谷歌人,也就是适应谷歌文化的人。
(4)专业角色相关知识。
应聘者需要做4次面试,每次考察一项指标。
不在这4个指标中的东西,谷歌不但不在乎,而且确保不考虑,以降低面试官的判断噪声。
2.打分:每个面试官只负责一项指标,给一个分数。这一步的原则是独立性。每个面试官只管自己这一摊,在最终决定之前绝对不能知道候选人其他指标的得分。
面试官的任务不是决定自己喜不喜欢这个候选人,而是要通过搜集各种信息,尽可能客观准确的给候选人打分。
不但要提问,而且要记录在案,而且要根据一个统一的评分表、按照之前设定的评分标准打分。
整个流程看起来不像面试,更像是考试,甚至是审讯,这是一个调查取证的过程。
3.整体判断:候选人的分数已经得出,到了要拍板的时候。这一步的原则是“延迟的直觉”。
最终录取是一个委员会共同做出的,根据分数,比较容易达成共识。
这套方法的特点是基于流程,但是不拘于流程,不只看分数,但是尊重分数。
调解评估规程(mediating assessments protocol):特点是结构化,过程是“评估——讨论——评估”,其原则是:
1.设定几个结构化的指标
2.各指标独立判断
3.根据最终分数使用直接决策
要点是关心的是过程,不是结果,好的判断不是来自伟大领导人的灵光一现,而是参谋团队兢兢业业的专业工作。这不是形式主义也不是繁文缛节,而是必要的、卫生的解题步骤。
第九讲:判断力批判
生活可以多姿多彩,创造可以天马行空,但是自由的行动,最好是建立在合理判断的基础之上。
自由裁量权(discretion):在一定的范围内,你有权自行选择该怎么做。discretion是一个权力,所以有一个所有者。就是谁的discretion,需要事前确定好。discretion的核心不是自由,而是判断。这个自由不是胡作非为的自由,而是自己掌舵自己承担后果的自由。
标准:是关于做一件事情的指引,其特点是比较含糊,需要在其中使用自由裁量权。
规则:则是严格的,是什么就是什么,你没有自由裁量权。
关于饮酒问题,所有政府都不提倡青少年饮酒。
在中国:建议最好别喝,但是非要喝也没人拦着,自己的事情自己看着办。
在美国:有严格的法律规定,任何商家不得向21岁以下的人卖酒。
小心驾驶是个标准。
限速120公里是个规则。
在一个人人都是优秀的判断者、都能很好的使用discretion的世界里,应该只有标准而没有规则。但这是不现实的,标准的最大问题是:discretion的判断噪声太大。
规则没有噪声,因为根本不需要判断。但是规则可能会有偏差,而且容易僵化。
法律会故意保留一些模糊性,立法者留出一定的解释权和判断权,让司法机构在具体的案件中行使自由裁量权进行解释和判断,才能真正解决问题,也才能让法律适应未来社会的变迁,而不至于频繁的修改。
到底使用标准还是规则,其实是个成本问题:规则不需要判断,使用时决策成本低,但持续频繁修改,制定规则的决策成本高。标准需要判断,使用时的决策成本高,但是制定标准的决策成本低。
但比决策成本更重要的是犯错成本。给规则还是给标准,本质上是自由裁量权在谁手里的问题。你的判断力有多好,就能得到多大的信任,就有多大的自由裁量权。判断力越大,责任才能越大。你自己的判断有章法,我们才能放心不给你制定强制的章法。
discretion强的人有三个特点:
1.专业知识强:专家掌握行业规范,知道深浅的微妙拿捏,他们的判断是建立在真实场景的经验之上。所有的专业知识都有一定的模糊性,留下了解释的空间。空间内如何运用discretion,很大程度上取决于经验。没有神童医生、神童法官,因为没有经验,就无法做专业的判断。
2.智力水平高:一般心智能力(general mental ability, GMA)比其他任何指标都重要。真正智力高的人判断力也高,因为他们更能避免偏差和噪声。
3.谦逊的认知风格:认知反思测试(cognitive reflection test, CRT),测量一个人做出一个判断之后,能不能迅速反思,看看自己有没有错误,能不能遏制自己匆忙下结论的冲动。认知反思能力越弱的人,越容易相信鬼魂、占星术等神秘主义,约容易相信假新闻。
认知需求:测试一个人是否愿意自己思考寻找答案。
开放性:是否愿意寻找跟自己的假设矛盾的信息,能否考虑别人的不同意见,考虑新的证据,是否允许自己被相反的论点说服。开放性高的人能随着新信息积极修改自己的预测。
高水平判断者绝对不能是那种死板的、一根筋的人,也绝对不是没有章法、胡乱说话的人。
自由裁量权的自由是探索的自由、是调动一切有用信息的自由、是学习相关知识的自由、是直接运用逻辑而不必接受生硬命令的自由,不是放任的自由。discretion不是我心中想是什么就是什么,而是我发现世界是什么就是什么。
如果你的判断力强,你就配的上拥有标准;如果判断力弱,就只能拥有规则。判断力强恰恰善于运用判断规则。
判断者悖论:如果你尊重规则,你就可以不遵守规则;如果你不尊重规则,你就必须遵守规则。