即時不分類 - 聯合新聞網 ( ) • 2024-05-12 06:05
有些人在被问及收入时,会出于虚荣或乐观而夸大数字。有些人在被问及收入时,会出于虚荣或乐观而夸大数字。

如果你有一桶豆子,里面有些是红豆,有些是白豆,你只有一种方法,能准确知道每种颜色的豆子有几颗:那就是全部数一遍。

不过,你也可以用比较简单的方法算出大约有多少红豆:只要抓一把豆子,算出其中有多少红豆,并假设这把豆子的红豆数量与整桶的比例相符就行了。

/*.innity-apps-underlay-ad {z-index: 34 !important; }*/ .innity-apps-underlay-ad ~ .header {z-index: 35;} .innity-apps-underlay-ad ~ .main-content .inline-ads { background: transparent;} #eyeDiv ~ .footer{ position: relative; z-index: 2;} /* sizmek_underlay 投递调整置底 z-index 权重 */ .article-content__abbr__text {display:inline-block;} /* to be remove */

内建偏误的样本

如果你采计的样本数够多,采样的方式也适当,在绝大多数状况下,采样结果的确可以代表整体。但如果样本数不够多,采样方式也不适当,相较于采样,理性猜测的结果可能还准确得多;因为这种采样只能提供虚假的科学准确感,除此之外什么意义都没有。

本文出自《统计操控的真相与谎言》本文出自《统计操控的真相与谎言》更可悲的是,在我们读到或自认了解的事情背后,往往是借由取样偏误或数量过少的样本,又或是两者兼具所得到的结果。

举一个极端的例子,可以更清楚看出样本偏误是如何产生的。假设你进行了一份问卷调查,问卷中包含这个问题:「请问您喜欢回答问卷吗?」接著你分析了回收的问卷,得出「大多数人都喜欢回答问卷」的结论,而且你为了让数据更具说服力,还特别计算到最精确的小数位。

当然,真实情况可能是大多数回答「否」的人,都早已将问卷丢进了最近的垃圾桶,从而将自己从样本中剔除。即使在原始样本中,进了垃圾桶的问卷占了样本数的 90%,但当你宣布了你的惊人发现时,忽略那些被丢掉的问卷会是一种惯性的传统作法。

在现实生活中,是否也会产生这样的偏误?我敢打包票一定会。

吹嘘自己的「不老实」样本

有了这个知识背景,让我们来研究一下一则几年前的新闻,该报导指出:「1924年毕业的耶鲁大学校友的平均年薪是25,111美元(约新台币84万元)。」

哇,这薪水真是不错!

但是,等一下,这个惊人的数字到底代表什么意义呢?是不是就像表面上看起来的那样,证明若你把小孩送进耶鲁大学,当你老了之后就不用工作,甚至当他老了之后也一样?

若带著怀疑的眼光观察此数字,你会发现有两件事很引人注目。第一,这个数字惊人的精确;第二,这个数字美好到不太像是真的。

在任何广泛的群体当中,平均收入绝对不太可能精确到个位数字。若要确认自己的去年收入达个位数字的程度,除非所有收入都来自薪资,否则不太可能做到。而收入达到2.5万美元的人,往往不会只赚取薪资;这个阶层的人很可能拥有各种投资收入。

此外,这个可爱的平均值无疑是根据耶鲁毕业生自己宣称的收入所计算出来的。即使耶鲁大学已在1924年于纽哈芬( New Haven)建立了荣誉制度,我们也不能确定这套系统在四分之一个世纪之后还能运作良好,足以让这些耶鲁毕业生全都诚实回报收入。

有些人在被问及收入时,会出于虚荣或乐观而夸大数字。而有些人则会低报,尤其是当他们已将税务申报表上的数字减至最小,后续在提及收入的文件或声明上,就不太可能提出和申报表不符的数字。

(本文出自《统计操控的真相与谎言》,作者:德瑞尔.赫夫 译者:闻翊均)