多数是什么意思(数据真的能证明一切吗)
admin
2023-08-04 07:02:57
0

导读:,以下新闻能在多大程度上说服你?

新闻发布会:经济取得了巨大的进步。上个月,我们的失业率下降了一个百分点。

上面的论点根本打动不了你。这个论点用数据欺骗了我们!

作者提出的最常见的证据之一是& quot统计数据& quot。你可能经常听到人们用下面的短语来支持他们的论点:我有数据可以证明。"

但是统计真的能证明一切吗?

作者:尼尔布朗,斯图尔特基利。

如需转载,请联系华章科技。

我们用统计数据(通常是以不恰当的方式)揭示战争伤亡的增加或减少,提醒公众发生率的变化,衡量一种新产品的销售量,判断一只股票的盈利能力,确定下一张牌是A的概率,衡量不同大学的毕业率,记录人们在不同年龄的性生活频率,为许多其他问题提供资源和信息。

统计数据(statistics)就是用数字表达出来的证据。这样的证据可能看起来非常感人,因为数字使证据看起来非常科学和准确,仿佛它代表了& quot事实& quot。但是统计数据可以,而且经常会说谎!他们不一定能证明他们想证明的一切。

提供数据的两种不同方式可能具有欺骗性:

最喜欢的食物

最喜欢的食物

提示:统计数据可能而且经常会说谎。他们不一定证明他们似乎想证明的一切。

作为一个能够思考和判断的人,你应该试着识别错误的统计论证。在短短的几个段落中,我们无法向您展示人们使用& quot帮助他们撒谎的统计数据& quot。但是,本文我们将为你提供一些基本策略,这样你就可以用来发现这些骗人的小伎俩。

同时,它也通过展示许多作者错误使用统计数据作为证据的最常见方法,提醒您数据论证中的缺陷。

关键问题:数据有没有欺骗性?

01不知来历和带有偏见的数据

年最近的一个新闻标题:40%的大学生患有抑郁症!

抑郁的时候应该过分担心吗?你怎么知道你可以相信这样的统计数据?

对于任何统计来说,要求某个地方发生的某些事件能够被定义和准确识别,往往是一件非常困难的事情。因此,要找出欺骗性的数据,第一个策略就是尽量找到足够多的关于这些数据是如何采集的信息。

我们能确切知道美国有多少人篡改了他们的纳税申报单,有多少人有过婚前性行为,有多少人开车和使用手机,或者有多少人使用非法药物吗?如果你想象一下做这些统计的细节,那么我们怀疑你的答案肯定会是& quot不大可能& quot。

为什么?因为为了获得某个特定目的的准确数据,你经常会遇到各种各样的障碍和绊脚石,包括关键词的模糊性,难以识别相关的人或事件,人们不愿意提供真实的信息,无法报告各种事件,以及观察事件的身体障碍。

所以统计数据的形式只能是一些基于事实的估计。这些估计有时是有用的,但也可能是欺骗性的。记住总要问一问,“作者是怎样得出这个估计的?”得到的细节越多越好。

来历不明的统计学最常见的用途之一就是用大量的数字来打动或打动别人,而这些数字的准确性往往令人怀疑。例如,大量的数字可能被用来提醒公众身体障碍或精神障碍的发病率不断增加,如癌症、饮食障碍或儿童自闭症。

如果我们能知道这些数据是如何细致地确定的,我们一定会被这些数据深深感染。例如,人们一直试图统计大学生抑郁症的确切发病率,但来源不明的数据成为影响统计的主要因素,研究报告的发病率在10%至40%之间。

所以,如果这部分开头提到的研究让你觉得过度惊慌,你可能看起来有点歪。记住:在对这样的数据做出反应之前,我们先要问一问它们是怎么得来的。.

02令人困惑的平均值

请检查以下陈述:

(1)快速致富的一个方法是成为职业足球运动员。2010年,美国国家足球联盟球星的平均收入为180万美元。

(2)为了在大学取得好成绩,学生需要付出的努力越来越少。根据最近的一项调查,大学生平均每周花12.8小时学习,大约只有20年前大学生的一半。

单词& quot平均& quot两个示例中都使用了。但是实际上有三种不同的方法来测量平均值,并且在大多数情况下,每种方法都会给出不同的值。

第一种方法是将所有的值相加,然后将总数除以相加的数。这种方法的结果是平均数.

第二种方法是将所有的值从高到低排列,然后找到中间的值,这就是中位数.

有一半的数值在中位数之上,另一半在中位数下面。

第三种方法是将所有数值排列好,计算每个不同数值出现的次数或每个不同数值范围出现的次数,出现频率最高的数值就叫作众数(mode),这是第三种平均值。

作者谈论的是平均数、中位数还是众数,将会产生很大的区别。

平均值的种类:

平均数:通过把所有数值相加然后用总数除以相加的数目来计算中位数:通过将所有数值从高到低排列然后找到位于最中间的数值来测定众数:通过计算不同数值出现的次数然后找出出现频率最高的数值的方法来测定

第一个例子当中取什么平均值最能说明问题?请考虑一下职业化运动当中大牌球星的收入与那些一般球员的收入对比。最大牌的球星,比如说橄榄球明星四分卫,收入比球队里大部分其他球员要高出很多。

事实上,2010年度薪酬最高的橄榄球运动员岁入超过1500万美元,而这远远高于平均值。这样高的收入将会急剧拉高平均数,但是对于中位数或众数而言则影响不大。

举例来说,国家橄榄球联盟的球员2010年度工资平均数是180万美元,但是其工资中位数却只有77万美元。因此,在大部分职业运动当中,平均数工资要比中位数工资或者众数工资高出很多。所以,如果有人想让工资水平显得非常非常高,他就会选择平均数作为平均值。

现在让我们来仔细看看第二个例子。如果这里列举的平均值要么是中位数要么是众数,我们有可能就高估了平均的学习时间。有些学生很可能花了极多的学习时间,比如一周30或40个小时,这样就提高了平均数的数值,但是却不影响中位数或者众数的数值。学习时间的众数数值可能远低于或远高于中位数,主要取决于多长的学习时间对学生而言最为常见。

当你见到平均值的时候,一定要记得问一下:“是平均数、中位数还是众数,平均值的含义不同会不会产生什么影响?”要回答这个问题,请想一想平均值的不同含义会给信息的意义带来怎样的变化。

不仅判断一个平均值是平均数、中位数还是众数非常重要,判定最小数值和最大数值之间的差距,即全距(range)以及每个数值出现的频率,也就是数值分布,常常也显得异常重要。

下面我们来看一个例子,在这个例子里知道数值的全距和分布就显得非常重要。

医生对20岁的病人说:你所患癌症的预后不容乐观。患同样癌症的病人存活时间的中位数是10个月。所以剩下来的这几个月你想做什么就做点什么吧,不必有什么顾虑了。

病人听到医生给出这样的诊断结果,对自己的未来该做出怎样可怕的展望呢?首先,我们确定知道的是获得这种诊断的病人有一半不到10个月就去世了,还有一半人存活时间超过了10个月。

但是我们并不知道活下来的那部分人的存活时间的全距和数值分布。也许存活时间超过10个月的病人的数值全距和分布会显示,有些人、甚至很多人活得远远超过了10个月的时间。其中有些人、甚至很多人可能活到80岁以上呢!知道病人存活情况的完整分布可能会改变这个癌症患者对未来的看法。

一般来说,病人应该考虑国内不同的医院对于他的疾病的存活率是不是有不同的全距和数值分布。这样的话,他就应该考虑选择在那家有最乐观的数值分布情况的医院就诊。

当我们遇到平均数的时候,记住全距和数值分布的一个总体好处,就是这样做会提醒你,大多数人或事并不完全符合确切的平均值,与平均数值差异极大的结果也在预料之中。

例如,很多旨在促进我们健康状况的干预措施,都会展示某些健康手段的平均获益情况,尽管参与这项研究的许多人获益极少或基本没有获益,有些人甚至还会不同程度地受损。

03把一件事的结论用来证明另一件事

有些数据确实能证明一件事,而立论者往往宣称这些数据证明了另一件性质完全不同的事,这时候他们往往在欺骗我们。这些数据压根儿就证明不了它们用来证明的一切!有两种策略可以帮你找出这类欺骗。

一个策略就是对立论者提供的数据视而不见,然后问自己:“什么样的统计数据作证据,在证明他的结论时会有帮助?”然后,将“所需”的数据和给出的数据进行比较。如果两者之间难以吻合,你可能就发现了一个数据上的欺骗。下面的例子为你提供一个机会来应用这种策略。

如果你乘坐我们这座城市的地铁,十有八九你的手机会被人偷走。我刚读到一份统计数字,说小的电子产品占到地铁系统失窃率的70%。

需要做什么样的研究才能获得个好主意,可以知道自己乘地铁时电子产品被人偷走的可能性到底有多大。你自然想知道乘地铁被偷的概率,而不是被偷走电子产品的概率。这个数据证明了一件事,即地铁系统的大部分偷窃行为都是奔着小电子产品去的。但它并没有证明这类偷窃行为发生的概率有多大。

要回答这个问题,你需要这样问,在坐地铁的时候被偷的概率到底是多少?有可能总体的偷窃行为非常少,但是其中大部分都牵涉到小电子产品。从这个例子当中得到的最重要的教训就是:我们一定要加倍注意统计数据和结论的措辞,看看二者是不是指的同一件事情。如果不是,作者或演说者就很可能是在用数据说谎。

知道什么样的数据证据应被用来支持一个结论是很难的。因此,另一个策略就是不急于去看作者的结论,而是先仔细检查作者的数据,然后问自己,“从这些数据我们可以得出什么合适的结论?”然后拿你的结论和作者的结论相比较。请用这个策略来检验下面这个例子。

大约半数的美国人欺骗了自己的另一半。研究人员最近在一家购物中心采访了很多人。在接受采访的75人当中,有36人坦承他们有朋友曾承认欺骗过自己的约会对象。

你有没有想到这个例子一开始得出的结论?大约一半人在某个特定地点承认有朋友告诉过自己,他们在和他人约会或交往过程中至少有过一次欺骗行为。你有没有看出数据所证明的东西和作者的结论之间存在着巨大的差异?如果你看出来了,那你就发现了这位作者是如何利用数据来撒谎和欺骗的。

04通过省略信息欺骗

统计数据经常因为不完整而欺骗了我们。因此,另一个在数据论证中找到缺陷的非常有用的策略就是问一问:“在判断数据的影响力之前,还需要什么进一步的信息?”让我们先看看下面的例子,展示一下这个问题所起的作用。

大公司正在将市中心地带的小镇气息破坏殆尽。就在去年,城里的大公司的数目增长了75%。尽管大家都挺害怕,但跳伞运动其实比其他活动比如说驾驶汽车要安全得多。拿某一个月的时间来作比较,这段时间里,洛杉矶有176人死于车祸,而死于跳伞事故的却只有3人。艾滋病预防项目需要较大的资金增幅。2009年,有54000人饱受艾滋病的折磨。

第一个例子中,75%这个数字很吸引眼球。但是缺少了一些东西:这个百分比所依据的绝对数值。假如我们知道这种增长是从4家增长到7家,而不是从12家增长到21家,我们还会觉得如此惊讶吗?

在第二个例子里,我们倒是有数字了,但是却不知道比率。难道我们不需要知道这些数字对参加这两种活动的人数的百分比来说有什么意义吗?不论怎样,参加跳伞活动的总人数比起驾车的总人数而言简直是微不足道。

第三个例子展示了我们社会中常见的一个事实,通过聚焦全国范围内受病痛折磨的总人数,企图引起公众对某个社会问题的关注。尽管这显然是个亟待解决的问题,但当我们将54000除以美国的大概总人口3亿人,我们只得到一个大概0.02%的数值。

当你遇到听起来让人动心的数字或者百分比,一定要当心!你可能需要其他信息来判定这些数字到底有多让人动心!当只有绝对数值摆在眼前的时候,问一问知道百分比是不是有可能帮你做出更好的判断;当只有百分比出现在眼前的时候,问一问是不是绝对数值会丰富它们的含义。

当你遇到统计数字的时候,一定要记得问一问:“缺少了什么相关信息?”

关于作者:尼尔·布朗,博林格林州立大学(BowlingGreenStateUniversity)的杰出经济学教授。获有托雷多大学法学博士学位和得克萨斯大学的博士学位。

斯图尔特·基利,美国伊利诺伊大学心理学博士。现为美国博林格林州立大学心理学教授。

本文摘编自《学会提问》(原书第11版),经出版方授权发布。

延伸阅读《学会提问》(原书第11版)

推荐语:不会提问就是胡思乱想,学会提问就是思考的光芒。批判性思维领域“圣经”更新至第11版。

相关内容

热门资讯

5分钟教会你!开心游戏外挂辅助... 您好,开心游戏这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,...
详细房卡教程“新朝圣大厅房卡正... 咨询房/卡添加微信:41828340许多玩家在游戏中会购买房卡来享受更好的游戏体验。那么,今天我就来...
玩家必看“新悠悠房卡获取方式”... 【要素一】(KK)微信链接各大厅/房卡介绍微/44858861新悠悠是一款非常火爆的游戏应用,拥有众...
房卡秒懂“白虎大厅房卡怎么购买... 咨询房/卡添加微信:41828340许多玩家在游戏中会购买房卡来享受更好的游戏体验。那么,今天我就来...
5分钟教会你!789大菠罗外挂... 您好,789大菠罗这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别...