巧克力与诺奖关系的迷思

作者:浙云 摘自:读者

  《新英格兰医学期刊》刊登过一篇文章,说一国人均巧克力消费量越大,其诺贝尔奖得主占总人口的比例就越高。

  按照文章作者弗朗茨·梅瑟利的觀点,巧克力消费与获得诺奖存在因果关系,其理论机制是:巧克力的主要原料可可富含黄烷醇,而黄烷醇作为强抗氧化剂类黄酮的一个亚类,能提高记忆力和学习能力,改善推理、决策、语言能力和数学逻辑等认知功能。

  然而,人均巧克力消费量越大并不代表那些诺奖得主吃的巧克力就更多,也就是说,吃巧克力的人与诺奖得主并不一定属于同一群人。因此,该文作者仅为上述理论机制提供了很弱的统计学证据支持。对文章更严重的质疑来自这样一个事实:虽然黄烷醇在天然可可中含量很高,但在巧克力中含量很低。哈佛大学医学院研究黄烷醇的专家诺姆·霍伦伯格指出,黄烷醇会使巧克力发苦,因此,巧克力制造商会尽量降低巧克力中黄烷醇的含量。鉴于此事实,可以认定,文章的统计学证据根本没有为上述理论机制提供任何支持。

  那么,怎样有效地解释该文章的统计学证据呢?一种比较诙谐的解释是,虽然从巧克力消费到获得诺奖并不一定存在因果关系,但反向的因果关系有可能存在:那些有很多诺奖得主的国家或许喜欢用巧克力来庆祝本国学者斩获诺奖。更严肃的解释来自2001年诺贝尔物理学奖得主埃里克·康奈尔。他认为,一个国家的巧克力消耗量与该国的富裕程度相关联,而越富裕的国家对科研投入就越多,从而越可能产生更多的诺奖得主。因此,巧克力消费量和诺奖得主数量正相关所反映的是经济发展对二者的促进作用,而非二者的因果关系。

  埃里克·康奈尔实际上是基于统计学中的“虚假关系”概念来对此进行解释的。所谓虚假关系,是指在两个变量之间不存在因果关系,但会因为分别与第三个变量相关而具有相关性。不幸的是,这种相关性会误导人们认为这两个变量存在因果关系。与本文案例类似的例子有很多,例如,手掌大小与阅读能力没有因果关系,但二者正相关,原因是年龄越大、手掌越大,同时阅读能力越强。

  前文的分析表明,变量A与B相关,并不一定意味着A就是B的原因。B可能是A的原因,或者二者根本不存在因果关系,仅仅因为都与第三个变量C相关而相关。还有一种可能是,这二者的相关只是一种不必过度解读的巧合。就弗朗茨·梅瑟利所进行的研究而言,他选取了人均产生诺贝尔奖得主数量排名前23位的国家作为研究样本,显然样本量很小,从而很容易出现巧合性结果。

  寻求因果关系是人类的本能,然而在此过程中陷阱重重。若要避免掉入这些陷阱,我们不妨记住哲学家康德的著名论断:“经验的因果归纳没有合法性。”