这么多葡萄酒打分机构,我们该信谁

编译:王智慧 | 葡萄酒在线

同一产区两个相邻酒庄的葡萄酒,为什么有时价格上却有不小差异呢? 这当然有酒庄更用心,酿酒成本更高些的原因,也有市场做的更好,消费者认可度更高的原因,还有就是被酒评人用力夸过之后,身价也是会哗哗哗涨起来的。我们这里要说的是在互联网时代,能帮助一瓶酒红起来的已经不止是传统大牌酒评人,比如Robert Parker了。

22222

电影《Sideways》(杯酒人生)带动了Pinot Noir销量上涨和梅乐销量下滑

2004年,微软团队推出了Cellar Tracker, 这是一个业余选手也能随意对自己喝过的葡萄酒进行评价的网站。现如今民意代表——民间酒评网站Cellar Tracker已经有超过11万3千的用户留下的对于超过220万种不同葡萄酒的630万条评论了。

许多专业酒评人,毫无意外的,嘲笑了业余爱好者的业余水准:理解都谈不上,还煞有介事的给打个分?2012年著名酒业网站Wine Spectator(葡萄酒观察家)Matt Kramer 在专栏里将群众的智慧描述为“有害的妄想”(pernicious delusion),他写道,“100个根本不知道Auxey-Duresses是什么的人,发表了100个混乱的、令人费解的、胡乱重复的结论。”(Auxey-Duresses是勃艮第Meursault地区的小村子,著名酒庄Leroy就创建于那里。)酒评人Steve Body 2014年在他的个人网站The Pour Fool上发表过文章《关于民间打分以及为什么民间打分烂透了》:“这些网站的用户基本上都无客观可言,都是个人喜好的奴隶,随着时下流行的趋势人云亦云而已。”

确实,与专业人士相比,只是凑热闹的爱好者们未经系统培训,基础差,缺乏专业知识,还常陷在自己的偏见中不肯出来。然而即使这样,他们这些免费的酒评和意见就真的毫无价值了吗?他们对于一款酒的测评结果和专家们到底能差出多少呢? 好事者如美国网站VOX做了这样的试验,他们选择了一组2014年或更早些的的加州葡萄酒,分别统计对比了葡萄酒专业组和业余组的品鉴分数,并整理了出来。业余组就是Cellar Tracker了。专业组VOX选择了Wine Advocate(Robert Parker的网站)、International Wine Cellar和Jancis Robinson。选择他们是因为数据库显示他们打过分的酒款与Cellar Tracker有据可查的酒款交集最多。具体做法是用WA的10679款酒、Wine Cellar的12182款酒和Jancis Robinson的 1167 酒的分数数据与CellarTracker的进行对比,结果如下:

在说结果之前,先说一下这种研究结果被称作“观测数据”——把隐没在一大批看来杂乱无章的数据中的信息通过观察和测量集中提炼出来,以找出所研究对象的内在规律。如果事实证明,专家和爱好和之间对于葡萄酒品质的意见背道而驰,这能说明什么呢?专家对于葡萄酒有更客观和精辟的见解吗?不,它更应该被解释为,专家的喜好和普通消费者的所偏好的葡萄酒是不一样的。

可结果。。。并不是你们想象的两个组在结论上大相径庭,但也没有高度一致,VOX从中发现了一些更有趣的东西。

1

看懂了么?这个表格上有9119个小点点,每个点都代表了一瓶WA和Cellar Tracker都打过分的酒,纵坐标是Cellar Tracker的分数,横坐标是WA的分数,如果两者打分越接近,那么这个点将越接近从原点引出的象限角平分线。现在你看到图里,右上部黑乎乎一片都非常接近这条线,甚至有些就位于线上,就是他们的分数相似性还是挺高的。

Spearman correlation是Fox所使用的统计工具的名称。1是完美重合,0是完全不相关,最后统计出WA和Cellar Tracker的平均契合度是0.576.乍看之下好像哎呦还不错哦,仔细想想比零没有没什么差别,这就好比某企业内部打篮球友谊赛时会出场的选手和NBA职业男篮选手的差距。

2

The Cellar Tracker 和 International Wine Cellar 的契合度要低一点点,0.555.

3

和Jancis Robinson的重合度最低,0.424.

但是这并不是有趣的部分,有趣的部分就要来了:为了进一步弄清Cellar Tracker和专家组们的关系,让我们暂时把它抛在一边,比较一下专家组先。

4

在专家组中,WA和International Wine Cellar的契合度相较之下是最高的,Spearman correlation达到0.568.

jrvswa

JR和WA的契合度是0.208,和International Wine Cellar的契合度只有0.222.

什么意思,根据这上万款酒的数据分析结果来看,这说明Cellar Tracker和各个专家之间的意见的相似度,要比专家们之间的意见的相似度更高。也就是说,如果你想一次性知道所有专家的想法,最好的地方,看起来,似乎是, Cellar Tracker?!

6

▲ 各个网站打分相似度对比

至于为什么会出现这种情况呢,数据并没有告诉我们。我们完全可以推测说,Cellar Tracker上的打分其实只是对专业人士的重复,普通用户们也怕说的太离谱会丢脸,在上网去显摆自己一款喝过的酒之前,比先去大网站看看帕克怎么说,JR怎么说,然后心里十分踏实的也上去评价一下。

那么,难道Cellar Tracker的成千上万瓶,每一瓶都是这样吗?

(注:这里必须指出一点,因为选择的都是加州的酒,这个测试对象是有局限性的。加州葡萄酒肯定是美国网站最为热点的关注对象,但这个结果是否适用于其他葡萄酒产区,比如西班牙、智利、勃艮第和新西兰,这需要更深入更广泛的研究了。)

 

结论一:打分的人越多,这个分数越靠谱

也不能说Cellar Tracker 和专家就是一致的,说不准他们是在哪儿就严重对立了,且毫无规律。如果现在你回过头去看Cellar Tracker+WA分数对比的那张图,你会看到没有在那一片点点集中区域里的,位于右下部的一个点点。从他的X轴和Y轴可以看出,这款1999年的Testarossa霞多丽,WA给了它88分,评语是“平均水准以上、非常好”,可 CellarTracker仅仅给了它52,说它“可怕,糟透了”。

然而在进一步检查数据之后,VOX注意到,只有一个CellarTracker用户为这款霞多丽打了分,代表了极小的样本量。事实上,一款酒的评论越多,爱好者越踊跃的地方,业余组和专家组们的契合度就越高。意见严重相左的例子虽然也有,但其实是很少见的。

结论二: 酒越好,分数越靠谱

另外有个趋势是,当葡萄酒品质越好的时候,打分趋向相同。我们还记得上面几张图,点阵集中的部分都在高分相交区,图的右上部吧。所有酒的平均分数,WA是89分,InternationalWine Cellar是91分,Jancis Robinson是17分(20分满分),Cellar Tracker是89分。这也说明另外一件事,专家和爱好者们似乎都没有多花时间去琢磨平庸的酒~

然后最顶部都是空白:这世上有许多非常好的葡萄酒,但少有谁能称的上是伟大。这是专家和爱好者最能达成共识的地方。

Vox最终做出了支持平民网络打分的结论。至少他们并没有给出一个错误的导向。期待每一个饮酒的普通人都能坚持自己内心真实的想法,参与到喝酒,喝完酒讨论打分这件事情里来。也许你与大师们打分差别很多,这可能是因为你的爱好倾向和判断体系与他不同,但你可以找一个与你契合度最高的专家,多参考他的意见就好了,毕竟你才是买买买那个,你是对于这个市场来说,非常重要的存在啊。

原文出自:vox.com
原文作者: Richard Bazinet,多伦多大学的自然科学博士

微信号:WINECLOS

美食 | 美酒 | 旅游| 八卦| 分享,欢迎关注我们