
一篇新论文认为,试图通过跟踪人们的Google搜索这种疾病来识别流感爆发的尝试并没有达到其最初的承诺。
Google流感趋势这是试图通过搜索术语来追踪流感爆发的尝试,在2012-2013季节高估了流感病例的数量,最新数据看起来并不令人鼓舞。
拉泽告诉《现场科学》:“那里有很大的潜力,但也有很多犯错的潜力。” [6个超级细菌要注意这是给出的
Google的错误
Google Flu趋势并不总是打入本垒打也就不足为奇了。 2013年2月,研究人员在《杂志》中报告说,该计划的估计约为两倍流感病例的数量如疾病控制与预防中心(CDC)所记录的,该中心跟踪了实际报告的病例。
拉泽说:“当它从轨道上脱落时,它确实脱离了轨道。”
Google流感趋势也在2009年苦苦挣扎,完全缺少H1NI的非季节流感爆发。根据Lazer的初步分析,今天(3月13日)(3月13日)向社会科学前网站社会科学研究网络(SSRN)进行了初步分析,这些错误导致Google团队重新计算其算法,但最新的流感季节表明这些变化并没有解决问题。
Lazer说,这个问题不是Google流感所独有的。所有社会科学大数据,或者对移动或社交媒体技术的大量人口进行分析,面临着Google Flu团队试图克服的挑战。
大数据弊端
弄清Google流感趋势出了什么问题并不容易,因为该公司没有透露其用于跟踪流感的搜索术语。
拉泽说:“他们得到了复制的F。”这意味着科学家没有足够的有关测试和复制发现的方法的信息。
但是Lazer和他的同事们对出了什么问题有一种感觉。他说,一个主要的问题是,Google是有兴趣促进搜索的业务,而不是一个科学团队收集数据。然后,Google算法提示与用户相关的搜索:如果有人搜索“流感症状”,则可能会提示他们尝试搜索''流感疫苗,“例如。因此,即使流感病例没有,与流感相关的搜索数量也可能滚雪球。5个危险的疫苗接种神话被揭穿这是给出的
Lazer说,另一个问题是,Google流感团队必须区分与流感相关的搜索和与流感季节相关但无关的搜索。为此,他们采用了超过5000万次搜索词,并将其与CDC流感率的1,100个数据点相匹配。
Lazer说,玩很多术语的相关游戏必然会返回一些怪异,荒谬的结果,就像猴子最终可以打字莎士比亚一样。”例如,“高中篮球”在三月期间将其作为搜索阶段的峰值,这往往是流感季节的顶峰。 Google显然挑选了虚假的相关性并将其删除,但是尚不清楚它们所删除的术语以及这样做的逻辑。 Lazer说,某些术语,例如“咳嗽”或“发烧”可能与流感相关,但实际上表明了其他季节性疾病。
他说:“这是流感探测器的一部分,是冬季探测器的一部分。”
问题和潜力
Google团队在2009年和2013年失败后改变了他们的算法,但对媒体报道的飙升进行了最新的变化。2012-2013流感季节Lazer和他的同事在SSRN论文中写道,引起了问题。假设折扣2009 H1N1的主要媒体报道大流行研究人员认为,在2011-2012流感季节中未能解释错误。
Google发言人将现场科学指向博客文章在Google流感更新中,该更新称为改善“迭代过程”的努力。
Lazer很快指出,他不是在Google上选择的,而是称Google Fly Trands为“一个好主意”。 Lazer说,在其他社交媒体数据集中回应了Google流感面临的问题。例如,Twitter让用户知道网站上的趋势,这进一步提高了这些条款。 [Facebook的十大黄金规则这是给出的
重要的是要了解在线收集的大量数据集的限制。斯科特·戈德(Scott Golder),在公司环境中与此类数据集合作的科学家相关。例如,使用社交媒体的人的样本不是整个人口的横截面 - 例如,他们可能年轻,更丰富或更精通技术。
没有参与Lazer的Google批评的Golder告诉Live Science:“人们必须谨慎。”
戈德说,关键字选择和社交媒体平台的算法是其他问题。几年前,他正在研究一个在社交媒体上研究负面影响的项目。 “丑陋”一词在晚上一直在峰值。事实证明,人们没有夜间自尊危机。他们正在谈论ABC节目“丑陋的贝蒂”。
但是,这些问题不是大数据的死亡之后 - Lazer本人说,大数据可能性是“令人难以置信的”。 Lazer说,社会科学家一直在处理不稳定数据的问题,而Google的流感数据是可解决的。
他说:“我的感觉,查看数据及其如何删除,这是您可以在不调整自己的商业模式的情况下纠正的。” “您只需要知道[问题]就在那里并考虑含义。”
Lazer呼吁在大数据研究人员和传统的社会科学家之间进行更多合作,并使用小型,受控数据集工作。戈德同意这两种方法可以是互补的。他说,大数据可以暗示需要对传统技术进行审查的现象。
戈德说:“有时,如果是正确的数据,则少量数据可能会更有益。”
关注斯蒂芬妮·帕帕斯(Stephanie Pappas)叽叽喳喳和Google+。跟着我们@livescience,,,,Facebook和Google+。原始文章现场科学。