
根据一项新研究,通过监视人们寻找有关Wikipedia的流感信息的次数,研究人员可能会更好地估计流感季节的严重程度。
研究人员创建了一个新的数据分析系统,该系统着眼于Wikipedia文章的访问,并发现该系统能够比释放疾病控制和预防中心的流感数据更快地估算美国的流感水平。
在2007年12月至2013年8月之间的六个流感季节的数据中,新系统估计流感峰值周高于另一个基于数据的系统的Google流感趋势。研究人员发现,基于Wikipedia的系统可以准确地估计了六个赛季中三个季节的流感高峰周,而基于Google的系统仅获得了两个峰值。 [10种将改变您生活的技术这是给出的
波士顿儿童医院的博士后研究员戴维·麦克弗(David McIver)说:“我们能够对人口中的[流感]水平的估计非常好。”
新系统检查了对Wikipedia文章的访问,其中包括与氟化疾病有关的术语,而Google Flu趋势则查看搜索到Google中的搜索。研究人员分析了来自Wikipedia的数据在一个小时内,观看了一条文章的几次,并使用他们创建的模型将其数据与CDC的流感数据结合在一起。
研究团队希望使用一个数据库,该数据库可供所有人访问,并创建一个比Google Flu趋势更准确的系统,该趋势具有缺陷。例如,在猪流感期间大流行在2009年以及2012-2013流感季节,Google流感趋势研究人员说,由于对两种疾病的媒体报道的增加,由于媒体报道的增加而变得有些“困惑”,并且高估了流感。
当大流行袭击时,人们会寻找与大流行有关的新闻报道,但这并不意味着他们患有流感。总的来说,基于Internet的估计系统的问题是,几乎不可能告诉人们是否正在寻找有关的信息疾病研究人员说,因为他们生病了。
在新系统中,研究人员试图通过包括许多维基百科文章研究人员在研究中写道:“充当Wikipedia正常使用的一般背景级活动的标志。”但是,就像任何其他基于数据的系统一样,Wikipedia系统与弄清楚与流感有关的信息的实际动机有关的问题并非免疫。
因此,将诸如Google流感趋势和Wikipedia系统之类的系统视为与CDC这样的官方来源数据的补充,这一点很重要。
他说:“我们并不是要创建可以取代疾病预防控制中心或类似物质的东西。”相反,研究人员的目标是“让两者都可以很好地工作,以使我们对正在发生的事情有更全面的看法”。
该研究今天(4月17日)发表在《 PLOS计算生物学》杂志上。
跟随Agata blaszczak-boxe上的叽叽喳喳。跟随现场科学@livescience,,,,Facebook和Google+。原始文章现场科学。