在Ellen DeGeneres導致Twitter暫時遇到技術問題之前,她的史詩般的團體自拍在不到一天的時間內轉發了近200萬次,這是一項安靜的研究增加了另一個角度,這是Twitter如何發展的另一個角度。
它可以預測艾滋病毒爆發。
新的學習說,通過跟踪推文和映射它們的來源,可以預測與毒品使用和性風險有關的行為,並確定有問題的地理區域,這將使衛生當局能夠防止爆發爆發。
這項研究由加州大學洛杉磯分校大衛·格芬醫學院家庭醫學助理教授肖恩·揚(Sean Young)領導。 Young還在UCLA創立了數字行為中心,他目前擔任聯合導演。
該中心研究社交媒體和移動技術,以及如何用於預測和改變行為。該中心通過與來自不同學科的其他學術研究人員以及私營部門公司合作來實現這一目標。
在這項研究中,在2009年5月26日至12月9日之間收集了大約5.5億條推文。在推文中創建了一種算法,以查找與風險行為有關的詞語和短語,例如“性別”或“性別”。然後將這些標記的推文繪製在地圖上,以確定艾滋病毒案例數量最高的區域是否與標記的推文相同。
發現超過8,000條推文包含表明性風險行為的單詞,1,342條建議使用刺激性藥物。將這些推文的地理起源與AIDSVU.org可用的交互式在線地圖上的2009年艾滋病毒案例的地理數據進行了比較。研究人員發現了這條推文與在線地圖上的數據之間存在顯著關係。
加利福尼亞州作為該州的榜首,其中與HIV相關的推文比例最高,為9.4%。得克薩斯州以9.0%的成績排名第二,紐約以5.7%的速度排名第二,佛羅里達州為5.4%。當涉及人均比例時,哥倫比亞特區成為了最大的與HIV風險相關的推文的原始數量。其次是特拉華州,路易斯安那州和南卡羅來納州。
這項研究是在較早的研究中使用相同方法發表了有關通過Twitter跟踪流感爆發的發現的。約翰·霍普金斯大學(Johns Hopkins University)的研究人員提出了一種過濾推文來監測病例和流感傳播的方法。 2011年,在PLOS One發表了一項研究,揭示了Twitter在AH1N1大流行期間如何用於跟踪感染和公眾關注的水平。該方法還優化了使用關鍵字來識別大流行有關的推文。
Twitter每天從近2億個註冊用戶那里處理估計的3.4億條推文。實時生成的大量社交媒體數據,也稱為“大數據”,可能對公共衛生管理具有一些重要的新含義。
Young說:“最終,這些方法表明,我們可以使用社交媒體中的'大數據'來遠程監測和監視HIV風險行為和潛在爆發。”