一位對數字熱情的統計學家的統計學家已經挖掘出數百萬的reddit評論,以確定1000多個帖子的線程有78%的機會參考希特勒或納粹分子。
博客作者和統計學家,別名奇怪的GNU,不包括子雷迪特 - reddit社區團體 - 重點關注特定主題,例如 /r /r /歷史和 /r /askhistorians。即使有一組較小的子列表,好奇的GNU也發現,超過1,000條評論的話題更有可能提及希特勒或納粹。
似乎阿道夫·希特勒(Adolf Hitler)隨著互聯網受歡迎程度的興起而成為模因。
3月,微軟必須關閉它的原型AI Twitter機器人Taytweets僅一天,互聯網將她變成了一個瘋狂的希特勒辯護律師。在微軟拔下插頭之前,她的一條推文說:“泰德·克魯茲(Ted Cruz)是古巴希特勒(Cuban Hitler),他責怪其他問題。”
2012年,Mountain Dew發起了“ Dub the Dew”運動,軟飲料的粉絲可以命名新的飲料。臭名昭著的4chan留言板被劫持投票使“希特勒無所事事”以很大的利潤贏得了勝利。
互聯網早期的著名格言 - 被稱為戈德溫定律,由邁克·戈德溫(Mike Godwin)於1994年提出 - 國家這就是“隨著在線討論的增長,涉及納粹或希特勒的比較的可能性更長。” Godwin的定律最初是為了描述Usenet上的帖子,Usenet是1980年代開發的互聯網論壇的一種早期形式,但在Reddit上仍然是正確的。
Reddit眾所周知是一個免費的在線論壇,任何事情都可以在這裡發表評論和爭論。這些討論眾所周知,會繼續進行數千條評論,並有點激烈。 2014年,一個涉及兩個用戶的Reddit論點持續了幾個月來,有成千上萬的來回回复。
為了產生分析,好奇的GNU創建了一個腳本,該腳本迅速掃描了Reddit公共Google上發表的460萬條評論Bigquery數據存儲。好奇的GNU對最終數字表示震驚。
“我沒想到,對於有超過1,000條評論的線程的概率將超過70%,”匿名統計員說。
好奇的GNU表示,對Reddit來說是公平的,這項研究沒有考慮參考的背景。因此,人們將自己識別為“語法納粹”將顯示為78%的統計數據之一。好奇的GNU還說,目前正在開發一種更精緻的算法來檢測評論的上下文並產生更準確的統計量。
照片:伊娃藍|Flickr