微軟的新人工智慧能夠發現好笑話
飛出個未來/二十世紀福斯
儘管電腦能夠在短短幾秒鐘內處理數百萬個數字,但它們並不以具有深厚的情感或幽默感而聞名——直到現在。 一個新的微軟開發的系統經過訓練,可以發現正在進行的最有趣的提交內容紐約人卡通字幕比賽。 事實上,該軟體的開發部分是出於需要,大量條目湧入,人類編輯無法應對。
“每週查看 5,000 個字幕條目的過程通常會在大約兩年內摧毀[我的編輯助理]的思維,然後我會得到一個新的,”紐約人漫畫編輯鮑伯·曼考夫向彭博解釋。 “這有點令人畏懼。這就像雪盲一樣;你的幽默失明了。”
這就是曼考夫一直與微軟研究人員 Dafna Shahaf 和 Eric Horvitz 合作開發新的幽默敏感人工智慧軟體的原因。 當然,該程式需要接受哪些有趣、哪些不好笑的訓練,因為它沒有天生的感知力來判斷什麼是有趣的:透過輸入數千條之前提交的內容,人工智慧獲得了一個包含先前回應的大型資料庫。
然後還有一個問題,就是讓軟體準確地識別卡通所描繪的內容——如果它要為其挑選一個標題,這一點至關重要。 為了解決這個問題,研究人員選擇了一系列關鍵字,分成兩組——上下文和異常——這為人工智慧引擎提供了足夠的數據來處理。 在最終的計算中,計算機在選擇最有趣的標題方面不如人類編輯那麼好,但它足以過濾掉糟糕的笑話,使其變得有用。
標題的複雜性、可讀性、其中的情感、專有名詞和不定冠詞的數量等因素都被用來衡量一個笑話是否真的有趣。 在研究結束時,團隊估計每周至少有 2,200 份提交作品可以從比賽中被淘汰,而不會面臨丟棄潛在寶石的風險。 “我確實認為未來是人機陪伴”曼考夫說。“計算機可以提供很大的幫助。”
對於微軟來說,長期目標是達到一個階段,讓軟體能夠想出自己的笑話(當然是基於以前的俏皮話的龐大數據庫,而不是最初的想法)——這將使應用程序,例如科塔娜相處起來更愉快。 這是一種改變,不再需要擔心機器人崛起並接管文明。 如果我們能夠防止類似的事情再次發生,那麼這一切都是完全值得的:
研究人員的努力正在 8 月 13 日悉尼 KDD 數據會議上進行展示,官方報告也已發布線上發布。