要知道什麼
- OpenAI 已經有了一種文字浮水印方法,儘管其發布正在「考慮」並在內部進行辯論。
- 最近的報告表明,水印文本不會影響 ChatGPT 的輸出質量,並且該方法對於本地篡改和釋義仍然具有穩健性。
- 但 OpenAI 認為文字浮水印會對非英語使用者產生不成比例的影響,使人工智慧聊天機器人的使用蒙受恥辱,並阻止用戶使用 ChatGPT。
學生使用 ChatGPT 來寫作業對老師和教授來說是一場噩夢。 但看來 OpenAI 可能有辦法判斷給定文字是否由 ChatGPT 產生。
根據華爾街日報,OpenAI 已經有一個系統可以為 ChatGPT 產生的文字添加浮水印。 但它正在考慮是否發布它,理由是涉及的幾個問題和複雜性,並可能推遲那些不想使用人工智慧生成的文本被發現的用戶。
在更新的部落格OpenAI 在其關於人工智慧文字檢測的研究的帖子中指出:“我們的團隊開發了一種文字浮水印方法,我們在研究替代方案時會繼續考慮該方法」。
文字浮水印方法並非沒有問題和複雜性,並且可能會對人工智慧生成的內容產生負面影響。 但該公司聲稱,他們的文字浮水印方法是專門為 ChatGPT 生成的內容開發的,非常準確,誤報率非常低。
據《華爾街日報》報道,「技術…可以以 99% 的確定性檢測人工智慧編寫的文本,「所以水印方式不會影響ChatGPT的輸出品質。
文字浮水印方法的工作原理是稍微調整人工智慧選擇單字的方式,並創建單字和短語出現的可預測模式。
儘管該方法被證明可以有效防止釋義和局部篡改,但 OpenAI 指出“它對全球化篡改的穩健性較差; 例如使用翻譯系統,用另一個生成模型重新措辭,或要求模型在每個單字之間插入一個特殊字符,然後刪除該字符——這使得不良行為者的規避變得微不足道。」
為了解決這些問題,OpenAI 已經開始研究另一種浮水印方法,該方法使用嵌入式元資料並且不會產生誤報,而文字浮水印在應用於大量文字時可能會導致更多誤報。
根據他們的研究,OpenAI 也認為文字浮水印方法對某些群體的影響可能比其他群體更大,並可能導致非母語人士對人工智慧聊天機器人的污名化。
但更重要的是,該公司擔心,如果實施浮水印方法,許多現有用戶將減少使用 ChatGPT。 目前,內部關於是否發布文字浮水印方法的爭論仍在繼續。 至於替代元資料浮水印方法,OpenAI仍處於早期探索階段。 因此,現在判斷方法是否有效還為時過早。