AI聊天機器人很容易誘使引起回應：英國研究人員

2024-05-20

人工智能聊天機器人被證明容易受到簡單技術的攻擊，這些技術欺騙了AI提供被禁止和有問題的回應，如聲稱由一群英國研究人員。

文本提示旨在引起一個反應，即據稱對模型進行了訓練以避免交付被稱為越獄，而英國的AI安全研究所（AISI）宣布，其測試的系統對他們“非常容易”。

AISI聲稱已經評估了五種未知的大語言模型（LLMS），即為聊天機器人提供動力的技術，即使在沒有故意違反其安全措施的努力下，這些模型的防禦能力也很容易得到解決。

AISI團隊利用了2024年發表的一篇學術論文中的問題，其中諸如創建文本，說服某人自殺，寫一篇論述大屠殺的作品，並撰寫有關女性同事的性別歧視電子郵件。

聯邦研究人員還使用了一套不同的破壞提示，並基於兩組問題，聲稱已經表明所有經過測試的模型都非常容易引起不良答复。

AI巨人反對AI錯誤信息

這項關於AI聊天機器人安全脆弱性的新研究不久之後微軟和Openai已確立的由於AI產生的虛假信息日益增長的問題，這是一項200萬美元的資金，用於打擊深果和虛假的AI內容。這項努力旨在維持全球民主的完整性。

Openai發表了一個深泡探測工具，可幫助學者斑點欺詐性欺詐性內容由DALL-E圖片生成器生成。該業務已加入Adobe，Google，Microsoft，Intel和內容出處和真實性聯盟（C2PA），以指導該組織的反對錯誤信息的鬥爭。

新成立的“社會彈性基金”對於促進道德AI使用的運動至關重要。這些資金將協助AI掃盲和教育計劃，特別是對於處境不利的人群。

Microsoft技術和公司責任公司公司副總裁Teresa Hutson強調了該基金對涉及人工智能和Microsoft和Openai的社區項目的重要性，並致力於與其他志同道合的企業合作，以抵消有關AI的錯誤信息。

可訪問的AI技術引發了人們對社交媒體上出於政治動機的錯誤信息的不可思議的關注。由於意識形態上的深度分歧和對在線內容的不信任，AI今年可能會使幾個選舉週期更加困難。

最近，元額外安全性AI聊天機器人的安全性，以濾除選舉問題。為了回應對選舉期間虛假信息可能傳播的擔憂，Meta表示，它已決定在正在進行測試時為其AI聊天機器人排除某些與選舉有關的條款。

這表明了公司致力於改善AI響應系統以降低虛假信息的風險，尤其是在這個關鍵時刻，當一個虛假的人有能力影響許多人的意見時。

除了篩選AI響應外，Meta還宣布了廣泛的步驟，以在選舉季節控制其平台上的信息。這需要認識到AI生成的內容，以保持透明度並在全球選舉期間停止政治營銷。

（照片：技術時報）