Meta 毫不猶豫地收集 Facebook 和 Instagram 上共享的出版物來為其生成式人工智慧提供動力。然而,為了保護使用者的隱私,該組織禁止存取包含過多個人資訊的私人訊息和資料集。
日前,Meta 借 Connect 大會之機宣布大量與生成人工智慧相關的新功能。這個加州組織希望人工智慧能夠為其元宇宙注入新的生命,首先揭開了它的面紗。元人工智慧,一個類似 ChatGPT 的聊天機器人。這個對話機器人應該會在不久的將來整合到 Facebook Messenger、WhatsApp 和 Instagram 中。
毫不奇怪,Meta 特別依賴其社交網路上可用的數據訓練聊天機器人背後的語言模型,駱駝2。與之相伴的是 Emu,一種能夠產生影像的人工智慧,如 Adobe Firefly 或 Midjourney。與所有生成式人工智慧一樣,Meta 的模型需要大量資料才能運作並產生回應和影像。
遵循與 Meta 相同的邏輯,亞馬遜也利用客戶與 Alexa 的對話來為其人工智慧提供支持。這項政策多年來一直有效,允許該公司收集用戶的所有語音請求,以供 Alexa 教師模型使用。 Meta 的做法並不令人意外。
元設定限制
在接受路透社同事的詢問時,Meta 負責全球事務和傳播的副總裁尼克·克萊格 (Nick Clegg) 指出,僅公開出版物在Facebook等Instagram被收集來訓練人工智慧。該官員表示,這些數據包括文字和圖像。
幸運的是,私人訊息與家人和朋友的交流並沒有被 Meta 所吸引。同樣,Messenger、WhatsApp 或 Instagram 上的私人聊天也被排除在資料語料庫之外。無論如何,在訊息服務上交換的訊息都是完全加密的。顯然,Meta 無法存取訊息內容。
“我們試圖排除個人資訊占主導地位的數據集”尼克·克萊格解釋說,他指出,推動人工智慧發展的大部分數據都是可供公眾訪問的。
此外,Meta 解釋說,已經照顧到過濾私人數據其人工智慧模型吸收的公共資訊體。事實上,就像所有開發人工智慧模型的巨頭一樣,這家加州集團實際上利用了其平台之外的數據。
不要碰 LinkedIn
例如,門洛帕克巨頭並沒有觸及微軟專業社群網站Linkedin上可見的資料。 Meta 認為該網站上存在太多敏感數據,這代表隱私風險以及對私人生活的尊重。在那裡我們可以找到有關網路使用者的專業背景及其技能的資訊。這是惡意個人手中的潛在危險資料。
最後,Meta 授予自己使用聊天機器人與用戶的未來互動來改進模型的權利。與 OpenAI、Google 等公司一樣,Meta 將使用查詢來提高聊天機器人的精確度。
Opera One - AI 驅動的網頁瀏覽器
作者:歌劇
來源 : 路透社