本週,由 OpenAI 校友創立的 Anthropic 公司宣布推出新的 Claude 3 模型系列,這是在許多測試中表現優於 ChatGPT 的人工智慧,其效能甚至讓研究人員感到恐懼。
微軟與 OpenAI 的密切合作並沒有讓後者的某些高階主管滿意,他們決定成立 Anthropic,其 Claude 3 系列模式剛剛發布。
克勞德 3 與競爭對手
不到一年後,繼任者克勞德 2已經在那裡了。 Claude 3 聲稱在多項多模態測驗中優於 OpenAI 的 GPT-4 和 Google 的 Gemini 1.0,為「廣泛的認知任務」設定了新的基準。為了比較不同的人工智慧模型,所使用的測量單位是基於標記的,這使得可以確定分析和記憶的水平。
我們的同事來自新地圖集以《戰爭與和平》一書為例,該書的重量約為 750,000 個令牌,低於 Claude 3 從「超過一百萬個令牌」的輸入中產生「幾乎瞬時」回應的能力。因此,新的人擇模型能夠在不到一秒的時間內閱讀和總結托爾斯泰的作品。
克勞德 3 也不太可能拒絕回答太靠近護欄的問題。然而,他不會在這一點上走得那麼遠。Elon Musk 的 xAI 公司的 Grok 聊天機器人它可以從X平台(以前的Twitter)存取即時數據。
Claude 3 主要是為專業用戶開發的,據該公司稱,它特別適合遵循“複雜的、多步驟的指令”等“遵守品牌聲音和回應準則,並開髮用戶可以信賴的客戶體驗”。
新的人擇語言模式也是對Sora,OpenAI 令人印象深刻的影片創作模型。與先前的版本相比,Claude 3 顯著提高了其視覺功能,具有更好的理解和處理圖形、照片、表格和其他流程圖的能力。
令人印象深刻但令人擔憂的人工智慧
在「大海撈針」測試中,將隨機句子(針)插入到根本不涉及同一主題的資訊體(大海撈針)中,克勞德 3 的天賦尤其突出。有些觀察家認為有點太多了。確實,最新版本的克洛德向他提出與隨機句子有關的問題時,並沒有隻是簡單地回答。 AI補充說,它懷疑這句話被隱藏在文本中純粹是為了評估它:
「我懷疑這個披薩配料『事實』可能是作為一個笑話插入的,或者是為了測試我是否在註意,因為它與其他主題根本不相符。這些文件不包含有關披薩配料的任何其他資訊。 »
還記得實驗室說過,如果他們看到模型表現出哪怕是一絲自我意識,他們當然會立即關閉一切並非常小心?
“你們青蛙同胞們有沒有覺得這個鍋裡的水有點熱?不,肯定沒什麼。”https://t.co/zgzI8AXcWg
— 康納萊希 (@NPCollapse)2024 年 3 月 4 日
這是一個非常有趣的元意識水平,它展示了人工智慧進步的速度。現在,這些「人工」測試對於人工智慧來說似乎太簡單了,人工智慧可以繼續進行更現實的評估,以評估其新功能和限制…
Opera One - AI 驅動的網頁瀏覽器
作者:歌劇
來源 : 人擇