Anthropic宣布推出Claude 3.5十四行詩,這是其AI模型陣容的最新成員,有望提高性能和成本效益。
這新版本這是即將推出的Claude 3.5模型家族中的第一個,旨在為智力,速度和負擔能力設定新的行業標準。
擬人化更好,更快的Claude AI模型
根據人類,Claude 3.5十四行詩的表現優於其前身Claude 3 Opus和在一系列評估中的競爭模型。它在研究生水平的推理(GPQA),本科級別的知識(MMLU)和編碼水平(HumaneVal)中表現出色,這標誌著AI功能的實質性飛躍。
Claude 3.5十四行詩的傑出特徵之一是對細微差別,幽默和復雜說明的了解得以提高,使其特別擅長於以自然,相關的語氣生產高質量的內容。
它以Claude 3 Opus的速度運行的兩倍,提供了性能提升,這對於復雜的任務至關重要,例如上下文敏感的客戶支持和策劃多步工作流。
此外,該型號的成本僅為成本的一小部分,價格為每百萬個輸入令牌3美元,每百萬個產出令牌15美元,具有200K令牌上下文窗口。
Claude 3.5十四行詩可以在Claude.ai和Claude iOS應用程序上免費訪問,Claude Pro和Team Plans用戶的利率限制明顯更高。
它還與擬人API,Amazon Bedrock和Google Cloud的頂點AI集成在一起,從而擴大了其對開發人員和企業的可用性。
另請閱讀:Google DeepMind研究揭示了AI難以寫喜劇
Claude 3.5十四行詩具有卓越的解決問題的技能
在內部代理編碼評估中,Claude 3.5十四行詩證明了其出色的問題解決能力,解決了64%的問題,而Claude 3 Opus則解決了38%。
評估測試了模型修復錯誤或基於所需改進的自然語言描述為開源代碼庫添加功能的能力。
當提供相關工具時,Claude 3.5十四行詩可以獨立編寫,編輯和執行代碼,展示複雜的推理和故障排除技能。它在代碼翻譯方面的熟練程度使其對於更新舊應用程序和遷移代碼庫特別有效。
該模型在視覺推理任務中還表現出色,超過了標準視覺基準的Claude 3 Opus。它可以準確地解釋圖表和圖形,並從不完美的圖像中轉錄文本,這是零售,物流和金融服務等行業的寶貴功能。
擬人引入了新的AI功能
為了增強用戶互動,Anthropic引入了一項新功能,稱為文物在claude.ai上。此功能允許用戶在對話旁邊的專用窗口中生成內容片段,文本文檔或網站設計等內容。
工件創建了一個動態的工作空間,用戶可以在其中實時查看,編輯和構建Claude的創作,從而促進AI生成的內容無縫集成到他們的項目中。
至於AI安全,該公司已經與外部專家(包括英國的)互動人工智能安全研究所,以完善模型的安全機制。擬人化還可以確保未經明確許可,維護強有力的隱私原則,未經用戶的數據進行培訓。
未來發布
展望未來,Anthropic計劃在今年晚些時候在Claude 3.5家族中發布更多的AI模型,包括Claude 3.5 Haiku和Claude 3.5 Opus。
該公司還正在探索新功能,例如內存,這將使Claude能夠記住用戶的偏好和交互歷史記錄,從而使體驗更加個性化和高效。
保持在Tech Times。