要知道什麼
- Mistral AI 推出了名為 Pixtral Large 的新多模態 AI 模型,具有 1240 億個參數。
- 它在 MathVista、DocVQA 和 ChartQA 等基準測試中表現良好,超越了幾個領先的模型。
- Pixtral Large支援多語言光學字元辨識(OCR),可有效分析文件、圖表和影像。
- Le Chat 平台已升級,增加了多項新功能,包括帶有引文的網路搜尋功能以及用於內容編輯的 Canvas 工具。
Mistral AI 透過其最新產品在人工智慧領域引入了重大更新。公司推出像素大號,一個多模態 AI 模型,包括 1240 億參數多模態解碼器和 10 億參數視覺編碼器,可以處理文字和圖像。該模型有一個包含 128,000 個 token 的上下文窗口,使其能夠在一次輸入中處理多達 30 張高分辨率圖像或大約 300 頁的文檔。
Pixtral Large 在各種基準測試中表現良好,在用於數學推理的 MathVista、用於文件問答的 DocVQA 以及用於圖表分析的 ChartQA 中取得了顯著的分數。它超越了多個領先型號,包括 GPT-4o 和 Gemini-1.5 Pro。該模型能夠理解和分析文件、圖表和自然圖像。它還支援多語言光學字元辨識(OCR),增強了其在實際應用中的功能。
Pixtral Large 可以執行分析收據、計算總和並解釋複雜資料視覺化等任務。其設計使其適合需要文件分析和影像理解的環境。
該模型可根據用於學術用途的自訂 Mistral AI 研究許可證和用於商業應用的商業許可證使用。這些功能使 Pixtral Large 成為希望利用 AI 執行資料處理任務的組織的有用工具。
- 下載像素大號來自抱臉
Mistral 也推出了其旗艦純文字模型系列的新版本,米斯特拉爾大號。更新後的模型名為 Mistral Large 24.11,在長上下文理解方面提供了“重大改進”,使其成為文件分析和任務自動化等應用的理想選擇。
與 Pixtral Large 一起,Mistral 也增強了其貓平台。這種生成式人工智慧助理現在可以執行網路搜索,為用戶提供類似於其他人工智慧工具中的引文。
新的「Canvas」工具允許使用者輕鬆編輯和轉換內容,從而無需重新生成即可建立文件、簡報和程式碼。
Le Chat 的功能進一步擴展,現在可以分析和總結複雜的 PDF 文件和影像。此功能對於需要從大量材料中提取資訊的專業人員特別有用。此外,Le Chat 透過與 Black Forest Labs 合作提供了先進的圖像生成功能,允許用戶直接在平台內創建視覺效果。
為了提高效率,米斯特拉爾引入了“代理”,可以自動執行重複性任務,例如費用報告和發票處理。這些功能使樂聊成為現有人工智慧生產力工具的強大替代品,特別是對於尋求有效解決方案的學生和專業人士。所有這些增強功能在測試階段都是免費提供的,允許用戶在公司繼續完善其服務的同時探索 Mistral 的產品。