Databricks是一個領先的數據和AI啟動,啟動了DBRX,靈活大語言模型(LLM)這表現優於行業基準的所有開源模型。
DBRX民主化了對全球組織的獨特,高性能LLM的培訓和調整,從而消除了對封閉模型的需求。 DBRX允許企業快速構建,培訓和部署自定義的LLMS。公司的媒體發布。
DBRX由Mosaic AI開發,並在NVIDIA DGX雲上進行了培訓,它使用Megablocks開源項目來改善其混合式Experts(MOE)體系結構。 DBRX為具有領先績效的組織啟用定制且透明的生成AI解決方案,並且可以使競爭性LLM的計算效率增加一倍。
DBRX比Chatgpt好嗎?
在語言理解,編程,數學和邏輯基準中,DBRX的表現優於Llama 2 70B和Mixtral 8x7b之類的開源LLM。 DBRX在關鍵基准上的表現特別優於GPT-3.5,創建了新的開源模型標準。
但是,除了數據庫編程語言開發外,DBRX是在Openai的GPT-4背後在大多數方面,根據TechCrunch的一份報告。
Databricks of Generative AI的Naveen Rao承認DBRX與其他生成的AI模型,可能“幻覺”。儘管進行了安全測試和紅色團隊,但DBRX的答复可能是由於其培訓以將單詞或短語與想法相關聯的培訓而不准確。
DBRX無法評估或產生視覺效果,與最近的旗艦生成AI模型(如多模式)不同。 Rao說,數據鏈球菌利用社區認可的免費數據集來培訓DBRX,但消息來源尚不清楚。
饒只是說,當被問及培訓數據中的版權或偏見問題時,數據助理採取了保障措施並進行了練習以解決模型缺陷。如果生成的AI算法重複有偏見或受版權保護的數據,則用戶可能會面臨道德和法律問題。
Databricks不提供侵權的法律支出,但Rao表示,該業務正在檢查該期權。
考慮到這些考慮因素,一些專家預測,DBRX可能難以吸引Databricks客戶以外的消費者,因為其競爭對手Openai在合理的定價下提供了有趣的技術。此外,許多生成AI模型比DBRX更好地匹配開源的常規定義。
然而,行業領導者承認DBRX對AI創新的破壞性影響。 Accenture的首席AI官Lan Guan讚揚先進的開源模型,而AI2的主要軟件工程師Dirk Groeneveld強調了行業透明度和合作。 Block,Nasdaq,Prosus Group,Replit和Zoom希望使用DBRX改善其AI並擴展。
Databricks擴展超出數據解決方案
DBRX是免費的,可通過GitHub和擁抱面孔進行研究和商業用途。 Databricks平台,AWS,Google Cloud和Microsoft Azure允許企業毫不費力地將DBRX納入其流程中,以最大程度地提高生成AI的特定業務需求。
DATABRICKS宣布,它收購了基於波士頓的應用研究業務丁香,該公司開發了數據理解和操縱工具。
上週,這家總部位於加利福尼亞的人工智能公司公佈了合併丁香的計劃人員和技術根據VentureBeat的說法,進入其數據情報平台,以前是Data Lakehouse。該戰略策略旨在簡化跨領域生產級LLM應用程序的數據集質量增強。
此次收購鞏固了數據解決方案的擴展,以包括所有生成AI領域。由Apache Spark的創建者建立的Databricks在收購丁香時也投資了領先的AI公司Mistral。米斯特拉爾(Mistral)去年舉起了歐洲最大的種子回合,是一位主要的生物AI球員。 Databricks的戰略努力展示了其致力於提供數據管理和生成AI解決方案的奉獻精神。