Databricks是一个领先的数据和AI启动,启动了DBRX,灵活大语言模型(LLM)这表现优于行业基准的所有开源模型。
DBRX民主化了对全球组织的独特,高性能LLM的培训和调整,从而消除了对封闭模型的需求。 DBRX允许企业快速构建,培训和部署自定义的LLMS。公司的媒体发布。
DBRX由Mosaic AI开发,并在NVIDIA DGX云上进行了培训,它使用Megablocks开源项目来改善其混合式Experts(MOE)体系结构。 DBRX为具有领先绩效的组织启用定制且透明的生成AI解决方案,并且可以使竞争性LLM的计算效率增加一倍。
DBRX比Chatgpt好吗?
在语言理解,编程,数学和逻辑基准中,DBRX的表现优于Llama 2 70B和Mixtral 8x7b之类的开源LLM。 DBRX在关键基准上的表现特别优于GPT-3.5,创建了新的开源模型标准。
但是,除了数据库编程语言开发外,DBRX是在Openai的GPT-4背后在大多数方面,根据TechCrunch的一份报告。
Databricks of Generative AI的Naveen Rao承认DBRX与其他生成的AI模型,可能“幻觉”。尽管进行了安全测试和红色团队,但DBRX的答复可能是由于其培训以将单词或短语与想法相关联的培训而不准确。
DBRX无法评估或产生视觉效果,与最近的旗舰生成AI模型(如多模式)不同。 Rao说,数据链球菌利用社区认可的免费数据集来培训DBRX,但消息来源尚不清楚。
饶只是说,当被问及培训数据中的版权或偏见问题时,数据助理采取了保障措施并进行了练习以解决模型缺陷。如果生成的AI算法重复有偏见或受版权保护的数据,则用户可能会面临道德和法律问题。
Databricks不提供侵权的法律支出,但Rao表示,该业务正在检查该期权。
考虑到这些考虑因素,一些专家预测,DBRX可能难以吸引Databricks客户以外的消费者,因为其竞争对手Openai在合理的定价下提供了有趣的技术。此外,许多生成AI模型比DBRX更好地匹配开源的常规定义。
然而,行业领导者承认DBRX对AI创新的破坏性影响。 Accenture的首席AI官Lan Guan赞扬先进的开源模型,而AI2的主要软件工程师Dirk Groeneveld强调了行业透明度和合作。 Block,Nasdaq,Prosus Group,Replit和Zoom希望使用DBRX改善其AI并扩展。
Databricks扩展超出数据解决方案
DBRX是免费的,可通过GitHub和拥抱面孔进行研究和商业用途。 Databricks平台,AWS,Google Cloud和Microsoft Azure允许企业毫不费力地将DBRX纳入其流程中,以最大程度地提高生成AI的特定业务需求。
DATABRICKS宣布,它收购了基于波士顿的应用研究业务丁香,该公司开发了数据理解和操纵工具。
上周,这家总部位于加利福尼亚的人工智能公司公布了合并丁香的计划人员和技术根据VentureBeat的说法,进入其数据情报平台,以前是Data Lakehouse。该战略策略旨在简化跨领域生产级LLM应用程序的数据集质量增强。
此次收购巩固了数据解决方案的扩展,以包括所有生成AI领域。由Apache Spark的创建者建立的Databricks在收购丁香时也投资了领先的AI公司Mistral。米斯特拉尔(Mistral)去年举起了欧洲最大的种子回合,是一位主要的生物AI球员。 Databricks的战略努力展示了其致力于提供数据管理和生成AI解决方案的奉献精神。