Stability AI 是能够生成图像的机器学习模型背后的公司,刚刚宣布推出新的开源语言模型 StableLM。目前提供 alpha 版本,StableLM 有两个版本:一个集成了 30 亿个参数,另一个集成了 70 亿个参数。 Stability AI 并不打算就此止步,它已经表明其他具有 150 亿和 650 亿参数的模型即将到来。通过推出其语言模型套件,Stability AI 旨在让尽可能多的人能够使用人工智能驱动的技术。
更小但更专业的语言模型
Stability AI 在其博客文章中解释说,其不同的语言模型可以生成文本和代码,并且它们将用于制作动画“一系列应用”。稳定性人工智能希望证明“小型且更高效的语言模型可以通过适当的训练提供高性能»。
该公司表示,为了组建 StableLM,它依赖于“基于 The Pile 构建的新实验数据集”,但比这个大三倍。提醒一下,The Pile 是一个大小超过 800 GB 的数据集,其中包含用于训练语言模型的不同文本语料库。得益于这些丰富的新数据,Stability AI 可确保 StableLM 提供性能“出奇的高» 尤其是在编码任务中。即使对于集成 3 到 70 亿个参数的较小模型也是如此。相比之下,为免费版 ChatGPT 提供支持的语言模型 GPT-3 有 1750 亿个。

«语言模型将构成我们数字经济的支柱,我们希望每个人都对其设计有发言权» 在其博客文章中表示 Stability AI。
StableLM 语言模型已经可以在稳定性 AI 的 Github。该公司表示将很快发布完整的技术文档,以便有意愿的开发人员和研究人员可以做出贡献。您现在可以通过以下地址测试具有 70 亿个参数的 StableLM 版本:在此页面上。
该公司还宣布正在启动一项参与式强化学习计划,并希望利用 Open Assistant 等社区工作创建一个可用于人工智能助理的开源数据集。
Opera One - AI 驱动的网络浏览器
作者:歌剧
来源 : 稳定性人工智能