Anthropic宣布推出Claude 3.5十四行诗,这是其AI模型阵容的最新成员,有望提高性能和成本效益。
这新版本这是即将推出的Claude 3.5模型家族中的第一个,旨在为智力,速度和负担能力设定新的行业标准。
拟人化更好,更快的Claude AI模型
根据人类,Claude 3.5十四行诗的表现优于其前身Claude 3 Opus和在一系列评估中的竞争模型。它在研究生水平的推理(GPQA),本科级别的知识(MMLU)和编码水平(HumaneVal)中表现出色,这标志着AI功能的实质性飞跃。
Claude 3.5十四行诗的杰出特征之一是对细微差别,幽默和复杂说明的了解得以提高,使其特别擅长于以自然,相关的语气生产高质量的内容。
它以Claude 3 Opus的速度运行的两倍,提供了性能提升,这对于复杂的任务至关重要,例如上下文敏感的客户支持和策划多步工作流。
此外,该型号的成本仅为成本的一小部分,价格为每百万个输入令牌3美元,每百万个产出令牌15美元,具有200K令牌上下文窗口。
Claude 3.5十四行诗可以在Claude.ai和Claude iOS应用程序上免费访问,Claude Pro和Team Plans用户的利率限制明显更高。
它还与拟人API,Amazon Bedrock和Google Cloud的顶点AI集成在一起,从而扩大了其对开发人员和企业的可用性。
另请阅读:Google DeepMind研究揭示了AI难以写喜剧
Claude 3.5十四行诗具有卓越的解决问题的技能
在内部代理编码评估中,Claude 3.5十四行诗证明了其出色的问题解决能力,解决了64%的问题,而Claude 3 Opus则解决了38%。
评估测试了模型修复错误或基于所需改进的自然语言描述为开源代码库添加功能的能力。
当提供相关工具时,Claude 3.5十四行诗可以独立编写,编辑和执行代码,展示复杂的推理和故障排除技能。它在代码翻译方面的熟练程度使其对于更新旧应用程序和迁移代码库特别有效。
该模型在视觉推理任务中还表现出色,超过了标准视觉基准的Claude 3 Opus。它可以准确地解释图表和图形,并从不完美的图像中转录文本,这是零售,物流和金融服务等行业的宝贵功能。
拟人引入了新的AI功能
为了增强用户互动,Anthropic引入了一项新功能,称为文物在claude.ai上。此功能允许用户在对话旁边的专用窗口中生成内容片段,文本文档或网站设计等内容。
工件创建了一个动态的工作空间,用户可以在其中实时查看,编辑和构建Claude的创作,从而促进AI生成的内容无缝集成到他们的项目中。
至于AI安全,该公司已经与外部专家(包括英国的)互动人工智能安全研究所,以完善模型的安全机制。拟人化还可以确保未经明确许可,维护强有力的隐私原则,未经用户的数据进行培训。
未来发布
展望未来,Anthropic计划在今年晚些时候在Claude 3.5家族中发布更多的AI模型,包括Claude 3.5 Haiku和Claude 3.5 Opus。
该公司还正在探索新功能,例如内存,这将使Claude能够记住用户的偏好和交互历史记录,从而使体验更加个性化和高效。
保持在Tech Times。