Skip to content
  • 熱門
  • 趨勢
  • 精選

Forgot Password?

← Back to login
世界圖譜
世界圖譜
  • 熱門
  • 趨勢
  • 精選
登入
訂閱
世界圖譜
世界圖譜

Elon Musk 的 Grok 3 vs ChatGPT vs DeepSeek:哪个是当今最好的人工智能聊天机器人?

  • 2025-02-20
  • Elinore

埃隆·马斯克的 xAI 终于发布了其新的 AI 模型表示,其性能优于 OpenAI、DeepSeek 等形式的竞争对手。但它能实现吗?

凭借新的推理功能和更强的计算能力,Grok 3 已经取得了长足的进步,但人工智能专家仍对其前景持观望态度。让我们看看它与现有的顶级人工智能模型相比如何。

Mariia Shalabaieva/Unsplas

马斯克在一次发布会上透露了 Grok 3 系列X 上的直播,介绍 Grok 3 Reasoning(测试版)和 Grok 3 Mini Reasoning。与传统的生成式人工智能模型不同,基于理性的人工智能能够“思考”问题,最大限度地减少错误信息或幻觉的可能性。这是增强人工智能可靠性和准确性的一个重要里程碑。

xAI 声称 Grok 3 在关键基准测试中优于 OpenAI 的 o1 和 DeepSeek-R1。在Chatbot Arena的盲测中,代号“巧克力”的Grok 3排名靠前,证明尽管其进入市场较晚,但已经赶上了行业领导者的步伐。

ChatGPT 会被废黜吗?

人工智能先锋安德烈·卡帕蒂,OpenAI 创始成员、前 Tesla AI 总监测试了 Grok 3 并分享了他的见解。

据他介绍,具有深度搜索推理功能的 Grok 3 可以与 o1-pro(200 美元/月)等 OpenAI 顶级模型相媲美,并且性能略优于 DeepSeek-R1。

尽管取得了这些进展,Karpathy 并不认为 Grok 3 足以让用户取消其 ChatGPT 订阅。

AI 教授 Ethan Mollick 回应了这一观点,他表示:“Grok 3 的出现符合预期”,并补充说计算能力和速度仍然是 AI 开发的关键差异化因素。

xAI 基准争议:他们是否过度炒作了 Grok 3?

Grok 3 的性能图表迅速走红,显示其性能优于主要竞争对手。然而,OpenAI 的 Rex Asabor 对这些说法提出了质疑,并分享了一张“更新”的图表,显示在数学和科学基准测试中击败 Grok 3。

虽然 OpenAI 的 o3 尚未公开,但这种比较为 xAI 的说法增添了一层怀疑。

平心而论,xAI 在运行测试时可能并不了解最近的 OpenAI 基准测试分数。然而,这提醒人们,人工智能竞赛还远未结束。

Grok 3 的指数级增长:冰山一角?

尽管有人质疑,Grok 3 的快速发展是不可否认的,可混搭写入。Google 和 OpenAI 在开发方面领先了多年(分别为 13 年和 8 年),而 xAI 于 2023 年问世。尽管如此,Grok 3 已经作为领先的 AI 模型加入了讨论。

马斯克还表示,Grok 3 的训练计算能力是 Grok 2 的 10 倍,使用了 20 万个 GPU。这重申了计算量增加会增强人工智能性能的一般规则。

然而,加里·马库斯(Gary Marcus)等研究人员确实质疑,扩大计算规模是否会进一步将人工智能智能提高到一定阈值以上。

Grok 3 的局限性:仍在进行中

尽管 Grok 3 已经取得了长足的进步,但它仍然遇到许多与其他 AI 模型相同的问题:

  • 幽默能力较弱:与许多 AI 模型类似,Grok 3 产生幽默的能力较差,经常讲乏味的爸爸笑话。
  • SVG 图像生成挑战:AI 模型通常很难定位复杂的视觉元素。 Grok 3 的性能优于 Gemini 1.5 Flash 等替代品,但仍然存在空间关系问题。
  • 政治偏见问题:马斯克将 Grok 定义为“反觉醒”的人工智能模型,与因政治正确性而受到批评的人工智能模型相对应。但卡帕蒂发现 Grok 3 不会讨论一些道德挑战,这可能使其比马斯克的观众所希望的更加“过于敏感”。

马斯克过去曾指出,早期的 Grok 模型偏左,因为公开的培训材料往往偏左。他发誓,未来的更新将使 Grok 在政治上更加中立。

最好的选择是什么?

Grok 3 首先向 X Premium+ 订阅者提供,该计划最近涨至每月 50 美元。虽然该模型取得了重大进展,但可能还不足以推翻 OpenAI 的 ChatGPT 和 DeepSeek,后者是

对于人工智能和马斯克的粉丝来说,Grok 3 是人工智能领域的一个受欢迎的补充。但对于任何寻求最佳 AI 模型的人来说,Grok 3 目前可能还不足以让用户从行业顶级参与者转向。

在另一篇评论中解密,Grok-3 比其他 AI 聊天机器人允许更多的“言论自由”。当谈到编码时,它“只是比其他的更好”。然而,在数学推理中,OpenAI 和 DeepSeek 仍然是更好的聊天机器人。

相關貼文

Apex Fusion宣布发射Prime Chain和AP3X令牌

Apex Fusion宣布发射Prime Chain和AP3X令牌

Openai的Sam Altman预测爆炸性AI增长,因为成本每年将下降10次

Openai的Sam Altman预测爆炸性AI增长,因为成本每年将下降10次

韩国 K3 坦克是世界上第一个氢气罐,由现代制造,用于静音、隐形任务

韩国 K3 坦克是世界上第一个氢气罐,由现代制造,用于静音、隐形任务

Gemini AI关于iOS的最新更新,新功能显示Siri如何完成

Gemini AI关于iOS的最新更新,新功能显示Siri如何完成

特朗普声称台湾窃取了美国芯片产业,一旦他担任总统,他们将被征税

特朗普声称台湾窃取了美国芯片产业,一旦他担任总统,他们将被征税

据报道,苹果正在为传闻可折叠的iPhone开发芯片,该iPhone专注于电池寿命

据报道,苹果正在为传闻可折叠的iPhone开发芯片,该iPhone专注于电池寿命

《堡垒之夜 x 细胞分裂》联动即将到来?新的泄密声称著名的汤姆克兰西射击游戏仍然遥远

《堡垒之夜 x 细胞分裂》联动即将到来?新的泄密声称著名的汤姆克兰西射击游戏仍然遥远

Nintendo Switch 2谣言戏弄春季发布:这些线索可以回答您的好奇心

Nintendo Switch 2谣言戏弄春季发布:这些线索可以回答您的好奇心

三星粉丝反击:请愿书要求蓝牙S笔为Galaxy S26 Ultra返回

三星粉丝反击:请愿书要求蓝牙S笔为Galaxy S26 Ultra返回

熱門閱讀

  • 如何阻止 LinkedIn 根据您的数据训练其 AI 模型 2024-11-08
  • 三星 Galaxy 拆箱活动大肆宣传并带来全新 Galaxy S25 系列等 2025-01-10
  • SATA SSD 与 NVMe 磁盘:找出这些硬盘中哪一个值得购买! 2022-01-05
  • 如何自定义 MacBook Touch Bar 2022-08-02
  • 2025 年下载适用于 Windows 10 的 Internet Explorer 11 2025-01-25
  • Windows 11 KB5028245:您应该了解的最新更新 2023-07-26
  • 没有电话3A计划发布:价格,功能和完整详细信息 2025-02-03
  • Safari for Vision Pro 用户很快将获得空间照片和视频支持 2024-10-27
  • Android 和 iOS 上 15 款最佳消磨时间游戏 2025-04-07
  • 如何在 Android 上下载 YouTube 视频以便在没有互联网的情况下离线观看 2024-12-28

上升趨勢

  • 昆士蘭州洪水中的bilbies“會很好” 2025-04-17
  • 橙色後機:Livebox 6已經回來了 2025-04-18
  • “但是是什麼?” »:特朗普將馬斯克排除在與中國戰爭的秘密簡報之外 2025-04-18
  • 唐納德·特朗普(Donald Trump)在半導體上收緊絞索...對美國經濟的冒險賭注 2025-04-18
  • 它將像熱門蛋糕一樣銷售:Redmi Note 14 Pro以令人難以置信的價格( 2025-04-18
  • 這是Moing V,第一個折疊式閱讀器 2025-04-18
  • 高速公路上的150 km/h在AI幫助下,這是合理的嗎? 2025-04-18
  • 有了這個項目,MG希望以不到20,000歐元的價格出售電動汽車 2025-04-18
  • 個性化您的三星星係以前從未有過:最終在Google Play上的終極工具 2025-04-18
  • 騙局,深擊,加密貨幣:Google在2024年封鎖了51億個廣告 2025-04-18

最近發布

  • Kuniskis说RAM 1500 RAMCHARGER推迟到H2 2025 2025-02-25
  • 到 2025 年,大多数家庭将不得不多花几十欧元 2025-01-19
  • Mopar Canada发布了Mopar '25 RAM 1500 RHO的定价 2025-03-11
  • 尽管第四季度前景令人失望,分析师为何仍看好 Roku 2024-11-09
  • 印地赛车公告意味着顶级自由球员将无法获得全职骑行机会 2025-01-17
  • 宾夕法尼亚州人迹罕至的餐厅,值得一日游 2024-10-02
  • 濒临灭绝的蝴蝶不仅受益,而且在飓风之后蓬勃发展 2025-02-09
  • 电信软件:效率和服务交付的游戏规则改变者 2024-12-11
  • 蜘蛛侠:为什么汤姆·赫兰德与漫威的合作还远未结束 2021-11-30
  • 是什么使一级方程式电路变得困难?探索3个主要因素 2025-01-31

Copyright © 2024 世界圖譜

  • 關於本網站
  • 隱私權政策
  • 服務條款
  • 世界圖譜