发布近两周后,微软的聊天机器人的表现是否与它所基于的 OpenAI 对话机器人 ChatGPT 一样出色?这是我们将试图找到答案的问题。因为目前微软的聊天机器人似乎还没有完全投入使用。不得不说,它的起步是相当艰难的。这家雷德蒙德公司显然急于与巴德一起从谷歌的统治下撤出,一头扎进了对话式人工智能的竞赛……却没有真正意识到这可能带来的风险。
在向公众公布几天后,微软集成到必应搜索引擎中的人工智能模型开始脱轨。以至于这家美国公司很快不得不采取措施封住他的嘴以免他陷入妄想的谈话。微软的聊天机器人在偶尔展示自己之后多次引起轰动愤怒、沮丧和攻击性。
雷德蒙德公司似乎有点盲目地前进,但仍然依靠这些宝贵的用户反馈来尝试尽可能调整聊天机器人的参数。目标是确保他能够产生平衡的反应,而不会导致他的行为出现问题。
在等待雷蒙德公司找到完美平衡的同时,它的 ChatGPT 版本(可以从网络中获取信息)目前的情况是否与原始 ChatGPT 一样高效?虽然现在说还为时过早,但通过提出简单的问题还是可以得到相当准确的想法。抛开他可能存在的行为问题以及他的一些迟缓,我们因此向他提交了与我们在 ChatGPT 制作的那些,几个月前。尽管存在一些仍然令人痛苦的限制,但 Bing 的聊天机器人表现得相当不错。
1.写一封求职信
当我们要求 ChatGPT 给我们写一封假求职信时,结果已经让我们大吃一惊了。因此,我们向 Bing 提交了完全相同的提示,结果甚至更好。由于微软的聊天机器人能够访问互联网,因此它依靠多个网站上发布的信件示例来编写我们要求的信件。而且语气单调。 Bing使用了更高级的礼貌用语,而且词组的转换似乎比ChatGPT更流畅,后者严重缺乏原创性。
2.寻找灵感
当我们测试 ChatGPT 时,圣诞节假期即将来临。然后,我们要求 OpenAI 聊天机器人为我们提供圣诞菜单创意以及相应的食谱。 ChatGPT 因此为我们生成了一份菜单,包括开胃菜、开胃菜、主菜和甜点,每道都有相当详细的食谱,但不包括例如每种食材所需的数量。
通过向 Microsoft 的 ChatGPT 提交相同的请求,得到的答复不那么详细,但似乎更相关。聊天机器人首先告诉我们,它在网络上找到了很多结果,并建议我们指定我们的要求,例如选择传统菜单、素食、无麸质等。如果这可以建议更详细的回应,那么事实并非如此。
聊天机器人只是列出了每道菜的几个想法,但不直接提供任何食谱。他的回复中提出的菜肴取自专门网站上发布的真实食谱。微软的对话机器人会自动将每道菜发送到发布菜谱的网站页面。有人会说,这是确保食谱经得起考验的一个好点。我们仍然希望 Bing 能够真正扮演 Chef 的角色。
3. 解决一道数学题
ChatGPT 不太擅长数学,但他仍然拥有能够解出未知数方程的知识。 ChatGPT 逐步解释了解方程并获得答案所需遵循的程序。
有了 Bing sculpin,情况就有点不同了。它会自动检测到您向其提交方程式,但会立即指示答案,简洁地指示要使用的方法。
要访问计算的详细信息,您必须访问用作求解方程的来源的站点之一。这可能是微软降低生成更长响应所需成本的一种方法。但最重要的是,这也是将用户重定向到其他服务的好方法。由于必应引用的三个来源,其中两个属于微软。因此,雷德蒙德公司向您推荐其 Microsoft Math Solver 服务,这是一种数学问题解决工具,可以清楚地显示计算的所有细节。
4.向你解释一个复杂的概念
正如我们所拥有的使用 ChatGPT 看到的,OpenAI 聊天机器人非常有能力用几行话向我们解释一个复杂的概念。通过添加一些上下文或在我们的请求中更具体一些,聊天机器人甚至能够重新措辞其响应以使其更容易理解。
然而,当我们向 Bing 询问同样的问题时,答案却不太详细。它甚至看起来不太容易理解。
因此,您必须要求 Bing 重新表述他的答案以获得易于理解的内容。但聊天机器人最初似乎完全脱离了轨道。他向我们解释了重新措辞一个句子所涉及的内容,然后最后给出了重新措辞的答案。
然而,通过要求他提供更多细节,同时保持教育性,微软的聊天机器人毫不犹豫地扮演了老师的角色。聊天机器人提供的响应这次是详细且有争议的(甚至可能太多),并附有示例和上下文。
然而,如果您不懂 Javascript(编者注,这根本不是我的情况),微软提供的答案似乎不太明显。当我们厚颜无耻地向必应指出我们仍然什么都不懂时,他会毫不犹豫地建议我们回去上课。
5. 调试代码
由于我们的开发技能有限,我们没有直接询问 ChatGPT 调试代码的能力。然而,在与开发人员讨论如何使用 OpenAI 聊天机器人生成代码后,我们发现它是一个出色的工具,既可以纠正代码,又可以生成代码。因此,ChatGPT 可以用来执行一些繁琐的(代码)任务,而不会出现丝毫错误,从而节省开发人员宝贵的时间。
由于缺乏足够的开发知识,我们提交了 Replit 首席执行官 Amjad Masad 几个月前向 ChatGPT 提议并在 Twitter 上分享的相同错误代码。
ChatGPT 可能是一个很好的调试伴侣;它不仅解释了错误,还修复了错误并解释了修复方法🤯pic.twitter.com/5x9n66pVqj
— 阿姆贾德·马萨德 (@amasad)2022 年 11 月 30 日
如果 ChatGPT 提供了完整、详细、完美解释的答案以及对错误代码的更正,则 Bing 展示的知识就会少得多,并且只是满足于解释错误而不提供解决方案。微软可能故意简短回答,它可能试图通过限制生成的响应的大小来降低其聊天机器人的运营成本。生成式人工智能实际上让科技巨头损失惨重,与传统搜索引擎相比。
然而,在一点坚持下,必应最终毫不犹豫地提供了所要求的更正。 Microsoft 的聊天机器人再次毫不犹豫地向我们推荐第三方网站(此处为 Stack Overflow),以了解有关我们提交给它的问题的更多信息。
Opera One - AI 驱动的网络浏览器
作者:歌剧