这只是 DIY,但它也许是对个人助理未来的第一次展望。 Mate Marschalko 是一位开发人员,他无疑厌倦了 Siri 为他提供的答案,他想到了一个绝妙的主意:测试 ChatGPT,通过语音控制他的联网家庭。
在 Reddit 和 YouTube 上发布的一段视频中,他展示了他的实验结果——绝对令人震惊——这让谷歌、苹果和亚马逊的助手再次陷入困境。
如果你经常使用 Siri、Google Assistant 或 Alexa 来控制你的灯泡、散热器和其他连接的物体,你一定已经意识到你必须适应它们。换句话说,执行非常基本的命令:“打开客厅的灯”、“打开暖气”、“关闭电视”。让他们理解更复杂的请求是不可能的,因为他们很快就会失去控制。
Marschalko 的工具是一个游戏规则的改变者,它结合了 ChatGPT 和 Apple 的“Shortcuts”应用程序的功能,在一小时内构建完成。并正确解释比所有 GAFA 助手都复杂得多的请求。举个例子?这个请求显然会给传统语音助手带来麻烦:“我妻子 15 分钟后到。当她去公园时,为她打开外面的灯。» 程序毫无问题地理解了,助手自豪地回应:“当您的客人到达时,灯应该亮起。”甚至这个也受益于 ChatGPT 的知识:“将卧室的暖气调节至您认为可以帮助我睡得更好的温度”。助理反驳道:“房间恒温器设置为 19 度。祝您睡眠愉快!”。极致的精致,助手每次的反应都不同,几乎就像是活生生的一样。
程序……没那么复杂
为了将他的十几盏灯、恒温器、通风系统和摄像头连接到 ChatGPT,他分两个阶段进行。首先,我们必须“指导”ChatGPT。它的长查询(见下文)看起来就像一个用自然语言编写的小型计算机程序。
因此,Marschalko 要求 ChatGPT 以 JSON 的形式响应每个请求,这是一种著名的数据结构格式,很容易被 iOS Shortcuts 应用程序理解。然后,他描述了必要的查询类型,定义了 ChatGPT 必须生成的 JSON 结构,最后提供了他的房子以及每个房间中连接对象的精确描述。就是这样。哦对了,他还问了机器人假装是“房子的大脑,一个智能人工智能,但没有透露其真实身份。»
然后他在 iOS 上设置了一个新的快捷方式,看起来像是之前的快捷方式的增强版。几天前我们向您描述过。这一系列命令冗长且相当复杂,允许您通过 Apple 的 HomeKit 平台使用 JSON 格式的数据与连接的对象进行交互。
现在(还)还没有
Marschalko 的黑客技术巧妙且高效,但也并非没有缺陷。首先是价格。该解决方案需要通过其 API 访问 ChatGPT,因此……即使 OpenAI 提供(少量)免费信用,也是付费的。但这里很快就耗尽了,因为查询很长。据程序员称,每 70 个请求大约需要 1 美元。然后就是……缓慢。因此,该视频可能会令人困惑,因为 ChatGPT 似乎响应很快。然而,它已经被安装了:在语音命令和机器人响应之间存在不可压缩的几秒钟延迟。
然而,我们希望苹果、谷歌或亚马逊也能考虑利用生成式人工智能来提高其语音助手的相关性。随着 ChatGPT 的出现,这一点已经变得相当陈旧了。
来源 : Mate Marschalko 博客