ChatGPT 4 准备好取代医生了吗？

该书由哈佛大学计算机科学家兼博士 Isaac Kohane 博士在记者 Carey Goldberg 和微软研究副总裁 Peter Lee 的帮助下共同撰写，重点关注人工智能的影响关于医学。

作为他研究的一部分，生物医学研究人员测试了GPT-4，GPT 语言模型的最新更新，为 ChatGPT 提供支持。 3 月份宣布，GPT-4 仅适用于付费订阅者聊天GPT Plus目前。这位医生指出，他已经“提前接触”人工智能来进行实验。

另请阅读：ChatGPT 最糟糕的情况——研究人员将人工智能推向极限

ChatGPT已通过医疗执照

为了测试 AI 的极限，Isaac Kohane 向美国医疗执照考试提出了 ChatGPT 4 问题，该考试计划可让您获得医疗执照在美国。这个三步计划赋予了在美国土地上从事医疗职业的权利。它评估涵盖大多数医学学科的知识，从生物化学到诊断推理。所有美国医学院都会在学生学习期间组织考试。第一阶段大约需要两年学习完成，第二阶段需要四年学习，第三阶段需要成为一名医生。

第一个观察结果：GPT-4 设法正确响应程序中90%的问题。该语言模型比之前版本的人工智能 GPT-3.5 有效得多。二月测试，AI获得了60%的平均分，还算及格。具体来说，机器人获得的分数在52.4%到75%之间。 GPT-4 更新显着改善了聊天机器人的结果。哈佛医学院生物医学信息学系主任补充道，他甚至比一些医生做得更好。

正如研究人员在他的书中所解释的那样，ChatGPT 还因其附加功能而脱颖而出。在测试过程中，聊天机器人的表现非常出色，这要归功于他作为翻译的才华。他能够翻译一位用葡萄牙语说话的患者提供的信息。 AI还以清晰易懂的解释回应患者。对话机器人能够帮助医生与患者沟通，避免使用技术术语等。

ChatGPT 可以模仿医生

然而，ChatGPT 4 与其前身一样，无法理解医疗信息和概念。它只是根据可用数据生成答案。对于《医学中的人工智能革命》一书的作者来说，聊天机器人可以模仿医生成功诊断的方式。

为了得出这个结论，艾萨克·科哈内（Isaac Kohane）医生向生成人工智能提交了几个案例，其中包括他几年前遇到的一个婴儿的案例。根据超声波和激素水平等少量信息，聊天机器人诊断出先天性肾上腺增生症，这是一种罕见的内分泌疾病。该书的作者通过案例得出了同样的结论。

不幸的是，ChatGPT 是离绝对正确还很远。在 Kohane 进行的实验中，ChatGPT 出现了许多计算错误或近似值，其后果显然是灾难性的。与所有生成式人工智能一样，聊天机器人有时可以以令人惊讶的沉着说出任何话。 ChatGPT 有时会开始“产生幻觉”，也就是说，如果缺乏数据，就会发明答案。 GPT-4 也不例外，尽管 OpenAI 声称通过该模型降低了产生幻觉的风险。

现阶段，我们不应该只相信人工智能所说的一切。如果您向聊天机器人询问与健康相关的问题，我们建议您在线并与您的医生确认所有答案的准确性。 Isaac Kohane 博士在他的书中建议使用……GPT-4 来验证 GPT-4。通过打开新的对话，语言模型将以新的视角评估其推理并识别可能的错误。