该书由哈佛大学计算机科学家兼博士 Isaac Kohane 博士在记者 Carey Goldberg 和微软研究副总裁 Peter Lee 的帮助下共同撰写,重点关注人工智能的影响关于医学。
作为他研究的一部分,生物医学研究人员测试了GPT-4,GPT 语言模型的最新更新,为 ChatGPT 提供支持。 3 月份宣布,GPT-4 仅适用于付费订阅者聊天GPT Plus目前。这位医生指出,他已经“提前接触”人工智能来进行实验。
ChatGPT已通过医疗执照
为了测试 AI 的极限,Isaac Kohane 向美国医疗执照考试提出了 ChatGPT 4 问题,该考试计划可让您获得医疗执照在美国。这个三步计划赋予了在美国土地上从事医疗职业的权利。它评估涵盖大多数医学学科的知识,从生物化学到诊断推理。所有美国医学院都会在学生学习期间组织考试。第一阶段大约需要两年学习完成,第二阶段需要四年学习,第三阶段需要成为一名医生。
第一个观察结果:GPT-4 设法正确响应程序中90%的问题。该语言模型比之前版本的人工智能 GPT-3.5 有效得多。二月测试,AI获得了60%的平均分,还算及格。具体来说,机器人获得的分数在52.4%到75%之间。 GPT-4 更新显着改善了聊天机器人的结果。哈佛医学院生物医学信息学系主任补充道,他甚至比一些医生做得更好。
正如研究人员在他的书中所解释的那样,ChatGPT 还因其附加功能而脱颖而出。在测试过程中,聊天机器人的表现非常出色,这要归功于他作为翻译的才华。他能够翻译一位用葡萄牙语说话的患者提供的信息。 AI还以清晰易懂的解释回应患者。对话机器人能够帮助医生与患者沟通,避免使用技术术语等。
ChatGPT 可以模仿医生
然而,ChatGPT 4 与其前身一样,无法理解医疗信息和概念。它只是根据可用数据生成答案。对于《医学中的人工智能革命》一书的作者来说,聊天机器人可以模仿医生成功诊断的方式。
为了得出这个结论,艾萨克·科哈内(Isaac Kohane)医生向生成人工智能提交了几个案例,其中包括他几年前遇到的一个婴儿的案例。根据超声波和激素水平等少量信息,聊天机器人诊断出先天性肾上腺增生症,这是一种罕见的内分泌疾病。该书的作者通过案例得出了同样的结论。
不幸的是,ChatGPT 是离绝对正确还很远。在 Kohane 进行的实验中,ChatGPT 出现了许多计算错误或近似值,其后果显然是灾难性的。与所有生成式人工智能一样,聊天机器人有时可以以令人惊讶的沉着说出任何话。 ChatGPT 有时会开始“产生幻觉”,也就是说,如果缺乏数据,就会发明答案。 GPT-4 也不例外,尽管 OpenAI 声称通过该模型降低了产生幻觉的风险。
现阶段,我们不应该只相信人工智能所说的一切。如果您向聊天机器人询问与健康相关的问题,我们建议您在线并与您的医生确认所有答案的准确性。 Isaac Kohane 博士在他的书中建议使用……GPT-4 来验证 GPT-4。通过打开新的对话,语言模型将以新的视角评估其推理并识别可能的错误。
“几乎在任何方面,从诊断到医疗记录再到临床试验,影响都将如此广泛和深远,我们相信我们现在必须开始努力以最大限度地发挥影响”,我们可以在《医学中的AI革命》中读到。
Isaac Kohane 博士总结道,通过采取预防措施,ChatGPT 可以充当医生的助手。在书中,他想象了卫生专业人员如何使用对话代理来确定患者所患的疾病。在医生(无论是专家还是一年级住院医师)手中,ChatGPT 都是一个非常宝贵的工具......只要他们保持批判性思维。
来源 : 商业内幕