Openai的'深入研究'是最新的(AI)工具波浪並承諾在幾分鐘之內做什麼才能讓人類專家完成。
捆綁為Chatgpt Pro和銷售作為可以與受過訓練的分析師相匹配的研究助理,它自主搜索網絡,編譯來源並提供結構化報告。甚至得分人類上一次考試(HLE)的26.6%,一個艱難的AI基準,表現不佳許多型號。
但是深入的研究並不能完全符合炒作。儘管它產生了拋光報告,但也存在嚴重的缺陷。根據記者的說法 誰嘗試過,深入的研究可能會錯過關鍵細節,與最新信息鬥爭,有時會發動事實。

OpenAi標誌在列出其工具的局限性時。該公司還說“有時可能會在響應中幻覺事實或做出錯誤的推論,儘管速度明顯低於現有的CHATGPT模型,但根據內部評估。”
不可靠的數據可以滑入毫不奇怪,因為AI模型並不像人類一樣“知道”事情。
AI“研究分析師”的想法也提出了許多問題。機器(無論多麼強大)可以真正取代受過訓練的專家嗎?知識工作的影響是什麼? AI真的可以幫助我們思考更好,還是只是使完全停止完全思考的更容易?
什麼是“深入研究”,它是為了誰?
深入研究是針對金融,科學,政策,法律和工程以及學者,記者和商業戰略家的專業人士的推銷,深入研究是最新的。代理經驗“ Openai已在Chatgpt推出。它有望在幾分鐘之內進行研究。
目前,深入研究僅適用於美國的Chatgpt Pro用戶,每月為200美元。 Openai說它將在接下來的幾個月中推廣到Plus,Team和Enterprise用戶,併計劃將來更具成本效益的版本。
與提供快速響應的標準聊天機器人不同,深入研究遵循多步驟的過程來生成結構化報告:
- 用戶提交請求。這可能是從市場分析到法律案件摘要的任何事情。
- AI闡明了任務。它可能會提出後續問題以完善研究範圍。
- 代理搜索網絡。它自動瀏覽數百種來源,包括新聞文章,研究論文和在線數據庫。
- 它綜合了其發現。 AI提取了要點,將它們組織成結構化的報告,並引用其來源。
- 最終報告已交付。在五到30分鐘內,用戶收到了一個多頁文檔 - 甚至可能是博士學位論文- 總結髮現。
乍一看,這聽起來像是知識工作者的夢想工具。仔細觀察揭示了重大局限性。
- 它缺乏背景。 AI可以總結,但並不完全了解重要的事情。
- 它忽略了新的發展。它錯過了重大的法律裁決和科學更新。
- 它使事情變得艱難。像其他AI模型一樣,它可以自信地生成虛假信息。
- 它無法從小說中說出事實。它沒有區分權威來源和不可靠的來源。
儘管Openai聲稱其工具與人類分析師相媲美,但AI不可避免地缺乏使良好研究有價值的判斷,審查和專業知識。
AI不能替換
Chatgpt並不是唯一隻能使用幾個提示來搜索網絡並產生報告的AI工具。值得注意的是,僅僅是Openai釋放後24小時,Hugging Face發布了免費的開源版本,幾乎與其性能相匹配。
對“人類水平”研究銷售的深入研究和其他AI工具的最大風險是AI可以取代人類思維的幻想。 AI可以總結信息,但是它不能質疑其自己的假設,突出知識差距,創造性地思考或理解不同的觀點。

任何AI代理,無論多快,仍然只是一種工具,而不是替代人類智能的替代品。對於知識工作者而言,投資AI無法複製的技能比以往任何時候都重要:批判性思維,事實檢查,深厚的專業知識和創造力。
如果您想使用AI研究工具,則有多種負責任的方法。周到的人工智能使用可以增強研究,而無需犧牲準確性或深度。您可能會使用AI來提高效率,例如總結文件,但要保留人類做出決定的判斷。
總是驗證來源,因為AI生成的引用可能會產生誤導。不要盲目地相信結論,而要與信譽良好的來源應用批判性思維和交叉檢查信息。對於高風險主題 - 例如健康,,,,正義和民主- 補充AI調查結果。
儘管多產的營銷試圖告訴我們,但生成的AI仍然有很多局限性。可以創造性地綜合信息,挑戰假設並進行批判性思考的人將保持需求 - AI尚無法替代它們。
Raffaele F Ciriello,業務信息系統的高級講師,悉尼大學