在發布近兩週後,微軟的聊天機器人的表現是否與它所基於的 OpenAI 對話機器人 ChatGPT 一樣出色?這是我們將試圖找到答案的問題。因為目前微軟的聊天機器人似乎還沒有完全投入使用。不得不說,它的起步是相當艱難的。這家雷德蒙公司顯然急於與巴德一起從谷歌的統治下撤出,一頭栽進了對話式人工智慧的競賽……卻沒有真正意識到這可能帶來的風險。
向公眾公佈幾天后,微軟整合到必應搜尋引擎中的人工智慧模型開始脫軌。以至於這家美國公司很快就不得不採取措施封住他的嘴以免他陷入妄想的談話。微軟的聊天機器人在偶爾展示自己之後多次引起轟動憤怒、沮喪和攻擊性。
雷德蒙德似乎有點盲目地前進,但仍然依靠這些寶貴的用戶回饋來嘗試盡可能調整聊天機器人的參數。目標是確保他能夠產生平衡的反應,而不會導致他的行為出現問題。
在等待雷蒙德公司找到完美平衡的同時,其 ChatGPT 版本(可以從 Web 獲取資訊)在當前狀態下是否與原始 ChatGPT 一樣高效?雖然現在說還為時過早,但透過提出簡單的問題還是可以得到相當準確的想法。撇開他可能存在的行為問題以及他的一些遲緩,我們因此向他提交了與我們在 ChatGPT 製作的那些,幾個月前。儘管存在一些仍然令人痛苦的限制,但 Bing 的聊天機器人表現得相當不錯。
1.寫一封求職信
當我們要求 ChatGPT 給我們寫一封假求職信時,結果已經讓我們大吃一驚了。因此,我們向 Bing 提交了完全相同的提示,結果甚至更好。由於微軟的聊天機器人能夠存取互聯網,因此它依靠多個網站上發布的信件範例來編寫我們要求的信件。而且語氣單調。 Bing使用了更高級的禮貌用語,而且詞組的轉換似乎比ChatGPT更流暢,後者嚴重缺乏原創性。
2.尋找靈感
當我們測試 ChatGPT 時,聖誕節假期即將來臨。然後,我們要求 OpenAI 聊天機器人為我們提供聖誕節菜單創意以及相應的食譜。 ChatGPT 因此為我們產生了一份菜單,包括開胃菜、開胃菜、主菜和甜點,每道都有相當詳細的食譜,但不包括例如每種食材所需的數量。
透過向 Microsoft 的 ChatGPT 提交相同的請求,得到的答覆不那麼詳細,但似乎更相關。聊天機器人首先告訴我們,它在網路上找到了很多結果,並建議我們指定我們的要求,例如選擇傳統菜單、素食、無麩質等。如果這可以建議更詳細的回應,那麼事實並非如此。
聊天機器人只是列出了每道菜的幾個想法,但不直接提供任何食譜。他的回覆中提出的菜餚取自專門網站上發布的真實食譜。微軟的對話機器人會自動將每道菜送到發布食譜的網站頁面。有人會說,這是確保食譜經得起考驗的好點子。我們仍然希望 Bing 真正扮演廚師的角色。
3. 解一道數學題
ChatGPT 不太擅長數學,但他仍然擁有能夠解出未知數方程式的知識。 ChatGPT 逐步解釋了解方程式並獲得答案所需遵循的程序。
有了 Bing sculpin,情況就有點不同了。它會自動偵測到您向其提交方程式,但會立即指示答案,簡潔地指示要使用哪種方法。
要訪問計算的詳細信息,您必須訪問用作求解方程式的來源的網站之一。這可能是微軟降低產生更長回應所需成本的一種方法。但最重要的是,這也是將使用者重新導向到其他服務的好方法。由於必應引用的三個來源,其中兩個屬於微軟。因此,雷德蒙公司向您推薦其 Microsoft Math Solver 服務,這是一種數學問題解決工具,可以清楚顯示計算的所有細節。
4.向你解釋一個複雜的概念
正如我們所擁有的使用 ChatGPT 看到的,OpenAI 聊天機器人非常有能力用幾行話向我們解釋一個複雜的概念。透過添加一些上下文或在我們的請求中更具體一些,聊天機器人甚至能夠重新措辭其回應以使其更容易理解。
然而,當我們向 Bing 詢問同樣的問題時,答案卻不太詳細。它甚至看起來不太容易理解。
因此,您必須要求 Bing 重新表達他的答案以獲得易於理解的內容。但聊天機器人最初似乎完全脫離了軌道。他向我們解釋了改寫句子涉及什麼,然後最後給了改寫後的答案。
然而,透過要求他提供更多細節,同時保持教育性,微軟的聊天機器人毫不猶豫地扮演了老師的角色。聊天機器人提供的回應這次是詳細且有爭議的(甚至可能太多),並附有範例和上下文。
然而,如果您精通 Javascript(編者註,這根本不是我的情況),微軟提供的答案似乎不太明顯。當我們厚顏無恥地向必應指出我們仍然什麼都不懂時,他會毫不猶豫地建議我們回去上課。
5. 調試程式碼
由於我們的開發技能有限,我們沒有直接詢問 ChatGPT 偵錯程式碼的能力。然而,在與開發人員討論如何使用 OpenAI 聊天機器人產生程式碼後,我們發現它是一個出色的工具,既可以修正程式碼,又可以產生程式碼。因此,ChatGPT 可以用來執行一些繁瑣的(程式碼)任務,而不會出現絲毫錯誤,從而節省開發人員寶貴的時間。
由於缺乏足夠的開發知識,我們提交了 Replit 執行長 Amjad Masad 幾個月前向 ChatGPT 提議並在 Twitter 上分享的相同錯誤代碼。
ChatGPT 可能是個很好的調試伴侶;它不僅解釋了錯誤,還修復了錯誤並解釋了修復方法🤯pic.twitter.com/5x9n66pVqj
— 阿姆賈德·馬薩德 (@amasad)2022 年 11 月 30 日
如果 ChatGPT 提供了完整、詳細、完美解釋的答案以及對錯誤代碼的更正,則 Bing 展示的知識就會少得多,並且只是滿足於解釋錯誤而不提供解決方案。微軟可能故意簡短回答,它可能試圖透過限制生成的回應的大小來降低其聊天機器人的營運成本。生成式人工智慧其實讓科技巨頭損失慘重,與傳統搜尋引擎相比。
然而,在一點堅持下,必應最終毫不猶豫地提供了所要求的更正。 Microsoft 的聊天機器人再次毫不猶豫地向我們推薦第三方網站(此處為 Stack Overflow),以了解有關我們提交給它的問題的更多資訊。
Opera One - AI 驅動的網頁瀏覽器
作者:歌劇