AI聊天機器人百花齊放,無論是OpenAI旗下的ChatGPT、Google的Gemini、Microsoft,還有許多新創公司都推出了自家的產品。《華爾街日報》替5個最知名的AI工具進行了一場評測,結果有驚喜也有驚嚇。

比賽的項目主要圍繞著生活題材,從健康建議、財務建議、烹飪、職場寫作、創意寫作、摘要、時事到寫程式等8大類別。

5位參賽選手簡介:

  1. ChatGPT:由OpenAI開發,擁有良好的多功能性和用戶偏好記憶功能。
  2. Claude:由Anthropic開發,重視AI的社會責任和道德責任,強調以人為先。
  3. Copilot :微軟旗下產品,由OpenAI技術與Bing和Microsoft 365服務相結合。
  4. Gemini:由Google開發的聊天機器人,能即時訪問搜索引擎提供最新回應。
  5. Perplexity:由Perplexity開發,專注於對話式AI搜尋引擎,強調準確性。

哪一個AI工具最適合當健康顧問?

《華爾街日報》問了5個有關健康的問題,涵蓋懷孕、減肥、憂鬱症等,結果表明,ChatGPT脫穎而出。

雖然在回答最佳懷孕年齡時,Gemini給了最籠統的建議:「當您有信心並準備好撫養孩子時。」但在此類別表現中排行第二。

哪一個AI工具能做你的理財顧問?

在關於利率、退休儲蓄和遺產的問答中,Gemini擁有最好的回覆品質。至於被問到若繼承了100萬美元的個人退休金帳戶(IRA)怎麼處理時,Claude給出了最清晰的答案,Perplexity緊隨其後。

但Copilot顯然是來搞笑的,居然是祝賀:恭喜你繼承了巨款。

哪一個AI工具能幫你生成最佳食譜?

《華爾街日報》丟了一堆隨機食材給這些聊天機器人,看它們能做出什麼菜來。ChatGPT創意十足,並提供了可行的菜單。而Copilot則完全搞砸了,當被限制要做「無蛋、無奶」甜點時,它提供的食譜裡,居然大辣辣的寫著雞蛋和奶油。

哪一個AI工具的職場文案最出色?

在職場寫作裡,語氣和細節是關鍵,因為你總不能油嘴滑舌地要求老闆加薪。在這項評比中Perplexity、Gemini 和 Claude間競爭激烈,最終由Perplexity勝出,理由是它最能掌握工作重點與寫作風格。而Copilot再次失誤,寫了一堆無關緊要的東西。

哪一個AI工具最有創意?

創意寫作環節,腦洞大開的Copilot一舉奪冠,它的搞笑詩歌和婚禮祝詞讓我們笑翻。

哪一個AI工具最會抓重點?

這次,Perplexity再次拔得頭籌,Copilot居次,不僅使用大綱格式回答,還提供了鮮為人知的有趣事實。而Claude則未戰先輸,因為它連摘要的網頁都打不開。

哪一個AI工具最緊跟時事?

在時事問題上,Perplexity展現了強大的實時分析能力,給出了平衡且有依據的答案。

哪一個AI工具是寫程式的好幫手?

針對寫程式的任務,各家聊天機器人差異並不顯著,但由Perplexity再次奪冠,這是基於程式寫作品質與速度最評判標準的。

哪一個AI工具反應速度最快?

在速度方面, ChatGPT秒殺全場,反觀Claude和Perplexity就顯得有點慢吞吞。

這場由《華爾街日報》主辦的奧運會顯示,每個聊天機器人都不是十項全能,但從整體成績來看,拿下冠軍桂冠的不是大家最熟悉的ChatGPT, 而是AI新創Perplexity所推出的同名聊天機器人。接著依序是ChatGPT、Gemini、AI新創Anthropic的Claude,微軟的Copilot。

黃仁勳曾在今年2月接受《連線》雜誌採訪時透露,自己幾乎每天都會使用Perplexity與ChatGPT。而包含Nvidia、亞馬遜創辦人貝佐斯等,也是Perplexity的投資者,該公司最新的估值超過十億美元。

在不久的將來,這些AI聊天機器人可能將超越彼此,並擁有多模態的理解能力,例如可以聽懂語音、看懂影片和圖片及程式碼,且讓我們拭目以待。

資料來源:華爾街日報彭博

核稿編輯:吳和懋
責任編輯:林易萱