Gemini 3是什麼?

Google在2025年11月正式推出新一代模型Gemini 3,宣稱是目前「最聰明、推理能力最強」的多模態大型語言模型。它同時具備高階推理能力、跨文字與影像的理解能力,以及能配合工具與環境自行執行任務的代理人特性。這一代的核心模型是Gemini 3 Pro,已率先導入搜尋AI模式、Gemini應用程式與Google AI Studio,成為Google整體AI產品的主力引擎。

對一般使用者來說,Gemini 3代表的是︰搜尋更懂你的問題、Gemini App回答更貼近需求;對工程師與企業來說,Gemini 3則是更強的代碼代理人與長期規劃助手。

Gemini 3整體特色可從3個核心能力與2項深化功能理解,涵蓋推理、多模態、代理人與長脈絡等面向。

項目 特色說明 適用情境
推理能力 多步驟邏輯推演、Deep Think強化推理。 高難度數理、科研分析、策略推演。
多模態理解 文字、圖片、PDF、影片、程式碼整合分析。 跨資料整理、內容分析、研究用途。
代理人能力 可規劃任務、調用工具、執行多步驟流程。 開發者、企業工作流、自動化任務。
長脈絡視窗 支援1百萬Tokens。 大型文件、程式碼庫、長文摘要。
Vibe Coding 從草圖或描述生成前端原型。 產品開發、UI/UX設計、原型建置。

Gemini 3 Pro 5大功能亮點

1.高階推理與Deep Think更能拆解複雜問題

Google在官方頁面與技術報告中,多次強調Gemini 3 Pro在推理與學術測試上的表現︰

  • 在Humanity’s Last Exam學術推理測試中,Gemini 3 Pro達到37.5%,明顯高於Gemini 2.5 Pro與Claude Sonnet 4.5。
  • 在GPQA Diamond科學知識測試中拿到91.9%,接近博士水準。
  • 在AIME 2025數學競賽題上,搭配程式碼執行時可達到100%解題率。

Deep Think模式進一步強化這種能力︰它會在內部進行多步驟推演與自我檢查,再輸出答案,適合用在研究、風險分析、大型決策等情境。

對一般使用者來說,直覺感受會是︰Gemini 3在處理複雜問題時,比前一代更願意「花時間想清楚」,而不是急著給出聽起來順眼、實際卻不準確的回答。

2.一百萬Token長脈絡與更強多模態理解

Gemini 3 Pro提供1百萬Token的脈絡長度,遠高於許多同級模型的40萬或40多萬Token上限。

這代表它可以︰

  • 一次讀完一本厚書、整份研究報告或完整法規條文,再幫你做結構化整理。
  • 吃下整個程式碼庫,協助Refactor、找Bug或產生技術文件。
  • 在影片、PDF與圖片混合的情況下,仍然維持相對一致的理解。

在多模態測試MMMU-Pro與Video-MMMU上,Gemini 3 Pro分數同樣領先其他旗艦模型,顯示它在解讀圖表、螢幕畫面與影片情境上有更好的穩定度。

3.Vibe Coding與視覺化程式開發

Vibe Coding讓Gemini 3 Pro不只是寫程式,更能理解視覺與互動設計,成為「會寫程式的設計夥伴」。

  • 可以上傳手繪UI草圖,Gemini 3 Pro會解析按鈕、版面與互動關係,自動產生對應的HTML、CSS、JavaScript或React程式碼。
  • 也可以用比較抽象的描述,例如「我想要一個Cyberpunk風格的3D儀表板」,讓模型同時幫你處理視覺與互動細節。
  • 在WebDev Arena等開發相關排行榜上,Gemini 3 Pro以1487 Elo拿下第一名,顯示其在網頁與互動介面生成上的整體實力。

對工程師來說,它不只是一個補程式碼的助手,而是真正能從「構想」一路協助到「可執行原型」的共同開發者。

4.更成熟的代理能力與工具整合

自Gemini 2開始,Google就把「Agent」概念放進產品設計,Gemini 3則把這條路走得更遠︰

  • 在Vending-Bench 2長期規劃測試中,Gemini 3 Pro模擬經營自動販賣機業務1年,最終報酬遠超過Gemini 2.5 Pro、GPT-5.1與Claude Sonnet 4.5,顯示它在長時程任務上更能維持穩定策略。
  • 搭配Google Antigravity時,代理人可以直接存取編輯器、終端機與瀏覽器,幫你完成端對端的開發任務。
  • 在搜尋AI模式中,Gemini 3會根據你的問題自動生成互動式工具,例如房貸計算機、物理模擬或資料視覺化介面。

這種能力,對想打造AI Agent產品的團隊尤其關鍵。

5.減少幻覺,回答更精準

Google在介紹Gemini 3 Pro時,特別強調它的回答風格是「聰明、簡潔、直接」,並且「傾向告訴你需要聽的事實,而不是你想聽的好話」。

在SimpleQA與FACTS Benchmark等測試中,Gemini 3 Pro的事實準確性也明顯優於前一代與多數競品,代表在一般資訊查詢與說明型任務上,出現嚴重幻覺的機率相對更低。

Gemini 3 Pro怎麼用?

Gemini 3 Pro使用方式非常簡單,只需要透過Google Gemini或Google AI Studio就可以輕鬆開始創作。

Gemini:直接開啟Gemini 網頁,右下角的「模型選擇(Model)」預設是「快速(2.5 Flash)」,點開後切換成Thinking(3 Pro)。

(來源:Gemini 3 Pro截圖)

Google AI Studio:開啟Google AI Studio,選擇「Gemini 3 Pro Preview」。

(來源:Google AI Studio截圖)

Gemini 3 Pro不同族群應用情境

族群

能解決的需求

實際可使用方式

學生與研究者

整理大量學習資料、理解複雜概念、協助推理與檢查論證。

  • 把論文PDF、課堂錄影、講義一起丟給Gemini3,整理成重點或摘要。
  • 製作互動式單字卡、練習題。
  • 用Deep Think檢查數學或科學推導過程,找出可能的錯誤或盲點。

上班族與商務人士

快速整合市場資訊、做簡報、管理信件與行程。

  • 用搜尋AI模式做市場資料彙整、競品比較、商業模式分析。
  • 請它整理簡報架構、決策摘要。
  • 透過Gemini Agent整理Gmail、產生回信草稿、排定行程。

工程師與產品團隊

加速開發、快速產生原型、簡化操作流程。

  • 用Vibe Coding把草圖變成可執行的前端原型。
  • 讓Gemini3閱讀整個程式碼庫,協助找bug、補技術文件。
  • 在Gemini CLI中用自然語言請代理人操作Git、診斷Cloud Run或產生專案架構。

內容創作者與媒體

整理多來源資料、加速稿件製作、多平台內容轉換。

  • 讀影片或直播逐字稿,快速產生稿件大綱與摘要。
  • 把圖表、截圖與PDF一起丟進去,請它寫成懶人包或教學文。
  • 同一篇內容轉寫成適合社群、電子報或短影片腳本的版本。

Gemini 3 Pro實際應用範例

Gemini 3 Pro已經能做出更多超乎想像的成果。許多使用者分享,只要上傳1張相片並輸入簡單指令,就能把平面的照片轉成動畫;也有人用幾句話就生成互動式地圖App。從個人網站、網站小工具、甚至小型網頁遊戲,Gemini 3 Pro都能在極短時間內做出可操作的版本,讓不會寫程式的人也能實現把想法變成作品。

以下整理5個最常見、實用的Gemini 3 Pro使用方式:

1.整合PDF、圖片與影片內容

在處理不同格式的資料時,Gemini 3 Pro能一次讀懂PDF、圖片、截圖與影片內容,並把重點整理成摘要、條列或比較表。不需要先轉檔或拆資料,能大幅減少整理資訊的時間。

(來源:Gemini 3 Pro截圖)

2.整理辨識手寫內容、筆記與掃描文件

面對手寫筆記、會議白板或掃描文件,Gemini 3 Pro能看懂內容、還原文字,並用上下文判斷真正的意思。它不只把字轉出來,也能幫忙整理成條列、摘要或結構化資料。

(來源:Gemini 3 Pro截圖)

3.協助核對帳冊與檢查數字是否合理

例如帳本上的金額、單位或加總結果有沒有問題,Gemini 3 Pro能讀取內容後進行計算與比對,並說明推算過程。它能協助發現「數字怪怪的地方」,讓你更快確認資料正確性,特別適合大量表格或跨頁資訊,能節省大量人工逐格檢查的時間。

(來源:Gemini 3 Pro截圖)

4.產生基本款網站小工具

如果你需要製作簡單的網站小工具,像是處理影片的剪輯、加字幕,或是倒數計時器、隨機密碼產生器、地圖查詢等功能,Gemini 3 Pro能依描述生成可運作的基礎原型。模型會將需求拆解成可執行的網頁或前端程式碼,讓你立即測試概念,而不必自己從零開始搭架構。

範例指令:

幫我寫一個「自定義隨機密碼產生器」的網頁小工具。

  • 功能需求:使用者可以選擇密碼長度(滑桿)、是否包含符號、數字或大寫字母。
  • 介面設計:用現代化的深色模式風格,按鈕要明顯,並包含一個「一鍵複製」的功能。
  • 程式碼要求:提供一個單一的HTML檔案,將CSS和JavaScript全部內嵌在裡面,讓我存檔後直接用瀏覽器打開就能運作。不需要依賴外部函式庫。

(來源:使用Gemini 3 Pro製作)

5.依照描述生成基本3D場景或互動示意

如果想要展示一個空間、遊戲場景或互動概念,Gemini 3 Pro能用Three.js等方式生成簡單的 3D世界,例如方塊地形、光影效果或可移動視角。這類內容雖然不等於完整遊戲,但很適合作為設計提案或初步Demo,讓概念更具體。

範例指令:

幫我寫一個「3D守宮飼養箱互動模型」的網頁。

  • 功能需求:幫我生成一個守宮飼養箱的立體模型,使用者可以用滑鼠拖放或點擊新增守宮及佈景物件,所有物件都能自由移動、旋轉、縮放和改變顏色。
  • 介面設計:用現代感的深色模式,畫面須含有「物件選單」、「3D飼養箱空間」和「編輯面板」3塊區域。
  • 程式碼要求:提供一個單一的HTML檔案,將CSS和JavaScript全部內嵌在裡面,讓我存檔後直接用瀏覽器打開就能運作。使用最適合在網頁上呈現3D互動的技術來實現。」

(來源:使用Gemini 3 Pro製作)

6.生成高品質圖片,支援清晰繁體中文

Nano Banana Pro是Google 3 Pro的影像生成模型,擅長維持角色與風格的一致性,也支援清楚的繁體中文。因此無論是做品牌角色、簡報插圖、教學圖示或一系列視覺素材,都能用簡單指令快速生成多張風格統一的圖片。

範例指令:

生成一張「可愛插畫風格的富士山旅遊地圖」。

需求︰畫面需包含富士山、五合目觀景台、河口湖、纜車與熱門散步路線,並加入清晰的繁體中文地標標示。整體風格統一、色調柔和,可作為旅遊介紹或簡報封面使用。

(來源:Nano Banana Pro生成)

延伸閱讀:Nano Banana Pro怎麼用?免費方案、功能亮點、中文指令實作範例

Gemini 3 Pro價格與費用方案

Gemini 3 Pro目前可從Google提供的不同服務中使用,依使用身份與需求大致可分成4種模式︰

1.一般使用者︰免費試用

在Google Gemini或Google AI Studio,使用者可以免費體驗Gemini 3 Pro的聊天、多模態分析與程式碼生成等功能,適合先評估模型能力、做簡單專案或內容整理。不過免費方案有使用額度限制,一旦進入大量生成或持續對話,就會受到用量限制。

2.一般使用者:付費訂閱Google AI Plus、Pro、Ultra

若需要更穩定的輸出、較高額度或進階功能,可選擇Plus、Pro與Ultra等訂閱方案。這些方案會提供更高的每日使用量、優先運算資源與完整多模態能力,適合自媒體、內容創作者或需要大量生成素材的個人用戶。

3.大學生︰Google Gemini 3 Pro學生免費方案

Google提供大學生AI Pro免費試用(需年滿18歲),在2025年12月9日前申請即可使用。學生可在一年內免費使用Gemini 3 Pro的完整功能與較高額度,並包含2TB雲端空間,適合做研究、報告、分析或視覺型專題。

4.企業與開發者︰API按量計費

若透過Gemini API、Vertex AI或Workspace作企業級導入,則採Token計價。輸入與輸出Token會分別計費,並依20萬Token為分界有不同級距。此模式適合需要在產品、內部系統或工作流程中大量使用模型的公司或開發團隊。

項目 免費方案 付費方案(每100萬Tokens計費,美金)
輸入Token價格 無法使用 $2.00(輸入≤20萬Tokens)
$4.00(輸入>20萬Tokens)
輸出Token價格(含思考Tokens) 無法使用 $12.00(輸出≤20萬Tokens)
$18.00(輸出>20萬Tokens)
脈絡快取(Context Caching) 無法使用 $0.20(≤20萬Tokens)
$0.40(>20萬Tokens)
脈絡快取儲存費 無法使用 每小時每100萬Tokens收$4.50
Google搜尋基準(Search Grounding) 無法使用 每日1500次免費(RPD)
之後每1000次查詢$14(即將上線)
Google地圖基準(Maps Grounding) 無法使用 無法使用
是否會用你的資料改善模型 不會

Gemini 3 Pro vs GPT-5.1誰比較強?

項目 Google Gemini 3 Pro OpenAI GPT-5.1
模型定位 Google旗艦級多模態、強推理、強代理能力。 OpenAI旗艦級泛用模型,強語言生成能力。
推理能力 在學術推理類測試分數較高(例如:HLExam、GPQA)。 推理能力強,但在部分科學推理測試落後Gemini 3。
數學能力 AIME類型題目搭配程式執行可達高正確率。 數學表現穩定,但進階賽題通常不及Gemini 3 Pro。
多模態(圖片、PDF、影片) 文字、圖片、PDF、影片、程式碼整合度高,在MMMU-Pro與Video-MMMU中領先。 具備多模態能力,但影片推理與長影片分析表現較不突出。
長脈絡能力 支援1百萬tokens,可處理大型程式碼庫與長文件。 脈絡長度提升,但未達Gemini 3的百萬等級。
編碼與代理能力 強調Vibe Coding,可從草圖生成前端原型;代理人能執行多步驟任務。 編碼能力強,但偏向補充與生成;代理任務執行深度較低。
工具整合度 深度整合Google搜尋、Gmail、日曆、瀏覽器與CLI。 整合度高,但依賴外部插件與API,整體屬互補式。
事實準確性與幻覺 走「簡潔、不阿諛」路線,在SimpleQA等測試中幻覺率低。 敘事更自然流暢,但有時較易補內容填空。
適合族群 工程師、分析師、研究者、需要跨資料整合作業者。 作家、內容創作者、客服對話、語言生成場景。
使用場景優勢 跨格式資料整合、程式開發、自動化、研究分析。 文案生成、自然語言理解、創作輸出。

Gemini 3 Pro常見問題

Gemini 3 Pro要付費嗎?

 一般用戶可以在Gemini網頁免費使用基礎額度,包括一定次數的Thinking模式,也就是以Gemini 3 Pro處理複雜任務。若需要更高額度或進階能力,例如代理人功能、長時間推理或更快的運算速度,則需升級到Google AI Plus、Pro或Ultra方案。

台灣目前能用到Gemini 3 Pro嗎?

Gemini 3 Pro已在全球多數地區上線,台灣用戶可透過Gemini網頁或Google AI Studio直接使用。搜尋AI模式的Thinking選項則依Google區域政策逐步開放,進階代理人功能會優先提供給高階訂閱用戶。

什麼情況下需要用Gemini 3 Pro模式?

當任務需要深度分析、整合多種來源、處理長文或涉及推理時,就適合切換到Thinking模式。例如分析研究資料、拆解商業案例、協助程式開發或比對多份文件。若只是簡單查詢或一般內容生成,使用快速模式即可。

參考資料:Google 3 pro

延伸閱讀:
博士生等級的AI助理來了!Google Gemini 3 Pro 四大功能一次看 Google Gemini 3一戰封神!狠甩ChatGPT,7年來市值首超微軟內幕
Nano Banana Pro怎麼用?免費方案、功能亮點、中文指令實作範例

核稿編輯:陳虹伶