※ 本文轉寄自 ptt.cc 更新時間: 2026-02-21 16:52:26
看板 Stock
作者 標題 [新聞] Google正式發表Gemini 3.1 Pro 全面強化
時間 Fri Feb 20 18:37:06 2026
-------------------------------發文提醒----------------------------------
1.發文前請先詳閱[新聞]分類發文規範,未依規範發文將受處分。
2.發文請依照格式文章標明段落,不符合格式者依 1-2-1 處分。
3.連結過長請善用縮網址服務,連結不能點擊者板規 1-2-2 處分。
4.心得/評論請盡量充實,心得過短或濫竽充數將以板規 1-2-3 處分。
------------------------ 按ctrl+y 可刪除以上內容。 ----------------------
原文標題:
Google正式發表Gemini 3.1 Pro 全面強化複雜任務處理能力
原文連結:
https://news.cnyes.com/news/id/6347511
Google正式發表Gemini 3.1 Pro 全面強化複雜任務處理能力 | 鉅亨網 - 科技 Google(GOOGL-US) 周四 (19 日) 透過官方部落格,突然宣布推出其最新的人工智慧核心模型 Gemini 3.1 Pro。這款模型被定位為處理最複雜任務的「智慧升級版」,象徵著 Google 在 AI 核心推理能 ...
發布時間:
2026-02-20 16:20
記者署名:
原文內容:
Google(GOOGL-US) 周四 (19 日) 透過官方部落格,突然宣布推出其最新的人工智慧核心
模型 Gemini 3.1 Pro。這款模型被定位為處理最複雜任務的「智慧升級版」,象徵著
Google 在 AI 核心推理能力上取得了重大突破。
隨著 Gemini 3.1 Pro 的發布,Google 旨在將更強大的智慧應用於日常開發與消費級產
品中,幫助使用者解決那些「簡單回答已不足夠」的艱難挑戰。
核心推理能力的飛躍:基準測試表現驚人
Gemini 3.1 Pro 最受矚目的改進在於其邏輯推理能力的提升。根據 Google 發布的數據
,該模型在評估邏輯模式解決能力的關鍵基準測試 ARC-AGI-2 中,獲得了 77.1% 的驗證
分數。與前代 Gemini 3 Pro 的 31.1% 相比,其推理性能提升超過兩倍,也遠高於
,該模型在評估邏輯模式解決能力的關鍵基準測試 ARC-AGI-2 中,獲得了 77.1% 的驗證
分數。與前代 Gemini 3 Pro 的 31.1% 相比,其推理性能提升超過兩倍,也遠高於
Gemini 3 Deep Think 的 45.1%。
https://cimg.cnyes.cool/prod/news/6347511/l/ec6f683db3c26648a93e93380118728e.jpg
https://reurl.cc/KONy0q
![[圖]](https://cimg.cnyes.cool/prod/news/6347511/l/ec6f683db3c26648a93e93380118728e.jpg)
![[圖]](https://cimg.cnyes.cool/prod/news/6347511/l/ec6f683db3c26648a93e93380118728e.jpg)
在與競爭對手的橫向對比中,Gemini 3.1 Pro 在多項指標上領先於 Anthropic 的
Claude Opus 4.6 以及 OpenAI 的 GPT-5.2。例如:
‧ Humanity"s Last Exam(人類最後的考驗):Gemini 3.1 Pro 分數為 44.4%,優於
Claude Opus 4.6 的 40.0% 與 GPT-5.2 的 34.5%。
‧ MMLU(大規模多任務語言理解):達到 92.6%,領先競爭對手。
‧ GPQA Diamond:得分 94.3%,展現出極高水平的專業知識理解。
儘管如此,報導也指出在特定領域中,競爭對手仍保有優勢。例如,Claude Opus 4.6 在
部分 SWE-Bench 驗證中仍位居榜首,而 OpenAI 的 GPT-5.3-Codex 則在特定的編程測試
中表現較佳。
部分 SWE-Bench 驗證中仍位居榜首,而 OpenAI 的 GPT-5.3-Codex 則在特定的編程測試
中表現較佳。
多樣化的實務應用
Google 強調,Gemini 3.1 Pro 不僅是數據上的進步,更在於能將高級推理轉化為實用的
功能。
1. 純程式碼動畫生成:該模型能直接根據文字指令生成網頁適用的 SVG 動畫。由於這些
動畫是基於純程式碼而非像素構建,因此在任何比例下都能保持清晰,且檔案體積遠小於
傳統影片。
動畫是基於純程式碼而非像素構建,因此在任何比例下都能保持清晰,且檔案體積遠小於
傳統影片。
2. 複雜系統整合:Gemini 3.1 Pro 展現了連接複雜 API 與使用者介面的能力。在官方
展示中,它成功構建了一個即時航太儀表板,利用公開遙測數據視覺化國際太空站
(ISS) 的軌道運行。
3. 沉浸式互動設計:該模型能編寫複雜的 3D 動態視覺效果 (如鳥群飛翔模擬),並結合
手部追蹤功能,讓使用者能操控視覺效果,甚至產生隨動作變化的生成式配樂。
4. 創意編碼與文學轉化:Gemini 3.1 Pro 展現了理解文學主題並將其轉化為功能性程式
碼的能力。例如,它能根據艾蜜莉 · 勃朗特的經典小說《咆哮山莊》的大氣色調,設計
出富有現代感的個人作品集網站,而非僅僅是摘要文字。
碼的能力。例如,它能根據艾蜜莉 · 勃朗特的經典小說《咆哮山莊》的大氣色調,設計
出富有現代感的個人作品集網站,而非僅僅是摘要文字。
全方位布局:如何體驗 Gemini 3.1 Pro
Google 目前已在多個平台上陸續推送 Gemini 3.1 Pro,涵蓋開發者、企業及一般消費者
:
‧ 一般消費者:可透過 Gemini App 使用。訂閱 Google AI Pro 與 Ultra 方案的用戶
將享有更高的使用限制。此外,NotebookLM 也已開放 Pro 與 Ultra 用戶專屬體驗。
‧ 開發者與企業:可透過 Gemini API (Google AI Studio)、Vertex AI、Gemini
Enterprise 以及 Google 的代理式開發平台 Antigravity 進行訪問。
‧ 開發工具整合:該模型也將整合進 Gemini CLI、Android Studio,甚至延伸至微軟的
服務,如 GitHub Copilot 和 Visual Studio Code。
AI 賽賽升溫:Google 的市場防禦與進攻
這次發布正值 AI 市場競爭最激烈的時刻。市場分析指出,Gemini 3 Pro 在去年 11 月
發布後曾引發 OpenAI 的「紅色警報 (code red)」,並導致部分用戶從 ChatGPT 流向
發布後曾引發 OpenAI 的「紅色警報 (code red)」,並導致部分用戶從 ChatGPT 流向
Gemini。Google 執行長 Sundar Pichai 在最近的財報中提到,Gemini App 的月活躍用
戶已超過 7.5 億,且其模型透過 API 每分鐘處理超過 100 億個 token。
Gemini 3.1 Pro 的推出被視為 Google 快速迭代策略的一部分。Google 表示,目前發布
的是預覽版,目的是為了在正式全面開放 (GA) 之前,驗證更新並進一步推進代理式工作
流 (agentic workflows) 等雄心勃勃的研發領域。
的是預覽版,目的是為了在正式全面開放 (GA) 之前,驗證更新並進一步推進代理式工作
流 (agentic workflows) 等雄心勃勃的研發領域。
Karpathy:應用商店模式正在過時
Gemini 3.1 Pro 發布之際,OpenAI 共同創辦人 Andrej Karpathy 提出「應用商店模式
正在過時」的觀點,他指出,隨著如 Gemini 3.1 Pro 等具備強大推理能力的模型出現,
模型已能從單純回答問題延伸到完成一整套專業工作流。
正在過時」的觀點,他指出,隨著如 Gemini 3.1 Pro 等具備強大推理能力的模型出現,
模型已能從單純回答問題延伸到完成一整套專業工作流。
Karpathy 預見一個由「AI 原生傳感器」和「執行器」構成的時代,屆時將由 LLM 負責
編排、即興生成高度定制的應用。這種「即時生成、用完即棄」或「個人專屬」的軟體邏
輯,將從根本上取代傳統應用商店的發布與下載機制。
編排、即興生成高度定制的應用。這種「即時生成、用完即棄」或「個人專屬」的軟體邏
輯,將從根本上取代傳統應用商店的發布與下載機制。
總結來說,Karpathy 認為,AI 讓軟體開發的門檻與成本降到極低,未來的趨勢是 AI 根
據用戶需求直接生成解決方案,而非用戶去適配應用商店中既有的 App。
心得/評論:
現在出的AI強到一句話就能輸出 完美的程式和動畫,
離AGI真的不遠
感覺人類似乎快無用了
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.193.229.55 (臺灣)
※ 作者: tanted 2026-02-20 18:37:06
※ 文章代碼(AID): #1fc3bNf2 (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1771583831.A.A42.html
※ 同主題文章:
● 02-20 18:37 ■ [新聞] Google正式發表Gemini 3.1 Pro 全面強化複雜任務處理能力
02-22 22:54 ■ Re: [新聞] Google正式發表Gemini 3.1 Pro 全面強化
※ 編輯: tanted (123.193.229.55 臺灣), 02/20/2026 18:39:19
--
推 : 噴噴噴噴噴噴噴1F 02/20 18:37
推 : 無感2F 02/20 18:38
推 : 早上就注意到了,盤前噴噴,聽說Coding 超越Claude3F 02/20 18:40
→ : 了
→ : 了
推 : 樓下點名台股估狗概念股週一市價買5F 02/20 18:40
推 : 救救狗家救救我!6F 02/20 18:41
推 : 歐噴醬的靈壓…7F 02/20 18:42
推 : 狗狗還有救嗎8F 02/20 18:42
→ : 坐等測評 前一版寫扣跟垃圾一樣9F 02/20 18:42
→ : 寫扣跟垃圾一樣=賺不到錢
→ : 寫扣跟垃圾一樣=賺不到錢
→ : 300撿好多了11F 02/20 18:43
推 : 99估狗12F 02/20 18:50
推 : claude我大哥13F 02/20 18:51
→ : 我用了之後覺得還是GPT翻譯比較好14F 02/20 18:54
推 : 軟工要死光了吧15F 02/20 19:04
推 : 希望真的有贏過Claude4.616F 02/20 19:06
推 : 才剛把狗賣了改搭美光戰艦17F 02/20 19:08
→ : 從垃圾變成贏過claude 彎道超車?18F 02/20 19:14
推 : 發哥開噴19F 02/20 19:18
噓 : 沒用了 下山已久20F 02/20 19:21
→ : 再下去就要比人類聰明了21F 02/20 19:24
推 : 可以生成澀澀嗎22F 02/20 19:25
推 : 現在估狗沒人要了,前進老黃。23F 02/20 19:27
推 : 真假啦 coding真超越claude我就要訂閱了24F 02/20 19:34
推 : 支持模型三家努力捲,得利的都是消費者。25F 02/20 19:37
推 : 歐印26F 02/20 19:42
推 : 人類完了27F 02/20 19:44
→ : claude其實本就還好。。。cursor也是28F 02/20 19:49
推 : 支持卷爛,看哪家方案更便宜29F 02/20 19:50
推 : 狗狗+u30F 02/20 19:52
→ : Coding有沒有比Cluade強見仁見智,但各方面都是31F 02/20 19:52
→ : 比較便宜或給的用量比較多
→ : 然後多語言能力其實沒特別進步 多模態能力還退步
→ : 但不重要,推理變強就好了
→ : 比較便宜或給的用量比較多
→ : 然後多語言能力其實沒特別進步 多模態能力還退步
→ : 但不重要,推理變強就好了
推 : 車太快35F 02/20 19:53
→ : 現在應用範圍太廣了,抓好什麼任務給哪個模型比較36F 02/20 19:54
→ : 需要下點功夫
→ : 需要下點功夫
→ : google真能一統天下 要考慮加碼38F 02/20 19:55
→ : 因為就算你技術不輸google 它也能用服務全家桶商法
→ : 贏你
→ : 因為就算你技術不輸google 它也能用服務全家桶商法
→ : 贏你
推 : 推理比較重要 不然重要任務還真不敢交給3.0處理41F 02/20 20:01
推 : 我已經不太能想像5-10年後的世界會有多可怕@@42F 02/20 20:01
→ : claude還好喔? 一看就是只會問低能問題的 呵呵43F 02/20 20:06
推 : 以後除了外勞還有AI勞 適用於勞基法嗎?44F 02/20 20:11
推 : 怒噴1%45F 02/20 20:24
推 : 請問有人對話被刪除嗎?46F 02/20 20:27
→ : 贏過Opus 4.6 再說47F 02/20 20:28
推 : 推文不看好才會漲48F 02/20 20:34
噓 : 早上用了一下,很會胡說八道,沒有的事實瞎吹一通49F 02/20 20:43
推 : 為什麼我才輸入幾句話就出現Gemini 3.1 Pro 短時間50F 02/20 20:44
→ : 要求過多無法處理
→ : 要求過多無法處理
→ : 噴噴噴噴噴噴54F 02/20 20:51
推 : 99菇狗55F 02/20 20:55
推 : 上次的Google概念股又要噴一波了?56F 02/20 20:56
推 : 發哥準備開噴57F 02/20 20:58
推 : 一根58F 02/20 20:58
![[圖]](https://i.mopix.cc/zW0XXZ.jpg)
推 : 狗狗等280我來買一些61F 02/20 21:04
噓 : 估狗跟垃圾一樣62F 02/20 21:10
噓 : 200再說63F 02/20 21:17
推 : 彈回320,接著烙賽回22564F 02/20 21:17
推 : 谷歌不是漲完了 沒跟到別接了65F 02/20 21:33
推 : 特別喜歡看Claude模型執行任務時的chain of thought66F 02/20 21:44
→ : 感覺它比其他家的大語言模型還活XD
→ : 感覺它比其他家的大語言模型還活XD
→ : 超越claude? 不太可能呢68F 02/20 21:50
推 : 4.6貴是真的有料阿 我是覺得還沒超越啦69F 02/20 21:53
→ : 越來越猛70F 02/20 21:58
推 : 進步速度越來越快了 AI不用睡覺 接下來會越來越快71F 02/20 22:26
噓 : 強不強跟能不能變現是兩回事72F 02/20 22:28
推 : 厲害73F 02/20 22:34
推 : 非常実用!很強大!74F 02/20 22:36
→ : 在推論方面,表現得不錯
→ : 在推論方面,表現得不錯
推 : 一個月後不降智再說76F 02/20 22:45
→ : 問問題成天突然幫我畫畫要解決了?77F 02/20 23:08
噓 : 用了兩個多小時 慘輸5.3-codex和opus4.678F 02/20 23:17
→ : 然後opus 4.6不如4.5 幻覺率有變高的感覺
→ : 越來越容易亂寫一通 4.5還比較聽話
→ : 5.3 codex還是屌打全部 尤其困難需求xhigh一發解
→ : 三個交叉用下來就是這樣 Gemini還是只能拿來產視覺
→ : 其它一無是處
→ : 然後opus 4.6不如4.5 幻覺率有變高的感覺
→ : 越來越容易亂寫一通 4.5還比較聽話
→ : 5.3 codex還是屌打全部 尤其困難需求xhigh一發解
→ : 三個交叉用下來就是這樣 Gemini還是只能拿來產視覺
→ : 其它一無是處
推 : 寫寫歌編曲,真有趣!84F 02/20 23:24
推 : 文組gpt理組Gemini85F 02/21 00:09
推 : 所有模型好壞取決於你要做的領域是什麼86F 02/21 00:35
→ : 大致上都不會太差 你問冷門的或是比較沒辦法收入到
→ : 訓練集都是用掰的
→ : 大致上都不會太差 你問冷門的或是比較沒辦法收入到
→ : 訓練集都是用掰的
噓 : 看看就好 上次也是吹很大 但coding實際用起來根本89F 02/21 00:48
→ : 沒比其他家強
→ : 沒比其他家強
推 : Codex屌打claude91F 02/21 01:09
推 : 算了吧 google bug會刪對話 一堆紀錄都沒了92F 02/21 01:28
推 : 擠牙膏大賽開始93F 02/21 01:32
推 : 三家都很爛 連寫個簡單腳本都會報錯 還改不好94F 02/21 02:08
推 : 谷歌不再擠牙膏了95F 02/21 07:19
推 : 越跑越慢96F 02/21 09:19
推 : 股溝資本支出超標 當然漲不動 現在你不擴充軍武97F 02/21 10:51
→ : 就是被淘汰 擴充就是跌股價 畢竟沒有100%成功投資
→ : 就是被淘汰 擴充就是跌股價 畢竟沒有100%成功投資
→ : 沒感覺99F 02/21 12:43
推 : Antigravity昨天claude的配額用完試著用gem3.1pro100F 02/21 15:18
→ : 來修code 個人覺得還是claude比較強
→ : 來修code 個人覺得還是claude比較強
--
※ 看板: Stock 文章推薦值: 0 目前人氣: 0 累積人氣: 142
→
guest
回列表(←)
分享