
本站由 Manus 全自動生成,並部署於 Cloudways 雲端主機,點擊連結即可免費試用。

Google 於 2026 年 3 月初,正式揭曉 Gemini 系列的新成員 3.1 Flash-Lite。這款適用於「高頻」、「低延遲」任務的小型化模型,目前已在 Google AI Studio 與 Vertex AI 開放預覽。相較於先前版本,3.1 Flash-Lite 在維持低成本優勢的同時,實現了「推理速度」與「準確性」的跨越式提升,旨在解決建構「大規模 AI Agent」與「即時內容審核」時面臨的資源瓶頸。
技術核心:自研張量處理架構與「思考深度」可調技術
Gemini 3.1 Flash-Lite 的技術突破在於「處理效率」,每秒推理速度可達 363 Token,遠超同量級競品。模型標配的思考等級(Thinking Levels)功能,允許開發者根據任務性質,自由調整投入的推理資源。對資料分類或大量翻譯等高頻任務,可切換至「淺思考模式」,以追求極致速度與最低成本。而在處理多步驟複雜指令時,可切換至「深思考模式」,展現不遜於大型模型的邏輯執行力。
技術亮點:極致成本控制與事實準確性的斷崖領先
在成本方面,3.1 Flash-Lite 展現出極強的競爭力,收費標準顯著優於 Claude 等同級模型。此外,該模型在事實準確性(Grounded Accuracy)上亦有進步,大幅降低了小型模型常見的幻覺現象。開發者實測顯示,該模型能在數秒內自動填滿「包含數百款商品」的電商介面原型,證明其在自動化工作流中的實戰價值。
阿力的觀點: 生成式 AI 競爭的全新賽道
3.1 Flash-Lite 的發布,代表 Google 已將 AI 的競爭重點,從單純的「參數競賽」轉向了「實戰效能」。這是個好現象,對 AI 生態系或使用者來說皆是。

新聞資料來源
https://alternativeto.net/news/2026/3/google-unveils-gemini-3-1-flash-lite-as-a-faster-cost-efficient-ai-model-now-in-preview/
https://www.digitimes.com.tw/tech/dt/n/shwnws.asp?id=0000747887_OA17DCKM9R16Y963BRNWB
