Google 推出 Gemini 2.5 Flash 模型,強調高效能與低延遲 AI 應用
- 柒 吴
- 4月10日
- 讀畢需時 1 分鐘
Google 推出全新 AI 模型 Gemini 2.5 Flash,專為高效處理、高吞吐量與低成本情境設計。此模型即將在 Google Vertex AI 平台上線,使用者可調整速度、精準度與成本之間的平衡,適用於客服、文件解析等即時任務。Gemini 2.5 Flash 作為「推理性」模型,能在回答前進行自我驗證。Google 也計劃於今年第三季將此模型部署至本地環境,透過 Google Distributed Cloud 與 Nvidia Blackwell 系統實現合規落地。
Comments