谷歌近日宣布對其圖像生成技術進行重大升級,推出名為Nano Banana Pro的新一代模型。該模型基于谷歌最新發布的大語言模型Gemini 3構建,在圖像細節、文本渲染、分辨率支持及功能擴展方面實現顯著突破,旨在為專業用戶提供更強大的創作工具。
相較于前代Nano Banana模型,新版本在圖像生成質量上實現質的飛躍。用戶現在可生成最高4K分辨率的圖像(原模型僅支持1024x1024像素),同時支持更精細的圖像控制參數,包括相機視角、光照條件、景深效果、焦點位置及色彩分級等。文本生成能力也得到強化,可呈現不同字體風格、多語言內容,并保持復雜排版中的準確性。
在成本控制與性能平衡方面,新模型采取差異化定價策略。基礎版Nano Banana生成1024像素圖像的成本為0.039美元,而Pro版生成1080p/2K圖像需0.139美元,4K圖像則需0.24美元。盡管成本有所上升,但谷歌強調其圖像質量提升幅度遠超價格增幅,特別適合對分辨率有嚴苛要求的專業場景。
技術集成層面,Nano Banana Pro已深度嵌入谷歌生態體系。Gemini應用將默認采用新模型生成圖像,但免費用戶存在使用次數限制,超出后自動切換回舊模型;付費訂閱用戶(AI Plus/Pro/Ultra)可享受更高配額,并在NotebookLM、Google Slides、Vids等工具中調用該功能。美國地區的AI Pro/Ultra用戶還能在搜索界面的AI模式中直接使用,Ultra用戶更可在視頻編輯工具Flow中體驗其能力。
開發者生態建設方面,谷歌通過Gemini API、AI Studio開發平臺及全新IDE工具Antigravity開放模型接口,支持第三方應用集成。為保障內容溯源,模型內置SynthID水印技術,可識別圖像是否經AI生成或修改,未來還將增加對C2PA內容憑證標準的支持,強化版權保護機制。















