▲Google 宣布 Gemini 2.0 Flash模型開放圖像生成功能預覽。(圖/Google,下同)
記者吳立言/綜合報導
Google今(8日)宣布,旗下多模態AI模型Gemini 2.0 Flash正式開放「圖像生成功能」預覽版。開發者現在可透過Google AI Studio與Google Cloud的Vertex AI,使用「gemini-2.0-flash-preview-image-generation模型」進行整合開發與測試。
根據Google官方部落格說明,這次更新除開放圖像生成功能外,也同步提升了呼叫頻率上限與價格彈性。相較於先前的實驗性版本,此次版本在三大面向皆有明顯改善:
※提升生成圖片的視覺品質
※增強文字渲染準確度
※大幅降低過濾器封鎖率
Google表示,這項功能能協助開發者在更多應用場景中快速生成高品質圖像,特別是在電商設計、內容創作、產品展示與UI試作等領域。實際應用包含以下幾項:
※將商品圖片置換至不同背景情境,實現情境式行銷圖生成
※在AI Studio上使用範例應用進行即時協作繪圖
※以自然語言指定圖片中欲修改的區域,進行局部編輯而不影響整體
※結合文字與圖像,自動生成新商品SKU與包裝設計提案
※作為創意夥伴,協助用戶發想視覺與內容組合
Google也提供了完整API串接方式,開發者可參考範例進行整合測試。目前圖像生成功能預覽版已全面開放,Google也預告未來將持續提升模型品質、拓展功能並開放更高頻率的使用限制。
讀者迴響