Gemini 2.0 Flash開放圖像生成功能 支援即時編輯與文字渲染

▲▼Google Gemini 2.0 flash。(圖/Google)

▲Google 宣布 Gemini 2.0 Flash模型開放圖像生成功能預覽。(圖/Google,下同)

記者吳立言/綜合報導

Google今(8日)宣布,旗下多模態AI模型Gemini 2.0 Flash正式開放「圖像生成功能」預覽版。開發者現在可透過Google AI Studio與Google Cloud的Vertex AI,使用「gemini-2.0-flash-preview-image-generation模型」進行整合開發與測試。

根據Google官方部落格說明,這次更新除開放圖像生成功能外,也同步提升了呼叫頻率上限與價格彈性。相較於先前的實驗性版本,此次版本在三大面向皆有明顯改善:

※提升生成圖片的視覺品質

※增強文字渲染準確度

※大幅降低過濾器封鎖率

▲▼Google Gemini 2.0 flash。(圖/Google)

Google表示,這項功能能協助開發者在更多應用場景中快速生成高品質圖像,特別是在電商設計、內容創作、產品展示與UI試作等領域。實際應用包含以下幾項:

※將商品圖片置換至不同背景情境,實現情境式行銷圖生成

※在AI Studio上使用範例應用進行即時協作繪圖

※以自然語言指定圖片中欲修改的區域,進行局部編輯而不影響整體

※結合文字與圖像,自動生成新商品SKU與包裝設計提案

※作為創意夥伴,協助用戶發想視覺與內容組合

Google也提供了完整API串接方式,開發者可參考範例進行整合測試。目前圖像生成功能預覽版已全面開放,Google也預告未來將持續提升模型品質、拓展功能並開放更高頻率的使用限制。

06/10 全台詐欺最新數據

更多新聞
627 3 8330 損失金額(元) 更多新聞

※ 資料來源:內政部警政署165打詐儀錶板

分享給朋友:

追蹤我們:

※本文版權所有,非經授權,不得轉載。[ ETtoday著作權聲明 ]

AI科技熱門新聞

Apple Intelligence繁體中文即將上線

Google重大勝利! 將為OpenAI提供額外算力

OpenAI大幅調降o3模型價格80%

OpenAI推出最新旗艦模型o3-pro

ChatGPT推出進階語音翻譯功能

OpenAI執行長:AI將重塑人類未來

GPT-4o疑啟動模型切換測試

Anthropic × Cursor探討AI編碼未來

AI散熱明牌? 4公司股價直直飆

Copilot、Gemini、ChatGPT差在哪?

OpenAI揭人機互動設計哲學

AI抗命「偷改程式」拒關機 馬斯克:令人擔心

OpenAI創辦人勉畢業生用AI改變未來

World App登台虹膜驗證換虛擬幣

相關新聞

讀者迴響

熱門新聞

最夯影音

更多

熱門快報

回到最上面
OSZAR »