經理人用戶成長中心 支琬清

奈米香蕉爆紅!Google AI Studio 是什麼?免費配額、應用實例一次看


「奈米香蕉」(Nano Banana)近期掀起 AI 圖像生成的社群風潮,它其實是來自 Google 旗下的 AI 開發平台 Google AI Studio 的一款圖像生成模型,正式名稱為 Gemini 2.5 Flash Image。
那麼,Google AI Studio 這個平台除了可以生成圖像,還有哪些應用?《經理人》帶你一次看:
Google AI Studio 是什麼?可以完成哪些任務?
Google AI Studio 搭載 Gemini 模型家族,並支援最新發表的「Gemini 2.5 Flash Image」技術,具備先進的圖像編輯與創作能力。
平台主打「免寫程式、免費使用」,只需輸入提示詞(prompt),即可生成圖像、撰寫文字與程式碼,還能進行資料分析如摘要檔案、分析或回答問題,以及自動化任務,例如:「生成角色頭像」、「根據冰箱內的食材設計菜單」、「設計社群貼圖」或是「自動回應顧客郵件」。
Google AI Studio 介面介紹:支援哪些 AI 模型?
Google AI Studio 是 Google 推出的免費生成式 AI 平台,並提供免費額度供原型開發與測試,目標在於降低 AI 開發門檻。使用者僅需登入 Google 帳戶,即可開始體驗 Gemini 模型的多媒體能力,無需額外申請 API 金鑰,也無需撰寫程式碼。根據 Google 官方說明,AI Studio 提供的免費配額足以支援初學者開發與測試應用。
AI Studio 支援的輸入格式涵蓋文字、圖片與表格如 CSV,具備多媒體處理能力。使用者可根據需求選擇不同的 Gemini 模型,目前提供包括 Gemini 2.5 Pro、Gemini 2.5 Flash 等模型版本,每種模型皆標示支援的輸入類型與功能限制。
除了基本的 prompt 編輯功能外,平台亦提供多項輔助工具,例如參數調整、提示範本(Prompt Templates)與版本紀錄(History)。開發者可透過 Remix 功能將現有應用快速修改、複製並建立新的應用實例,也能在平台上預覽結果,進行即時測試與修正。
AI Studio 支援與 Gemini API 串接,讓使用者可將模型能力整合至自家應用程式或網站。但需要留意,目前 AI Studio 本身偏重於原型設計與實驗性質,並非最終產品部署平台。若需大規模應用,Google 建議開發者改以 Gemini API 部署至雲端架構中運行。
Google AI Studio 免費額度、token 計價方式一次看懂
Google AI Studio 提供開放的免費模型操作環境,但底層運作仍依賴 Gemini API 的商業計價機制,不同模型與功能所對應的 token 消耗與費用相差甚遠,使用者如未妥善控管,容易在不自覺中超出免費額度並產生費用。
根據官方公告,每個 Google 帳戶提供大方的免費額度供測試與原型開發。例如 Gemini API 免費方案提供每分鐘 60 次請求,圖像生成功能亦設有免費次數。一旦超出,系統將根據實際用量如 token 數量或圖像生成次數進行計價。
Gemini 系列模型依照「輸入 token(Input)」與「輸出 token(Output)」分別計價。以 Gemini 2.5 Pro 為例,每 100 萬個輸入 token 收費約 1.25 至 2.5 美元,輸出則為約 10 至 15 美元。
若改用支援圖片生成的 Gemini 2.5 Flash Image,輸入成本低於 Pro 模型,且圖像輸出有其獨立計價方式,例如每張圖像約耗費 1290 輸出 token,收費 0.039 美元。此外,使用 VLM(Vision Language Model)處理圖片理解、或上傳 PDF、CSV 等結構化檔案,也會觸發額外編碼處理,增加總 token 數。
AI Studio 介面中會顯示當前會話已用 token 數,但未直接顯示剩餘免費額度。使用者如果要判斷是否即將超出免費配額,須自行前往 Google Cloud 控制台查閱帳單記錄,或透過 API dashboard 監控每日請求數。為降低成本風險,開發者可考慮設定預算上限或每日請求數限制,亦可使用相關套件實作 token 數據統計。
Gemini 2.5 Flash Image 功能全解:角色一致性、構圖理解與多模態生成支援
2025 年 8 月 Google 推出最新版圖像生成模型 Gemini 2.5 Flash Image,又稱「Nano Banana」,目前已整合至 Google AI Studio 以及 Gemini API,成為最新一代多媒體生成工具的一部分。
根據 Google 官方部落格說明,該模型提供先進的圖像品質與強大的創意控制能力,以回應對更高品質圖像的需求。
Gemini 2.5 Flash Image 具備多項圖像生成能力,包括角色一致性建構、場景理解、構圖補完與語意級的區塊編輯。開發者可透過單一 prompt 生成圖片,有助於快速進行創作比較與風格選擇。
模型也支援圖片與文字的複合式提示,可理解手繪草圖、照片、插圖等不同輸入類型,並據此進行內容生成或延伸。這使得 Flash Image 不僅能應用於圖像創作任務,也具備語意理解的潛力,適用於圖像說明(Vision-to-Text)或敘事性分析等任務。
模型在圖像風格處理上也顯示出彈性與精準度。使用者可透過詳細的提示詞描述,引導 Flash Image 生成與主題相符的圖像內容。此外,模型能處理細節導向的語義描述,並支援區域性改寫,如「將桌上的紅色蘋果改為綠色」等任務,展現高階語意辨識與畫面控制能力。
圖像輸出可於 AI Studio 視覺化介面中即時呈現,也支援透過 Remix 快速修改提示並建立新範例。Flash Image 的這些設計,使其成為設計、內容創作、原型開發等場景中的潛在工具。
Google AI Studio 使用範例、場景一次看
隨著 Google AI Studio 提供開發者便捷的存取方式與範例推廣計畫上線,大量由開發者貢獻的應用實例湧現,涵蓋創意生成、語言處理、資料自動化與教育模組等多元領域。
根據 DEV 社群與官方 Sample Apps 頁面,目前已公開的範例可分為:角色生成工具、個人化推薦系統、表格處理助手、語音翻譯模擬器與學習筆記工具。以下將依功能類型進行逐一解析,輔以對應操作引導,幫助讀者理解 Gemini 模型的實際應用潛力
範例一:RPG 角色生成器 —— 為遊戲打造專屬人物設定
這項應用針對遊戲開發者與敘事設計者設計,用戶可輸入多模態提示詞如職業、背景故事、性格等,Gemini 模型將同步生成角色描述、視覺外觀建議,甚至可延伸對話風格設計。這個範例來自官方 Sample Apps,設計上支援開發者進行 Remix 與 prompt 自訂,這類應用有潛力成為 AI 劇本與遊戲內容生成的熱門入門專案之一。
範例二:個人化菜單推薦系統 —— 從飲食偏好到每日料理計畫
透過多種提示如個人飲食習慣、禁忌食材與當日可用材料,Gemini 模型可生成適合的食譜與每日菜單建議。這類應用適合用於健康管理、個人營養追蹤、銀髮飲食建議等場景,且支援進一步透過 Gemini API 整合至外部介面,像是 LINE bot 或手機 App 進行互動式推薦。
範例三:即時翻譯模擬器 —— 結合語音輸入與語境提示
Gemini 支援語音檔轉錄與即時語境翻譯,並具備語境翻譯潛力。用戶可上傳語音檔或音訊連結,由 AI 自動轉為文字後,結合多語提示完成翻譯任務。這項應用也支援加入文化背景、說話對象等上下文變數,讓翻譯內容更具情境準確性。此應用特別適合導覽、旅遊、教育演講等場景。
範例四:表格分類與摘要助手 —— 協助資料分析與報表自動化
用戶可上傳包含結構化資料的 CSV 檔案,要求 Gemini 模型進行分類、摘要、重組或資料填補。AI Studio 介面支援直接拖曳上傳文件,透過自然語言指定處理邏輯,例如「依照地區分類營業額並計算成長率」。有助於日常商業分析、教育成績處理與內部簡報自動化流程。
範例五:學習筆記與摘要工具 —— Gemini 教學模組建置支援
Google 官方亦推出 Gemini 教育軟體資源,包括教師模組設計、教案管理與學習模組生成等功能,協助教育者建立教材範本或學生互動系統。使用者可透過 Remix 既有的學習筆記模板進行自訂,常見應用如整理課堂重點、生成摘要、設計複習題目等。
對 Google AI Studio 下提示詞的 4 大技巧:角色設定、格式控制、逐步引導缺一不可
在 Google AI Studio 中設計提示詞(prompt)時,提示語的精確度直接決定 Gemini 模型的回應品質。根據官方發佈的《Tips & Best Practices》指引,開發者可從多個方向優化提示設計:設定角色、控制格式、逐步引導、語義清晰以及補足多模態脈絡。
一、設定清楚的角色與任務目標
開頭明確指出模型扮演的角色能大幅改善語氣與內容方向。範例如:「你是一位經驗豐富的程式設計師,請解釋這段 Python 程式碼」或「你是一位英文母語老師,請幫我修改文法錯誤」。
二、指定輸出格式與語言風格
提示中如能清楚要求模型使用何種結構(如 JSON、表格、Markdown)或語氣風格,可提升輸出一致性。例如:「請以 JSON 格式回答,包含欄位:name、description、tags」。
三、確保語義清晰與任務聚焦
提示語應避免模糊不清或一次包含過多目標的句型,應將任務拆解為清晰的指示。例如,專注於「請說明什麼是量子糾纏」的提示,會比嘗試一次包含過多要求如用有趣故事、專業詞彙和科學數據同時說明更有效。
四、為多檔案輸入提供必要上下文
若提示中包含圖片、音訊等非文字內容,應加入補充說明,例如「這張圖是我拍的早餐,請列出菜名與熱量估算」。
除了以上技巧,Google 也建議使用者建立提示詞的使用習慣:「 輸入提示 → 觀察回應 → 修改語句 → 重試 → 儲存成功版本 」,這樣的流程有助於找出穩定有效的語句結構,提升使用效率與重現性。
Google AI Studio 常見問答(FAQ)
AI Studio 是什麼?
A:AI Studio 是 Google 推出的一款線上 AI 模型操作平台,使用者可以透過圖形化介面與 Gemini 模型互動,進行自然語言處理、圖片分析、程式碼生成等多模態任務。使用過程無需安裝額外軟體,登入即可使用。
Google AI Studio 有哪些功能?
A:Google AI Studio 支援文字、圖片與程式碼的多模態輸入,使用者可透過提示詞與模型互動,執行創作、說明、分析等應用。例如撰寫行銷文案、生成圖片說明、產出程式碼建議等。這些功能可透過調整模型參數、提示結構來進一步控制輸出內容。
Google AI Studio 有提供中文介面嗎?
A:目前 Google AI Studio 的操作介面為英文,不過 Gemini 模型本身支援中文輸入與回應,因此使用者可使用中文撰寫提示詞並獲得中文結果。
Google AI Studio 有免費方案嗎?
Google AI Studio 提供免費額度進行測試與原型開發。例如,Gemini API 提供每分鐘 60 次請求的免費方案,圖像生成功能亦設有免費次數。這些額度根據使用的 Gemini 模型有所不同。超出免費額度後,將依照實際用量收費。若需進一步使用 API 或進行應用整合,則需建立 Google Cloud 專案並啟用 Gemini API。
Google AI Studio 有中文教學資源嗎?
A:目前 Google 官方的教學與技術文件主要為英文。
Google AI Studio 與 Gemini 模型的關係是什麼?
Google AI Studio 是一個與 Gemini 模型互動的前端操作介面,使用者可透過提示詞直接測試模型能力。若開發者希望將模型功能整合至自家應用程式中,則可透過 Gemini API 執行相關任務。
我要怎麼開始使用 Google AI Studio?
Q:使用者可透過 Google 帳號登入 AI Studio( https://aistudio.google.com/),登入後可立即使用提供的免費額度進行測試與開發。如需串接 API 或部署至應用程式,則需建立 Google Cloud 專案並啟用 Gemini API 功能。
資料來源:Google1、Google2、DEV、AI Institute;本文初稿由 AI 協助整理,編輯:支琬清