Mr.CaCa

眾所周知 ── AI 很強,但你可能也遇過它「哪裡怪怪的」。
你有沒有遇到過,要 AI 生成一張麻辣鍋,但 AI 給了一個看起來有點像又不太像的奇怪火鍋?
為什麼會這樣呢? AI 遇到了什麼問題?
這其實不是台灣獨有的問題。
目前多數主流的生成式 AI,在訓練時主要使用的是:
所以,結果就變成了:
這是因為 資料本來就不平均,也就是說,AI 能學到的世界樣貌,本來就受到資料來源的限制。
以下是 chatGPT 整理出的經驗分類。
台北 101
穩定度:★★★★
原因:國際地標、外觀明確
描述建議:不必多說
中正紀念堂
穩定度:★★★★
原因:建築結構強烈
描述建議:強調白色大理石建築與藍色屋頂
日月潭
穩定度:★★★★
原因:自然景觀清楚
描述建議:補充湖面薄霧、群山環繞的畫面
阿里山
穩定度:★★★★
原因:與櫻花、森林高度連結
描述建議:指定日出、雲海或森林景色
九份老街(整體)
穩定度:★★★☆
原因:視覺辨識高
描述建議:描述狹窄山城街道與紅色燈籠
→ 這類通常 不用特別補救。
龍山寺
問題點:細節多
常見錯誤:變成泛亞洲寺廟
建議描述補強:台灣寺廟外觀、香火與煙霧
夜市(全景)
問題點:類型混雜
常見錯誤:變成泰國/日本夜市
建議描述補強:台灣夜市、以小吃攤為主
淡水老街
問題點:河岸不明
常見錯誤:像歐洲小鎮
建議描述補強:河岸、夕陽與街邊小吃
鹽水蜂炮
問題點:動態場景
常見錯誤:變成煙火秀
建議描述補強:擁擠街道、火花四射與防護裝備
台灣廟會細節
原因:缺乏標準樣本
建議:可作為氣氛圖,不追求細節準確
八家將
原因:與他國宗教混用
建議:不建議生成
繞境場景
原因:結構複雜,AI 理解困難
建議:拆成單一、靜態畫面描述
珍珠奶茶
穩定度:★★★★
說明:國際化程度高
描述建議:可以直接用「珍珠奶茶」
鹹酥雞
穩定度:★★★☆
說明:英文曝光高
描述建議:炸雞塊與九層塔
牛肉麵
穩定度:★★★☆
說明:有固定碗型
描述建議:清湯、牛肉片與麵條
滷肉飯
穩定度:★★★☆
說明:外觀穩定
描述建議:白飯上鋪滿滷過的絞肉
豆花
常見錯誤:變成布丁
描述建議:滑嫩豆腐、糖水與配料
蚵仔煎
常見錯誤:變成西式蛋餅
描述建議:扁平煎蛋,表面帶半透明粉漿質感,小顆蚵仔嵌在煎蛋中,在鐵板上煎製
菜頭粿
常見錯誤:變成白色糕點
描述建議:煎過、表面微焦的米粿
潤餅
常見錯誤:變成春捲
描述建議:薄餅皮包裹餡料、可看見內容物
白糖粿
常見結果:變成一般米糕
建議描述:細長形油炸米糰,表面裹白色砂糖,放在紙盤上,夜市小吃風格
米血糕
常見結果:變成黑色蛋糕
建議描述:由糯米與豬血製成的深色方塊,切片後串在竹籤上,台灣街頭小吃
碗粿
常見結果:變成果凍
建議處理:使用實拍素材
台式粉圓冰
常見結果:任意混搭
建議處理:使用實拍素材
最近天氣有點冷,我們就用 麻辣鍋 當例子。 以下示範的是,把「人類腦中的畫面」,翻譯成「AI 看得懂的畫面」。
我想要一鍋熱騰騰的麻辣鍋。
這句話跟台灣人說一定能聽懂,但 AI 對亞洲文化的學習比較有限。
一大鍋深紅色的湯,表面浮著一層紅色辣油,
湯裡有紅色乾辣椒和深色花椒,
鍋中間是深色湯底,周圍擺著白色的肉片和配料,
看起來油亮、熱氣冒出,適合多人圍著一起吃。
你沒有說「這是麻辣鍋」,
但 AI 已經比只聽到菜名時,更知道要畫什麼畫面了。
❌ 蚵仔煎
✔ 扁平狀的煎蛋料理,表面帶有半透明的粉漿質感,煎在鐵板上,夾著小顆蚵仔
❌ 白糖粿
✔ 細長形的油炸米糰,表面裹著白色砂糖,放在紙盤上,夜市小吃風格
❌酸菜魚
✔偏紅色的酸辣湯,表面浮著紅色辣油,湯中有白色魚片和深綠色酸菜,裝在大碗中供多人分享
→ AI 生成文字時,是在畫圖,很容易多一筆或少一筆變成亂碼。
AI 是一個需要被引導、也能一起完成事情的協作夥伴。
如果你已經理解它的強項與限制,歡迎到 mrcaca.com 試試看。
邊試邊調整,你會發現:
AI 有時候不行,是因為方法差一點點。如果還是不行,我們就先放過他吧!(也許這個題材現在還不適合交給 AI)
現在就想試試看嗎?傳送門這裡請 —— AI 設計名片 | 用 AI 畫 T-shirt | 用 AI 畫帆布袋