去年8月,谷歌發(fā)布了Gemini圖像模型Nano Banana,一度全網(wǎng)刷屏,成為現(xiàn)象級產(chǎn)品,同年11月,谷歌又發(fā)布了Nano Banana Pro,提供更高級的智能功能和工作室級別的創(chuàng)意控制。
北京時間2月27日凌晨,谷歌又更新了,這次是Nano Banana 2(Gemini 3.1 Flash Image),兼具了速度和Pro版的性能,同時價格也更便宜了。谷歌表示,這是團隊目前最好的圖像生成和編輯模型。
AI基準測試機構Artificial Analysis今天發(fā)文提到,Nano Banana 2以Nano Banana Pro的一半的價格在文生圖榜單中排名第一,在圖像編輯榜單中排名第三,僅次于GPT Image 1.5和Nano Banana Pro。

“谷歌再次改變了游戲規(guī)則。”大模型競技場LMArena也在今天發(fā)布了最新排行榜,提到Nano Banana 2在排行榜上拿下全球第一,文生圖測試得分 1280,同樣超越了GPT Image 1.5和Nano Banana Pro。
兩個測評機構都提及Nano Banana 2的性價比,綜合效果更強、速度更快,但價格比Nano Banana Pro 便宜一半。在谷歌AI Studio平臺,Nano Banana 2輸出每張1k圖片的單價為0.067美元,輸入為0.5美元,而Nano Banana Pro對應的價格是0.134美元和2美元。
有網(wǎng)友感慨,“設計師的時代已經(jīng)結束了。”也有人在評論區(qū)認為,當前AI生圖的不真實感仍然較重,有時候生成并不準確,下這個判斷還為時過早。不過,大部分都認為,“是時候適應新技術,向前看了”。
具體來看,此次更新的Nano Banana 2特色主要是:先進的世界知識、精確的文本渲染和翻譯、主題一致性、精確的指令執(zhí)行和視覺保真度提升等,模型可以呈現(xiàn)生動的光照、更豐富的紋理、更清晰的細節(jié)。
谷歌CEO桑達爾·皮查伊(Sundar Pichai)發(fā)布推文提及,Nano Banana 2利用了Gemini模型對世界的理解,并由來自網(wǎng)絡搜索的實時信息和圖像驅動,這意味著模型可以更真實、更準確地反映現(xiàn)實世界的情況。
為了展現(xiàn)模型的這一功能,谷歌創(chuàng)建了一個名為“Window Seat”(靠窗座位)的程序進行演示,用戶可以在這一程序上設定世界上任何一個地區(qū),指定想要的窗戶位置,讓Nano Banana 2生成一扇窗戶的逼真畫面,并根據(jù)實時天氣數(shù)據(jù)更新景色。

有動畫師發(fā)現(xiàn)了一個更有趣的玩法:打開地圖軟件里找到一個位置區(qū)域隨機截圖,然后讓Nano Banana 2生成此地點的動漫/卡通風格的全景圖。
第一財經(jīng)記者用廣州塔區(qū)域的地圖截圖,讓Nano Banana 2嘗試用動漫風格制作此地點的全景圖,或許由于網(wǎng)絡或后臺問題輸出速度較慢,但可以看到,畫面保持了一定的審美和水準,還原了廣州塔、獵德大橋等標志性景點,不過獵德大橋的位置錯誤,一些中文字體的標注仍有錯誤。

換成網(wǎng)頁版輸出,雖然速度更快,但連廣州塔的位置都繪制錯了。由此可見,當前Nano Banana 2的水平還并不穩(wěn)定,AI也并非完美。

谷歌提到,Nano Banana 2也支持高級文本渲染和本地化,可以構建動態(tài)UI生成器,生成更清晰準確的文本,并且能夠直接在圖像中生成或翻譯多種語言的文本。
為了展示這些功能,谷歌開發(fā)了一款名為“全球廣告本地化器”(Global Ad Localizer)的演示應用,它可以將一個英語版本的圖像廣告翻譯成不同語言,例如日文、法語等,以適應國際市場,這對出海的企業(yè)來說有應用價值。

相比初代Nano Banana,Nano Banana 2大幅縮小了速度與畫質(zhì)的差距,能生成高質(zhì)量、照片級的逼真圖像。在單個工作流中,最多能保持五個角色的形象相似性,以及最多14個對象的特征一致性,方便創(chuàng)作者進行故事板繪制和敘事創(chuàng)作。
有一些公司已經(jīng)提前體驗了產(chǎn)品,AI應用開發(fā)公司HubX高級產(chǎn)品經(jīng)理 Sertac Cinar就提到,通過集成Nano Banana 2,HubX 實現(xiàn)了74%–76% 的延遲降低,人臉編輯工作流速度提升了 4 倍,同時沒有犧牲專業(yè)級的畫質(zhì)。
有博主測評顯示,無論是人物表情控制、還是文本生成和排版,Nano Banana 2都比pro版本有了很大的提升。不過,或許是由于參數(shù)量較小的原因,Nano Banana 2對人體結構、復雜度動作、物體結構都認知不足,因此在一些如人體倒立這樣的復雜場景上會有問題。
顯然,Nano Banana 2并非完美,但它確實將圖像生成模型的性能推向新高。只是,這一次的王座能坐多久,下一個登頂者又會是誰?在模型競爭日益激烈的當下,一切仍是未知數(shù)。