谷歌剛剛推出了 Whisk,這是一款經過谷歌實驗室測試的新人工智慧工具。與傳統的圖像生成器不同,Whisk 不僅僅依賴文字描述。在這裡,您自己的圖像可以作為產生獨特視覺效果的提示。您可以添加多個視覺效果來定義主題、場景和風格,然後讓 AI 完成剩下的工作。

它是如何運作的?
背後的想法拂很明顯:讓您的工作更輕鬆。無需寫無休無止的提示;只需導入視覺效果,甚至使用建議的視覺效果。如有必要,您還可以使用一些附加文字來優化結果,但這不是強制性的。生成圖像後,可以透過調整提示或更多細節來編輯它。
使用的技術
Whisk 使用了 Google 的兩項技術:Gemini 和 Imagen 3。,AI 語言模型,分析您的圖像並以文字形式產生詳細描述。然後,這些描述會傳遞給影像生成模型 Imagen 3,該模型會根據這些資訊產生視覺效果。但請注意,Whisk 不會重新創建確切的圖像。他從中汲取靈感,創作出捕捉其精髓的作品。我的測試證實,我使用了自己的照片,最終結果中不是我。

具體例子
具體來說,如果您上傳一張貓的照片、一張海灘場景和一張漫畫風格的插圖,您將獲得受這三個元素啟發的視覺效果。我用一把椅子、一張自己的照片和一朵雲進行了測試,它給了我一些非常連貫的東西,即使我真的不知道我能用這樣的視覺效果做什麼。

一個用於實驗的工具,而不是用於生產的工具
谷歌自己說:Whisk 是為快速集思廣益而設計的,而不是最終的、即用型的創作。產生的視覺效果可能缺乏精確性或邏輯性。首先,它是一個在幾秒鐘內測試想法、探索風格或創造「原始」視覺效果的工具。
在功能方面,此介面提供了三種預定義樣式:貼紙、琺瑯別針和毛絨。進階模式可讓您進一步新增文字來調整結果。目前,可能性仍然有限,考慮到這是一個實驗,這是合乎邏輯的。
拂目前只能在美國透過 Google Labs 訪問,但它可以在您的裝置上正常運行通常,以及您的 Google 帳戶,即使是在法國建立的。該工具是免費的,用戶可以直接上傳自己的作品。谷歌希望根據第一批回饋來完善 Whisk,並有可能在未來擴展其功能。