Google Whisk 可以讓你在沒有提示的情況下產生圖像，而且相當有趣

谷歌剛剛推出了 Whisk，這是一款經過谷歌實驗室測試的新人工智慧工具。與傳統的圖像生成器不同，Whisk 不僅僅依賴文字描述。在這裡，您自己的圖像可以作為產生獨特視覺效果的提示。您可以添加多個視覺效果來定義主題、場景和風格，然後讓 AI 完成剩下的工作。

它是如何運作的？

背後的想法拂很明顯：讓您的工作更輕鬆。無需寫無休無止的提示；只需導入視覺效果，甚至使用建議的視覺效果。如有必要，您還可以使用一些附加文字來優化結果，但這不是強制性的。生成圖像後，可以透過調整提示或更多細節來編輯它。

使用的技術

Whisk 使用了 Google 的兩項技術：Gemini 和 Imagen 3。，AI 語言模型，分析您的圖像並以文字形式產生詳細描述。然後，這些描述會傳遞給影像生成模型 Imagen 3，該模型會根據這些資訊產生視覺效果。但請注意，Whisk 不會重新創建確切的圖像。他從中汲取靈感，創作出捕捉其精髓的作品。我的測試證實，我使用了自己的照片，最終結果中不是我。

具體例子

具體來說，如果您上傳一張貓的照片、一張海灘場景和一張漫畫風格的插圖，您將獲得受這三個元素啟發的視覺效果。我用一把椅子、一張自己的照片和一朵雲進行了測試，它給了我一些非常連貫的東西，即使我真的不知道我能用這樣的視覺效果做什麼。

一個用於實驗的工具，而不是用於生產的工具

谷歌自己說：Whisk 是為快速集思廣益而設計的，而不是最終的、即用型的創作。產生的視覺效果可能缺乏精確性或邏輯性。首先，它是一個在幾秒鐘內測試想法、探索風格或創造「原始」視覺效果的工具。

在功能方面，此介面提供了三種預定義樣式：貼紙、琺瑯別針和毛絨。進階模式可讓您進一步新增文字來調整結果。目前，可能性仍然有限，考慮到這是一個實驗，這是合乎邏輯的。

拂目前只能在美國透過 Google Labs 訪問，但它可以在您的裝置上正常運行通常，以及您的 Google 帳戶，即使是在法國建立的。該工具是免費的，用戶可以直接上傳自己的作品。谷歌希望根據第一批回饋來完善 Whisk，並有可能在未來擴展其功能。

它是如何運作的？

使用的技術

具體例子

一個用於實驗的工具，而不是用於生產的工具

Related articles