Lensa 照片和影片編輯應用程式在添加了一項功能後,可以讓您以當代藝術風格生成令人驚嘆的數位肖像,最近幾週在社交媒體上引起了轟動。
只需支付少量費用,並上傳 10 到 20 張不同的照片即可。
2022 年是文字到媒體人工智慧技術離開實驗室並開始殖民我們的視覺文化的一年,而 Lensa 可能是迄今為止該技術最靈活的商業應用。
它在尋求脫穎而出的社交媒體影響者中點燃了火焰,也在藝術界點燃了另一種火焰。澳洲藝術家 Kim Leutwyler告訴衛報她在倫薩的肖像畫中認出了特定藝術家的風格,包括她自己的風格。
自從 Midjourney、OpenAI 的 Dall-E 和 CompVis 小組的 Stable Diffusion 今年早些時候突然出現以來,個別藝術家的風格可以輕鬆模仿已經敲響了警鐘。
藝術家們感到他們的智慧財產權——或許還有他們的靈魂的一部分——受到了損害。但有嗎?
嗯,就現有版權法而言並非如此。
如果不是直接偷竊,那是什麼?
文字到媒體的人工智慧本質上非常複雜,但我們非電腦科學家可以從概念上理解。
— 勞倫·伊普蘇姆 (@LaurynIpsum)2022 年 12 月 6 日
為了真正掌握 Lensa 的優點和缺點,有必要退後幾步,了解藝術家的個人風格如何進出為 Lensa 等系統提供動力的黑盒子。
Lensa 本質上是一個精簡且客製化的前端,適用於免費提供的穩定擴散深度學習模式。它之所以如此命名,是因為它使用一種稱為潛在擴散的系統來為其創意輸出提供動力。
「潛在」這個詞是這裡的關鍵。在數據科學中,潛在變數是一種無法直接測量的質量,但可以從可測量的事物推斷出來。
當建構穩定擴散時,機器學習演算法被輸入了大量的圖像-文字對,它們自學了數十億種連接這些圖像和標題的不同方式。
這就形成了一個複雜的知識庫,其中沒有一個是人類可以直接理解的。我們可能會在其輸出中看到“現代主義”或“濃墨”,但穩定擴散看到的是數字和連結的宇宙。
所有這些都源自複雜的數學,涉及從原始圖像文字對生成的數字。
由於系統吸收了描述和圖像數據,因此我們可以透過輸入有意義的提示來繪製可能輸出的巨大海洋的路線。
以下圖為例。文本提示包括術語“數位藝術”和“artstation”——這是許多當代數位藝術家的家。
在訓練過程中,穩定擴散學會將這些詞語與它在接受訓練的各種藝術品中識別出的某些品質聯繫起來。結果是一個非常適合的圖像藝術站。

是什麼讓Lensa脫穎而出?
因此,如果穩定擴散是一個文字到圖像的系統,我們可以在其中瀏覽不同的可能性,那麼 Lensa 看起來就完全不同了,因為它接收的是圖像,而不是文字。這是因為 Lensa 最大的創新之一是簡化了流程文字倒裝。
Lensa 拍攝用戶提供的照片並將其註入到 Stable Diffusion 的現有知識庫中,教導系統如何「捕捉」使用者的特徵,以便對其進行風格化。雖然這可以在常規穩定擴散中完成,但它遠非簡化的過程。
儘管您無法將 Lensa 上的圖像推向任何特定的所需方向,但權衡是提供多種幾乎總是令人印象深刻的選項。這些圖像借鑒了其他藝術家作品的想法,但不包含他們作品的任何實際片段。
澳洲藝術法律中心說得很清楚儘管個別藝術品受版權保護,但背後的風格元素和想法卻不受版權保護。同樣,Dave Grossman Designs Inc. 訴 Bortin 案案件美國確定版權法不適用於一種藝術風格。
那麼藝術家們呢?
儘管如此,藝術風格和技術現在可以透過這種方式轉移這一事實對藝術家來說具有極大的破壞性和極大的不安。隨著像 Lensa 這樣的技術變得更加主流,藝術家們越來越感覺自己被敲詐了,立法可能會面臨適應它的壓力。
對於從事小規模工作的藝術家來說,例如為有影響力的人或其他網路企業創作數位插圖,未來看起來充滿挑戰。
然而,雖然使用人工智慧製作出看起來不錯的藝術品很容易,但創作具有特定主題和背景的非常具體的作品仍然很困難。因此,無論像 Lensa 這樣的應用程式如何改變藝術創作方式,藝術家的個性仍然是他們作品的重要背景。
藝術家自己可能需要藉用影響者手冊中的一頁,並投入更多精力來宣傳自己。
現在還處於早期階段,對於藝術生產者和消費者來說這將是一個動盪的十年。但有一件事是肯定的:精靈已經從瓶子裡出來了。