Lensa 照片和视频编辑应用程序在添加了一项功能后,可以让您以当代艺术风格生成令人惊叹的数字肖像,最近几周在社交媒体上引起了轰动。
只需支付少量费用,并上传 10 到 20 张不同的照片即可。
2022 年是文本到媒体人工智能技术离开实验室并开始殖民我们的视觉文化的一年,而 Lensa 可能是迄今为止该技术最灵活的商业应用。
? 奥巴桑乔敢吗? (@Carnage4Life)2022 年 12 月 8 日Lensa 基本上是在 Stable Diffusion 之上进行的即时工程,打包为一款应用程序,据传每天可以通过应用程序内购买赚取 100 万美元。
这只是新一代应用程序的一个例子,它将即时工程转变为生产力和娱乐工具。pic.twitter.com/LiVxInklD5
它在寻求脱颖而出的社交媒体影响者中点燃了火焰? 并在艺术界掀起了一股别样的火。 澳大利亚艺术家 Kim Leutwyler告诉守护者她认识特定艺术家的风格? 包括她自己的风格? 在伦萨的肖像画中。
自从 Midjourney、OpenAI 的 Dall-E 和 CompVis 小组的 Stable Diffusion 今年早些时候突然出现以来,个别艺术家的风格可以轻松模仿已经敲响了警钟。
艺术家感受到他们的知识产权吗? 也许还有他们的灵魂? 已被泄露。 但有吗?
嗯,就现有版权法而言并非如此。
如果不是直接盗窃,那是什么?
文本到媒体的人工智能本质上非常复杂,但我们非计算机科学家可以从概念上理解。
? 劳伦·伊普苏姆 (@LaurynIpsum)2022 年 12 月 6 日
为了真正掌握 Lensa 的优点和缺点,值得退后几步来了解艺术家的个人风格如何进入和走出为 Lensa 等系统提供动力的黑匣子。
Lensa 本质上是一个精简且定制的前端,适用于免费提供的稳定扩散深度学习模型。 它之所以如此命名,是因为它使用一种称为潜在扩散的系统来为其创意输出提供动力。
“潜在”这个词是这里的关键。 在数据科学中,潜在变量是一种无法直接测量的质量,但可以从可测量的事物中推断出来。
当构建稳定扩散时,机器学习算法被输入了大量的图像-文本对,它们自学了数十亿种连接这些图像和标题的不同方式。
这就形成了一个复杂的知识库,其中没有一个是人类可以直接理解的。 我们可能会在其输出中看到“现代主义”或“浓墨”,但稳定扩散看到的是数字和联系的宇宙。
所有这些都源自复杂的数学,涉及从原始图像文本对生成的数字。
由于系统吸收了描述和图像数据,因此我们可以通过输入有意义的提示,在大量可能的输出中绘制一条路线。
以下图为例。 文本提示包括术语“数字艺术”和“artstation”? 该网站是许多当代数字艺术家的家园。
在训练过程中,稳定扩散学会将这些词语与它在接受训练的各种艺术品中识别出的某些品质联系起来。 结果是一个非常适合的图像艺术站。

是什么让Lensa脱颖而出?
因此,如果稳定扩散是一个文本到图像的系统,我们可以在其中浏览不同的可能性,那么 Lensa 看起来就完全不同了,因为它接收的是图像,而不是文字。 这是因为 Lensa 最大的创新之一是简化了流程文本倒装。
Lensa 拍摄用户提供的照片并将其注入 Stable Diffusion 的现有知识库中,教导系统如何“捕获”用户的特征,以便对其进行风格化。 虽然这可以在常规稳定扩散中完成,但它远非一个简化的过程。
尽管您无法将 Lensa 上的图像推向任何特定的所需方向,但权衡是提供多种几乎总是令人印象深刻的选项。 这些图像借鉴了其他艺术家作品的想法,但不包含他们作品的任何实际片段。
澳大利亚艺术法律中心说得很清楚尽管个别艺术品受版权保护,但其背后的风格元素和想法却不受版权保护。 同样,Dave Grossman Designs Inc. v Bortin 案案件美国确定版权法不适用于一种艺术风格。
那么艺术家们呢?
尽管如此,艺术风格和技术现在可以通过这种方式转移这一事实对艺术家来说具有极大的破坏性和极大的不安。 随着像 Lensa 这样的技术变得更加主流,艺术家们越来越感觉自己被敲诈了,立法可能会面临适应它的压力。
对于从事小规模工作的艺术家来说,例如为有影响力的人或其他网络企业创作数字插图,未来看起来充满挑战。
然而,虽然使用人工智能制作出看起来不错的艺术品很容易,但创作具有特定主题和背景的非常具体的作品仍然很困难。 因此,无论 Lensa 这样的应用程序如何改变艺术创作方式,艺术家的个性仍然是他们作品的重要背景。
艺术家自己可能需要借用影响者手册中的一页,并投入更多精力来宣传自己。
现在还处于早期阶段,对于艺术生产者和消费者来说这将是一个动荡的十年。 但有一件事是肯定的:精灵已经从瓶子里出来了。
布伦丹·保罗·墨菲,数字媒体讲师,澳大利亚中央昆士兰大学