多客科技 发表于 2023-11-12 22:49

AI文生图原理分享

作者:文达Art
我们在2023年这一年中,经常被AI所刷屏,经常会收到某某AI软件更新了,某某行业要被取代了,那作为艺术创作者而言,AI会取代我们现有的媒介吗?我的答案是否定的,AI发展到今天,区别于任何一种媒介,有很多词汇是完全错误的,例如“AI摄影”,摄影的最核心的本质是时间与空间的切片,而AI并不具有这一特性。

基于以上观点,我想简单分享一下,现在主流使用的AI软件背后的原理,这样我们就可以很直观的明白为什么AI不会取代任何一种媒介



AIIG文生图原理

Algorithm+Dataset=AIIG

(AI-Image Generation)

AI算法+训练数据集=人工智能图像生成

也就是说,想要弄懂文生图,就要从AI算法和训练数据集两个方面去理解



算法

1.扩散模型(Diffuison Model)



重要强调概念:加噪和降噪

图从左向右看就是图像去噪的过程,最左边是没有去过噪点的图像

通俗理解,AI在存储图像时,原始图像大小从几兆到几百兆不等,那这样的大小,对于图像存储来说压力太大

那么AI便在图像上去增加噪声,最后使得图像变成所谓的噪点,将这些噪点储存起来,那这些噪点对应的则是这个图片



(噪点)

AI可以基于这种噪点还原回原本的图像,图像也可以变成这种便于存储的噪点,简单理解,这就是扩散模型

2.生成式对抗网络(GAN,GenerativeAdversarialNetworks)



(GAN对抗式网络的灵感来源于达尔文的进化论)

GAN系统简单来说

就是生成式机器人vs判断式机器人

生成式机器人的目的是为了骗过判断式机器人

而判断式机器人的目的就是去甄别生成式机器人所生成的图像是否过关

通俗理解,这样的算法,就好像丛林法则,强者生存,弱者淘汰,最后使得生成的图像质量很高

训练数据集

AI学习的过程和人不同

人可以在见过一只猫以后,便可以理解猫这一类的动物,下次见到猫,我可以瞬间说出这是猫

而AI则不同,AI在学习一类事物的时候,并不能通过一个图像理解图像所对应的图像群,他只能通过图像本身的特性和特点去学习,最后理解

数据集(Dataset)

目前我们所有已知的AI软件,都是基于人类所创作的图像数据集而训练的,这里面包括人类的绘画,人类的摄影等等等

这也就回答了大家几个常见的问题:

为什么我们在拿mj的模型去生成摄影风格的图像时会有一种绘画感,就是因为大模型在训练的过程中,为了保证图像质量和泛化性,融入了大量的油画图像和其他领域的图像,这就导致我们在真正使用的过程中,所生成的摄影图像会有一种浓烈的油画味道

我国法律规定

AI写作第一案深圳南山案



有兴趣的同学可以去查一下,最后2020年判决AI胜诉,虽然是利用ai生成的文本,但依然不能随意搬运

我国只保护表达,而不保护思想,如果AI软件在学习图片的创作思想而并非简单地复制粘贴,这种情况下是不侵权的,不需要获得授权和支付使用费

所以利用AI这一媒介的表达是受到法律保护的

来源:法制日报



但这不代表可以随意利用他人的肖像权和声音去制作图像和声音

网信部+工信部+公安部深度合成管理明确规定了相关法律



AI会不会替代其他创作媒介

我认为一定不会

我们已经了解了他的原理,他所生成的所有图像都是基于人类原有图像的一种再生成和缝合,其实并没有实质性的创新,但这并不影响它在艺术创作上的使用,他的这种原理,替代不了其他媒介,其他媒介也不会有像ai一样的缝合能力,ai这一媒介的艺术表达不应该像任何一种媒介,它需要自己单独的赛道和风格

以上是对ai原理和ai会不会替代其他媒介的简单阐释,文章并没有引用数学公式

希望大家点个订阅,我会持续分享艺术有关的学习成果,多沟通多交流

页: [1]
查看完整版本: AI文生图原理分享