
前两篇文章已经聊了SD的安装和相关插件,今天我们来聊聊SD的学习及使用。
因为Stable Diffuion与Midjourney有贯通之处,所以我们就一起来聊这个事。
等后面不忙了,再补充一下MJ的安装教程。
本篇文章的重点在于梳理AI绘画技术的理论及需要学习的重点。
没有真实操,想学实操的看下一篇,但也希望你先看完这个对你有帮助。
吐槽:上一篇插件篇因为加入了一些插件的网站,文章被认定为推广网站不给推流,我也不想辩解什么,有需要的自己去看。这篇我就尽量少提及一些网站的事情。
那我们开始吧!
01 AI绘画就是个搜索引擎!(关键词)
如同每个时代科技产品的诞生都会在社会和舆论之中掀起一波浪潮一样。
AI绘画技术的出现也引起了不小的争论,有争论自然就有拥护者和抗议者。
在互联网这个大舞台上,为追随热点而故意吹捧效果的拥护者大有人在。
AI绘画被吹嘘到了一个令人着迷,又有几分畏惧的程度。
从学习和使用了一段时间AI绘画的体验者角度来讲:
AI绘画挺厉害,但并没有那么厉害,甚至还有些稚嫩。
说这些话两个目的:
1、不要对AI绘画抱有太大的期望。--抱着学会了就能做神笔马良不太现实
2、AI绘画相比于其他软件来讲比较简单。(比如PS\AE\C4D等等)--不要害怕很轻易上手。
这里我们聊一个编外话题:
人们对新技术的恐惧:
你是否知道,在汽车刚刚被发明的时候,人们对这个铁家伙非常畏惧。甚至立法:汽车只能开5迈,并且每次出门都要有四个人在前后开路。(当然这里面有马车生产链资本控制的缘故)
在相机被发明时,画家也是对其十分恐慌,我们的老祖宗甚至认为这个东西可以摄人心魄。当然摄影也有一个至今一直争论的问题,与AI绘画也有关,那就是摄影究竟是应该记录真实事物(比如战地拍摄),还是应该美化我们看到的事物(比如个人写真)?这是一个哲学问题,各位看官自己思考吧。
好 结束题外话
AI是搜索引擎:
我之所以这么说,是为了让你更好的理解AI绘画。
你要跟着我的思路去把AI当成搜索引擎,你就可以在短短几分钟内把AI绘画学明白。
我们知道百度是个搜索引擎,我们输入想要知道的内容,反馈给我们对应的信息。
那如果我们把饿了吗、美团也当做一种搜索引擎,我们输入内容,它给我们反馈的是饭店名称和提供什么服务。一个定向的搜索引擎,只呈现规定类的信息。
现在我们在AI中输入内容,它反馈给我们的是画面。我们提供的这些关键词就成了画面中的元素。这与外卖软件提供一个信息给你一个门店的信息是不是很类似。
这么理解是不是就简单了。
之所以让你这么理解,是AI绘画有别于传统绘画软件,传统绘画软件是学习用什么笔刷,怎么调整笔刷的效果,怎么下笔,用什么工具修饰等等。而AI绘画我们学习的是如何搜索画面。
02 怎么搜索很重要-从哪里搜也很重要(模型)
现在你知道了AI绘画是个搜索引擎,那么搜索引擎从哪里给我们呈现内容呢?
我们搜索牛肉面,百度会给我们提供很多信息,什么是牛肉面,牛肉面怎么做,牛肉面的由来等等。百度是靠爬虫搜索了大量网上的信息提供我们预览的。饿了吗和美团呢?他们是靠入住的商家提供我们信息的。AI绘画是靠模型提供我们信息的。
模型就是这些信息的数据库,就是你身边入住的那些商家。你今天想吃西安羊肉泡馍,你一搜,结果没有,这说明什么:说明你家附件没有卖羊肉泡馍的店。
也就是说:你所要搜索的内容(想要画的内容)模型中必须有才能呈现!
但你不必担心,一般情况下大模型里都有你想要的内容,即使没有也有类似的内容。
那如果你就想要大模型里没有的内容呢?那就使用小模型(lora)做补充。
还是以点餐为例:现在你想点羊肉泡馍,恭喜你家附近有了!但是不配糖蒜!多么可怕的事。这时候你发现有好心人建立了一个羊肉泡馍配糖蒜的讨论组,他们提供糖蒜服务,是不是很贴心~~ 这个讨论组就是lora模型。还有的讨论组专门负责不放香菜,这就是负面词lora模型(我们放在负面模型文件夹中embeddings)
顺便提一下,这些好心人确实大公无私,提供了很多模型供我们使用,感谢大神。
现在我们换个角度想这个问题,你可能需要给自己点餐,也可能要给你女朋友点餐,你的女朋友在城市的另一头,那你点餐时就不能选择本地。需要选择女朋友所在的位置。这就是有多个大模型供你选择,他们分别代表:插画类、2.5D类、真人类。
当然还有很多细分,还有一些很特殊的比如:Q版、风景的、科幻的等等。
所以在你绘画之前,你要先选好自己所需的大模型。
每个模型提供了不同的信息库,并且这些大模型都是好心人制作的,所以现在流通的大模型非常多。就跟你不能为了点餐把全中国的餐馆信息都调取出来一样,你也不能把所有大模型都下载到自己的本地部署。
所以对于大模型,你需要多交流,多发现,多实践,找到自己喜欢和常用的模型。
讨论区我会分享一些模型,这里就不展开讲了。
还记得那个C站助手吗?它可以帮助你更好的学习模型和观察模型与模型之间区别的有利助手。
而关于lora,这个虽然小,但非常多,而且永远都有你想要的,准备好空间下载吧。
现在你知道了AI绘画需要:关键词+大模型+lora
下面我们讲最后一点
03 控制
AI绘画者不管自己叫画师,因为会受到抵制,我们更愿意称呼自己叫魔法师或者咒术师,这个你随意怎么起。
之所以这么叫,是因为我们是用一段话来绘画的,如同念了一段咒语一样。
关键词就是咒语,而能做出什么样的画除了取决于模型以外,还取决于你控制魔法的能力。
是不是很玄学,AI绘画就是很玄学的东西。我们是在玄学中找寻逻辑规律,提高我们的施法能力。
控制说起来其实很简单:
1、关键词的控制:你要学会使用关键词的修饰符,及掌握一些关键词的用法
2、大模型和lora:有一个非常精准的模型或者lora会对你的绘画有明显的提高
3、通过外力:比如插件,PS等绘图工具,对你的图像进行准确定位,准确修改。
常用的控制方法:
controlnet控制生图的准确性--经过PS初步修饰--放到图生图局部修饰--再图生图洗一下。
A模型生图--B模型修图。或者MJ生图SD修图。
软件作为一个工具,就是让事情变得越来越简单,学习AI绘画的难点不是如何做出你想要的图,而是你想要什么样的图!怎么做容易,而你想吃什么难,想想你每次点餐是不是没个想法。
04 学习
了解完这些,你已经对AI绘画有了个初步的认知。
我们来聊一下学习的问题,这个要比你怎么操作更重要。
我们已经知道了AI绘画是:关键词+大模型+lora+控制操作
其中最难的是:关键词和模型
难点在于关键词和模型太多了,你没法把他们全记住,就如同你没法把百度上所有的内容都背下来一样。或者说:你要学习的是英文,不是背英语词典。
而文字与画面之间的联系,我们很难靠记忆把他们都记录下来(记多了就乱了)。
这时我们需要一个特别厉害的软件帮我们记忆,那就是excel表格!
在使用AI绘画时,你最好准备一个excel表,将每次使用的关键词和模型等信息分类记录下来,并形成一个属于你自己的信息体系。
在学习上说点个人经验供大家参考:
1、专注于一类画:面面俱到是不可能的,就找一类你喜欢或者能为你提供价值的内容去收集和整理。
2、一定要有自己的excel表格:网上有很多4000+或者12000+关键词整理表,(90%都是免费的,可以通过很多途径获得)但意义不大,刚开始算是个参考,后期你会发现词越多你越难以下手。
3、多实践:包括网上送你关键词表格的人也讲,要多实践,反复的尝试。将自己的词汇细分的越细越好,多实践多总结。
回到正文:
除了收集excel表以外,你还要多找参考,多抄作业。抄作业的目的是在于你把信息存入自己的作品中。这样省去很多你打字整理的过程,遇到特殊情况就把参数研究明白单独存在excel里,随着慢慢累积,你就会有自己的词库,方便使用。
整理思路:
信息尽量存在图片中,并将这些图片放在固定的参考文件夹里
图片信息要多尝试,不同模型多出图,发现这个模型对这个词敏感,而另一个模型对这个词无视,就用excel记录下来,方便日后查询。
对于特殊效果的词,研究一下是不是模型都通用,然后记录在execl里。
日常固定的一些比如:场景、元素、发型、服饰等等这些内容词也分批记录在execl里
并做好标注,比如A模型出的衣服更好看一些,B模型的脸型你更喜欢一些。
多做对比,挑出自己常用的,并去网上搜索相关的信息。
多找姿势和构图的参考,并将其分门别类的规制好。
找个平台,把你收集的信息记录下来,不想公开可以私有,作为日记保存。
关键词和模型这些信息都需要你自己整理!别人藏的东西你永远找不到!
05 玄学
最后讲点玄学。
1、AI是一个搜索引擎,其机制就是给你提供与关键词相关的信息。但信息并不一定准确,AI绘图是随机的,所以这里面有概率的问题,我们管每次生图叫抽卡,你获得一张好图是由抽卡次数*概率决定,精准控制决定概率大小,无论怎么精准控制都要有大量抽卡次数做保证。
2、关键词:关键词是非常玄学的,其中包含:关键词可能不起效!关键词相互之间干扰(哪怕完全不相关的关键词)!关键词之间即使矛盾也能共存!本次抽卡可能会出现上次抽卡时涉及的关键词的信息!关键词需要不断尝试和调整。关键词的基础是你的词汇量(中文)和联想能力。
举个例子:关键词:微笑或者大笑,都能产生表情的生动变化。但如果你加上嘴角上扬,就会比大笑控制能力更强,这就是联想。
3、抄作业:记住即使相同的模型,相同的lora,相同的关键词,相同的种子,相同的设置,也可能出现天差地别的两个图!这里面非常玄学,我们需要通过其他方式:插件/PS/操作,让其更加精准。很多你看着非常好看的,元素丰富带有设计感的图都是靠后期软件和AI绘画反复合作完成的。
4、尺寸:这个不是玄学,但是一个新人都面临的问题,为什么你生的图会乱七八糟,为什么你生的图只有一半脑袋,都是因为尺寸。尺寸中宽度高度都不能给太大,其中一个值为512最佳。因为很多模型是用512大小的图训练的。大于这个值就会出错。
06 最后
学习是无止境的,一点踏入其中你会发现你什么都想了解,但又什么都了解不清晰。
现如今非常准确和精准的信息已经不多了。找到一条你希望成就的方向,按着这个方向去研究往往事半功倍。
AI绘画没有那么神奇,请不要盲目神话其中。想单凭AI绘画成为设计师,不太现实,娱乐足以。下一章我们进入正式的SD学习。同时我也分享一章关于AI变现的现状。
希望对你有所帮助。