小凌梦
2024-12-13

【AICG绘画】轻松月入10000+,云端AI应用使用指南,一键打破信息壁垒,快速掌握AI绘画实用技巧。

本帖最后由 小凌梦 于 2024-12-13 15:10 编辑

亲爱的宝子们又见面喽~在这两天突然想到一件事,自从之前给宝子们推荐了一下AIGC的云端应用,可能会有宝子不知道如何正确来使用它呢,所以今天打算给宝子们出一期如何来打破AI绘画使用壁垒,以及AI绘画可以应用到哪些领域中的一篇帖子。

好了宝子们先来看下到底什么是AI绘画,咱们又该如何来理解它呢?咱们接着往下看✧(≖ ◡ ≖✿)

AI绘画基础介绍
AI绘画它是人工智能的一种,主要是通过深度的学习算法来实现的,它是咱们现在唯一可以使用算法来创作视觉作品的一种方式,至于在该过程的背后,都是依托于科学家和工程师来搭建起可以通过图像进行自我学习的一个系统,他们会像系统中提供大量的图像,这将会有成百上千万可使用的图像来给系统进行自我学习,也正是在如此庞大的数据下,AI算法会快速进行自我成长,逐渐理解不同的物品、环境、光影、风格等效果,当我们输入文本指令给它时,那么它就会根据咱们输入的指令来匹配它所学到的一些知识进行关联,从而成为相应的图像呢。

它的本质还是基于算法来的,AI只是它的一个代名词,它并不具备像人们一样的艺术和思考能力,它主要是通过算法的运用使其来进行图像的生成来达到一种艺术效果,现在市面上关于AI绘画的工具还是有很多种的,其中有影响力的有:StableDIffusionWebUI、MIdjourney、AdobeFireFly、ComfyUI、LibLib等产品,这些产品都可以帮助我们来进行创作和商业使用的图像(^U^)ノ~YO。

宝子们可以看下面的几张图,它们分别对应上面的StableDIffusionWebUIMIdjourneyAdobeFireFlyComfyUILibLib的一些页面。

image (10).png

image (11).png

image (12).png

image (13).png

image (14).png

那么咱们再来看下AI绘画的底层逻辑吧~


AI绘画底层逻辑

咱们知道了以上的这些产品和AI绘画的基础后,这时就可以来了解一下AI绘画的底层逻辑了,那么咱们在了解了它后有什么用呢?咱们了解完后可以更好的来使用AI绘画工具,可以帮助我们来更好的进行创作呦~(  ̄ー ̄)人(^▽^ )

image (15).png

AI绘画的基本运行原理是从文本→文本向量(提示词)→潜空间→图像生成

预训练模型
宝子们可能会有疑问,为什么会有预训练模型这一项呢?这是因为在潜空间中进行映射时就需要预训练的模型来进行操作,我们可以简单理解为怎么让文字或提示词来和图像进行匹配,只有这样咱们生成的图像才是符合我们想要的样子的呢,这种文本映射到图像的生成只有在模型训练时才可以完成,如果在后续使用时想要更该映射条件是非常难的,比如咱们想要生成一直猫,那么咱们的提示词就需要写Cat而不是Dog,如果我们在进行模型的预训练时偷偷滴将猫的数据图像换成狗的,那么我们在使用时输入Cat则生成的图像就会是狗子呢( * ̄▽ ̄)((≧︶≦*),这只有在模型的预训练中才可以进行干预哦~

另外一点就是模型的训练需要庞大的数据量和参考图像,并且还需要大量的计算力等基本需求,所以想要训练一个通用的大模型是非常难的,我们自己想要进行模型的微调基本上是不太现实,但我们可以训练个人的Lora来修改风格,AI通用大模型基本都是大公司训练出来的,也有个人训练的一些模型,但这些模型只能应用到特定的领域中哦~

image (16).png


采样器预览
宝子们可能不知道什么是采样器预览,采样器预览其实就是在生成图像时会有一个从草图逐渐生成最终图像的展示,我们可以通过采样器预览来看到图像是怎么来进行生成的,这个我们其实只能观看,并没有办法在生成时来进行其它操作,我们不管是使用SD还是ComfyUI或者是其它的一些工具(除了MIdjourney外)时都可以看到这个逐渐从草图生产最终图像的效果。

每个产品它都有自己的实现方案,就比如MIdjourney和Firefly它们则是采用的GAN算法,它是生成对抗网络的一种算法,在SD中则使用的是扩散算法这包括后来的ComfyUI也是使用的该算法,它们都配有VAE编码器,我们可以理解为潜空间的编解码器,只有使用VAE编码器后才可以在潜空间来生成图像,图像生成完成后再使用VAE解码器来进行图像的最终展示,这就是VAE的一个作用呢。

其实不管在什么算法下,它们都会先从一个比较抽象的画面中来进行扩散,直到最终生成效果,在这里不能说每次都可以生成指定的效果,有时候可能是因为模型的原因或者是参数等其它原因,这时最终生成的效果就会偏离咱们的预期,这点宝子们有使用过AI绘画的话都会有体会的吧~ο(=•ω<=)ρ⌒☆

image (17).png image (18).png image (19).png

image (20).png

我们使用AI绘画工具时可以看到在采样器下方就会有一个逐渐变化的图片,这个就是图像生成的一个过程,当我们运行了程序后,程序执行到采样器时就会先生成一个非常低分辨率的图像,然后神经网络会一层层将其在基础上面来进行覆盖,它还会在原来的图像上面来添加更多的细节部分,这就是神经网络的工作呢,是不是很神奇呢,上图中咱们的随机种子其实是固定住的,我们只有修改提示词或者是其它参数才可以重新生成,但是在生成时我们也是无法干预它的结果的,我们可以做的只有暂停和修改参数。
image (21).png

具体文生图
不管是在哪个AI绘画的工具中它都会有一个输入框的地方,我们称这个地方为提示词,上面的我们就称为正向提示词,下面的我们就称为反向提示词,宝子们我们要知道正反向提示词在刚开始出来的时候就已经存在于SD中了,而MIdjourney则不需要反向提示词哦~这点咱们了解一下就可以呐,在这两年多的时间中我们只要使用SD还是需要输入反向提示词的,只有这样我们才可以生成更高质量的图像呢。

那么正向提示词和反向提示词又是什么意思呢?给宝子们解释一下何为正反向提示词哦~正向提示词表示的是要在最终生成的图像中来展示有哪些东西(物品、人物、光影、颜色、环境等等),那么反向提示词则就是相反的了,也就是表示不在最终图像中出现哪些东西(坏手、多手、低质量、画面崩坏等)。

我们只要SD的模型就需要输入正反向提示词,如果宝子们使用MIdjourney只要输入正向描述词就好了呦~因为它们的执行算法不同要求的就会不同,宝子们如果使用FLUX模型也是不需要输入反向提示词呢,宝子们知道这点就好了呢,在使用时按照正常来使用也不会有太大问题的呢。
image (22).png

image (23).png

宝子们我们想要生成越符合预期的图像,则提示词就要写的越多,这样才会更加精确描述,但提示词它也是会有上限的,正常情况下正向提示词100多个就足够生成一些复杂的图像了呢,在早期时150个提示词就达到了上限了呢,提示词过多了的话也会导致最终生成才图像偏离预期哦~

宝子们可能会说不会自己写提示词或者是描述词要怎么办?嘻嘻~宝子们不要忘记了ChatGPT呢,我们可以将图像发送给ChatGPT来让它帮我们写提示词,这样做不仅省时还省力对吧o( ̄▽ ̄)d
image (24).png

image (25).png

当然有时候ChatGPT可能给咱们的提示词也不是很精准,我们可以在此基础上面手动来进行优化也是可以的呢,或者我们使用图像反推提示词的功能,就比如:JoyCaptionPreAlpha使用它我们就可以将图像反推出更精准的提示词来进行使用啦。
image (26).png

嘻嘻~这样咱们就不用写提示词啦,当然想要复刻原图姿态等细节是需要ControlNet等插件进行细微控制的哦~
AI绘画产品工具
StableDiffusion
StableDifffusion我们简称为SD或者是SDWebUI,它是一个可以在本地进行部署的AI绘画程序,因其是开源的非常受大家的喜爱,动手能力强的宝子们可以选择自己来搭建这个哦~我们还可以根据自己的需求和风格来进行定制模型训练,其中包含的插件有Lora、ControlNet、VAE、Tag反推等,当然我们也是可以来选择自己安装指定插件,推荐宝子们使用秋叶版本的呢~ヽ( ̄ω ̄( ̄ω ̄〃)ゝ
image (27).png

ComfyUI
ComfyUI它是一个高度模块化的AI绘画程序,我们可以像搭建积木一样简单来搭建工作流,不同的工作流可以执行不同的操作,也就是说可以完成我们不同的需求,它不像我们的SD每次都需要来调节细微参数后才可以使用,咱们使用ComfyUI来搭建工作流就会比使用SD更方便且高效,偷偷告诉宝子们ComfyUI支持两种模型的加载方式哦~我们可以更深入来定制图像生成的步骤,从模型的选择到整体参数的调整,搭建起来非常简单,它也是基于SD的扩散算法来实现的,只不过它和SD的操作页面有所不同,SD是传统的操作页面,ComfyUI则是节点式操作页面,这样做的目的是更加的灵活易用哦~
image (28).png

image (29).png

在上图中咱们使用的ComfyUI版本也是秋叶的版本哦~
这样咱们就不用自己安装非常多的东西了,因为该整合包里面已经包含了最基本的使用环境呢。
MIdjourney
MIdjourney简称为MJ它需要在Discord上面才可以使用,因为它不是开源的所以我们在使用它时则需要订阅才可以呢,MIdjourney它也是现在市面上商业化最成功的一个AI绘画平台了,我们想要使用它的话需要进行魔法上网后通过订阅才可以来使用呢,它是目前AI绘画在线平台人数最多的一款绘画工具了,出图效率快、质量高,所以很受用户的喜爱(。^▽^)。
image (30).png

AdobeFirefly
最后一个就是Adobe家的Firefly了,它是Adobe自己所开发的一款AI绘画工具,它是目前年龄最小的一款产品了,毕竟就在前段时间刚发布了不久,让我猜一下宝子们大多数应该都得使用过Adobe家的产品吧,比如PS、DW、AI、AE或者是ME等,作为一家以软件工具为核心的企业,Firefly拥有很高的生产力属性,它支持分层式生成,还可以导入到自己的其它软件中来进行操作,可谓是非常滴方便呢。
image (31).png

image (32).png

其实除了以上这些的AI绘画产品外还有挺多其它产品的,只不过在国内使用的人数比较少,还有一些产品只有特定领域才可以使用呢,其它的产品比如有:NovelAi、Parti、Tiamat、Dalle和LibLib等,所有产品现在都快快速迭代和开发中,我们只要选择一个适合的工具来使用就好啦,开源的好处是操作性和定制化比较高,但稳定性可能没有官方的好些,一些使用问题还是可以找到解决方案的呢。

在目前的AI绘画中找到一款适合自己的产品才是最重要的,虽然AI绘画已经从开始到现在有两年多的时间了,但它还是处于一个起步阶段中,在最初时我们是很难将它应用到商业领域中的,但可以肯定的是,现在整个行业都在快速成长,目前谁也不敢说那款产品最好用效果最好,我们选择一个适合自己的才是最优的选择呐~( ̄︶ ̄)↗
AI绘画应用领域
目前的AI绘画相较于两年前刚出来的时候进步的太多了,AI绘画的诞生让设计领域有的革命性的创薪,它可以帮助设计师来完成创作、设计、构图等,最主要的是它可以帮助咱们来提高产量和质量,我们可以将AI绘画应用到如下的这些领域中,甚至是其它领域也可以来使用它哦~[]~( ̄▽ ̄)~*
产品包装
阅读全文 [ 创薪币: 38 ] , 点击支付
分享到:
回复

使用道具 举报

评论|共 3 个

进洋

发表于 2024-12-13 21:23 | 显示全部楼层

凌梦大佬主业是干啥呀,看凌梦大佬发的精品贴,确实是高产似那啥
我要说一句(1)
我要说一句 展开1条回复
回复

使用道具 举报

Gira小黑

发表于 2024-12-16 12:03 | 显示全部楼层

进洋 发表于 2024-12-13 21:23
凌梦大佬主业是干啥呀,看凌梦大佬发的精品贴,确实是高产似那啥

大佬我最近刚学AI绘画,想取经~
我要说一句
爱钱的蟹老板
回复

使用道具 举报

小凌梦

来都来了点个关注再走

  • 27 日记
  • 196 粉丝
  • 0 活跃度