最近后台总有人问我,说想用AI画真人,但出来的图要么像塑料娃娃,要么五官扭曲得能吓自己一跳,到底该用哪个模型训练,才能让画出来的人像有呼吸、有温度,甚至有点自己的“脾气”?
这事儿吧,还真不是随便挑个模型就能解决的,你得先明白,AI画真人,本质上是在“模仿”和“重组”它看过的大量真人图像数据。模型“吃”进去的是什么,很大程度上决定了它“吐”出来的是什么。
先说说最常被提起的几个“老江湖”。
SD 1.5 和它的衍生系,可以说是很多人的启蒙老师了,它就像一个基本功扎实、但风格略显老派的画师,你用合适的提示词,它能给你画出结构准确的人脸,但问题也在这儿——太“平均”了,如果你不花心思去调教,出来的脸很容易陷入一种“网红模版感”,大眼睛、高鼻梁、完美皮肤,美则美矣,缺少点能让人记住的瑕疵或个性,想用它画真人,你得像导演调教演员一样,用非常具体、甚至有点“啰嗦”的提示词去约束它,略带疲惫的眼神”、“笑起来一边嘴角更高”、“颧骨处有淡淡的雀斑”…… 你得跟它“搏斗”,才能从那种标准的完美里,抢出一点真实感。
然后就是 ChilloutMix 这类模型,曾经火得一塌糊涂,它“吃”了大量亚洲面孔的写真和网络照片,特别擅长生成符合东亚审美、皮肤质感细腻的年轻女性形象,你让它画个“咖啡馆窗边的女孩”,它大概率能给你一张可以直接当头像的漂亮脸蛋,但它的“舒适区”也很明显,风格比较单一,容易腻,因为它训练数据来源的问题,有时候你会觉得生成的人物气质过于“特定”,仿佛都是从同一个影楼里走出来的,如果你想画不同年龄、不同地域特征、有强烈故事感的脸,它可能就有点力不从心了。
.jpg)
那想要更真实、更富有细节和感染力的人像呢?很多人会把目光投向 Realistic Vision 系列,这个系列,听名字就知道它的追求,它在皮肤纹理、毛发、瞳孔反光、甚至面部细微的褶皱上,下了更多功夫,生成的人物,乍一看没那么“惊艳”,但耐看,你能感觉到光线在皮肤上的过渡,嘴唇的湿润感,眼白里细微的血丝,它更像一个沉迷于细节的写实派画家,它的“真实”有时会显得有点……沉重?或者说,它倾向于呈现一种未经修饰的、带着生活痕迹的真实,如果你想要的是那种轻盈、梦幻的“艺术照”感,它可能反而不会是你的首选。
除了这些通用大模型,LoRA(低秩适应模型) 才是真正让AI人像“活”起来、拥有个性的秘密武器,你可以把基础大模型想象成一个天赋很高的素描生,而LoRA就是一套套针对性的特训课程。
你想画一个具有90年代港星风韵的女性,可能就有一个专门的“港风LoRA”;你想让人物带有某位特定演员的某种神韵(注意,这里涉及版权和伦理的灰色地带,需极其谨慎),也可能有对应的LoRA;甚至还有专门表现“汗水”、“泪痕”、“老旧胶片颗粒感”的LoRA,这些小巧的模型文件,就像给AI这个画师递上了不同的参考照片和画笔,让它迅速锁定某种特定的真实感。玩真人AI绘画玩到后期,几乎都是在和各种各样的LoRA打交道。 你组合不同的LoRA,就能调配出独一无二的“真实”配方。
这里有个巨大的坑,也是我觉得最需要提醒新手的地方:对“真实”的追求,很容易滑向“恐怖谷”,有些模型,为了追求极致的皮肤毛孔和毛发细节,如果参数没调好,会生成一种令人不安的、近乎解剖学标本的质感,眼睛里的高光可能死板得像玻璃珠,牙齿的排列过于完美而显得诡异,这时候,真实反而成了噩梦,避免这个,需要你在“细节强度”和“整体和谐”之间反复拿捏,稍微“模糊”一点,留给观者一点想象空间,效果会更好。
说到底,没有一个“最好”的模型,只有“最适合”你当下需求的模型。 你的需求是什么?是想要一张能吸引眼球的精美海报,还是需要一个有说服力的故事角色设定图?是追求社交媒体上的“第一眼惊艳”,还是耐人寻味的艺术表达?
我的建议是,别贪心,先从一个基础模型(比如SD 1.5或Realistic Vision的某个版本)开始,彻底摸透它的脾气,像收集邮票一样,收集几个评价高、风格你喜欢的LoRA,就是最重要的环节——疯狂地实验和失败,别怕出废图,每一次扭曲的五官和诡异的肢体,都在告诉你模型的边界在哪里,记录下那些能产生“灵光一现”效果的提示词组合和模型搭配。
也是我最想强调的一点:技术永远在追赶想象。 模型只是工具,它帮你解决了“手”的问题,但“眼”和“心”还是得靠你自己,多观察真实世界里的人,他们的表情如何瞬息万变,光线如何塑造他们的轮廓,岁月和经历如何留下痕迹,这些观察,才会最终让你知道,该给AI下怎样的指令,去生成那份打动人心的“真实感”。
毕竟,我们想要的,或许从来不是一张像素完美的脸,而是那张脸上,仿佛能看见的一个故事。
(免费申请加入)AI工具导航网

相关标签: # ai绘画真人用什么模型训练
评论列表 (0条)