本文仅代表个人工作流总结&行业思考,较为粗糙,并无阐述过多技术点。如有其他想法欢迎交流。
有部分科普性质文字,同专业同学可以只看第4和第5部分。
01 不同AIGC软件效果图
目前AIGC的主流软件有和 。
我用mj生成的产出图:
我用sd生成的产出图:
可以明显看出,mj的生产图精细度更高,画面更细腻;sd则质量稍差一些。二者根本区别在于,sd的底层框架是开源的,而mj是闭源的。
02 原理阐述&软件选择
开源的本质含义是——我可以自由的选择这项技术的任何节点,自我改造成适应我业务的模式;所以大多数情况下,适合介入工业化的软件都会是sd而不是mj。
03 AIGC工业化到底是什么
与业务美术风格(画风)一致的前提下,AI可以根据项目的具体需求,快速大量出图解决需求or提高解决需求的效率;使人工成本降低,生产力提高。
美术要求越低越少、量越大的业务,AIGC可用价值就越高。
具体落地的核心点只有两个:
1. 可以训练出与项目画风一致的大模型。
2. 可以结合软件快速完成多种多样的个性化需求。
04 举个例子
我个人在工作和个人创作中针对AI跑了很多条工作流想去节约自己的时间和提升效率,基于时间和隐私问题我就不再这里展开讲述,只是拿出基本的思路拆解给大家举个小例子。
某小业务的画风来源于一名叫的韩国画师,现有数字人/角色需求如图。
AIGC会如何介入?
第一步
训练符合画风的模型。(此模型为我的友人工作室训练提供,仅为此次文章练手,非商用无版权问题)
1. 找到画风一致的素材图 70-100张左右。
2. 打tag。
3. 测试数据分批试跑 直至找到风格最接近且稳定的lora。(目前不太推荐loha,乘积参数变量太大)
第二步
结合软件快速完成多种多样的个性化需求。
这里我推荐我个人的两种工作流,:一种是面对想法少时间赶的文生图法,第二种是想法偏多的图生图法。同理,想法越多,设计师介入程度越高。
文生图:
1. 将需求转化为关键词。
2. 适当调整并输入。
3. 选图。
4. 我认为这张不错。
可以看到这张图还存在诸多的细节问题,但已经可以基本满足60%需求了。从生成到选图,花费时间在3h左右。剩下的细节设计调整,就需要靠设计师手动调整,并与需求方强交接。
这套文生图的方法流更多是做一个大方向的快速出具,给需求方更多选择后,靠设计师自行迭代完善。不过也可以用于需求方给美术出具参考图的环节。
图生图:
1. 如果需求方并没有那么确定自己的想法,那么画师前期可以多尝试一些草图,确认大方向。
2. 利用插件介入,拒绝不稳定生成。
集合多个处理器,如canny线稿检测、姿势检测等,将其他图片的内部信息检测后可应用到自己的图片创作中来。
将草图导入,让后启动了hed处理器。(我个人觉得这个处理器比较全面,所以喜欢用这个)
3. 设计师高强度介入,反复叠图修改。
4. 这张相对是比较想要的感觉。
这样一张图基本可以达到最终效果的80%,它的设计在画师和AI的不断修正中已经基本确定,欠缺的是细节的调整和补充。这样的工作流,更适合想法偏多、磨合更多的需求当中。
不同业务侧,需求不同。
结合需求和AI介入程度,自行打造管线即可。例如,在某画风确定且有大量美术素材的游戏项目中,想利用AI节省美宣成本,那管线可以是:
固定角色lora+场景lora+画风lora或画风大模型,搭配文生图or图生图任意工作流。
05 不同业务要求下AI能够介入的程度,对设备及人员的要求 所有业务对于AI介入的底层逻辑思路,其实都是一致的。
想法越多、对于内容的确定性越强,AI的介入程度就会变得越低。
AI无法顶替设计师,它始终是作为工具的辅助性存在。文娱内容向的产品,重要的从来都是内容,而内容作为感性产物,始终需要设计师人为感应市场和他人的诉求后,做出选择和决定。要求越高,那么美术皮下的内容和想法就越重要,AI的介入程度就越低,否则反之。
买量向产品、大众市场高迭代向产品,不管是品牌还是游戏,AI介入应该都是笔划算的买卖。此类业务中,AI没有办法做到90分,但可以达到70分,只要保证模型稳定需求清晰,可以提升20%甚至30%的前期美术效率。
但在偏高品质、要求高想法的业务中,AI对于UI、UX、插画、原画、平面设计等工种来说,更多是提供局部流程上的改善,整体提升效果偏弱。
AIGC目前对于设备的要求尚可,sd本地部署基本需要2080的显卡及以上,云端部署对于中小业务来说是不错的选择。
而训练同理,Lora等小模型目前的开源训练包已经非常成熟,主要是分批测试较为花费时间成本;而对于使用者来说,sd和mj的学习成本并不算很高,对于审美和需求磨合能力的要求,远高于对技术能力的要求,基本大多数需求方里1至2名设计师配合等比技术即可。
AI的多应用方向:
UI、字体,都是可以被做成模型的应用方向。
06 我所看到的盈利方向
我个人认为,想要盈利,目前缺乏的是挖掘AI到底能被融入到哪些需求中的洞察力,而不是单一专注于AI技术本身。就像我在文章开头说过的,sd能应用工业化是因为它开源,但开源的技术一般都难以盈利。
sd直接盈利很难,不过拿来封包做应用应该没那么难。尤其是做成妙鸭相机的甜品级应用(用户诉求不高、量大、单一),或是to B的业务应用(封包管线)。
更多是通过一种将需求转化为可应用的能力,来达到盈利目的。
07 结尾
其实笔者作为一名画师,在刚接触AI时是极度焦虑的,甚至认为自己会失业,想要转变职业走向去逃避AI。但在一次次学习尝试和摸索中,我发觉AI的出现让画面做精美的难度,的确比之前大大降低。同时,市场对画面故事性、情感性、风格特殊性的要求,也会大幅度增加。
也就是说,大家对于内容的要求增加了,本质变化是,我需要在日后漫长的职业生涯里,学会预判下一步市场会喜欢怎么样的美术,什么创新尺度是观众可以接受的,我做的设计表达出来的内容观众能否第一时间感知到,这些内容是否也能引起他人共鸣……这些成了我的新职业命题。
我画的每一张画都不是画,是一个内容的其中一部分。单一精美的画面没有用,但如果是一百张精美连在一起的画面,伴随着一个个故事、设定、玩法、模型、动画,就成了新内容的开始。
那内容的内核对于我来说,究竟是什么呢?
就好像《蜘蛛侠:平行宇宙》一样,在多个宇宙里,蜘蛛侠可以是黑色或白色,人类或动物,画风也会有变化……但只要他被一个蜘蛛咬了一口,爬到高楼之上,那他就是蜘蛛侠。
我爱蜘蛛侠。