长话短说,我先直击大家几个痛点问题
Q1:训练用底模是?
A1:原生1.5,chillout训练出来质感太真了对不上我xp,不过chillout训练效果也很赞,都试过的
Q2:学习参数?
A2:就有没有一种可能,默认数值是默认,不是没有理由的。我所有的数值基本上都是按照默认数值微调的,比如稍微增大了一点network到32(64也行,128弄不好会过拟合),alpha一半就ok,学习率宁增毋减,我从1变成1.5来着,总之要保证学习率能让loss稳步下降即可,多试。根据国内外多方网友发帖,学习率认机子,每个机子配置不同,都会对其造成影响,所以也必须要多试,适合自己才是坠好的
Q3:数据收集怎么整
A3:以我来说,我几乎全练的是coser,coser几乎是天灾级别的难度,人物面容统一还好,最可怕的是那种一天一个样的coser,几乎没法练,loss掉的真的非常勉强。而我图中这个coser还好,面容,身材都很统一,相对好一点。在收集数据时,我们必须面面俱到,高质量模型成功的基础不是堆图,而是有目的的选图,角度尽量全(俯视仰视侧视斜视后视),构图尽量丰富(大头,半身全身)。我们练的是人,不是衣服,所以衣服可以随意一些,但必须保证人物四肢清晰,例如洛丽塔那种大裙子,完全看不到腿的,慎选。还有就是有关最近lora删tag这个训练方法,目前来看,我没删过,但确实改过一些很离谱的识别错误。我认为如果你的选图中,这个角色瞳色,发色,嘴唇(如果能识别出来的话)都很统一,那我建议删掉,我这次没删是因为这些差别都太大了,cosplay,懂得都懂
Q4:loss到底怎么看
A4:越低越好,但是两种情况除外:1,在学习即将结束时,学习率回升,不要选择回升后的模型,要选择回升前的。2,bs过多或者过大的学习率会导致loss震荡,如果学习结束后回顾loss一直是来回波动的,几乎可以判定这波丹全废,建议减小学习率再来
Q5:出图有没有讲究?
A5:有,首先得看你的需求,如果你的训练集没有nsfw的话,dpm出裸图就比较费劲,有时候会出现噪点批这种奇怪的东西,而ddim就不会,目前的话我也只试了这两种,(euler真的还有人在用吗)。其次cfg7左右够用。最重要的是出图尺寸,我这次练了全身图,当尺寸过小时,脸部完全崩坏,所以出全身图必须拉大尺寸,否则就别想了