1946年2月14日,世界上第一台计算机ENAC诞生,使用的是最原始的穿孔卡片。
这种卡片上使用的语言是只有专家才能理解的语言,与人类语言差别极大,这种语言就称为机器语言。
【资料图】
随着计算机技术的发展,又诞生了相对“简单”的汇编语言。汇编语言也称为符号语言。比起机器语言,汇编大大简单了。
再后来,有了人类能够“理解”的计算机编程语言,通过指定的单词、符号和固定的格式,来实现人和计算机的交互。
经过几十年的迭代,迎来了python。
python相对于它的前辈们,已经进化的非常简单,很接近自然语言,上手很快,甚至几小时内就能学会用python编写一段代码来满足自己的日常办公需求。
俗话说:人生苦短,我用python。
正在大家探讨谁来接替python的时候,AI进化了,尤其是NLP大模型的不断突破,ChatGPT们几乎能够毫无障碍的理解人类语言,并且能够将其转化为机器语言。
人类不再借助编程直接和机器沟通的时代,来临了。
然而不幸的是,不是所有人都会说自然语言。
很多人用了AI工具,但大家对它们的功能却褒贬不一,很大程度上就是这个原因。
比如,在StableDiffusion输入“a girl”,会随机生成一张AI小姐姐。
这个小姐姐长相有点随意。
而我输入一串单词后,生成的小姐姐长这样:
差别出在哪儿呢?
原来,我录入的这一串单词更详细更复杂:
<lora:koreanDollLikeness_v15:0.6> , best quality, ultra high res, (photorealistic:1.4), 1woman, sleeveless white button shirt, black skirt, black choker, cute, (Kpop idol), (aegyo sal:1), (platinum blonde hair:1), ((puffy eyes)), looking at viewer, full body, facing front,fashion,premium
这串“魔法咒语”叫做prompt,可以理解为关键词,AI通过对关键词的识别,再去组合输入者想要的图像。
输入的越详细越精准,输出的就越符合想象。
其中,单书名号里的是lora,
所谓LoRA,英文全称是 Low-Rank Adaptation of Large Language Models。这是微软研究员在训练AI的过程中引入的一项新技术,主要用于处理大模型微调的问题。
下载好的lora文件需要拷贝到stable-diffusion-webui/models/lora 路径下。
简单讲,lora可以以极小代价换来高效的微调效果,可以指定整体风格、指定人脸等等。这张图使用的就是大名鼎鼎的koreanDollLikeness,浓浓的韩国风。
后面的单词就是对图片的期望描述,因为我的“极简风”生成的穿搭被海归同事小姐姐觉得有廉价感,于是在她的建议下加了两个单词:fashion,premium。
括号表示权重,括号越多表示权重越高,这是由于在自然语言描述的时候,往往会出现前后文冲突,那么需要特别着重的,就用括号括起来,冒号+数字也是同样的效果。
小妹生活在中俄边境,她想要让AI画出自己,于是说出来一串描写自己的词:
(俄罗斯中国混血女孩),(栗棕色头发),(有雀斑),(高鼻梁),M型嘴唇,有点兜齿,腼腆,1个女孩,淡淡的微笑,直发,淡紫色羽绒服,牛仔裤,红色围脖,蓝色手套,麋鹿,雪橇
直接交给StableDiffusion效果是不太好的,可以让ChatGPT参与下。
以下提示用于指导Al绘画模型创建图像。它们包括人物外观、背景、颜色和光影效果,以及图像的主题和风格等各种细节。这些提示的格式通常包括带权重的数字括号,用于指定某些细节的重要性或强调。例如,"(masterpiece:1.4)"表示作品的质量非常重要。以下是一些示例:1. (8k, RAW photo, best quality, masterpiece:1.2),(realistic, photo-realistic:1.37), ultra-detailed, 1girl, cute, solo, beautiful detailed sky, detailed cafe, night, sitting, dating, (nose blush), (smile:1.1),(closed mouth), medium breasts, beautiful detailed eyes, (collared shirt:1.1), bowtie, pleated skirt, (short hair:1.2), floating hair, ((masterpiece)), ((best quality)),2. (masterpiece, finely detailed beautiful eyes: 1.2), ultra-detailed, illustration, 1 girl, blue hair black hair, japanese clothes, cherry blossoms, tori, street full of cherry blossoms, detailed background, realistic, volumetric light, sunbeam, light rays, sky, cloud,3. highres, highest quallity, illustration, cinematic light, ultra detailed, detailed face, (detailed eyes, best quality, hyper detailed, masterpiece, (detailed face), blue hairlwhite hair, purple eyes, highest details, luminous eyes, medium breats, black halo, white clothes, backlighting, (midriff:1.4), light rays, (high contrast), (colorful)chatapt prompt仿照之前的提示,写一段描写如下要素的提示:(俄罗斯中国混血女孩),(栗棕色头发),(有雀斑),(高鼻梁),M型嘴唇,有点兜齿,腼腆,1个女孩,淡淡的微笑,直发,淡紫色羽绒服,牛仔裤,红色围脖,蓝色手套,麋鹿,雪橇
ChatGPT返回的关键词是:
(high quality:1.2), (realistic:1.4), (detailed:1.3), (mixed Russian-Chinese heritage:1.5), 1 girl, (chestnut brown hair:1.1), (freckles:1.1), (high nose bridge:1.2), (M-shaped lips:1.1), (buck teeth:1.05) (shy:1.1), (subtle smile:1.1), (straight hair:1.1), (light purple down jacket:1.05), (blue jeans:1.05), (red scarf:1.1), (blue gloves:1.05), (reindeer:1.1), (sled:1.1)
看起来ChatGPT对括号和数字都很爱用,不过没关系,扔给StableDiffusion,于是生成了一系列林海雪原风格的照片。
除了麋鹿有点迷以外,AI生成的照片和她本人,已经十分神似了。
标签:
X 关闭
X 关闭