IT博客汇 | 【AI绘画】AI又进化了，革命性突破

【AI绘画】AI又进化了，革命性突破

Jack Cui发表于 2023-02-20 13:35:41

大家好，我是 Jack。

2023 年，AI 真的杀疯了。短短不到一年的时间，当我们还在感慨 AI 一键生成的二次元画作精美万分的时候，它已经进化到了写实美照也能手到擒来的地步。

更多的效果，可以看刚刚发布的视频，求个免费的赞啦～

https://www.bilibili.com/video/BV1X24y1n77u/

今天分享一下可以学习的资源。

1、Stable Diffusion WebUI

这个项目是 Stable Diffusion 算法的 Web 版，就是增加了一个 Web 交互界面，方便运行算法。

我出过这个项目的部署视频，不了解的可以先看这个视频：

https://www.bilibili.com/video/BV1q84y1i78L/

视频提到的一键安装包，已经有些老了，可以用最新的：

https://pan.baidu.com/s/1raISOqEcYi9M_3E68kcuow?pwd=jack

里面已经包含了文章开头的所展示的真人生成模型、Lora模型等。

还有汉化插件、ControlNet插件等。

2、模型分享网站

网友很强大，训练好的模型，还有一些 prompt 参数，都有人分享。

模型资源很多，可以看看这里：

https://civitai.com/

比如第二个 ChilloutMix，就是一个效果非常好的真实图片生成模型。

点击这里就能下载了。

下载好后的模型，需要放到工程目录的：models/Stable-diffusion 里。

这个我已经打包好了。

除了这种模型可以下载，还能下载 Lora 模型，可以理解为这个是一种画风的小模型，可以配合 Stable Diffusion 模型一起使用，放在 prompt 中。

比如我已经安装好了一个 koreanDollLikeness_v10 Lora 模型，就可以使用以下步骤找到：

选中这个模型，会自动生成 prompt 指令， <lora:koreanDollLikeness_v10:1>，最后跟着的 1 就是权重，可以是0.1，也可以是1，甚至2，数越大使用的权重越多。

模型也是可以在 civitai 下载：

比如第一个就是上文所展示的 Lora 模型开源页面。下载好的模型，需要放到 models/Lora 目录下：

3、第三方插件

这个项目还支持我们安装第三方扩展插件，比如汉化插件、集成ControlNet的插件。

汉化插件下载地址：

https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN

直接打包下载 ZIP 压缩包：

然后将文件解压放到 extensions 目录下：

我们重启 Web 服务：

勾选上插件，就能使用了：

然后在 Show all pages 里：

英文直接搜 local 就能找到，选择 zh_CN 即可完成汉化。

记得设置完，重新 Web 生效。

ControlNet 插件下载同理。

https://github.com/Mikubill/sd-webui-controlnet

直接下载文件，并放到指定目录即可（extensions）。

这个不用额外配置，放到指定目录后，重启就可以看到生效了：

想要使用 ControlNet 需要提前下载好权重文件：

https://huggingface.co/toyxyz/Control_any3/tree/main

比如这个姿态估计模型：

点击下载按钮即可下载，下载好的模型放到工程目录的 extensions/sd-webui-controlnet/models 中即可。

4、其它

1）ChatGPT

chatgpt的使用，我出过一期视频：

https://www.bilibili.com/video/BV1yP4y1Q7PH/

对应的注册教程：

https://docs.qq.com/doc/DT2FEQXNZcE1hUFZ3

2）Wav2lip

Wav2lip就是语音转音频，这个算法老了一些，可以看看是否有更新的。

2020年，这个算法刚出的时候，我第一时间写过简单的文字版教程：

https://mp.weixin.qq.com/s/6AP_Dl4T75lkviPAOJyHDA

项目地址：

https://github.com/Rudrabha/Wav2Lip

3）Chat-GPT-LangChain

已经有集文本对话、语音识别、表情驱动的项目了，虽然目前效果有限，但对这方面感兴趣的，可以提前看看，做个调研够用了：

项目地址：

https://huggingface.co/spaces/JavaFXpert/Chat-GPT-LangChain

5、絮叨

近两年是 AI 爆发的两年，无论是文本领域还是图片领域，都有了突破性的进展。

各种 AI 技术，我会持续分享，感谢各位小伙伴一直以来的关注与支持啦～

期待你在这里有所收获，有所感触，悄悄拔节，惊艳所有~