IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    【AI绘画】AI又进化了,革命性突破

    Jack Cui发表于 2023-02-20 13:35:41
    love 0

    大家好,我是 Jack。

    2023 年,AI 真的杀疯了。短短不到一年的时间,当我们还在感慨 AI 一键生成的二次元画作精美万分的时候,它已经进化到了写实美照也能手到擒来的地步。

    更多的效果,可以看刚刚发布的视频,求个免费的赞啦~

    https://www.bilibili.com/video/BV1X24y1n77u/

    今天分享一下可以学习的资源。

    1、Stable Diffusion WebUI

    这个项目是 Stable Diffusion 算法的 Web 版,就是增加了一个 Web 交互界面,方便运行算法。

    我出过这个项目的部署视频,不了解的可以先看这个视频:

    https://www.bilibili.com/video/BV1q84y1i78L/

    视频提到的一键安装包,已经有些老了,可以用最新的:

    https://pan.baidu.com/s/1raISOqEcYi9M_3E68kcuow?pwd=jack

    里面已经包含了文章开头的所展示的真人生成模型、Lora模型等。

    还有汉化插件、ControlNet插件等。

    2、模型分享网站

    网友很强大,训练好的模型,还有一些 prompt 参数,都有人分享。

    模型资源很多,可以看看这里:

    https://civitai.com/

    比如第二个 ChilloutMix,就是一个效果非常好的真实图片生成模型。

    点击这里就能下载了。

    下载好后的模型,需要放到工程目录的:models/Stable-diffusion 里。

    这个我已经打包好了。

    除了这种模型可以下载,还能下载 Lora 模型,可以理解为这个是一种画风的小模型,可以配合 Stable Diffusion 模型一起使用,放在 prompt 中。

    比如我已经安装好了一个 koreanDollLikeness_v10 Lora 模型,就可以使用以下步骤找到:

    选中这个模型,会自动生成 prompt 指令, <lora:koreanDollLikeness_v10:1>,最后跟着的 1 就是权重,可以是0.1,也可以是1,甚至2,数越大使用的权重越多。

    模型也是可以在 civitai 下载:

    比如第一个就是上文所展示的 Lora 模型开源页面。下载好的模型,需要放到 models/Lora 目录下:

    3、第三方插件

    这个项目还支持我们安装第三方扩展插件,比如汉化插件、集成ControlNet的插件。

    汉化插件下载地址:

    https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN

    直接打包下载 ZIP 压缩包:

    然后将文件解压放到 extensions 目录下:

    我们重启 Web 服务:

    勾选上插件,就能使用了:

    然后在 Show all pages 里:

    英文直接搜 local 就能找到,选择 zh_CN 即可完成汉化。

     

    记得设置完,重新 Web 生效。

    ControlNet 插件下载同理。

    https://github.com/Mikubill/sd-webui-controlnet

    直接下载文件,并放到指定目录即可(extensions)。

    这个不用额外配置,放到指定目录后,重启就可以看到生效了:

    想要使用 ControlNet 需要提前下载好权重文件:

    https://huggingface.co/toyxyz/Control_any3/tree/main

    比如这个姿态估计模型:

    点击下载按钮即可下载,下载好的模型放到工程目录的 extensions/sd-webui-controlnet/models 中即可。

    4、其它

    1)ChatGPT

    chatgpt的使用,我出过一期视频:

    https://www.bilibili.com/video/BV1yP4y1Q7PH/

    对应的注册教程:

    https://docs.qq.com/doc/DT2FEQXNZcE1hUFZ3

    2)Wav2lip

    Wav2lip就是语音转音频,这个算法老了一些,可以看看是否有更新的。

    2020年,这个算法刚出的时候,我第一时间写过简单的文字版教程:

    https://mp.weixin.qq.com/s/6AP_Dl4T75lkviPAOJyHDA

    项目地址:

    https://github.com/Rudrabha/Wav2Lip

    3)Chat-GPT-LangChain

    已经有集文本对话、语音识别、表情驱动的项目了,虽然目前效果有限,但对这方面感兴趣的,可以提前看看,做个调研够用了:

    项目地址:

    https://huggingface.co/spaces/JavaFXpert/Chat-GPT-LangChain

    5、絮叨

    近两年是 AI 爆发的两年,无论是文本领域还是图片领域,都有了突破性的进展。

    各种 AI 技术,我会持续分享,感谢各位小伙伴一直以来的关注与支持啦~

    期待你在这里有所收获,有所感触,悄悄拔节,惊艳所有~

     



沪ICP备19023445号-2号
友情链接