IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    微信聊天记录导出的开源项目,火了!

    Jack Cui发表于 2024-01-16 01:55:15
    love 0

    大家好,我是 Jack。

    今天又是分享开源项目的一天。

    一、留痕

    最近想训练一个符合某人说话风格的 AI,微信的聊天记录里就有着丰富的训练数据。

    聊天记录是珍贵的记忆,也是每一场对话、每一个互动的真情流露。

    想要拿到这些数据,无论是保存备份还是用于 AI 训练,手动拷贝都不现实。逛 Github 发现了这个不错的项目:留痕。

    这是一名西北工业大学的学生开源的一个项目,作者这样说道:

    使用方法非常简单:将手机的聊天记录迁移到电脑,然后使用WeChatMsg解密。

    安卓:手机微信->我->设置->聊天->聊天记录迁移与备份->迁移-> 迁移到电脑微信;

    iOS:手机微信->我->设置->通用->聊天记录迁移与备份->迁移-> 迁移到电脑微信。

    迁移完成后重启微信,迁移前也最好提前备份一下聊天数据。

    然后 clone 项目并安装依赖:

    # Python>=3.10 仅支持3.10、3.11、3.12,请勿使用其他Python版本
    git clone https://github.com/LC044/WeChatMsg
    cd WeChatMsg
    pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

    直接运行 main.py 即可解析数据。

    python main.py

    解析好的数据,可以做清洗,用于 AI 模型训练,也可以用于个人的数据分析。

    项目地址:

    https://github.com/LC044/WeChatMsg

    有需要的自取。

    二、Free Books

    现在网上的开源资源越来越多,想要学习编程就有很多学习资料。

    有些小伙伴想要自学计算机领域的知识,自学编程语言,问我有什么资料可以学习?

    不妨看看:free-programming-books

    里面涵盖了从初学者到高级开发人员各个层次的书籍,包括但不限于编程语言、算法、数据结构、操作系统等方面的书籍和资料。

    项目地址:

    https://github.com/EbookFoundation/free-programming-books

    这个里面的项目大多数都是英文的资料,学起来吃力的话,可以看看类似的中文项目:

    https://github.com/justjavac/free-programming-books-zh_CN

    内容同上,也都是很丰富:

    引用的书籍和资料都是中文的。

    又到了收藏等于学会的时候了!

    好了,今天就聊这么多,我是 Jack,我们下期见!



沪ICP备19023445号-2号
友情链接