IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    国产新模型 DeepSeek-R1 发布,MIT 授权,性能对标 OpenAI o1 正式版

    青小蛙发表于 2025-01-21 10:35:30
    love 0

    DeepSeek 在昨晚发布了最新的 DeepSeek-R1 模型,性能比肩行业标杆 OpenAI o1,并且采用宽松的 MIT 授权,可以商业使用,允许模型蒸馏。@Appinn

    国产新模型 DeepSeek-R1 发布,MIT 授权,性能对标 OpenAI o1 正式版 6

    省流版

    1️⃣ 采用 MIT 授权,允许模型蒸馏。
    2️⃣ 在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版(如图1)
    3️⃣ 蒸馏小模型超越 OpenAI o1-mini
    4️⃣ 价格(如图2)

    国产新模型 DeepSeek-R1 发布,MIT 授权,性能对标 OpenAI o1 正式版 7
    国产新模型 DeepSeek-R1 发布,MIT 授权,性能对标 OpenAI o1 正式版 8

    DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。

    什么是模型蒸馏?

    模型蒸馏(Model Distillation)是一种深度学习中的技术,旨在通过将大型复杂模型(通常称为教师模型)的知识转移到较小的简单模型(称为学生模型)中,从而实现模型的压缩和性能提升。

    • 教师模型:这是一个经过充分训练的大型模型,通常在某个任务上表现优异,但计算资源消耗较大。
    • 学生模型:这是一个较小的模型,设计上更轻量化,适合在资源有限的环境中运行。

    DeepSeek-R1 在哪?

    DeepSeek-R1 在 GitHub 发布,并且模型文件已经可以从 HuggingFace 下载。

    群里的小伙伴已经纯 CPU 跑起来了:

    国产新模型 DeepSeek-R1 发布,MIT 授权,性能对标 OpenAI o1 正式版 9

    App 与网页

    目前在 DeepSeek 官网和 App,打开“深度思考”模式,就可以调用最新版 DeepSeek-R1 完成各类推理任务了。

    青小蛙觉得,这种采用 MIT 授权,免费让所有人使用的模型,才属于全人类的瑰宝。


    原文:https://www.appinn.com/deepseek-r1/

    现在唯一的问题是,本地运行模型需要大 CPU、大内存、大显卡、大硬盘…真的是很费钱啊


    ©2025 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
    3659b075e72a5b7b1b87ea74aa7932ff
    点击这里留言、和原作者一起评论

    [ 点击前往获取链接 ]




沪ICP备19023445号-2号
友情链接