IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    大模型(LLM/LMM)盘点跟踪

    Yanjun发表于 2024-02-12 16:26:32
    love 0
    发布时间 LLM/LMM 名称 模型参数量 组织名称 论文及模型优势
    2024-01 Qwen-VL-Max 96亿 Alibaba [论文]LMM。信息推理,扩展创作,视觉定位,针对画面区域问答。
    2023-12 Gemini 18/23.5亿 DeepMind [论文]LMM。包含三个版本 Ultra/Pro/Nano。
    2023-12 Qwen-VL-Plus 96亿 Alibaba [论文]LMM。细节识别,处理图像中的文本的能力也显著提升。
    2023-12 Claude 2.1 Anthropic [论文]
    2023-09 GPT-4V OpenAI [论文]LMM。情绪识别、支持提供图像输入,推理能力突出。
    2023-09 Qwen-VL 70亿 Alibaba [论文]LLM。大规模视觉语言模型。
    2023-09 Falcon 1800亿 TII [论文]LLM。开源,基于 3.5万亿 token 训练,击败 LLaMA 2。
    2023-09 GPT4All 130亿 Nomic AI [论文]LLM。开源,基于 LLaMA 微调。PC 上运行,不需要显卡。
    2023-08 Guanaco 650亿 [论文]LLM。基于 LLaMA 衍生的 LLM。
    2023-07 Llama2 700亿 Meta [论文]LLM。基于 2万亿 token 训练。强大的逻辑表达能力。
    2023-07 Claude 2 860亿 Anthropic [论文]LLM。支持 200K 上下文,注重有用性、诚实性和无害性。
    2023-06 BLOOM 1760亿 BigScience [论文]LLM。开源,基于 59 种语言、数百个来源数据集训练。
    2023-05 PaLM 2 3400亿 Google [论文]LLM。基于 Transformer。四个版本:Gecko/Otter/Bison/Unicorn。
    2023-05 Command 520亿 Cohere [论文]LLM。文本生成模型。
    2023-04 M6 Alibaba [论文]
    2023-03 CodeGeeX 130亿 智普 AI [论文]LMM。基于 Transformer,支持代码自动生成、代码解释、代码翻译。
    2023-03 GPT-4 1.5万亿 OpenAI [论文]LMM。图像理解分析、高级推理、多语言支持。
    2023-03 GPT-3.5 20亿 OpenAI [论文]LLM。更强自适应和泛化能力。支持语言生成、机器翻译、问答。
    2023-03 Claude v1 Anthropic [论文]LLM。支持 100K 上下文,概括、总结和翻译更长文本。
    2023-02 Llama 650亿 Meta [论文]LLM。基于开源数据训练,基于 Transformer 训练,超越 GPT-3。
    2022-12 OPT-IML 1750亿 Meta [论文]LLM。问答、文本摘要、翻译。
    2022-04 PaLM 5400亿 Google [论文]LLM。多语言理解、翻译、自动生成代码、修复代码 Bug。
    2022-03 GLM 1300亿 智谱 AI [论文]LLM。开源,支持高精度千亿中英双语语言模型。
    2022-03 Chinchilla 700亿 Deepmind [论文]LLM。减少的模型尺寸,降低推理成本,优于 Gopher。
    2022-01 LaMDA 1370亿 Google [论文]LLM。基于 Transformer,通过对话训练,出色上下文理解能力。
    2022-01 MT-NLG 5300亿 NVIDIA [论文]LLM。自然语言生成模型,更快的学习能力。
    2021-12 Gopher 2800亿 Deepmind [论文]LLM。在知识密集领域,如事实检测和常识上表现有所提高。
    2021-12 Ernie 3.0 Titan 2600亿 Baidu [论文]LLM。文心大模型,最强大的中文预训练模型。
    2021-04 PanGu-α 2000亿 Huawei [论文]LLM。针对行业友好、专业的大模型,可提供端到端 AI 解决方案。
    2020-10 mT5 130亿 Google [论文]LLM。文本生成模型,支持分类、相似度计算、文本生成。
    2020-05 GPT-3 1750亿 OpenAI [论文]LLM。支持语言生成、文本分类、问答,图像生成功能更成熟。


沪ICP备19023445号-2号
友情链接