发布时间 |
LLM/LMM 名称 |
模型参数量 |
组织名称 |
论文及模型优势 |
2024-01 |
Qwen-VL-Max |
96亿 |
Alibaba |
[论文]LMM。信息推理,扩展创作,视觉定位,针对画面区域问答。 |
2023-12 |
Gemini |
18/23.5亿 |
DeepMind |
[论文]LMM。包含三个版本 Ultra/Pro/Nano。 |
2023-12 |
Qwen-VL-Plus |
96亿 |
Alibaba |
[论文]LMM。细节识别,处理图像中的文本的能力也显著提升。 |
2023-12 |
Claude 2.1 |
|
Anthropic |
[论文] |
2023-09 |
GPT-4V |
|
OpenAI |
[论文]LMM。情绪识别、支持提供图像输入,推理能力突出。 |
2023-09 |
Qwen-VL |
70亿 |
Alibaba |
[论文]LLM。大规模视觉语言模型。 |
2023-09 |
Falcon |
1800亿 |
TII |
[论文]LLM。开源,基于 3.5万亿 token 训练,击败 LLaMA 2。 |
2023-09 |
GPT4All |
130亿 |
Nomic AI |
[论文]LLM。开源,基于 LLaMA 微调。PC 上运行,不需要显卡。 |
2023-08 |
Guanaco |
650亿 |
|
[论文]LLM。基于 LLaMA 衍生的 LLM。 |
2023-07 |
Llama2 |
700亿 |
Meta |
[论文]LLM。基于 2万亿 token 训练。强大的逻辑表达能力。 |
2023-07 |
Claude 2 |
860亿 |
Anthropic |
[论文]LLM。支持 200K 上下文,注重有用性、诚实性和无害性。 |
2023-06 |
BLOOM |
1760亿 |
BigScience |
[论文]LLM。开源,基于 59 种语言、数百个来源数据集训练。 |
2023-05 |
PaLM 2 |
3400亿 |
Google |
[论文]LLM。基于 Transformer。四个版本:Gecko/Otter/Bison/Unicorn。 |
2023-05 |
Command |
520亿 |
Cohere |
[论文]LLM。文本生成模型。 |
2023-04 |
M6 |
|
Alibaba |
[论文] |
2023-03 |
CodeGeeX |
130亿 |
智普 AI |
[论文]LMM。基于 Transformer,支持代码自动生成、代码解释、代码翻译。 |
2023-03 |
GPT-4 |
1.5万亿 |
OpenAI |
[论文]LMM。图像理解分析、高级推理、多语言支持。 |
2023-03 |
GPT-3.5 |
20亿 |
OpenAI |
[论文]LLM。更强自适应和泛化能力。支持语言生成、机器翻译、问答。 |
2023-03 |
Claude v1 |
|
Anthropic |
[论文]LLM。支持 100K 上下文,概括、总结和翻译更长文本。 |
2023-02 |
Llama |
650亿 |
Meta |
[论文]LLM。基于开源数据训练,基于 Transformer 训练,超越 GPT-3。 |
2022-12 |
OPT-IML |
1750亿 |
Meta |
[论文]LLM。问答、文本摘要、翻译。 |
2022-04 |
PaLM |
5400亿 |
Google |
[论文]LLM。多语言理解、翻译、自动生成代码、修复代码 Bug。 |
2022-03 |
GLM |
1300亿 |
智谱 AI |
[论文]LLM。开源,支持高精度千亿中英双语语言模型。 |
2022-03 |
Chinchilla |
700亿 |
Deepmind |
[论文]LLM。减少的模型尺寸,降低推理成本,优于 Gopher。 |
2022-01 |
LaMDA |
1370亿 |
Google |
[论文]LLM。基于 Transformer,通过对话训练,出色上下文理解能力。 |
2022-01 |
MT-NLG |
5300亿 |
NVIDIA |
[论文]LLM。自然语言生成模型,更快的学习能力。 |
2021-12 |
Gopher |
2800亿 |
Deepmind |
[论文]LLM。在知识密集领域,如事实检测和常识上表现有所提高。 |
2021-12 |
Ernie 3.0 Titan |
2600亿 |
Baidu |
[论文]LLM。文心大模型,最强大的中文预训练模型。 |
2021-04 |
PanGu-α |
2000亿 |
Huawei |
[论文]LLM。针对行业友好、专业的大模型,可提供端到端 AI 解决方案。 |
2020-10 |
mT5 |
130亿 |
Google |
[论文]LLM。文本生成模型,支持分类、相似度计算、文本生成。 |
2020-05 |
GPT-3 |
1750亿 |
OpenAI |
[论文]LLM。支持语言生成、文本分类、问答,图像生成功能更成熟。 |