IT博客汇
首页
精华
技术
设计
资讯
扯淡
权利声明
登录
注册
大模型系列之解读MoE
wireless_com
发表于
2024-05-05 20:24:51
love
0
Mixtral 8x7B 的推出, 使我们开始更多地关注 基于MoE 的大模型架构, 那么,什么是MoE呢?1. MoE溯源MoE的概念起源于 1991 年的论文 Adaptive Mixture of Local Experts(https://www.cs.toronto.edu/~hinton/absps/jjnh91.pdf)。这个概念与集成学习方法相似,旨在为由多个单独网络组成的系统并建...