大家好,今天继续聊聊科技圈发生的那些事。一、LitGPTLitGPT 是一款用于预训练、微调和部署LLM的命令行工具。我们能看到主页有这样一句话:For training the world's largest, most powerful open-sourceLLMs. (用于训练世界上最大、最强的开源 LLM。)一看到这种最大、最强之类的词,我们难免心生疑惑。那么 LitGPT 是怎么做的呢?LitGPT 重新实现了所有模型架构和训练配方:去除所有抽象层,采用单一文件实现。保证符合 Apache 2.0 标准,使企业使用不受任何限制。优化每个模型的每个细节,以获得尽可能快的性能,从而降低成本和训练速度。除此之外,LitGPT 还使用了很多先进的技术。比如用 LoRA 、 Adapter 等进行参数微调,用 Flash Attention 降低显存读写,提高运行速度等,这都是优势所在。另外,对于自行部署 LLM ,LitGPT 提供了 20 多种现成的 LLM 可供使用,其中不乏有许多我们耳熟能详的模型,比如 Llama 2。你可以使用这些模型配合自己的数据进行微调、预训练等。项目的部署也很简单,用 pip 直接安装即可。剩下的内容,比如使用、预训练等操作,作者团队在项目主页也已经给出了完整的教学。项目已经开源,想体验的小伙伴可以自行关注一下。项目地址:https://gith
...
继续阅读
(59)