Llama31开源大模型引领AI领域全新变革

2025/6/18 9:08:58 吾爱

【Llama31开源大模型引领AI领域全新变革】

Meta发布的Llama3.1是其迄今为止体量最大的开源AI模型，在多项基准测试中表现卓越。

Llama3.1包含8B、70B和405B三个参数规模，适用于多语言代理、复杂推理和编码助手等多种场景。其上下文窗口从8k增加到了128K，扩大16倍，同时支持英、德、法等八种语言。405B版本模型在超过15万亿个token上进行训练，使用了1.6万块H100的GPU。该模型采用标准的仅解码器Transformer架构并加以细微调整，通过迭代的post - training流程提升性能。

在150多个基准测试中，Llama3.1的405B版本追平甚至超越了GPT - 4o和Claude3.5Sonnet等闭源模型，标志着开源模型在性能上首次超越闭源模型。405B版本的模型在常识、可操纵性、数学、工具使用和多语言翻译等方面展现出超越现有顶尖模型的能力，8B和70B升级版本与同等参数下的顶尖模型能力基本持平。

Llama3.1的发布具有重要意义，它使开发者可以自由使用其“蒸馏”输出来训练小众模型，加快专业领域的创新和部署周期。Meta承诺继续推动开源人工智能发展，随着Llama3.1的发布，开源AI有望成为行业新标准，与全球开发者和合作伙伴一起造福全人类。

对不起，会员才可查看！请注册！

已注册，请登录！