Meta发布人工智能新模型系列 Llama 4

小小2周前 (04-06)即时新闻11

　　Meta公司在周六发布了其 Llama 系列中的一组新的人工智能模型 ——Llama 4。

　　该系列总共有四个新模型：Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。Meta 称，所有这些模型都经过了 “大量未标注的文本、图像和视频数据” 的训练，以使它们具备 “广泛的视觉理解能力”。

Meta发布人工智能新模型系列 Llama 4

　　Scout 和 Maverick 模型在Llama.com网站以及 Meta 的合作伙伴（包括人工智能开发平台 Hugging Face）处均可公开获取，而 Behemoth 模型仍在训练中。Meta 表示，其人工智能助手 Meta AI（应用于 WhatsApp、Messenger 和 Instagram 等应用程序）已在 40 个国家更新为使用 Llama 4 模型。目前，多模态功能仅在美国以英语提供。

　　一些开发者可能会对 Llama 4 模型的使用许可持异议。

　　“位于” 欧盟或 “主要营业地” 在欧盟的用户和公司被禁止使用或分发这些模型，这可能是该地区人工智能和数据隐私法律所施加的监管要求导致的结果（过去，Meta 曾谴责这些法律过于繁琐）。此外，与之前发布的 Llama 模型一样，月活跃用户超过 7 亿的公司必须向 Meta 申请特殊许可，Meta 可自行决定是否授予该许可。

　　Meta 在一篇博客文章中写道：“这些 Llama 4 模型标志着 Llama 生态系统新时代的开始。这仅仅是 Llama 4 系列的开端。”

Meta发布人工智能新模型系列 Llama 4

　　Meta 表示，Llama 4 是其首个采用混合专家（MoE）架构的模型系列，这种架构在训练和回答查询时计算效率更高。混合专家架构基本上是将数据处理任务分解为子任务，然后将它们委派给更小的、专门的 “专家” 模型。

　　例如，Maverick 总共有 4000 亿个参数，但在 128 个 “专家” 模型中只有 170 亿个活跃参数（参数数量大致与模型的问题解决能力相对应）。Scout 有 170 亿个活跃参数、16 个 “专家” 模型以及总计 1090 亿个参数。

　　根据 Meta 的内部测试，Maverick 最适合用于 “通用助手和聊天” 等应用场景，比如创意写作，在某些编码、推理、多语言、长文本上下文和图像基准测试中，其表现超过了 OpenAI 的 GPT-4o 和谷歌的 Gemini 2.0 等模型。然而，Maverick 与谷歌的 Gemini 2.5 Pro、Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4.5 等功能更强大的最新模型相比，仍有一定差距。

　　Scout 的优势在于文档摘要以及对大型代码库的推理等任务。独特的是，它拥有非常大的上下文窗口：1000 万个词元（“词元” 代表原始文本的片段，例如单词 “fantastic” 可拆分为 “fan”、“tas” 和 “tic”）。简单来说，Scout 可以处理图像以及多达数百万字的文本，使其能够处理和使用极其冗长的文档。

　　根据 Meta 的计算，Scout 可以在单个英伟达 H100 GPU 上运行，而 Maverick 则需要英伟达 H100 DGX 系统或同等设备。

　　Meta 尚未发布的 Behemoth 模型将需要更强大的硬件支持。据该公司称，Behemoth 有 2880 亿个活跃参数、16 个 “专家” 模型，总参数数量接近 2 万亿个。Meta 的内部基准测试显示，在一些衡量解决数学问题等科学、技术、工程和数学（STEM）技能的评估中，Behemoth 的表现优于 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro（但不如 Gemini 2.5 Pro）。

　　值得注意的是，Llama 4 系列中没有一个模型是像 OpenAI 的 o1 和 o3-mini 那样真正意义上的 “推理” 模型。推理模型会对其答案进行事实核查，并且通常能更可靠地回答问题，但因此也比传统的 “非推理” 模型花费更长的时间来给出答案。

Meta发布人工智能新模型系列 Llama 4