即时新闻

news
首页 > 即时新闻 > 正文内容

Meta发布人工智能新模型系列 Llama 4

小小2周前 (04-06)即时新闻11

Meta发布人工智能新模型系列 Llama 4

  Meta公司在周六发布了其 Llama 系列中的一组新的人工智能模型 ——Llama 4。

  该系列总共有四个新模型:Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。Meta 称,所有这些模型都经过了 “大量未标注的文本、图像和视频数据” 的训练,以使它们具备 “广泛的视觉理解能力”。

Meta发布人工智能新模型系列 Llama 4

  Scout 和 Maverick 模型在Llama.com网站以及 Meta 的合作伙伴(包括人工智能开发平台 Hugging Face)处均可公开获取,而 Behemoth 模型仍在训练中。Meta 表示,其人工智能助手 Meta AI(应用于 WhatsApp、Messenger 和 Instagram 等应用程序)已在 40 个国家更新为使用 Llama 4 模型。目前,多模态功能仅在美国以英语提供。

  一些开发者可能会对 Llama 4 模型的使用许可持异议。

  “位于” 欧盟或 “主要营业地” 在欧盟的用户和公司被禁止使用或分发这些模型,这可能是该地区人工智能和数据隐私法律所施加的监管要求导致的结果(过去,Meta 曾谴责这些法律过于繁琐)。此外,与之前发布的 Llama 模型一样,月活跃用户超过 7 亿的公司必须向 Meta 申请特殊许可,Meta 可自行决定是否授予该许可。

  Meta 在一篇博客文章中写道:“这些 Llama 4 模型标志着 Llama 生态系统新时代的开始。这仅仅是 Llama 4 系列的开端。”

Meta发布人工智能新模型系列 Llama 4

  Meta 表示,Llama 4 是其首个采用混合专家(MoE)架构的模型系列,这种架构在训练和回答查询时计算效率更高。混合专家架构基本上是将数据处理任务分解为子任务,然后将它们委派给更小的、专门的 “专家” 模型。

  例如,Maverick 总共有 4000 亿个参数,但在 128 个 “专家” 模型中只有 170 亿个活跃参数(参数数量大致与模型的问题解决能力相对应)。Scout 有 170 亿个活跃参数、16 个 “专家” 模型以及总计 1090 亿个参数。

  根据 Meta 的内部测试,Maverick 最适合用于 “通用助手和聊天” 等应用场景,比如创意写作,在某些编码、推理、多语言、长文本上下文和图像基准测试中,其表现超过了 OpenAI 的 GPT-4o 和谷歌的 Gemini 2.0 等模型。然而,Maverick 与谷歌的 Gemini 2.5 Pro、Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4.5 等功能更强大的最新模型相比,仍有一定差距。

  Scout 的优势在于文档摘要以及对大型代码库的推理等任务。独特的是,它拥有非常大的上下文窗口:1000 万个词元(“词元” 代表原始文本的片段,例如单词 “fantastic” 可拆分为 “fan”、“tas” 和 “tic”)。简单来说,Scout 可以处理图像以及多达数百万字的文本,使其能够处理和使用极其冗长的文档。

  根据 Meta 的计算,Scout 可以在单个英伟达 H100 GPU 上运行,而 Maverick 则需要英伟达 H100 DGX 系统或同等设备。

  Meta 尚未发布的 Behemoth 模型将需要更强大的硬件支持。据该公司称,Behemoth 有 2880 亿个活跃参数、16 个 “专家” 模型,总参数数量接近 2 万亿个。Meta 的内部基准测试显示,在一些衡量解决数学问题等科学、技术、工程和数学(STEM)技能的评估中,Behemoth 的表现优于 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro(但不如 Gemini 2.5 Pro)。

  值得注意的是,Llama 4 系列中没有一个模型是像 OpenAI 的 o1 和 o3-mini 那样真正意义上的 “推理” 模型。推理模型会对其答案进行事实核查,并且通常能更可靠地回答问题,但因此也比传统的 “非推理” 模型花费更长的时间来给出答案。

Meta发布人工智能新模型系列 Llama 4

  有趣的是,Meta 表示,他们对所有 Llama 4 模型进行了优化,使其更少拒绝回答 “有争议的” 问题。据该公司称,Llama 4 能够回答之前的 Llama 模型不会回答的 “有争议的” 政治和社会话题。此外,该公司还表示,Llama 4 在处理那些它完全不会回应的提示时 “更加平衡”。

  Meta 的一位发言人告诉meiti:“你可以指望 [Llama 4] 提供有用的、基于事实的回答,且不带任何评判。我们会继续让 Llama 模型更具响应性,以便它能回答更多问题,能够回应各种不同的观点…… 并且不会偏袒某些观点而忽视其他观点。”

  这些调整是在一些白宫盟友指责人工智能聊天机器人在政治上过于 “觉醒” 的背景下做出的。

  美国总统唐纳德・特朗普的许多亲信,包括亿万富翁埃隆・马斯克以及加密货币和人工智能 “沙皇” 大卫・萨克斯,都声称流行的人工智能聊天机器人审查保守派观点。萨克斯过去曾特别指出 OpenAI 的 ChatGPT “被编程为具有觉醒倾向”,并且在政治话题上不真实。

  实际上,人工智能中的偏见是一个棘手的技术问题。马斯克自己的人工智能公司 xAI 也一直在努力开发一款不会偏袒某些政治观点的聊天机器人。

  尽管如此,包括 OpenAI 在内的公司仍在调整其人工智能模型,使其能够回答比以前更多的问题,尤其是与有争议话题相关的问题。

扫描二维码推送至手机访问。

版权声明:本文由啛啛喳喳发布,如需转载请注明出处。

转载请注明出处http://m.gdhtwj.com/post/5692.html

分享给朋友:

相关文章

胖东来,新动作

胖东来,新动作

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   胖东来官宣进驻郑州。   2月23日上午,胖东来创始人于东来在社交媒体发文称,胖东来决定在郑州开设超市。   此番官...

中国移动发布“广州参照系企业管理咨询有限公司负面行为处理结果公告”,后者去年曾被列入欠税公告名单

中国移动发布“广州参照系企业管理咨询有限公司负面行为处理结果公告”,后者去年曾被列入欠税公告名单

  3月6日,中国移动发布《关于广州参照系企业管理咨询有限公司负面行为处理结果的公告》。   广州参照系企业管理咨询有限公司,成立于2013年09月22日,位于广东省广州市海珠区,法定代表人为李红锦,...

肿瘤系列检查什么?肿瘤系列检查的项目有哪些?

肿瘤系列检查什么?肿瘤系列检查的项目有哪些?

肿瘤系列检查:为健康保驾护航的重要手段肿瘤,作为一种严重威胁人类健康的疾病,其早期发现和诊断对于治疗效果和预后至关重要。肿瘤系列检查是一系列用于筛查、诊断和监测肿瘤的方法和项目。首先,血液检查是常见的...

丹阳市龙华废钢铁加工有限公司成立 注册资本500万人民币

天眼查App显示,近日,丹阳市龙华废钢铁加工有限公司成立,法定代表人为郑佳佳,注册资本500万人民币,经营范围为一般项目:生产性废旧金属回收;金属废料和碎屑加工处理;再生资源回收(除生产性废旧金属);...

《哪吒之魔童闹海》海外票房超545万美元

《哪吒之魔童闹海》海外票房超545万美元

快讯摘要 【《哪吒之魔童闹海》海外票房超545万美元】讯,据灯塔专业版全球票房榜,截至2月16日,影片《哪吒之魔...

恒鑫生活:内部控制鉴证报告

恒鑫生活:内部控制鉴证报告 (:贺...

现在,非常期待与您的又一次邂逅

我们努力让每一次邂逅总能超越期待

  • 开源程序
    开源程序

    既是博客,也是CMS建站系统

  • 性能稳定
    性能稳定

    响应速度快,放心有保障

  • 用户体验
    用户体验

    响应式布局,兼容各种设备

  • 持续更新
    持续更新

    不断升级维护,更好服务用户