Meta开创新先河:Llama 4引领大模型发展新趋势
当地时间周六(4月5日),美国科技巨头Meta发布了其最新推出的开源人工智能模型Llama4。该模型目前包含两个版本,分别命名为Scout和Maverick。
Meta宣布,Llama4是一款具备多模态能力的大规模模型,它可以处理并融合多种类型的数据,如文本、视频、图像以及音频,并且能够在这些不同形式的内容之间实现转换。
Llama4系列创新性地引入了混合专家(MoE)架构,该架构在训练及响应用户提问时表现更为高效,能够将模型分解为多个擅长不同任务的“专家”子模型。
据Meta介绍,Scout和Maverick不仅是其“迄今为止最先进的模型”,也是“多模态领域中最先进的模型”。
据悉,Scout拥有170亿个活跃参数以及16个“专家”模型,其总参数量达到1090亿。而Maverick同样具备170亿个活跃参数,但其“专家”模型数量多达128个,总参数更是飙升至4000亿。 从这些数据可以看出,Maverick在模型数量上的投入显然比Scout更大,这可能意味着它在处理复杂任务或多样化应用场景时具有更强的适应能力。然而,Scout虽然在模型数量上相对较少,但其总参数量也相当可观,这或许表明其每个模型都经过了更为精细的优化,从而在特定领域内表现出色。两者各有千秋,未来的发展方向可能会取决于各自的技术优势与市场需求。无论是Scout还是Maverick,它们都在人工智能领域展现了强大的潜力,也为行业竞争增添了新的活力。
Meta正在积极研发一款名为Behemoth的新模型,这款模型被公认为世界上最智能的大模型之一,并且因其卓越的表现,被誉为“新模型中的教师”。Behemoth不仅在技术上实现了突破,还展现了极高的学习与适应能力。 我认为,Behemoth的出现标志着人工智能领域又迈出了重要的一步。它不仅仅是一款技术产品,更可能成为推动未来AI教育与研究的关键力量。随着这类超级大模型的发展,我们有理由期待它们在未来能够帮助解决更多复杂的全球性问题。同时,这也提醒我们需要更加重视数据安全与隐私保护,在享受技术进步带来的便利时,确保技术的应用符合伦理规范和社会利益。
这些模型通过大量未标注的多模态数据进行训练,从而拥有了强大的视觉理解能力。这种训练方式让模型能够更好地解析复杂的视觉信息,并在多种场景下展现出色的表现。 在我看来,这种基于海量数据的训练方法不仅展示了人工智能技术的进步,也反映了当前技术发展中对数据依赖性的增强。随着模型能力的提升,我们有理由期待它们在未来能为各行各业提供更多创新的应用场景。不过,这也带来了关于数据隐私和安全的新挑战,如何平衡技术创新与用户隐私保护将成为未来的重要议题。
Scout 和Maverick模型在Llama.com网站以及Meta的合作伙伴处均可公开获取,也可以在WhatsApp、Messenger、Instagram Direct上获取。
Meta宣布,其人工智能助手MetaAI已经升级至Llama4模型,并在40个国家上线。现阶段,多模态功能仅限于美国市场,且仅支持英语。
该公司首席执行官扎克伯格周六发表讲话称:“我们的目标是建立世界领先的人工智能,将其开源,并使其普遍可用,以便世界上每个人都能受益。”
“我很久以前就说过,我认为开源人工智能将成为领先的模型,而随着Llama 4的推出,这一切已经开始发生。”他说,“Meta AI今天得到了一次重大升级。”
Meta首席产品官Chris Cox 上个月提到,Llama4 的发布将使 AI 智能体的功能更加强大,提升其推理与执行任务的能力。
据知情人士称,Llama3版本已经在一年前正式推出,但Llama4迟迟未能面世,主要原因是该模型在研发过程中未能满足Meta的预期表现,特别是在推理能力和数学任务处理方面存在不足。另外,Meta还担忧其模型在模拟自然语言对话方面与OpenAI的模型相比存在一定差距。
Meta公司计划在2025年投入高达650亿美元用于扩展其人工智能基础设施,但投资者正在向大型科技公司施压,要求它们展现投资所带来的实际回报。