首页 > 人工智能 > 人工智能
发布日期:2025-07-09 10:45:51

明略科技突破性成果入选ACM MM 2025,首创个性化注视点预测新范式

明略科技引领视觉认知新纪元,首创个性化注视点预测技术

   近日,明略科技与北京大学、吉林大学合作的最新研究成果《PRE-MAP: Personalized Reinforced Eye-tracking Multimodal LLM for High-Resolution Multi-Attribute Point Prediction》已被ACMMM 2025正式接收。该研究针对当前视觉注意力模型在个性化注视点预测方面的不足,提出了一种新的方法(PRE-MAP)并构建了一个大规模多模态数据集(SPA-ADV),旨在更精准地捕捉个体差异,提升高分辨率视频中多属性注视点的预测效果。 这一成果不仅体现了学术界与产业界在人工智能领域的深度融合,也展示了中国科研团队在视觉感知与多模态学习方向上的持续突破。随着视频内容日益高清化与多样化,如何实现更精准的用户行为分析变得愈发重要。PRE-MAP的提出,为相关技术的应用提供了新的思路和数据支持,具有重要的现实意义和推广价值。

明略科技突破性成果入选ACM MM 2025,首创个性化注视点预测新范式

   ACMMM 2025(ACM国际多媒体会议)将于2025年10月27日至31日在爱尔兰都柏林举行。该会议由国际计算机学会(ACM)主办,是全球多媒体技术领域的重要学术会议,同时也是中国计算机学会(CCF)认定的A类国际学术会议。

   论文标题: PRE-MAP: Personalized Reinforced Eye-tracking Multimodal LLM for High-Resolution Multi-Attribute Point Prediction

   (中文标题:PRE-MAP:一种用于高分辨率多属性注视点预测的个性化眼动追踪多模态大语言模型

   论文作者:吴寒冰*、姜平*、苏安炀*、赵晨旭、傅天宇、吴明辉、谭北平、李慧盈(*为共同第一作者)

   研究成果简述:

   1. 直击行业核心痛点

   在当前的数字广告行业中,精准把握消费者的注意力成为关键。然而,不同背景的观众——如年龄、性别各异的人群——在观看同一视频广告时,其关注点存在显著差异,而传统技术难以有效捕捉这些个性化特征。现有的显著性预测模型多采用分割方法,依赖于低分辨率图像进行处理,并生成相应热图后再放大至原始分辨率,这种方式在细节表现上存在局限,从而影响了对个体注意力模式的准确识别。

   2. 构建高质量数据底座

   为解决这一难题,研究团队创新性地构建了行业领先的大规模个性化注视行为数据集(SPA-ADV),首次采集了超过4500名具有不同年龄和性别背景用户的实际视觉行为数据。该数据集提供了精准的个体级注视点坐标,为个性化显著性建模提供了高质量的基准数据支持。

   3. 研发高精度预测模型

   基于此数据集,团队研发了PRE-MAP创新AI预测模型。该模型能结合用户的个人特征,利用最前沿的多模态大模型技术,增强模型的泛化能力和个性化预测效果,精准预测出“某一类人会看哪里”。有效解决现有AI模型预测不准、难以聚焦个性化热点的问题,帮助品牌方和广告商更科学地优化广告创意、评估投放效果,实现真正的“精准触达”。

   明略在多模态技术方面的探索,正逐步从脑电到眼动,为广告预测模型补上关键的一环。这种跨领域的数据融合,不仅提升了模型对用户心理和行为的感知能力,也为精准营销提供了更科学的依据。随着技术的不断深入,多模态分析正在成为广告效果预测中不可或缺的一部分,推动行业向更智能、更个性化的方向发展。

   此次成果并非孤立的突破,而是明略科技在多模态领域长期且深入投入的自然结果,体现了公司在前沿人工智能技术探索以及大模型应用落地方面的前瞻性布局。可以看出,企业对技术发展的持续关注与战略布局,是推动创新的重要动力。在当前AI技术快速演进的背景下,这种深耕细作的模式更具参考价值。

   早在2023年,明略科技率先成为国内首家将多模态大语言模型(MLLM)应用于智能社交媒体内容分析与策略生成的企业,首次利用MLLM识别并预测能够带来最佳营销效果的多样化内容类型,开启了广告领域多模态技术应用的新方向。 从行业发展趋势来看,此次明略科技的突破不仅是技术层面的创新,更标志着企业在数据驱动营销中的能力迈上了新台阶。随着用户内容消费方式的不断变化,单一的信息处理方式已难以满足精准营销的需求。而多模态大语言模型的引入,使得企业能够在文本、图像、视频等多种信息形式中提取更丰富的语义特征,从而实现更高效的内容策划与传播策略制定。这一进展为整个广告行业的智能化转型提供了有力支撑,也预示着未来竞争将更多聚焦于技术整合与应用场景的深度挖掘。

   2024年,明略科技推出超图多模态大型语言模型(HMLLM),进一步整合了脑电等非标模态数据,支持企业对广告素材中的实体、情绪、效果、场景及受众等多样化元素进行深度分析,从而提升营销效果,生成预测效果良好的有效营销内容,并为企业视频广告提供多维度优化建议。超图多模态大型语言模型(HMLLM)的相关成果曾荣获ACM MM 2024最佳论文提名。

   今年6月,基于自研的超图多模态大语言模型(HMLLM)与混合专家(MoE)架构,明略科技推出全新创新成果——AI驱动的全球化广告测试与优化平台AdEff。该平台专注于全球广告创意的效果评估,能够高效、精准地预测消费者对广告的主观感受及整体传播效果,并提供相应的优化建议。在提升测试效率的同时,大幅降低广告测试成本,使企业能够对每一条广告进行全面测试,在“创意感性”与“商业理性”之间实现更好的平衡。

   截至7月,本次研究成果被正式接收,标志着明略科技在多模态学习这一人工智能前沿领域再次取得突破性进展,填补了广告预测模型中“用户个性化视点追踪”这一关键环节的空白。这不仅是推动广告预测模型高质量发展的关键一步,也预示着机器对人类感知的理解精度将迈入新的阶段。

   在当前数字化内容愈发碎片化的背景下,AI驱动的科学预测正成为提升内容传播效率的重要推动力。明略科技在多模态学习方面的系统性探索,将在提升品牌效果、降低运营成本以及推动内容创新等方面展现出巨大的应用潜力。

   立足于此,明略科技的布局不仅局限于多模态领域的深入发展,未来公司还将拓展至更广泛的AI大模型及Agent技术领域,持续进行探索与创新。公司致力于将最新的科研成果转化为实际的产业动力,推动广告营销及其他多个行业的智能化转型,为构建更加高效、智能的技术生态发挥积极作用。

人工智能最新资讯
友情链接 百度权重≥3友情链接交换
数界探索  |  科技快讯中文网  |  经济脉动  |  科技先锋  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经  |  财经风向标
Copyright © 2025 智慧科技官网 网暻网络
备案号:陇ICP备16003923号-4 版权所有