汤晓鸥:多模态融合,将打开 AI 工业化新空间
商汤科技创始人、香港中文大学教授汤晓鸥在全球AI工业化论坛上发表演讲,明确提出“多模态融合将成为AI工业化的核心驱动力,打开AI工业化的全新空间”,结合商汤科技的实践经验,为AI与实体经济的深度融合提供了路径参考,引发产业界的广泛关注。
汤晓鸥表示,AI工业化的核心是“让AI技术真正嵌入工业生产的全流程,实现降本增效、提质升级”,而单模态AI技术已无法满足工业场景的复杂需求——工业生产中,需要同时处理图像、声音、数据、文本等多种信息,只有实现多模态融合,才能让AI具备全面的感知、分析与决策能力,适配工业场景的多样化需求。
作为计算机视觉领域的权威专家,汤晓鸥强调,多模态融合并非简单的技术叠加,而是算法、数据、场景的深度协同。他以商汤科技的实践为例,其研发的多模态工业大模型,能同时处理生产线上的图像数据(产品瑕疵检测)、声音数据(设备故障诊断)、文本数据(生产参数),实现生产全流程的智能管控,帮助企业降低生产成本、提升产品质量。汤晓鸥指出,2026年将是多模态融合技术规模化落地的关键一年,随着技术的不断成熟,AI将全面渗透到工业制造、新能源、汽车等领域,打开AI工业化的全新空间,推动实体经济高质量发展。
