DeepSeek发布多模态大模型技术报告,开源生态再迎关键跃迁
多模态大语言模型(MLLM)自2024年起成为全球AI研发竞争的核心赛道,其目标是实现文本、图像、音频乃至视频的跨模态统一理解与生成。相较于纯文本大模型,MLLM对架构设计、对齐策略与数据工程提出更高
多模态大语言模型(MLLM)自2024年起成为全球AI研发竞争的核心赛道,其目标是实现文本、图像、音频乃至视频的跨模态统一理解与生成。相较于纯文本大模型,MLLM对架构设计、对齐策略与数据工程提出更高
芯片设计正面临前所未有的复杂性危机:先进制程下晶体管数量指数级增长,BlackwellGPU达1040亿晶体管,而传统EDA工具依赖人工规则与经验迭代,设计周期长达36-60个月,流片失败率超35%。
人形机器人长期被视作‘实验室珍品’,高昂成本(普遍超50万元)与有限场景适配性严重制约产业化进程。尽管波士顿动力Atlas、特斯拉Optimus屡获关注,但其技术路线聚焦高动态运动,与制造业刚需存在显
AI助手长期困于‘信息过载’与‘行动断点’双重困境:能回答问题却无法完成购买,能推荐商品却难以比价下单。尽管多家平台尝试嵌入购物入口,但缺乏深度语义理解与履约协同能力,转化率普遍低于3%。字节跳动旗下
端侧AI长期受限于算力、功耗与模型轻量化瓶颈,多数厂商止步于语音唤醒或简单意图识别。尽管高通、联发科近年持续强化NPU性能,但真正具备自主推理、记忆与任务编排能力的‘AI原生手机’始终未见量产。这一局
多模态大语言模型(MLLM)自2024年起成为全球AI研发焦点,其核心挑战在于跨模态对齐、视觉-语言联合推理与低成本部署。主流方案长期依赖闭源架构与私有数据闭环,导致学术复现难、产业适配弱。在此背景下
2026年4月28日,蚂蚁集团正式在其旗舰AI助手App‘灵光’中上线‘体验世界模型(WorldModelExperience)’功能,成为全球首个在消费级智能手机上实现可交互、长时序、高一致性3D世
2026年4月27日,中国国家发展改革委外商投资安全审查工作机制办公室发布正式公告,依法禁止美国科技巨头MetaPlatforms收购中国AI初创企业Manus的交易,并责令相关方立即撤销已签署的并购
2026年4月28日凌晨,OpenAI与微软联合发布重磅声明,宣布修订延续近八年的战略合作协议,正式结束微软在OpenAI模型对外商业分销中的独家地位。这意味着自即日起,AmazonWebServic
2026年4月28日,‘智绘菠萝海·AI庆百年——2026徐闻菠萝AIGC大赛’组委会宣布重大利好:为充分保障参赛作品质量与创作者权益,大赛投稿截止日期由原定的4月20日延长至5月5日23时59分。此