DeepSeek发布mHC架构:以流形约束重塑残差连接,破解大模型训练不稳定难题
2026年2月27日,DeepSeek-AI研究团队正式公开预印本论文《mHC:Manifold-ConstrainedHyper-Connections》,提出一项具有理论深度与工程潜力的新型大模型
2026年2月27日,DeepSeek-AI研究团队正式公开预印本论文《mHC:Manifold-ConstrainedHyper-Connections》,提出一项具有理论深度与工程潜力的新型大模型
传统数据分析高度依赖专业数据科学家的经验与试错,导致企业洞察周期长、人力成本高、知识难以沉淀。2024年4月1日,吉林大学与上海交通大学联合发布DS-Agent——首个将‘数据科学家’角色完全具身化的
视频理解作为多模态AI的终极挑战之一,长期受限于固定分辨率采样与静态令牌编码带来的信息冗余与计算浪费。2024年12月16日公开的Dynamic-VLM论文提出一种‘简单而有效’的动态视觉令牌压缩机制
截至2026年4月7日,我国金融领域大模型应用已进入规模化落地深水区。最新行业统计显示,技术研发与运营(19%)、客户营销服务(17%)、运营管理数字化(17%)及风险合规及核验(16%)四大场景合计
在生成式AI向终端设备下沉的大趋势下,如何在有限算力与内存约束下实现高质量、低延迟的多模态理解与生成,已成为产业落地的核心挑战。2026年3月23日,斯坦福与Meta联合团队正式发布Mobile-O—
截至2026年4月中旬,中国大模型产业正呈现‘双轨并进’新格局:对外,以通义千问、DeepSeek、Qwen-VL等为代表的国产模型已深度嵌入全球AI创新生态;对内,金融、医疗、政务等关键行业应用进入
2026年4月11日,摩根士丹利发布重磅AI行业研报,首次系统性提出‘前沿大模型能力正经历阶跃式、非线性突变’的核心判断。报告指出,以GPT-5原型、Qwen-VL-Max及DeepSeek-R1为代
2024年4月,吉林大学与上海交通大学联合发布DS-Agent——首个面向复杂机器学习建模任务的领域专用大模型智能体。该Agent不再局限于通用问答或简单代码生成,而是深度模拟专业数据科学家的完整工作
2024年12月16日,arXiv上线的论文《Dynamic-VLM:SimpleDynamicVisualTokenCompressionforVideoLLM》引发视频理解领域广泛关注。该研究直击
2026年3月23日,一项颠覆移动智能边界的重磅成果发布:Mobile-O——全球首个支持在旗舰智能手机上本地化运行的统一视觉-语言-扩散(VLD)大模型正式开源。该模型仅含1.6B参数,却在GenE