2026年3月6日,由中国科学院信息工程研究所与澜舟科技联合完成的研究成果‘LightRetriever’被国际机器学习顶会ICLR 2026接收,并获评‘杰出论文奖’。该工作对沿用三十年的传统信息检索范式发起根本性质疑:在绝大多数实际场景中,查询(Query)端的深度语义建模不仅非必需,反而成为性能瓶颈。研究团队提出‘极致非对称Embedding架构’,将全部计算负荷迁移至文档(Doc)侧编码,查询端仅需一次词元查表(Lookup)与均值聚合即可生成向量,彻底取消LLM前向传播。这一设计使查询编码速度提升1024倍,端到端吞吐量(QPS)达传统对称模型的12.7倍,而检索精度(nDCG@10)仍保持在对称模型的94.8%。

技术实现上,LightRetriever创新性地采用‘文档感知的查询稀疏化’策略:在Doc侧编码器中嵌入轻量级查询适配模块,使每个文档向量隐式携带对高频查询模式的响应偏好;查询向量则退化为‘路由信号’,仅激活文档向量中与其语义最相关的子空间。在BeIR英文与CMTEB-Retrieval中文基准测试中,其在金融、法律、医疗等专业领域检索任务上表现尤为突出,长尾查询召回率提升达41.6%。

该成果已催生新一代企业搜索基础设施。蚂蚁集团已将其集成至‘蚁鉴’风控知识图谱,支撑日均3.2亿次实时欺诈线索检索;国家知识产权局上线基于LightRetriever的‘专利快搜’系统,审查员输入技术方案关键词,0.3秒内即可定位全球相似专利簇。业内专家指出,这项研究标志着AI检索正从‘模型驱动’迈入‘架构驱动’新阶段——算力不应浪费在重复计算上,而应精准投向真正产生价值的环节。目前,LightRetriever模型与训练框架已在Hugging Face开源,支持PyTorch/TensorFlow双后端,成为2026年最受关注的工业级Embedding解决方案。