美团开源LongCat-AudioDiT:波形潜空间建模刷新音色克隆SOTA
2026年4月1日,美团AI研究院正式开源LongCat-AudioDiT音频生成模型,提出全球首个基于波形潜空间(WaveformLatentSpace)的扩散Transformer架构,在音色克隆
2026年4月1日,美团AI研究院正式开源LongCat-AudioDiT音频生成模型,提出全球首个基于波形潜空间(WaveformLatentSpace)的扩散Transformer架构,在音色克隆
2026年3月30日,阿里巴巴集团正式发布Qwen3.5-Omni多模态原生大模型,以215项权威基准测试SOTA成绩超越Gemini-3.1Pro,成为当前全球综合性能最强的开源多模态基础模型。该模
2026年3月30日,谷歌正式发布Gemma4系列开源大模型,包含E2B、E4B、26BMoE与31B四种规格,全系支持多模态输入与语音交互,并采用ApacheLicense2.0这一业界最宽松的开源
2026年4月2日,OpenAI正式发布GPT-5.4旗舰版本,标志着大模型技术从‘参数竞赛’全面转向‘系统性工程能力比拼’。该模型在多模态理解、长上下文推理(支持2Mtokens)、实时工具调用稳定
2026年4月1日,杭州互联网法院审结全国首例因生成式AI‘幻觉’引发的侵权纠纷案,判决被告科技公司赔偿原告梁先生经济损失及合理维权费用共计8.6万元。该案源于2025年6月,原告使用被告研发的大语言
据2026年3月16日行业权威信源确认,备受瞩目的DeepSeekV4与全新混元大模型预计将于2026年4月正式发布,此举被业内视为中国大模型发展从‘参数竞赛’迈向‘推理即服务(RaaS)’的关键转折
2026年4月2日,新华社深度报道雄安新区‘全域智能’建设取得实质性突破。位于容东片区的雄安城市计算中心——这座被喻为‘雄安之眼’的标志性建筑,已正式承载全城127万常住人口、4.3万家企业及2100
随着生成式AI深度嵌入用户信息获取路径,传统SEO(搜索引擎优化)正被GEO(GenerativeEngineOptimization,生成式引擎优化)全面取代。2026年4月1日发布的《2026年企
2026年4月1日,人工智能领域迎来历史性拐点——OpenAI正式宣布完成总额1220亿美元的新一轮私募融资,刷新全球科技公司单笔融资最高纪录。该轮融资由亚马逊以500亿美元领投,英伟达与软银各出资3
2026年4月2日,新华社深度报道雄安新区‘全域智能’建设进展,揭开了这座‘未来之城’超级大脑的运行逻辑。位于容东片区的雄安城市计算中心(昵称‘雄安之眼’)已建成全球最大规模的城市级AI算力中枢,部署