联想发布巴掌大AI主机P7:国产此芯P1驱动,首创‘免费Token生产模式’冲击AI问答终端生态

2026-05-20 20:38 👁 39214

5月19日晚间,联想集团在北京举办‘天禧AI 一体多端全场景新品超能之夜’发布会,正式推出全球首款面向个人开发者与轻量级AI应用的微型AI主机——联想AI主机P7。该设备体积仅约12.8×9.2×3.5厘米,重量不足380克,真正实现‘巴掌大小、桌面即用’,成为迄今最紧凑的本地化AI推理终端之一。尤为关键的是,其并非传统边缘计算盒子,而是首次将‘大模型模式’深度产品化:用户可在离线或混合环境下,直接调用内置轻量化MoE架构模型,实时生成标准Token(词元),且不依赖云端API计费——即所谓‘免费Token生产’,为中小开发者、教育机构及AI问答应用初创团队提供零边际成本的语义单元供给能力。

该主机搭载国产AI加速芯片——此芯科技P1,采用7nm制程,集成自研NPU核心与双通道LPDDR5X内存控制器,INT4算力达28 TOPS,支持FP16/INT8混合精度推理,并通过天禧Claw智能体框架实现任务感知调度。现场实测显示,P7在运行Qwen2.5-1.5B本地微调版本时,单次128-token生成延迟低于320ms,可持续输出超5000 token/分钟,远超同尺寸竞品。值得注意的是,此芯P1系国内首颗通过信创适配认证、支持全栈开源AI工具链(含vLLM、llama.cpp、Ollama)的端侧AI SoC,其流片良率与功耗控制已获三大国产大模型厂商联合背书。

行业影响层面,P7标志着AI问答基础设施正从‘云中心化调用’迈入‘终端原子化供给’新阶段。以往Token作为云计算资源计量单位,高度绑定厂商服务协议;而P7将Token还原为可本地生成、可编程、可审计的基础语义材料,有望催生‘Token农场’‘Token交易所’等新型中间态生态。多家AIGC工具开发商已在闭门测试中接入P7,用于构建无需联网的私有知识库问答终端、离线考试AI监考模块及方言语音转写问答一体机。

未来展望方面,联想透露P7将于2026年6月下旬开启首批开发者限量发售(定价2999元起),并同步开放SDK与Token计量SDK,允许第三方应用精确追踪、分配与结算本地生成Token。业内预判,随着此类设备规模化落地,AI问答系统的成本结构将被重写:服务层毛利空间压缩,而硬件+固件+垂直模型套件的组合价值显著提升。一场以‘Token主权回归终端’为内核的AI问答去中心化浪潮,或将在2026下半年加速成型。