编辑部 整理自
MEET2026量子位 | 公众号 QbitAI
随着AI从回答问题迈向自主执行和创造,行业开始进入真正的Agentic AI落地元年。这不仅改变了应用形态,也正在重塑整个AI技术栈的底层逻辑。
与此同时,智能体体系结构的复杂度呈指数级增长,从任务规划、工具调用到长期记忆,每一环节都对底层框架提出了更高要求。对此,PPIO联合创始人兼CEO姚欣表示:
能看到无论是PC时代,还是移动时代、云时代,操作系统才是最核心的中间层。
这意味着,未来的AI应用将从回答问题的工具转向能够直接完成任务的助手,而要承载这类能力,行业迫切需要一种新的基础设施——Agent时代的操作系统。
在本次量子位MEET2026智能未来大会上,姚欣围绕智能体演进、Agent Infra等关键词分享了自己对AI底层基础设施架构重塑的判断:
今天的Agent会成为未来AI应用的主力,而Agent Infra会成为下一个AI时代的操作系统。
无论模型能力如何提升,无论应用形态如何演进,未来趋势都指向同一个目标:在AI时代,通过新的Runtime体系,实现模型能力、工具能力与执行能力的高度融合。
为了完整体现姚欣的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。
MEET2026智能未来大会是由量子位主办的行业峰会,20余位产业代表与会讨论。线下参会观众1000+,线上直播观众320万+,获得了主流媒体的广泛关注与报道。
核心观点梳理
以下为姚欣演讲全文:
AI从生成式迈向Agent时代
大家好,我今天分享的主题也是很多嘉宾讲的新话题Agentic AI——今年AI进入了到一个全新的时代。
过去一周,豆包手机横空出世,它能够自动帮你下单、比价、执行任务,这正是我们今年所看到的——从Generative AI向Agent AI的进步。
AI以前更多只是做一些聊天、回答问题;而从年初的Manus、Genspark,到现在的豆包手机,这些产品越来越清晰地展示出AI应用开始像智能体一样自动化完成任务和进行创作。
今天提到智能体这个话题的时候,我发现行业内,特别国内很多人把它定位成工作流。
以前像扣子那样的编排工具,只能算是最早期的智能体形态,并不是完全体。
今天真正的完全态智能体需要具备自主分析、自主决策以及自动化完成任务的能力,而执行与落地正是其中的关键环节。
同时,我们之前在很多AI工具中看到的Deep Research功能,虽然能帮助做搜索和处理,但我认为这仍然只是智能体的早期阶段,真正的智能体需要全新的架构和全新的形态。
真正的智能体需要从能力堆叠走向系统化结构
2023年的时候,OpenAI研究员LilianWeng也发了一篇很著名的论文,《LLM Powered Autonomous Agents》。
这篇文章里面揭示了真正的智能体有哪些核心的组件,包括四个核心的元素:Memory、Planning、Tools、Action。
在梳理每个核心组件的特点和特性时,发现了这样一些类比:如果把智能体当作数字生命体,那么Memory有点像大脑的记忆功能,负责短期记忆、长期记忆,甚至需要具备遗忘能力;Planning更像思考单元,能够进行深度推理和深度分析。
Tools、Action则更像我们的五官,能够感知外部世界发生了什么,甚至像手和脚一样去影响和改造外部世界。真正的智能体不仅是执行的机器,更重要的是具备从思考到执行再到分析的一整套综合系统。
我们想一想,什么样的系统是既能做资源的管理又能做记忆的管理,甚至调用大量的工具呢?
我认为今天的智能体的基础设施更像以前的操作系统,这里我列举了一下过去三四十年一系列操作系统的发展和诞生,能看到无论从PC时代到移动时代还是到云时代,操作系统才是最核心的中间层。
一方面,它要管理大量不同的异构资源,把计算资源、硬件资源,以及各类异构的记忆、存储、传输能力整合起来。
另一方面,还需要把这些能力抽离并抽象成标准化的功能调用,暴露给上层应用,让开发者可以轻松进行二次开发,而无需针对每一种硬件结构单独开发。
无论是在PC时代、手机时代,还是云时代,操作系统始终扮演着这样的角色。
Agent Infra:未来AI时代的新操作系统
我提出一个看法:今天我们做的Agent Infra,本质上是在构建AI时代的操作系统。
传统操作系统管理CPU、内存、存储等硬件资源,而Agent Infra管理的是模型能力、工具调用能力,以及任务和执行能力,在这个维度上完成资源管理、统一调度与抽象,让上层开发者能够更方便地进行应用构建。
在整个Agent Infra体系中,最核心的部分我们认为是Runtime。
Runtime解决的是“能不能跑起来”的问题,真正的智能体能否在各种环境下大规模、通用地适配并稳定运行,依赖的正是把不同能力进行综合调度的Runtime,这也是Agent Infra的核心所在。
PPIO是一家AI云计算公司,我们从底层算力到IaaS、PaaS,再到MaaS,逐层构建了完整的AI云能力,为Agent Infra提供底座支撑。
自2020年算力出现短缺开始,我们整合大量数据中心闲置算力,构建分布式算力网络。如今我们在中国已有4000+算力节点、1300多个能提供大量分布式算力的合作伙伴;2023年从CPU扩展到GPU;2024年我们在全球六大洲三十多个地区和国家开始部署算力网络能力,整合全球各地的算力资源,这是我们的第一层。
第二层是GPU推理云平台。2023年我们打造了第一代推理云平台,实现异构算力的统一调度。2024年推出分布式推理引擎,并托管近百个开源与社区模型,每天处理接近2000亿Token,为模型提供推理加速、降本和性能增强,是支撑开源模型落地的重要基础。
基于前期积累,我们在今年WAIC发布了首个兼容E2B的Agent沙箱,以Runtime为核心整合模型调用、短期/长期记忆和数据库能力,帮助头部Agent厂商规模化落地,通过更安全、敏捷的沙箱体系降低错误率。
该沙箱是专为Agent执行任务设计的云端运行环境,为Agent赋予安全可靠、高效敏捷的“手和脚”,沙箱内支持动态调用Browser use、Computer use、MCP、RAG、Search等各种工具。
PPIO Agent沙箱基于Firecracker MicroVM构建,具备强安全隔离、毫秒级极速启动、高并发创建三大特性,无需预部署,即启即用,让 Agent 的所有操作均处于“受限、可控”的状态。
强安全隔离,让不同Agent沙箱的环境可实现完全隔离,当多个任务并发执行时,每个任务都能在独立环境中运行,从根源上避免数据泄漏和资源抢占冲突。
小于200ms的极速启动时间,远远小于传统虚拟机沙箱数分钟甚至更长的时效,可瞬间创建沙箱环境、运行生成的代码并展示预览效果,大幅提升用户的开发流畅度。
并且PPIO Agent沙箱还支持同时快速启动数千个沙箱实例的高并发创建能力,可充分满足业务场景中的高并发需求,加快结果交付速度,保障用户体验。
沙箱上线以来,月度活跃数在持续增长,我们希望通过Agent Infra成为AI时代新的操作系统,帮助更多开发者成长与创业。



































