很多人在讲大模型、讲智能体，讲得最多的还是屏幕里的 AI；具身智能最近也很火，而目前看到的很多是“具身”，而不是“智能”。真正落到线下世界里的 AI，反而很少人讲了。这大概是和爱笔智能 CEO 林元庆聊完之后，我最强烈的感受。

线上的世界已经被反复定义：模型、Agent、推理、多模态、代码生成、工作流自动化……过去两年，几乎所有 AI 叙事都围绕这些概念展开。相比之下，线下世界显得沉默得多。购物中心里的人流，新能源汽车门店里的接待，机场停机坪上的飞机和保障车辆，城市路口的车流与红绿灯，它们都仍然以一种很“物理”的方式存在着——复杂、笨重、昂贵，也不太性感。

林元庆偏偏做的就是这件事，把 AI 从屏幕里带到这些场景之中。

如果只看履历，林元庆很容易被归类为一位典型的技术型创业者：清华大学硕士、宾夕法尼亚大学博士学位。在顶级国际会议和期刊发表论文50+ 篇，引用次数过万。2010年 ImageNet 冠军，作为 ImageNet 早期的核心贡献者，与李飞飞教授在2011-2014年间有多项深度学术合作。

同时，在吴恩达离开后接任百度研究院院长。那正是百度把“深度学习”作为公司级战略押注的阶段。彼时被引入的核心人物，后来几乎构成了中国 AI 产业早期的重要骨架：创办地平线的余凯、前 Facebook 资深科学家徐伟、Rutgers 大学教授张潼，以及此后百度 AI 体系中长期担任关键角色的王海峰等。

但三个小时的对话之后，这种“技术创业者”的标签开始变得不太准确。

更贴近的描述是，他仍然站在技术里，但已经被业务反复塑形。他讲问题时有很强的结构感，对行业和技术都有清晰判断。他从技术切入，却很快落到客户和场景；也会从一线问题出发，再回到技术能力本身。谈话里，技术只是其中一部分，更多时候，他在讲客户、行业、产品化和现金流，同时也在反复推演一个更长期的问题：空间智能、三维理解，以及物理世界 AI，什么时候会迎来属于自己的“ ChatGPT 时刻”。

在爱笔智能成立的2017年，林元庆看到的是一个被 AI 甩在后面的世界：线上世界已经开始用 AI 驱动电商、搜索、推荐，线下的大多数垂直行业却还没被真正数字化，更谈不上智能化。

他给公司起名爱笔智能（Aibee），AI To B。名字几乎直白得没什么修饰，但也因此显出一种罕见的笃定：他从一开始就知道自己想做什么，而且直到今天也没改。

这家公司做的事情也和当下许多 AI 创业叙事不太一样。它不轻，不快，不像一个靠模型能力一夜之间“涌现”出来的故事。很多人说更像“大炮打蚊子”，它要做空间扫描、摄像头部署、算法工程化、BI、数据服务、客户陪跑，链条长，落地慢，还是典型的脏活累活。

但在林元庆看来，这些脏活累活恰恰构成了某种壁垒，也构成了他们对未来的押注。如果物理世界AI 真的会迎来自己的“ ChatGPT 时刻”，那今天这一切笨重的积累，就不是绕路，而是地基。

爱笔今天有四条 AI 赋能的主行业：购物中心、连锁门店、机场和枢纽、双智城市。而底层其实是一套能力，对三维物理空间的感知和理解。过去他们叫“线下空间的数字化和智能化”，也就是现在的“空间智能”。

如果说大语言模型带来了语言世界的突破，那他更关心的是另一个问题：物理世界什么时候会迎来自己的“ ChatGPT ”时刻？

他说，这件事不会明年就发生，不会突然发生，但很可能会是未来5到10年 AI 里最前沿、最难、也最重要的 AI 方向。爱笔做的所有这些脏活累活，说到底，都是在为那个时刻做准备。

但在这些关于“未来”的判断之外，这家公司也已经走到了一个更现实的阶段。林元庆提到，去年公司已经非常接近盈亏平衡和正现金流，而今年，他预计一定会实现盈利，并开始推进上市相关的准备。

在他看来，只要把现有的四个主线领域继续做深，爱笔有机会成为一家年收入五十亿到一百亿元、同时具备较高毛利和稳定盈利能力的 AI 公司。这个规模不算巨大，但在国内 AI 行业里，真正同时做到“有体量、有利润、还能持续”的公司，仍然很少。同时，这家公司把物理世界AI大模型，即物理世界的“ ChatGPT时刻 ”，看成是自己的诗和远方。

以下是网易《态度》栏目和林元庆的对话，经不改变原意的编辑。

网易《态度》栏目：回到最开始。2017年，您为什么会决定创业，做这样一件在外界看来又重、又脏、又累的事？

林元庆：爱笔原来起的名字其实就是 AI To B，Aibee。我们一开始就下了个很明确的使命，到今天也没变：AI 升级赋能垂直行业，打磨极致 AI 技术。

那个时候我们已经看到，AI 在互联网公司里面已经非常厉害了，甚至已经成为很多核心业务的主驱动力。像电商、外卖、搜索，那时候其实已经很明显了。

但你2017年往互联网外面一看，大部分垂直行业，特别是线下实体行业，AI 的赋能几乎还是很弱的。可能有些人脸识别之类的技术，但离真正赋能业务还差得很远。

所以我们当时就想，要找到一些行业，真正帮这个行业做实质性的升级，而不只是做一些看起来有意思的工具。

后来也有人说，爱笔这家公司是在“大炮打蚊子”。但我一直觉得，如果这些蚊子都打不下来，大炮其实也没有用。

我们后来选的这些行业——零售、购物中心、门店、机场、枢纽、城市——一方面体量够大，另一方面技术场景也非常丰富。你如果做 AI To B，这个行业不能只有一两家主要公司，否则你还不如直接加入它们。我们要找的是那种足够大、足够分散、又确实需要数字化升级的行业。

现在回头看，我觉得我们当时选的方向是非常好的。当然不能说是最优，但我觉得很对。

一个是产研，也就是产品和技术研发，这是一大块。我们现在基本上有4条大的产品线，更准确地说其实是4条行业线：购物中心、连锁门店、机场和枢纽、城市。每一条线下面又会有具体产品。每条线都会有产研负责人，也会有市场负责人，因为每条线本身都比较独立在运行。

我非常紧密地跟进每条线的产研进展。比如我们一个季度开始会定 OKR，定这条线这个季度产研要做到什么程度；每两周会有一次比较完整的 review，平时周中也会有小的 follow up，去看研发进展。这一块大概会花掉我差不多三分之一的时间。

另外一块其实是市场和客户。很多人可能很难想象，但我在爱笔其实有非常多客户对接，特别是跟客户高层去打交道。这里面不只是市场推广，更重要的是我自己也在学习。因为我原来的背景确实比较纯技术，所以要想办法扎进一个行业，去看它最核心的业务逻辑是什么。

比如一条业务线，它最核心的业务逻辑到底是什么？在这种情况下，AI 到底怎么能给它的核心业务带来赋能？并且这种赋能得是比较可量化、可闭环的，不能只是一些 nice to have 的东西。对企业来说，nice to have 用处不大。

剩下可能五分之一到六分之一，是公司内部管理。但其实管理工作也都融在前面这些事里，比如 OKR review，本身也是管理。

创业到现在第九年了，我基本上一直都是这么过来的。一般周一、周二在北京，周三到周五大概率出差，周五晚上回到北京，周六&周日是和各产品线的产研 review 和市场进展 review。一周7天，差不多都是这么过来的。

网易《态度》栏目：这其中有一个词是“赋能业务”。这个词现在也经常被说得很空。你理解的“赋能”到底是什么？

林元庆：我觉得最重要的是，你不能只看客户今天哪里疼，而是要往前看。

今天很多企业当然也在讲降本增效，但这不够。更关键的是去看这个行业如果往前走5到10年，它最核心的业务会怎么变化，它需要什么样的升级，然后 AI 有没有机会去帮助它实现这个升级。

比如商业地产这几年就在发生非常大的变化。以前更多是建设、盖楼，现在越来越重运营，整个行业都在从开发商往运营商转。再比如进入存量市场之后，竞争会变得更激烈，大家拼的是谁的精细化运营能力更强，谁的管理半径能更大，谁能把一个商管团队从管20个购物中心做到管60个。

AI 在这里面的意义就很明确了，它不只是帮你节省一点人工，而是帮助你形成下一阶段的组织能力。

所以我现在花很多时间去跟客户交流、去行业一线学习。因为你只有把这个行业5年后的趋势看清楚，今天的技术落点才不会是浅的。否则你做的很多东西，最后就是个工具。

我一直觉得，AI 最终不应该只是个工具，它应该和企业能力融合在一起，变成这个企业在行业里的核心竞争力。

第一条是 AI 赋能购物中心。这块我们现在做得最深。包括 AI 精准客流、AI 停车、AI导航（ AR/VR 导航）、AI 大屏、AI 智能体，我们内部叫“ 5件套”。这几个产品在购物中心行业里，应该都处在代际领先的位置，而且市场上只有我们能一体化地把这几套都提供出来。

第二条是AI赋能连锁门店。最开始其实做过很多行业，服装、化妆品、儿童乐园、银行、汽车都做过。后来2021年我们做了聚焦，重点做新能源汽车门店。现在全国新能源汽车门店里，差不多接近一半的门店采用的是爱笔的 AI 精准客流方案。

第三条是AI赋能机场和枢纽。比如首都机场、通州副中心交通枢纽，这几年我们在这个行业里落地了很多系统。全国 Top20客流量的机场里面，已经和我们合作的有16家。

第四条是双智城市。这块是从海淀开始做的。以前我们偏室内，后来海淀发现我们的能力很适合用在城市治理、智慧交通上，于是就慢慢把这套“空间智能”的能力延伸到了路口、道路、摄像头联动这些场景里。

但如果从底层去看，这些其实不是4套技术，而是同一套底层技术：在三维空间里理解物体、理解状态、理解交互，再把这些能力转化成上层业务。

所以我们后来把原来那个很长的说法“线下空间的数字化和智能化”，简化成“空间智能”。

林元庆：从营收结构上看，前两年大致是智慧门店占三分之一，购物中心占三分之一，机场和枢纽再加上双智城市占三分之一左右。

从经营层面来看，公司的状态也在往我们想要的方向走。去年我们已经非常接近盈亏平衡，也非常接近正现金流，虽然还没有完全达到，但已经很接近了。今年肯定会是盈利的一年。随着公司走到这个阶段，我们也会开始准备上市相关的事情。

我一直在讲，爱笔真正重要的，是要逐步把自己的闭环建立起来。这个闭环是：资金带来技术研发，技术形成产品，产品进入场景，更多的场景赋能产生更多数据以及更多的商业变现，而更多的资金和数据进一步促进技术的研发。这个闭环一旦真正跑起来，公司就会越来越稳，越来越有力量。

从这个角度看，我对爱笔的业务还是很有信心的。哪怕我们只把现在这四个领域做好，我觉得就有机会把公司做成一家年收入五十亿到一百亿元、而且高毛利、很稳定的 AI 公司。这个规模当然不能说是特别巨大，但在国内，我目前还没有看到哪家 AI 公司，已经真正做到这样一个既有收入体量、又有高毛利、同时还能稳定盈利的状态。当然，盈利可以投入到长远的技术研发。

网易《态度》栏目：我看到爱笔可能一个最容易被理解的案例，就是帮某珠宝门店把业绩提升146%，租金收入提升约5倍。这个事到底怎么做到的？

我们做的是一套叫 AI 精准客流的方案。它不像传统客流系统简单数人头，而是像线上产品经理看 UV、PV、转化率一样，去看线下门店的“转化漏斗”。

比如一间门店门口路过多少人？多少人进店？进店的人里有多少人停留8分钟以上，我们把这个叫“深逛”？深逛的人里有多少最终成交？成交多少笔，再乘上客单价，就是销售额。

你一旦有了这个链路，门店业绩不好就不再是个模糊问题，而能往前追：到底是哪一环转化率低？

但前提是，这个数据得足够准。比如这家珠宝门店，客流量本来就不大，如果把店员进进出出都算成顾客，整个数据就废了。我们现在能把这个颗粒度做到非常细非常精准，这个在行业里应该是很少有人能做到的。

当时那个案例，我们和购物中心、品牌方、店长一起前后做了差不多3个月。第一轮分析发现，它的“深逛率”很低——进来的人不少，但很多两分钟就走了。跟周边同类珠宝业态比，也明显偏低。

所以爱笔这套系统有点像 X 光机。它先告诉你，薄弱环节在哪。后面爱笔团队、购物中心运营团队、店长，甚至这个品牌的区域经理，在一起去分析到底问题出在哪。

第一，货不够匹配客群。进来的客群偏年轻，但产品风格偏老派。

他们前面也试过一些方法，比如做邀约，但效果都一般。后来真正有效的，是两件事：一是做店员培训，以老带新；二是货品做了几轮迭代，每轮迭代之后都看数据反馈。

最后这家店业绩提升了146%。租金收入为什么会提升约5倍？因为现在购物中心很多是“固定租金 + 提成”的模式，业绩超过某条线以后，商场才会开始分成。所以当业绩被拉上来以后，租金收入的弹性会非常明显。

我一直觉得，线下这件事特别有意思。线上20年如一日都在做这种基于数据的优化，但线下以前几乎没有这个能力。爱笔做的，就是把这种能力带到了线下。

网易《态度》栏目：听下来你们不只是采数据，也做分析和落地，这个中间环节是不是也很关键？

林元庆：对，这个其实非常关键。很多 AI 公司做到数据这一步，觉得已经很好了。但还非常难的是：你怎么让 B 端客户真的把数据用起来。

我们前面有差不多5年时间，做了很多非常完整的数据分析系统。现在回头看，那些系统很完整，但不一定真适合客户去落地。

大概从2023年开始，我们在这件事上想得更清楚：方法论必须足够简单，足够容易理解，最好是全国都能通用的一套做法。哪怕做到这个程度，我们还是需要一个专门做“数据价值”的团队，去陪客户把这套方法论落下来。

比如刚才那个购物中心，我们有两位同学几乎在现场待了一年。后来这套方法论才慢慢标准化。现在这个团队其实只有4个人，但已经可以覆盖大部分购物中心客户，去告诉他们这些数据该怎么看、怎么用。

所以爱笔不是把一堆 BI 扔给客户就结束了。我们的目标是，最后客户真的能用这套系统实现运营效率的提升，最终实现业绩的提升。

网易《态度》栏目：很多 To B 公司会越做越重，最后靠堆人。爱笔怎么避免这件事？

从外面看，爱笔链条确实很长。一个落地项目从空间扫描、点位设计、安装部署，到软件、算法、BI、后续数据应用，几乎都是我们在做。你会觉得很重。

但反过来，这么做也有好处：因为链条都在自己手里，所以整套系统可以做到非常优化，而且可以真正产品化。

第一层是底层技术的产品化。虽然我们做了多个行业，但底层核心其实是一套技术，也就是空间智能。

第二层是业务侧的产品化。比如购物中心客流分析，在万达、华润、太古，基本都是高度标准化的产品；停车、导航也是一样。

所以，我们真正给客户做的定制化其实很少。很多公司做 To B 喜欢去做大总包，什么都接，甚至连打印机都卖。爱笔不是，我们非常拒绝这种模式。我们尽量做的是封装好的我们自己的产品。我们重产品化，而不是重项目制。

这也是为什么我们过去几年的增长还比较健康。疫情后的2023、2024年，我们大概每年增长30% 左右；2025年差不多增长接近60%；今年预计80% 到100%。背后不是靠拼命堆项目，而是靠产品化交付带来的内生增长。

网易《态度》栏目：您刚提到产品化。比如空间扫描、三维重建，这件事听起来成本很高，爱笔为什么能把成本做到这么低？

林元庆：因为我们把很多原来靠人做判断的环节，真正用算法替代掉了。

以前做一个10万平米购物中心的三维建模，行业里成本大概要300万到500万。我们现在能做到10万元以下。

原理上是这样的：我们不是只采一层数据，而是一次性采集6层数据，包括点云、图像、Wi-Fi 指纹、蓝牙指纹、地磁、气压计等。以前没有算法的时候，数据采得越多，工作量越大；但当你有很强的融合算法以后，数据越多，反而越能互相校验。

比如某一层重建信息不够充分，我可以看另外一层的信息，来判断这里应不应该拼接。原来这些都是靠很有经验的人去做判断，现在可以算法自动去做。

所以核心不是简单压低价格，而是技术上把原来的人工判断彻底替代掉了。

网易《态度》栏目：您刚刚讲成本优化，让我很好奇爱笔底层技术到底是怎么一步一步做出来的。

我们最早做购物中心 AI 精准客流的时候，要处理每个摄像头每一帧的数据。一个大购物中心可能有几百个摄像头，计算量非常大。

2018年底（创业一年后），我们大概把这套功能第一次做出来。当时一个购物中心一天的数据，需要150台8卡 GPU 服务器（共1200卡）跑10天。在2018年，我们用的还是1080Ti 这种卡。

很多人觉得这么重的事情根本不可能落地，但我们当时就判断，这套系统一定可以优化下来。

到了2019年暑假结束，我们把它优化到12台 GPU 服务器一天跑完一天数据，相当于提升了差不多100倍的计算效率。再到2019年11月，我们把90% 的计算塞到摄像头的 AI 芯片去算，就变成1台 GPU 服务器了。后面再往下做，到2022、2023年，基本上跟 GPU 有关的计算都挪到摄像头端上去了，最后变成了0台 GPU 服务器。

如果从计算成本看，当年150台卡那套方案，差不多对应的是2000多万元硬件，而且还得10天跑1天数据。今天如果用芯片去算，可能只要20万左右，算是1000倍的算力成本节省。

这个过程我们当年用的方法，其实就是去年 DeepSeek 出来之后现在大家熟悉的蒸馏、量化、剪枝这些技术。您看，2019年我们就在深度做这些技术了。您可以理解成，我们一直在用数据&训练去换计算效率。

所以爱笔的技术壁垒，不只是算法本身，而是：算法能不能工程化，能不能把成本压下来，能不能真的落地。

网易《态度》栏目：您刚刚提到双智城市，感觉更大也更抽象。能不能展开讲讲？它和以前讲的智慧城市到底有什么区别？

林元庆：以前大家说智慧城市，更多还是偏安防、偏公安那套，技术也比较浅，很多时候就是识别，尤其是人脸识别，再加上一些简单识别。

现在我们讲的双智城市，我理解是要从技术框架上升级到对城市三维空间的理解，也就是空间智能。这个区别很大。

以海淀为例。去年我们帮海淀把所有路上的部分——楼里没做——完成了三维建模。以前很多公司给海淀报过价，大概是2到3个亿，我们最后大概是800万做下来的。

做完三维建模以后，我们又把海淀路上接近2万个摄像头，统一到这套坐标系里。以前每个摄像头只是个编号，现在每个摄像头都有自己的坐标、角度、视域，它看的是空间的哪一块区域，全都清楚了。

这样一来，这些摄像头瞬间就是联动的。比如一辆车从一个摄像头驶出，一定会进入下一个摄像头的视野。你在路口做红绿灯控制的时候，就不再只是知道大概有多少车排队，而是能知道每辆车在三维空间里的实时状态，车头朝哪边、有没有堵进路口、是不是反溢出。

我们在联想东桥做的 AI 控制红绿灯，把拥堵系数下降了30% 多。这个路口的物理条件完全没变，但爱笔的这套系统上线之后，日均车辆通过量提升了大概14%，早高峰车辆平均速度提高了约40%，晚高峰提高了约90%。

所以我觉得，新的智慧城市不是更大的摄像头系统，而是对三维物理世界更深的理解能力。

网易《态度》栏目：现在大家都在讲大模型、多模态、具身智能、Physical AI。你怎么看爱笔在现在的位置？

林元庆：大语言模型出来以后，对我们当然有很多直接帮助。比如智能体，我们已经在购物中心、客户交互这些场景里大量在用了。以后用户到购物中心，不一定再去找小程序，也不一定要读很多说明文档，他可以直接问：我怎么积分最划算、停车位在哪、去哪个店最近、帮我找车、帮我排队。这些都已经能做很多事情了。

但从更大的趋势看，我们一直有一个判断：大模型这一波技术浪潮之后，更大的机会在物理世界的理解上。

如果把 AI 的主要方向粗分一下，自然语言理解这块，已经到了它的“ ChatGPT 时刻”；语音因为大模型带动，也算基本解决了。可计算机视觉还没有到它自己的“ ChatGPT 时刻”。

我理解的视觉“ ChatGPT 时刻”是什么？是摄像头看这个世界，能像人眼一样去理解：桌子上有水、有书，这个瓶子里装的是水，这个桌子能承重，它不会掉下去……这种理解是非常丰富的，而且是带空间信息和时间信息的。

所以我觉得，未来5到10年，AI 最前沿、最有挑战的一块，就是对三维物理世界的理解。你可以叫空间智能，也可以叫物理世界 AI，或者具身智能的“智能”部分，本质上是一个事情。

网易《态度》栏目：现在具身智能很热。您怎么看具身智能和空间智能的关系？

林元庆：我觉得如果把具身智能拆开看，实际上就是两大块：

第一块是“具身”的部分，也就是身体、控制、小脑、灵巧手这些；

第二块是“智能”的部分，也就是对三维物理世界的感知和理解。

过去几年，身体这部分其实发展很快，机器人跳舞、翻跟头、灵巧手都很厉害。但为什么很多机器人在台上能翻跟头，却下不了台阶？核心问题不是身体不够强，而是对环境的感知还不够强。

你真正走进现实世界，不同环境的台阶不是标准化的，环境是开放的、复杂的。如果对这个世界的感知&理解不够深，机器人的应用一定是有限的。

所以我说，空间智能这块如果发展得不好，具身智能的应用会很受限。只是它不是说一定要等5到10年后才突然发生，我觉得技术进展会是渐进式的。比如今天你可能先能解决下台阶，明天再解决更复杂场景，但大的方向上，这一块是必经之路。

网易《态度》栏目：现在市场上也有一些公司在讲“空间智能”概念，比如做3D 生成、空间设计、仿真的公司。你们怎么区分自己和他们？

一个方向偏生成，也就是你对物理世界有一定先验理解以后，去生成三维空间、三维场景，这一类公司大家更容易理解，视觉冲击也更强。

另一个方向偏感知和理解，尤其是对现实世界、真实世界的感知和理解。爱笔主要做的是这一块。我们从一开始做三维建模，到后面做人、车、飞机等物体在三维空间里的追踪和理解，走的一直是这条线。

我自己的判断是，现在这两个方向还是分开的，但大概2到3年左右，它们会慢慢汇合。因为你能生成，说明你其实对这个世界有很强的先验模型，能帮助更好地感知和理解物理世界；而你感知得越好，也越能反过来帮助积累更多的物理世界的先验，进而帮助生成。它们本质上是相辅相成的。

网易《态度》栏目：您刚才提到偏感知&理解的空间智能，好像和具身智能公司做得还不一样？

一种是 第一视角（egocentric），也就是摄像头装在机器人、车、设备上，它在动；另一种是我们现在做得更多的，叫环境视角或第三视角（exocentric），也可以理解成是上帝视角，摄像头装在环境里，它不动。

我有一个很重要的判断：如果物理世界的视觉有“ ChatGPT 时刻”，第三视角至少会比第一视角早1到2年。

为什么？因为环境视角有很多天然约束条件。摄像头装上以后，它一辈子就看这个地方。这样我们就更容易构建自学习、自标注、自训练的框架。对物理世界AI 来说，这个能力非常关键。因为如果你永远靠人工标注数据去训练，根本走不到计算机视觉的“ ChatGPT时刻“。

所以爱笔现在的卡位其实是很明确的：我们在做环境视角下，对三维物理世界的理解，而且已经有了非常大量的真实世界数据。到今天，我们每天真正深度处理、理解的视频时长，已经超过50万小时。这在国内创业公司里，我觉得肯定是数一数二的。

网易《态度》栏目：现在智能体特别热，包括龙虾的爆火。你觉得它对爱笔的业务会带来什么变化？

林元庆：我觉得会非常大。现在大家最直观感受到的是 AI 在 Coding 上很强，但我认为接下来一个影响可能更大的方向，是数据分析和数据可用性。

很多行业不是没有数据，而是数据太难用。BI 系统里什么都有，但一个普通运营人员很难读懂，也常常没时间读（因为平时要忙的事情已经很多）。你让一个购物中心的营管员天天去做复杂数据分析，这不现实。

但如果有一个足够强的 Agent 层，后面这些数据读取、理解、归因、形成建议的工作，它都可以帮你分析出来。比如一个营管员早上打开系统，Agent 直接告诉他：你负责的女装区今天哪些门店有问题，问题出在哪个漏斗环节，建议怎么处理。

这件事的意义非常大。因为原来“使用数据”的成本，不一定是钱，而是人的时间和精力。现在这个成本在快速下降，甚至可能降到零。

所以对爱笔来说，这是巨大的机会。我们本来就在做线下空间的数据化，如果上面再叠一层强 Agent，这些数据的价值会被释放得非常大。

网易《态度》栏目：现在外界有一种观点，说 Agent 会把传统软件杀死。您怎么看？

林元庆：我觉得问题“软件会不会死”，在于是比较传统的软件开发。但更有意思的是，相比于互联网时代，AI 时代的信息架构会发生根本变化，这是软件业的巨大新机会。

互联网时代，平台公司要把信息尽量都收集到自己这里，然后统一服务用户。这个模式过去非常成功。但它有两个问题：

第一，它不可能真正实时，全世界收集一遍出差需要几个月的时间；

到了 AI 时代，情况会变。因为有了 Agent，每个本地节点都可以有自己的 Agent。比如一个购物中心自己就有一个 Agent，它最清楚自己现在有没有停车位、哪家店在做什么活动、会员积分怎么最划算、停车场的哪条路最堵。

未来外部平台不一定要把这些数据全部抓走，它可以直接和本地 Agent 去对接，用自然语言的现实（而不是传统的API接口的形式），Agent-to-Agent (A2A) 地沟通。这样一来，数据是实时的，权限也更清晰。你问停车位，我可以告诉你；你问某家店今天销售额多少，我不会告诉你。

所以我觉得，未来更像是一个分布式、实时的 Agent 网络。而爱笔在这个体系里的价值，是帮这些线下场所——购物中心、机场、停车场等——把它们自己的 Agent 能力建起来，让它们能和所有外部平台对接。

网易《态度》栏目：以前大家会把你归成科学家创业者。你自己怎么看这些年从技术人到创业者的变化？对今天的 AI 创业者，您有什么建议？

林元庆：其实我到今天还是很技术。我还会看论文，也会花很多时间参与技术讨论。包括刚才我们聊的很多技术判断，我自己都在参与。

但技术创业确实有一个非常大的挑战：你不能只懂技术。技术能不能研发出来，这只是第一道坎。

第二道坎技术要变成产品，这里面会涉及标准化、成本、工程化、交付等等。

产品做出来以后，能不能真正赋能业务，这是第三道坎。赋能业务以后，能不能占领市场，这是第四道坎。占领市场以后，能不能形成壁垒，这是第五道坎。

然后后面还有团队/组织、融资、竞争、周期、宏观环境这些一堆因素。

所以技术创业特别难。很多人以为技术做出来就结束了，但其实那只是开始。后面是一层一层的转化漏斗。

如果说有什么经验，我觉得一是要对技术趋势和应用趋势有自己比较清晰的理解框架；二是团队要形成共识。因为创业这件事不可能十全十美，很多时候就是所有人都要一起牺牲眼前、一起扛。

网易《态度》栏目：如果把时间拉到未来10年，爱笔的目标是什么？阶段性重点又是什么？

先说业务。我们现在自己亲自深耕的 AI赋能的行业，基本就这四个：购物中心、连锁门店、机场枢纽、双智城市。原则上不会再扩很多行业了，顶多以后再多一两个，但不会很多。

我们的目标是，把这几个行业彻底打透，真的形成“爱笔做了以后，这个行业就很难再有第二家进来”的状态。中国市场做好以后，再往海外走。像机场，我们现在已经开始往中东走了，阿曼机场的 AI 赋能的一期已经做完，后面二期三期也在顺利推进中。

在业务形态上，我们也看得比较清楚：最开始是项目制，然后走向产品化交付，再往上是数据服务，再往上，有机会变成平台型业务。

比如我们现在在看的一个平台型方向，就是自主代客泊车（ AVP ）。如果未来2028到2030年这个趋势起来，那么购物中心和机场的停车场，需要一套环境侧能力：一方面提供上帝视角感知去和车端感知融合，另一方面管理这些 AVP 车辆。爱笔今天已经在很多停车场里落了数字化基础设施，我们希望未来 AVP 真来了，这些设施不需要重建，可以直接复用。而爱笔是为整个 AVP 行业提供场端智能的全国性的平台型企业。

再说技术。我们一直觉得，空间智能的终极态，或者说物理世界 AI 大模型，是爱笔未来10年的诗和远方。

当然今天你说直接去做这套训练系统，得投入非常大的资源，对创业公司不现实。所以我们的打法会更务实一点：基于我们1.0阶段已经积累下来的数据、算法和优化能力，先走一条比较轻量的路。

我们内部现在分为两个阶段来做。因为我们已经把检测、跟踪、时空理解做得比较好了，所以不一定非要像很多多模态模型那样，从 pixel、patch 开始重新做，那样成本太高。我们希望先把已经做好的物体级别的理解进一步 token 化、结构化，再往上训练，看这条路到底能走多远。

我跟团队说得很直接：如果未来物理世界AI 真到了 ChatGPT 时刻，我希望爱笔是站在终点的少数几家公司之一。

网易《态度》栏目：AI 变化这么快，但今天聊下来我的感觉反而是要有长期主义，有战略定力。你这种状态是怎么来的？

我毕业以后一直在工业界，先在 NEC 美国实验室，后来在百度研究院。工业界研究和学术界不一样，学术界很多时候是在提出问题，工业界更多是在解决真实问题，而且是要能落地的问题。

这段经历让我对技术怎么演进、怎么和应用结合、怎么真正赋能业务，会看得比较透。我自己脑子里一直有一套技术和应用结合的框架。

爱笔从2017年到今天，主线其实一直没怎么变。创业公司里，能做到七八年以后还在做最开始的那件事，而且越做越清晰的，不算特别多。某种程度上，这也说明我们的判断在大方向上是对的。

当然，不代表我们什么都对。我会花很多时间去思考这些事情，也会一直在一线，和客户、行业、技术都保持足够近。因为只有这样，你的判断才会不断被现实校正。

所以我觉得所谓战略定力，不是说我很固执，而是我会把大的方向看得比较长，但每一步走法都非常现实。

网易《态度》栏目：最后一个问题。现在回头看爱笔这9年，你最确定的一件事是什么？

林元庆：我最确定的一件事，是我们最初选的方向是对的。不一定是最优，但一定是很好的方向。

我们从一开始就做 AI To B，做垂直行业，做线下空间，做那些很多人觉得又重又累的事情。今天再看，购物中心、连锁门店、机场、城市都在发生很深的变化；大模型、 Agent、具身智能、空间智能，又把这件事的重要性进一步放大了。

爱笔这些年其实就是一点点把基础能力搭起来：算法、工程化、数据、场景、客户、产品化交付、正向现金流、闭环。

这些零部件平时看起来不一定最显眼，但如果未来物理世界 AI 真迎来它的ChatGPT 时刻，你会发现，真正能站在那个时点上的公司，前面很多年大概率都在做这些“脏活累活”。

所以我常跟团队讲，空间智能的终极态，或者说物理世界 AI 大模型，是爱笔到2035年的诗和远方。

*网易科技重磅推出系列对话栏目《态度AGI》。过去三年，AI变革风起云涌，全球科技秩序正在重构，通往AGI的道路或许正在悄然临近。本栏目以AGI为题，将对话100位AI专家、企业家、投资人，试图拨开云雾，与大家一道见证AGI时代的到来。第五十三期专访林元庆：Physical AI的关键，不是生成新世界，而是理解真实世界

《态度AGI》第一期：对话李开复：大模型创业狂奔一年中美差距缩小我十年不套现

《态度AGI》第二期：对话王小川：我们不跟进大模型价格战

《态度AGI》第三期：对话戴文渊：大模型价格战不解决核心问题

《态度AGI》第四期：对话智源研究院院长王仲远：GPT4不是国内大模型的尽头

《态度AGI》第五期：对话朱啸虎：5年后将没有独立的大模型公司存在，因为没有商业模式

《态度AGI》第六期：对话梅花创投吴世春：“中国大模型五虎”想要跑出来非常难

《态度AGI》第七期：对话跃然创新CEO李勇：做大模型应用如何和巨头错位竞争

《态度AGI》第八期：对话智谱AI CEO张鹏：视频生成是AGI必经之路，超级App将在“不知不觉”中到来

《态度AGI》第九期：对话科大讯飞副总裁、研究院院长刘聪：中国大模型已从追赶对标走向自主原创

《态度AGI》第十期：对话360周鸿祎：魔法对付魔法，大模型安全问题得靠大模型

《态度AGI》第十一期：对话彩云科技CEO袁行远：超越ChatGPT，需要打开“黑盒”

《态度AGI》第十二期：对话傅盛：不看好双足机器人商业化，三五年都没戏