出品 | 《态度AGI》栏目

作者 | 袁宁

编辑 | 丁广胜

很多人在讲大模型、讲智能体,讲得最多的还是屏幕里的 AI;具身智能最近也很火,而目前看到的很多是“具身”,而不是“智能”。真正落到线下世界里的 AI,反而很少人讲了。这大概是和爱笔智能 CEO 林元庆聊完之后,我最强烈的感受。

线上的世界已经被反复定义:模型、Agent、推理、多模态、代码生成、工作流自动化……过去两年,几乎所有 AI 叙事都围绕这些概念展开。相比之下,线下世界显得沉默得多。购物中心里的人流,新能源汽车门店里的接待,机场停机坪上的飞机和保障车辆,城市路口的车流与红绿灯,它们都仍然以一种很“物理”的方式存在着——复杂、笨重、昂贵,也不太性感。

林元庆偏偏做的就是这件事,把 AI 从屏幕里带到这些场景之中。

如果只看履历,林元庆很容易被归类为一位典型的技术型创业者:清华大学硕士、宾夕法尼亚大学博士学位。在顶级国际会议和期刊发表论文50+ 篇,引用次数过万。2010年 ImageNet 冠军,作为 ImageNet 早期的核心贡献者,与李飞飞教授在2011-2014年间有多项深度学术合作。

同时,在吴恩达离开后接任百度研究院院长。那正是百度把“深度学习”作为公司级战略押注的阶段。彼时被引入的核心人物,后来几乎构成了中国 AI 产业早期的重要骨架:创办地平线的余凯、前 Facebook 资深科学家徐伟、Rutgers 大学教授张潼,以及此后百度 AI 体系中长期担任关键角色的王海峰等。

但三个小时的对话之后,这种“技术创业者”的标签开始变得不太准确。

更贴近的描述是,他仍然站在技术里,但已经被业务反复塑形。他讲问题时有很强的结构感,对行业和技术都有清晰判断。他从技术切入,却很快落到客户和场景;也会从一线问题出发,再回到技术能力本身。谈话里,技术只是其中一部分,更多时候,他在讲客户、行业、产品化和现金流,同时也在反复推演一个更长期的问题:空间智能、三维理解,以及物理世界 AI,什么时候会迎来属于自己的“ ChatGPT 时刻”。

在爱笔智能成立的2017年,林元庆看到的是一个被 AI 甩在后面的世界:线上世界已经开始用 AI 驱动电商、搜索、推荐,线下的大多数垂直行业却还没被真正数字化,更谈不上智能化。

他给公司起名爱笔智能(Aibee),AI To B。名字几乎直白得没什么修饰,但也因此显出一种罕见的笃定:他从一开始就知道自己想做什么,而且直到今天也没改。

这家公司做的事情也和当下许多 AI 创业叙事不太一样。它不轻,不快,不像一个靠模型能力一夜之间“涌现”出来的故事。很多人说更像“大炮打蚊子”,它要做空间扫描、摄像头部署、算法工程化、BI、数据服务、客户陪跑,链条长,落地慢,还是典型的脏活累活。

但在林元庆看来,这些脏活累活恰恰构成了某种壁垒,也构成了他们对未来的押注。如果物理世界AI 真的会迎来自己的“ ChatGPT 时刻”,那今天这一切笨重的积累,就不是绕路,而是地基。

爱笔今天有四条 AI 赋能的主行业:购物中心、连锁门店、机场和枢纽、双智城市。而底层其实是一套能力,对三维物理空间的感知和理解。过去他们叫“线下空间的数字化和智能化”,也就是现在的“空间智能”。

如果说大语言模型带来了语言世界的突破,那他更关心的是另一个问题:物理世界什么时候会迎来自己的“ ChatGPT ”时刻?

他说,这件事不会明年就发生,不会突然发生,但很可能会是未来5到10年 AI 里最前沿、最难、也最重要的 AI 方向。爱笔做的所有这些脏活累活,说到底,都是在为那个时刻做准备。

但在这些关于“未来”的判断之外,这家公司也已经走到了一个更现实的阶段。林元庆提到,去年公司已经非常接近盈亏平衡和正现金流,而今年,他预计一定会实现盈利,并开始推进上市相关的准备。

在他看来,只要把现有的四个主线领域继续做深,爱笔有机会成为一家年收入五十亿到一百亿元、同时具备较高毛利和稳定盈利能力的 AI 公司。这个规模不算巨大,但在国内 AI 行业里,真正同时做到“有体量、有利润、还能持续”的公司,仍然很少。同时,这家公司把物理世界AI大模型,即物理世界的“ ChatGPT时刻 ”,看成是自己的诗和远方。

以下是网易《态度》栏目和林元庆的对话,经不改变原意的编辑。

AI赋能垂直行业,已经帮助很多实体门店业绩提升50%以上

网易《态度》栏目:回到最开始。2017年,您为什么会决定创业,做这样一件在外界看来又重、又脏、又累的事?

林元庆:爱笔原来起的名字其实就是 AI To B,Aibee。我们一开始就下了个很明确的使命,到今天也没变:AI 升级赋能垂直行业,打磨极致 AI 技术。

那个时候我们已经看到,AI 在互联网公司里面已经非常厉害了,甚至已经成为很多核心业务的主驱动力。像电商、外卖、搜索,那时候其实已经很明显了。

但你2017年往互联网外面一看,大部分垂直行业,特别是线下实体行业,AI 的赋能几乎还是很弱的。可能有些人脸识别之类的技术,但离真正赋能业务还差得很远。

所以我们当时就想,要找到一些行业,真正帮这个行业做实质性的升级,而不只是做一些看起来有意思的工具。

后来也有人说,爱笔这家公司是在“大炮打蚊子”。但我一直觉得,如果这些蚊子都打不下来,大炮其实也没有用。

我们后来选的这些行业——零售、购物中心、门店、机场、枢纽、城市——一方面体量够大,另一方面技术场景也非常丰富。你如果做 AI To B,这个行业不能只有一两家主要公司,否则你还不如直接加入它们。我们要找的是那种足够大、足够分散、又确实需要数字化升级的行业。

现在回头看,我觉得我们当时选的方向是非常好的。当然不能说是最优,但我觉得很对。

网易《态度》栏目:您现在一天大概怎么安排?

林元庆:公司里我直接看的东西其实比较多。

一个是产研,也就是产品和技术研发,这是一大块。我们现在基本上有4条大的产品线,更准确地说其实是4条行业线:购物中心、连锁门店、机场和枢纽、城市。每一条线下面又会有具体产品。每条线都会有产研负责人,也会有市场负责人,因为每条线本身都比较独立在运行。

我非常紧密地跟进每条线的产研进展。比如我们一个季度开始会定 OKR,定这条线这个季度产研要做到什么程度;每两周会有一次比较完整的 review,平时周中也会有小的 follow up,去看研发进展。这一块大概会花掉我差不多三分之一的时间。

另外一块其实是市场和客户。很多人可能很难想象,但我在爱笔其实有非常多客户对接,特别是跟客户高层去打交道。这里面不只是市场推广,更重要的是我自己也在学习。因为我原来的背景确实比较纯技术,所以要想办法扎进一个行业,去看它最核心的业务逻辑是什么。

比如一条业务线,它最核心的业务逻辑到底是什么?在这种情况下,AI 到底怎么能给它的核心业务带来赋能?并且这种赋能得是比较可量化、可闭环的,不能只是一些 nice to have 的东西。对企业来说,nice to have 用处不大。

这一块大概会花掉我一半左右的时间。

剩下可能五分之一到六分之一,是公司内部管理。但其实管理工作也都融在前面这些事里,比如 OKR review,本身也是管理。

创业到现在第九年了,我基本上一直都是这么过来的。一般周一、周二在北京,周三到周五大概率出差,周五晚上回到北京,周六&周日是和各产品线的产研 review 和市场进展 review。一周7天,差不多都是这么过来的。

网易《态度》栏目:这其中有一个词是“赋能业务”。这个词现在也经常被说得很空。你理解的“赋能”到底是什么?

林元庆:我觉得最重要的是,你不能只看客户今天哪里疼,而是要往前看。

今天很多企业当然也在讲降本增效,但这不够。更关键的是去看这个行业如果往前走5到10年,它最核心的业务会怎么变化,它需要什么样的升级,然后 AI 有没有机会去帮助它实现这个升级。

比如商业地产这几年就在发生非常大的变化。以前更多是建设、盖楼,现在越来越重运营,整个行业都在从开发商往运营商转。再比如进入存量市场之后,竞争会变得更激烈,大家拼的是谁的精细化运营能力更强,谁的管理半径能更大,谁能把一个商管团队从管20个购物中心做到管60个。

AI 在这里面的意义就很明确了,它不只是帮你节省一点人工,而是帮助你形成下一阶段的组织能力。

所以我现在花很多时间去跟客户交流、去行业一线学习。因为你只有把这个行业5年后的趋势看清楚,今天的技术落点才不会是浅的。否则你做的很多东西,最后就是个工具。

我一直觉得,AI 最终不应该只是个工具,它应该和企业能力融合在一起,变成这个企业在行业里的核心竞争力。

网易《态度》栏目:现在爱笔的业务主线是什么?

林元庆:现在我们自己深耕的,主要就是4条业务线。

第一条是 AI 赋能购物中心。这块我们现在做得最深。包括 AI 精准客流、AI 停车、AI导航( AR/VR 导航)、AI 大屏、AI 智能体,我们内部叫“ 5件套”。这几个产品在购物中心行业里,应该都处在代际领先的位置,而且市场上只有我们能一体化地把这几套都提供出来。

第二条是AI赋能连锁门店。最开始其实做过很多行业,服装、化妆品、儿童乐园、银行、汽车都做过。后来2021年我们做了聚焦,重点做新能源汽车门店。现在全国新能源汽车门店里,差不多接近一半的门店采用的是爱笔的 AI 精准客流方案。

第三条是AI赋能机场和枢纽。比如首都机场、通州副中心交通枢纽,这几年我们在这个行业里落地了很多系统。全国 Top20客流量的机场里面,已经和我们合作的有16家。

第四条是 双智城市。这块是从海淀开始做的。以前我们偏室内,后来海淀发现我们的能力很适合用在城市治理、智慧交通上,于是就慢慢把这套“空间智能”的能力延伸到了路口、道路、摄像头联动这些场景里。

但如果从底层去看,这些其实不是4套技术,而是同一套底层技术:在三维空间里理解物体、理解状态、理解交互,再把这些能力转化成上层业务。

所以我们后来把原来那个很长的说法“线下空间的数字化和智能化”,简化成“空间智能”。

网易《态度》栏目:经营层面来看呢?营收和业务结构?

林元庆:从营收结构上看,前两年大致是智慧门店占三分之一,购物中心占三分之一,机场和枢纽再加上双智城市占三分之一左右。

从经营层面来看,公司的状态也在往我们想要的方向走。去年我们已经非常接近盈亏平衡,也非常接近正现金流,虽然还没有完全达到,但已经很接近了。今年肯定会是盈利的一年。随着公司走到这个阶段,我们也会开始准备上市相关的事情。

我一直在讲,爱笔真正重要的,是要逐步把自己的闭环建立起来。这个闭环是:资金带来技术研发,技术形成产品,产品进入场景,更多的场景赋能产生更多数据以及更多的商业变现,而更多的资金和数据进一步促进技术的研发。这个闭环一旦真正跑起来,公司就会越来越稳,越来越有力量。

从这个角度看,我对爱笔的业务还是很有信心的。哪怕我们只把现在这四个领域做好,我觉得就有机会把公司做成一家年收入五十亿到一百亿元、而且高毛利、很稳定的 AI 公司。这个规模当然不能说是特别巨大,但在国内,我目前还没有看到哪家 AI 公司,已经真正做到这样一个既有收入体量、又有高毛利、同时还能稳定盈利的状态。当然,盈利可以投入到长远的技术研发。

网易《态度》栏目:我看到爱笔可能一个最容易被理解的案例,就是帮某珠宝门店把业绩提升146%,租金收入提升约5倍。这个事到底怎么做到的?

林元庆:这个案例其实挺典型的。

我们做的是一套叫 AI 精准客流 的方案。它不像传统客流系统简单数人头,而是像线上产品经理看 UV、PV、转化率一样,去看线下门店的“转化漏斗”。

比如一间门店门口路过多少人?多少人进店?进店的人里有多少人停留8分钟以上,我们把这个叫“深逛”?深逛的人里有多少最终成交?成交多少笔,再乘上客单价,就是销售额。

你一旦有了这个链路,门店业绩不好就不再是个模糊问题,而能往前追:到底是哪一环转化率低?

但前提是,这个数据得足够准。比如这家珠宝门店,客流量本来就不大,如果把店员进进出出都算成顾客,整个数据就废了。我们现在能把这个颗粒度做到非常细非常精准,这个在行业里应该是很少有人能做到的。

当时那个案例,我们和购物中心、品牌方、店长一起前后做了差不多3个月。第一轮分析发现,它的“深逛率”很低——进来的人不少,但很多两分钟就走了。跟周边同类珠宝业态比,也明显偏低。

所以爱笔这套系统有点像 X 光机。它先告诉你,薄弱环节在哪。后面爱笔团队、购物中心运营团队、店长,甚至这个品牌的区域经理,在一起去分析到底问题出在哪。

最后大概归结成两件事:

第一,货不够匹配客群。进来的客群偏年轻,但产品风格偏老派。

第二,接待能力不够。珠宝这种店,店员的接待非常关键。

他们前面也试过一些方法,比如做邀约,但效果都一般。后来真正有效的,是两件事:一是做店员培训,以老带新;二是货品做了几轮迭代,每轮迭代之后都看数据反馈。

最后这家店业绩提升了146%。租金收入为什么会提升约5倍?因为现在购物中心很多是“固定租金 + 提成”的模式,业绩超过某条线以后,商场才会开始分成。所以当业绩被拉上来以后,租金收入的弹性会非常明显。

我一直觉得,线下这件事特别有意思。线上20年如一日都在做这种基于数据的优化,但线下以前几乎没有这个能力。爱笔做的,就是把这种能力带到了线下。

网易《态度》栏目:听下来你们不只是采数据,也做分析和落地,这个中间环节是不是也很关键?

林元庆:对,这个其实非常关键。很多 AI 公司做到数据这一步,觉得已经很好了。但还非常难的是:你怎么让 B 端客户真的把数据用起来。

我们前面有差不多5年时间,做了很多非常完整的数据分析系统。现在回头看,那些系统很完整,但不一定真适合客户去落地。

大概从2023年开始,我们在这件事上想得更清楚:方法论必须足够简单,足够容易理解,最好是全国都能通用的一套做法。哪怕做到这个程度,我们还是需要一个专门做“数据价值”的团队,去陪客户把这套方法论落下来。

比如刚才那个购物中心,我们有两位同学几乎在现场待了一年。后来这套方法论才慢慢标准化。现在这个团队其实只有4个人,但已经可以覆盖大部分购物中心客户,去告诉他们这些数据该怎么看、怎么用。

所以爱笔不是把一堆 BI 扔给客户就结束了。我们的目标是,最后客户真的能用这套系统实现运营效率的提升,最终实现业绩的提升。

别人报价2到3亿,我们最后做了800万

网易《态度》栏目:很多 To B 公司会越做越重,最后靠堆人。爱笔怎么避免这件事?

林元庆:我们一直非常警惕这个问题。

从外面看,爱笔链条确实很长。一个落地项目从空间扫描、点位设计、安装部署,到软件、算法、BI、后续数据应用,几乎都是我们在做。你会觉得很重。

但反过来,这么做也有好处:因为链条都在自己手里,所以整套系统可以做到非常优化,而且可以真正产品化。

我觉得爱笔的产品化有两层。

第一层是底层技术的产品化。虽然我们做了多个行业,但底层核心其实是一套技术,也就是空间智能。

第二层是业务侧的产品化。比如购物中心客流分析,在万达、华润、太古,基本都是高度标准化的产品;停车、导航也是一样。

所以,我们真正给客户做的定制化其实很少。很多公司做 To B 喜欢去做大总包,什么都接,甚至连打印机都卖。爱笔不是,我们非常拒绝这种模式。我们尽量做的是封装好的我们自己的产品。我们重产品化,而不是重项目制。

这也是为什么我们过去几年的增长还比较健康。疫情后的2023、2024年,我们大概每年增长30% 左右;2025年差不多增长接近60%;今年预计80% 到100%。背后不是靠拼命堆项目,而是靠产品化交付带来的内生增长。

网易《态度》栏目:您刚提到产品化。比如空间扫描、三维重建,这件事听起来成本很高,爱笔为什么能把成本做到这么低?

林元庆:因为我们把很多原来靠人做判断的环节,真正用算法替代掉了。

以前做一个10万平米购物中心的三维建模,行业里成本大概要300万到500万。我们现在能做到10万元以下。

原理上是这样的:我们不是只采一层数据,而是一次性采集6层数据,包括点云、图像、Wi-Fi 指纹、蓝牙指纹、地磁、气压计等。以前没有算法的时候,数据采得越多,工作量越大;但当你有很强的融合算法以后,数据越多,反而越能互相校验。

比如某一层重建信息不够充分,我可以看另外一层的信息,来判断这里应不应该拼接。原来这些都是靠很有经验的人去做判断,现在可以算法自动去做。

所以核心不是简单压低价格,而是技术上把原来的人工判断彻底替代掉了。

网易《态度》栏目:您刚刚讲成本优化,让我很好奇爱笔底层技术到底是怎么一步一步做出来的。

林元庆:这个过程其实很磨人,但也很有壁垒。

我们最早做购物中心 AI 精准客流的时候,要处理每个摄像头每一帧的数据。一个大购物中心可能有几百个摄像头,计算量非常大。

2018年底(创业一年后),我们大概把这套功能第一次做出来。当时一个购物中心一天的数据,需要150台8卡 GPU 服务器(共1200卡)跑10天。在2018年,我们用的还是1080Ti 这种卡。

很多人觉得这么重的事情根本不可能落地,但我们当时就判断,这套系统一定可以优化下来。

到了2019年暑假结束,我们把它优化到12台 GPU 服务器一天跑完一天数据,相当于提升了差不多100倍的计算效率。再到2019年11月,我们把90% 的计算塞到摄像头的 AI 芯片去算,就变成1台 GPU 服务器了。后面再往下做,到2022、2023年,基本上跟 GPU 有关的计算都挪到摄像头端上去了,最后变成了0台 GPU 服务器。

如果从计算成本看,当年150台卡那套方案,差不多对应的是2000多万元硬件,而且还得10天跑1天数据。今天如果用芯片去算,可能只要20万左右,算是1000倍的算力成本节省。

这个过程我们当年用的方法,其实就是去年 DeepSeek 出来之后现在大家熟悉的蒸馏、量化、剪枝这些技术。您看,2019年我们就在深度做这些技术了。您可以理解成,我们一直在用数据&训练去换计算效率。

所以爱笔的技术壁垒,不只是算法本身,而是:算法能不能工程化,能不能把成本压下来,能不能真的落地。

网易《态度》栏目:您刚刚提到双智城市,感觉更大也更抽象。能不能展开讲讲?它和以前讲的智慧城市到底有什么区别?

林元庆:以前大家说智慧城市,更多还是偏安防、偏公安那套,技术也比较浅,很多时候就是识别,尤其是人脸识别,再加上一些简单识别。

现在我们讲的双智城市,我理解是要从技术框架上升级到对城市三维空间的理解,也就是空间智能。这个区别很大。

以海淀为例。去年我们帮海淀把所有路上的部分——楼里没做——完成了三维建模。以前很多公司给海淀报过价,大概是2到3个亿,我们最后大概是800万做下来的。

做完三维建模以后,我们又把海淀路上接近2万个摄像头,统一到这套坐标系里。以前每个摄像头只是个编号,现在每个摄像头都有自己的坐标、角度、视域,它看的是空间的哪一块区域,全都清楚了。

这样一来,这些摄像头瞬间就是联动的。比如一辆车从一个摄像头驶出,一定会进入下一个摄像头的视野。你在路口做红绿灯控制的时候,就不再只是知道大概有多少车排队,而是能知道每辆车在三维空间里的实时状态,车头朝哪边、有没有堵进路口、是不是反溢出。

我们在联想东桥做的 AI 控制红绿灯,把拥堵系数下降了30% 多。这个路口的物理条件完全没变,但爱笔的这套系统上线之后,日均车辆通过量提升了大概14%,早高峰车辆平均速度提高了约40%,晚高峰提高了约90%。

所以我觉得,新的智慧城市不是更大的摄像头系统,而是对三维物理世界更深的理解能力。

未来5到10年,AI最前沿的大机会是物理世界AI

网易《态度》栏目:现在大家都在讲大模型、多模态、具身智能、Physical AI。你怎么看爱笔在现在的位置?

林元庆:大语言模型出来以后,对我们当然有很多直接帮助。比如智能体,我们已经在购物中心、客户交互这些场景里大量在用了。以后用户到购物中心,不一定再去找小程序,也不一定要读很多说明文档,他可以直接问:我怎么积分最划算、停车位在哪、去哪个店最近、帮我找车、帮我排队。这些都已经能做很多事情了。

但从更大的趋势看,我们一直有一个判断:大模型这一波技术浪潮之后,更大的机会在物理世界的理解上。

如果把 AI 的主要方向粗分一下,自然语言理解这块,已经到了它的“ ChatGPT 时刻”;语音因为大模型带动,也算基本解决了。可计算机视觉还没有到它自己的“ ChatGPT 时刻”。

我理解的视觉“ ChatGPT 时刻”是什么?是摄像头看这个世界,能像人眼一样去理解:桌子上有水、有书,这个瓶子里装的是水,这个桌子能承重,它不会掉下去……这种理解是非常丰富的,而且是带空间信息和时间信息的。

这个事情今天还很远。

所以我觉得,未来5到10年,AI 最前沿、最有挑战的一块,就是对三维物理世界的理解。你可以叫空间智能,也可以叫物理世界 AI,或者具身智能的“智能”部分,本质上是一个事情。

网易《态度》栏目:现在具身智能很热。您怎么看具身智能和空间智能的关系?

林元庆:我觉得如果把具身智能拆开看,实际上就是两大块:

第一块是“具身”的部分,也就是身体、控制、小脑、灵巧手这些;

第二块是“智能”的部分,也就是对三维物理世界的感知和理解。

过去几年,身体这部分其实发展很快,机器人跳舞、翻跟头、灵巧手都很厉害。但为什么很多机器人在台上能翻跟头,却下不了台阶?核心问题不是身体不够强,而是对环境的感知还不够强。

你真正走进现实世界,不同环境的台阶不是标准化的,环境是开放的、复杂的。如果对这个世界的感知&理解不够深,机器人的应用一定是有限的。

所以我说,空间智能这块如果发展得不好,具身智能的应用会很受限。只是它不是说一定要等5到10年后才突然发生,我觉得技术进展会是渐进式的。比如今天你可能先能解决下台阶,明天再解决更复杂场景,但大的方向上,这一块是必经之路。

网易《态度》栏目:现在市场上也有一些公司在讲“空间智能”概念,比如做3D 生成、空间设计、仿真的公司。你们怎么区分自己和他们?

林元庆:我觉得空间智能现在大致有两个方向。

一个方向偏生成,也就是你对物理世界有一定先验理解以后,去生成三维空间、三维场景,这一类公司大家更容易理解,视觉冲击也更强。

另一个方向偏感知和理解,尤其是对现实世界、真实世界的感知和理解。爱笔主要做的是这一块。我们从一开始做三维建模,到后面做人、车、飞机等物体在三维空间里的追踪和理解,走的一直是这条线。

我自己的判断是,现在这两个方向还是分开的,但大概2到3年左右,它们会慢慢汇合。因为你能生成,说明你其实对这个世界有很强的先验模型,能帮助更好地感知和理解物理世界;而你感知得越好,也越能反过来帮助积累更多的物理世界的先验,进而帮助生成。它们本质上是相辅相成的。

只是现在这个行业还比较早期,所以大家还在分头推进。

网易《态度》栏目:您刚才提到偏感知&理解的空间智能,好像和具身智能公司做得还不一样?

林元庆:是的,这个领域是有2个不同的视角来实现的。

一种是 第一视角(egocentric),也就是摄像头装在机器人、车、设备上,它在动;另一种是我们现在做得更多的,叫环境视角或第三视角(exocentric),也可以理解成是上帝视角,摄像头装在环境里,它不动。

我有一个很重要的判断:如果物理世界的视觉有“ ChatGPT 时刻”,第三视角至少会比第一视角早1到2年。

为什么?因为环境视角有很多天然约束条件。摄像头装上以后,它一辈子就看这个地方。这样我们就更容易构建自学习、自标注、自训练的框架。对物理世界AI 来说,这个能力非常关键。因为如果你永远靠人工标注数据去训练,根本走不到计算机视觉的“ ChatGPT时刻“。

而第三视角在这件事上,至少比第一视角容易100倍以上。

所以爱笔现在的卡位其实是很明确的:我们在做环境视角下,对三维物理世界的理解,而且已经有了非常大量的真实世界数据。到今天,我们每天真正深度处理、理解的视频时长,已经超过50万小时。这在国内创业公司里,我觉得肯定是数一数二的。

技术创业者必须同时理解技术和商业

网易《态度》栏目:现在智能体特别热,包括龙虾的爆火。你觉得它对爱笔的业务会带来什么变化?

林元庆:我觉得会非常大。现在大家最直观感受到的是 AI 在 Coding 上很强,但我认为接下来一个影响可能更大的方向,是数据分析和数据可用性。

很多行业不是没有数据,而是数据太难用。BI 系统里什么都有,但一个普通运营人员很难读懂,也常常没时间读(因为平时要忙的事情已经很多)。你让一个购物中心的营管员天天去做复杂数据分析,这不现实。

但如果有一个足够强的 Agent 层,后面这些数据读取、理解、归因、形成建议的工作,它都可以帮你分析出来。比如一个营管员早上打开系统,Agent 直接告诉他:你负责的女装区今天哪些门店有问题,问题出在哪个漏斗环节,建议怎么处理。

这件事的意义非常大。因为原来“使用数据”的成本,不一定是钱,而是人的时间和精力。现在这个成本在快速下降,甚至可能降到零。

所以对爱笔来说,这是巨大的机会。我们本来就在做线下空间的数据化,如果上面再叠一层强 Agent,这些数据的价值会被释放得非常大。

网易《态度》栏目: 现在外界有一种观点,说 Agent 会把传统软件杀死。您怎么看?

林元庆:我觉得问题“软件会不会死”,在于是比较传统的软件开发。但更有意思的是,相比于互联网时代,AI 时代的信息架构会发生根本变化,这是软件业的巨大新机会。

互联网时代,平台公司要把信息尽量都收集到自己这里,然后统一服务用户。这个模式过去非常成功。但它有两个问题:

第一,它不可能真正实时,全世界收集一遍出差需要几个月的时间;

第二,很多本地、线下的数据,根本收集不上来。

到了 AI 时代,情况会变。因为有了 Agent,每个本地节点都可以有自己的 Agent。比如一个购物中心自己就有一个 Agent,它最清楚自己现在有没有停车位、哪家店在做什么活动、会员积分怎么最划算、停车场的哪条路最堵。

未来外部平台不一定要把这些数据全部抓走,它可以直接和本地 Agent 去对接,用自然语言的现实(而不是传统的API接口的形式),Agent-to-Agent  (A2A) 地沟通。这样一来,数据是实时的,权限也更清晰。你问停车位,我可以告诉你;你问某家店今天销售额多少,我不会告诉你。

所以我觉得,未来更像是一个分布式、实时的 Agent 网络。而爱笔在这个体系里的价值,是帮这些线下场所——购物中心、机场、停车场等——把它们自己的 Agent 能力建起来,让它们能和所有外部平台对接。

这个变化比“某个软件形态会不会消失”更本质。

网易《态度》栏目:以前大家会把你归成科学家创业者。你自己怎么看这些年从技术人到创业者的变化?对今天的 AI 创业者,您有什么建议?

林元庆:其实我到今天还是很技术。我还会看论文,也会花很多时间参与技术讨论。包括刚才我们聊的很多技术判断,我自己都在参与。

但技术创业确实有一个非常大的挑战:你不能只懂技术。技术能不能研发出来,这只是第一道坎。

第二道坎技术要变成产品,这里面会涉及标准化、成本、工程化、交付等等。

产品做出来以后,能不能真正赋能业务,这是第三道坎。赋能业务以后,能不能占领市场,这是第四道坎。占领市场以后,能不能形成壁垒,这是第五道坎。

然后后面还有团队/组织、融资、竞争、周期、宏观环境这些一堆因素。

所以技术创业特别难。很多人以为技术做出来就结束了,但其实那只是开始。后面是一层一层的转化漏斗。

如果说有什么经验,我觉得一是要对技术趋势和应用趋势有自己比较清晰的理解框架;二是团队要形成共识。因为创业这件事不可能十全十美,很多时候就是所有人都要一起牺牲眼前、一起扛。

把目标放到10年后,但非常现实地走每一步

网易《态度》栏目:如果把时间拉到未来10年,爱笔的目标是什么?阶段性重点又是什么?

林元庆:我觉得可以分成业务和技术两条线。

先说业务。我们现在自己亲自深耕的 AI赋能的行业,基本就这四个:购物中心、连锁门店、机场枢纽、双智城市。原则上不会再扩很多行业了,顶多以后再多一两个,但不会很多。

我们的目标是,把这几个行业彻底打透,真的形成“爱笔做了以后,这个行业就很难再有第二家进来”的状态。中国市场做好以后,再往海外走。像机场,我们现在已经开始往中东走了,阿曼机场的 AI 赋能的一期已经做完,后面二期三期也在顺利推进中。

在业务形态上,我们也看得比较清楚:最开始是项目制,然后走向产品化交付,再往上是数据服务,再往上,有机会变成平台型业务。

比如我们现在在看的一个平台型方向,就是自主代客泊车( AVP )。如果未来2028到2030年这个趋势起来,那么购物中心和机场的停车场,需要一套环境侧能力:一方面提供上帝视角感知去和车端感知融合,另一方面管理这些 AVP 车辆。爱笔今天已经在很多停车场里落了数字化基础设施,我们希望未来 AVP 真来了,这些设施不需要重建,可以直接复用。而爱笔是为整个 AVP 行业提供场端智能的全国性的平台型企业。

再说技术。我们一直觉得,空间智能的终极态,或者说物理世界 AI 大模型,是爱笔未来10年的诗和远方。

当然今天你说直接去做这套训练系统,得投入非常大的资源,对创业公司不现实。所以我们的打法会更务实一点:基于我们1.0阶段已经积累下来的数据、算法和优化能力,先走一条比较轻量的路。

我们内部现在分为两个阶段来做。因为我们已经把检测、跟踪、时空理解做得比较好了,所以不一定非要像很多多模态模型那样,从 pixel、patch 开始重新做,那样成本太高。我们希望先把已经做好的物体级别的理解进一步 token 化、结构化,再往上训练,看这条路到底能走多远。

这个事情不是一步到位,但它会不断积累经验。

我跟团队说得很直接:如果未来物理世界AI 真到了 ChatGPT 时刻,我希望爱笔是站在终点的少数几家公司之一。

网易《态度》栏目:AI 变化这么快,但今天聊下来我的感觉反而是要有长期主义,有战略定力。你这种状态是怎么来的?

林元庆:可能跟我的经历有关。

我毕业以后一直在工业界,先在 NEC 美国实验室,后来在百度研究院。工业界研究和学术界不一样,学术界很多时候是在提出问题,工业界更多是在解决真实问题,而且是要能落地的问题。

这段经历让我对技术怎么演进、怎么和应用结合、怎么真正赋能业务,会看得比较透。我自己脑子里一直有一套技术和应用结合的框架。

爱笔从2017年到今天,主线其实一直没怎么变。创业公司里,能做到七八年以后还在做最开始的那件事,而且越做越清晰的,不算特别多。某种程度上,这也说明我们的判断在大方向上是对的。

当然,不代表我们什么都对。我会花很多时间去思考这些事情,也会一直在一线,和客户、行业、技术都保持足够近。因为只有这样,你的判断才会不断被现实校正。

所以我觉得所谓战略定力,不是说我很固执,而是我会把大的方向看得比较长,但每一步走法都非常现实。

网易《态度》栏目:最后一个问题。现在回头看爱笔这9年,你最确定的一件事是什么?

林元庆:我最确定的一件事,是我们最初选的方向是对的。不一定是最优,但一定是很好的方向。

我们从一开始就做 AI To B,做垂直行业,做线下空间,做那些很多人觉得又重又累的事情。今天再看,购物中心、连锁门店、机场、城市都在发生很深的变化;大模型、 Agent、具身智能、空间智能,又把这件事的重要性进一步放大了。

爱笔这些年其实就是一点点把基础能力搭起来:算法、工程化、数据、场景、客户、产品化交付、正向现金流、闭环。

这些零部件平时看起来不一定最显眼,但如果未来物理世界 AI 真迎来它的ChatGPT 时刻,你会发现,真正能站在那个时点上的公司,前面很多年大概率都在做这些“脏活累活”。

所以我常跟团队讲,空间智能的终极态,或者说物理世界 AI 大模型,是爱笔到2035年的诗和远方。

*网易科技重磅推出系列对话栏目《态度AGI》。过去三年,AI变革风起云涌,全球科技秩序正在重构,通往AGI的道路或许正在悄然临近。本栏目以AGI为题,将对话100位AI专家、企业家、投资人,试图拨开云雾,与大家一道见证AGI时代的到来。第五十三期专访林元庆:Physical AI的关键,不是生成新世界,而是理解真实世界

*往期回顾

《态度AGI》第一期:对话李开复:大模型创业狂奔一年 中美差距缩小 我十年不套现
《态度AGI》第二期:对话王小川:我们不跟进大模型价格战
《态度AGI》第三期:对话戴文渊:大模型价格战不解决核心问题
《态度AGI》第四期:对话智源研究院院长王仲远:GPT4不是国内大模型的尽头
《态度AGI》第五期:对话朱啸虎:5年后将没有独立的大模型公司存在,因为没有商业模式
《态度AGI》第六期:对话梅花创投吴世春:“中国大模型五虎”想要跑出来非常难
《态度AGI》第七期:对话跃然创新CEO李勇:做大模型应用 如何和巨头错位竞争
《态度AGI》第八期:对话智谱AI CEO张鹏:视频生成是AGI必经之路,超级App将在“不知不觉”中到来
《态度AGI》第九期:对话科大讯飞副总裁、研究院院长刘聪:中国大模型已从追赶对标走向自主原创
《态度AGI》第十期:对话360周鸿祎:魔法对付魔法,大模型安全问题得靠大模型
《态度AGI》第十一期:对话彩云科技CEO袁行远:超越ChatGPT,需要打开“黑盒”
《态度AGI》第十二期:对话傅盛:不看好双足机器人商业化,三五年都没戏
《态度AGI》第十三期:对话宇树创始人兼CEO王兴兴:通用机器人的iPhone时刻还需要3-4年
《态度AGI》第十四期:对话MiniMax创始人闫俊杰:打不赢,就应该被淘汰

《态度AGI》第十五期对话荣耀赵明:AI时代 开放肯定会击败封闭

《态度AGI》第十六期对话昆仑万维首席科学家颜水成:大模型的三个共识与三个分歧

《态度AGI》第十七期对话聂再清:生物医药即将迎来“ChatGPT时刻”,2-3年内实现重大技术飞跃

《态度AGI》第十八期:对话刘作虎:手机是AI应用体验最好的载体
《态度AGI》第十九期:对话realme徐起:AI已成为消费者购机的主要考量因素
《态度AGI》第二十期:对话喻友平:大模型已从“暴风骤雨”到“润物细无声”
《态度AGI》第二十一期:对话月之暗面杨植麟:竞争是做正确的事 当下最关心“留存”
《态度AGI》第二十二期:对话许四清:眼下投AI,就是在不确定里找到必然

《态度AGI》第二十三期:对话讯飞创投合伙人朱永:AI创企已经迈入了价值兑现的关键时刻

《态度AGI》第二十四期:对话王啸:我看好应用层,一直没投基础大模型

《态度AGI》第二十五期:对话投资人姚海波:人形机器人尚未解决“手”和“脑”问题

《态度AGI》第二十六期:没有这双“神仙”手,特斯拉机器人也难成!魔法原子总裁吴长征:90%零件自己造,2025机器人场景落地生死年!
《态度AGI》第二十七期:对话智元合伙人姚卯青:不做大模型的机器人公司没有未来
《态度AGI》第二十八期:对话方小雷:单日面试1.4万人,朱啸虎连投三轮的AI应用什么样?
《态度AGI》第二十九期:半马获亚军,订单暴增800%,对话松延动力创始人姜哲源
《态度AGI》第三十期:对话昆仑万维CEO方汉:大厂争王座,中厂抢地盘
《态度AGI》第三十一期:对话姜大昕:AGI实现路径清晰了,世界模型不远了
《态度AGI》第三十二期:对话高成投资洪婧:SaaS已死?在中国不赚钱?错了!
《态度AGI》第三十三期:傅利叶十年鏖战,要撕掉人形机器人“大玩具”标签
《态度AGI》第三十四期:对话深势科技柯国霖:AI for Science是实现AGI的必经之路
《态度AGI》第三十五期:对话盛景网联彭志强:跳出SaaS亏损黑洞!从“卖工具”到“卖结果”的AI RaaS转型法则
《态度AGI》第三十六期:对话顾嘉唯:售出千万台,卖爆618,他却说“只想做下一代AI终端”

《态度AGI》第三十七期:对话首程控股叶芊:具身智能走过“婴儿期” 2025是交付

《态度AGI》第三十八期:对话XREAL徐驰:AI眼镜只有5岁智商

《态度AGI》第三十九期:对话谷歌全球广告副总裁:搜索广告正在被AI改造,关键词逻辑变了!

《态度AGI》第四十期:对话宇树科技CEO王兴兴:回应关于宇树上市,机器人降价,AI投入以及出货量

《态度AGI》第四十一期:对话VAST创始人宋亚宸:“3D时代的抖音”当属创业者

《态度AGI》第四十二期:专访 | Soul怎么做AI伴侣?CTO陶明:我们不定义关系

《态度AGI》第四十三期:对话Plaud莫子皓:还没投广告 国内产品销量已经第一

《态度AGI》第四十四期:对话灵足时代联创邵元欣:做机器人领域的“英伟达”

《态度AGI》第四十五期:VLA模型仍存在明显缺陷 大晓机器人携ACE范式入

《态度AGI》第四十六期:对话传音阿里夫:方向大于速度|300亿美金市场的“非洲之王”用AI找第二曲线

《态度AGI》第四十七期:破解具身智能“数据荒”,对话鹿明创始人:数据采集效率提升5倍,成本降至1/5

《态度AGI》第四十八期:给机器人做仿真训练 这家创企年营收破亿 预计26年翻4倍

《态度AGI》第四十九期:对话周亚辉:不和字节腾讯卷,要在海外做“AI版Spotify"

《态度AGI》第五十期:对话傅利叶CEO顾捷:意念控制机器人不是科幻 1-2年就落地

《态度AGI》第五十一期:独家对话吴军:AI刚起步,泡沫期或在2028年,绝大部分AI公司终将消亡

《态度AGI》第五十二期:对话枫清科技高雪峰:龙虾之后,企业搞AI没有退路了