数据成本从3元压到6毛：具身智能的“铲子生意”长什么样？,铲子是用来干啥的

新眸原创·作者 | 鹿尧

如果说2025年是人形机器人的“登台之年”，2026年则正在成为检验成色的“卸妆之年”。

3月，Figure AI宣布与OpenAI分道扬镳，全自研端侧模型；4月，特斯拉Optimus在得州工厂的料箱搬运视频再次刷屏，马斯克喊出年内交付千台；国内，宇树G1以9.9万元售价继续拉低整机门槛，银河通用、星动纪元等接连拿下新融资。

一片喧嚣中，一个很关键的问题却被反复绕开：这些越来越会走、越来越能秀的机器人，究竟用谁的数据在训练？

前段时间，国家发改委在新闻发布会上明确提出加快具身智能训练基础设施建设，支撑数据采集和“大小脑”模型训练——政策信号已经发出，但产业层面的答案似乎仍然稀缺。

目前市面上95%的所谓真机训练数据，不过是不同颜色的短袖T恤叠衣视频。真正来自复杂物理世界的有效交互数据，占比微乎其微。而单条高质量遥操作采集数据的成本，按一年使用周期折算，仍高达3-5元。这还没算上后期清洗、标注、对齐的人力投入。

这就形成了一个很尴尬的局面：数据太贵所以采不起，采不起所以模型笨，模型笨所以没人用，没人用所以更没数据，也更难发展。先有鸡还是先有蛋，吵不出答案。

去年2月成立于清华园的灵御智能，做的事说起来不复杂：同时从“鸡”和“蛋”两端下手，把这个死结剪开。他们并没有做了一个更聪明的机器人，而是在“身体”和“大脑”之间重新做了一次分工。

别看这家公司年轻，才一年时间就交付接近百台机器人，意向订单超千台，单任务采集成本压到0.6元，端到端延迟控制到90毫秒以内——今天我们来聊聊，他们是怎么做到的。

10万-20万的“数据母机”

先解决“用得起”的问题

先看一组数据。

据行业统计，目前全行业汇聚的高质量具身数据仅约50万小时，不足大语言模型训练数据的数万分之一。不少从业者判断，训练一个具备通用泛化能力的具身模型，至少需要千万小时级的数据支撑。

四个字可以概括当下状况：物理数据饥荒。受限于物理操作的固定耗时，真机数据的获取往往精度低、效率低、成本高。

很多人习惯用“喂数据就能解决问题”的逻辑套用具身智能，但这是个误区。具身智能需要在三维空间中进行强交互，比如判断什么材质、怎么发力，数据维度是指数级跃升，靠简单堆叠真机数量就很难解决。

用图灵奖得主Yann LeCun团队的话来说，具身智能向世界模型升级的关键瓶颈正是“缺少能真正理解物理规律的规模化交互数据”。

而面对数据荒，灵御智能的打法是先解决“采集”。他们的主力产品叫TeleAvatar，一台没有双足、没有灵巧手、没有脖子的轮式双臂机器人。在第二届中关村具身智能机器人应用大赛的遥操作赛道中，它以30秒的实际作业时间，把第二名甩出近5分钟。

副总裁李旭曾在受访时直言，选择轮式底盘加夹爪而非双足加灵巧手，是刻意的减法：“双足机器人会把45%以上的能耗和50%以上的算力浪费在走路平衡上，灵巧手成本是夹爪的10到100倍——但对数据采集来说，这两项功能其实没有产生相应的边际收益。”

这种“场景定义硬件”的思路，直接拉通了成本结构。

谐波减速器被行星减速器替代，六维力传感器被电流估算加500Hz控制频率的闭环算法替代，齿轮背隙用廉价传感器加软件补偿。这使得一台TA机器人的售价落在10万至20万元区间，仅为同类产品均价的1/3到1/2。

售价下探带来的，是数据采集经济模型的重写。灵御给出的算账口径是：单台机器人年化总成本控制在30万元以内，折合每小时成本100-150元，单任务数据成本约0.6元。

这样一来，与行业同等品质采集设备的3-5元相比，一个年需百万条数据的中型项目，仅账面成本差额就可能达到数百万元。

不过我们也知道，对于任何技术创新来说，“便宜”不是故事的核心，“好用”才是。

灵御的联合创始人兼首席科学家莫一林，这位师从美国工程院院士Richard M. Murray的清华副教授，深耕自动驾驶感知项目，对多传感器时间同步的致命性有切身体会。

在他看来，降低成本只是结果，真正构成壁垒的是数据质量——多传感器的时间同步、毫米级的空间精度，这些决定了采集到的数据到底能不能训练出好模型，否则就和普通第一视角视频没什么本质区别。

基于这一理解，TA机器人的定位是做行业最高质量的本体：在硬件底层实现了S100、x86主控、激光雷达、6路相机等全套传感器的亚微秒级时钟同步，相机触发达到纳秒级对齐，从曝光到数据入内存的整体延迟可压至40ms。机械臂重复定位精度做到0.1mm，绝对定位精度控制在1mm。

你可能不太理解这些复杂数据的意味，简单来说，这台机器所有传感器的时间是同步到微秒级别的，不存在“眼睛看到了、手还没感觉到”这种脱节。数据记录的速度极快，基本是实时入账，不拖后腿。

而且它干活非常稳，无论是一台机器反复干，还是换台机器接着干，精准度都足够高。这几个能力加在一起，才能保证产出的数据真正“拿来就能训”，不是那种还得人后期费劲对齐的毛坯数据。

但到这里，问题只解决了一半。有了便宜好用的“数据生产设备”，下一步是：这些数据怎么变成模型能力？怎么回流到物理世界？

具身智能的“Model 3时刻”

或许不在端侧

2026年的具身智能赛道，端侧自主几乎是默认选项。从Figure自研Helix，到国内厂商争相将大算力芯片集成进本体，主流叙事很明确：让机器人越来越不依赖外部。

灵御把这个逻辑反了过来。端侧只保留一个低功耗芯片，负责急停、避碰等本地安全控制；真正负责认知、推理、学习、进化的“大脑”，全部上云。

换句话说，把“大脑”塞进云端，再解决“用得好”的问题。

创始人兼CEO金戈在内部交流中多次谈到，这个选择基于三个绕不过去的物理硬约束：

第一，功耗。主流机器人电池容量普遍只有半度电，而汽车动辄十几度甚至上百度，端侧算力堆不上去。第二，算力天花板。大语言模型的智能涌现证明，只有云端级别的算力密度，才能支撑复杂的推理和规划。第三，网络环境。机器人的工作场景相对固定，网络基本可控，不像自动驾驶必须在毫秒级内完成本地决策。

可以想像一下，让每个机器人都背一个超级大脑，就像让每个家用电器里都塞进一整套超算——违背工程规律。

但灵御的这套逻辑要成立，有一个前提：通讯不能掉链子。否则“云端大脑”就是空中楼阁。

灵御在通讯层做了大量“抠时间”的工程优化。他们把端到端链路拆成20个环节，在示波器上逐环节精确测量耗时。目前，城内公网传输延迟压至4毫秒左右，千公里跨城传输增加约10毫秒，端到端整体控制在90毫秒以内。

低延迟通讯把路铺好之后，云端大脑的真正价值才释放出来——“一身多脑”。

同一台TA机器人，可以根据任务类型按需调用云端不同的专家模型池。你不需要一个什么都会但什么都不精的“通才模型”，而是让专业模型各司其职。每一次作业产生的数据，又会自动回流到对应模型的训练管道里。

今年4月，灵御与英特尔合作完成了一次关键验证：在真实任务中采集数据，训练云端模型，再通过云端模型操控机器人执行物理任务。这个闭环雏形，在杭州西子智慧产业园的现场交流中首次对外展示。

除此以外，京东的七鲜超市已与灵御展开合作，将部分递送、理货任务交由远端操作员完成，积累特定品类的抓取数据。

到这里，那条逻辑线就清楚了：“身体”（TA机器人）负责低成本、高精度地生产高质量数据；“大脑”（云端架构）负责把这些数据实时转化为模型能力，再反哺回物理世界。

两者合在一起，把“采数据—训模型—用模型”这个链条，从脱节的断头路变成了闭环的高速路。

当机器人变成跨区劳力的“数字替身”

有了这套“身体+大脑”的基础设施，一个更具商业想象力的故事开始自然生长出来。

灵御内部观察到，早期客户正自发地将数据采集母机投入实际运营场景。典型模式是：高人力成本地区部署灵御机器人，由低人力成本城市的远程操作团队接管日常作业。一台十余万元的设备，几个月就通过人力成本差回本。

这本质上是“机器人即服务（RaaS）+操作即服务（MaaS）”的雏形。更关键的是，在这个过程中，每一次人工操作都在产生高质量训练数据。机器在干活的同时就在产数据，产数据的同时就在进化模型，进化完的模型又让机器更能独立干活。

金戈曾在采访中阐述过灵御的远期定位：长期看，客户不需要买机器人，而是按需调用机器人的作业能力，按任务付费。云端智能是订阅服务，长期来看会是模型能力+人能力的混合形态。这意味着，一家北京商超的理货需求，可以由成都的操作员在云端完成。

按规划，2026年Q3灵御将推出开发者公测版平台，2027年上线商业化正式版，涵盖多源异构数据管理、AI辅助标注、主流算法架构内置训练、一键云端推理等功能。目前平台MVP核心能力已完成，支持ROS2生态一键部署。

团队将2026年设为从“产品公司”到“基础设施服务商”的转折年，目标锚定三个硬指标：全年交付800台机器人、在1-2个真实场景中跑通正向ROI的闭环、为行业提供至少百万小时的高质量真机数据集。

这三件事互为前提，毕竟部署量上去才有场景数据，场景验证跑通才有商业价值，数据飞轮转起来才谈得上网络效应。

回顾2026年上半年的行业格局，人形机器人赛道正在经历一轮快速分化：一类企业继续沿着端侧全自主的技术路径攀登通用智能的高峰；另一类则选择从垂直场景的数据闭环切入，先让机器人干好活、产生数据、优化模型，再谈更大范围的泛化。

灵御智能属于后者。它的逻辑与特斯拉当年用Model S切入豪华市场、以Model 3实现规模化数据采集的路径有相似之处——只不过特斯拉采集的是路况数据，灵御采集的是物理交互数据。

当政策层面开始明确推动训练基础设施建设和“大小脑”模型训练时，这条路径的政策确定性也在增加：加快训练基础设施建设，让机器人“进工厂、进商场、进家庭”。具身智能的“Model 3时刻”，就在那些已经开始干活、回传训练、迭代进化的商业闭环之中。

莫一林曾在采访中做过一个类比：“AlphaGo初期学人类棋谱，达到一定水平后，再学人类棋谱反而会拉低棋力。只有通过自我对弈才能突破。具身智能的低质数据，总有一天会成为负向资产。”

这话既是对行业的提醒，也是灵御锁定高质量真机数据的注脚。

出身清华、师从机器人操作领域开山级学者Richard M. Murray，莫一林比大多数创业者更早意识到，算法不能脱离硬件独立存在。眼下在他看来，具身智能最稀缺的，不是更华丽的算法架构和关节设计，而是一条低成本、高效率、高质量连接物理世界与数字世界的输送带。

灵御要做的，就是成为这条输送带的基建商。

当行业仍在争论“双足还是轮式”“端侧还是云端”“全自主还是遥控”，具身智能行业还没有谁能拿出一个放之四海而皆准的答案。但灵御智能选择的技术路径，验证了“高质量本体 + 低延迟通讯 + 数据飞轮”的可行性。

据了解，灵御智能的天使轮融资已于今年完成，华映资本、国海创新资本等多家机构入局。目前已完成多轮融资，累计近亿元，并在CES 2026斩获海外首单。

在资本愈发谨慎的当下，市场愈发认可数据基础设施的长期价值，而能连续拿钱且交付规模稳步爬坡的团队，本身就是对其能力的一种印证。