产品 +

iEnter|智慧企业 +

企业资源计划管理系统

智钉

iManu|智能制造 +

制造执行系统

物流执行系统

高级计划及排程

iSupply|智慧供应链 +

运输管理系统

仓储管理系统

供应商关系管理系统

EP|智慧生态营销 +

经销商管理系统

全面营销管理系统

客户关系管理系统

Connect|智能网联 +

智能网联云平台

新能源汽车监控平台

商用车企业监控平台

电检系统

行驶记录仪

车载T-BOX

汽车故障诊断仪

国六OBD产品

后装GPS产品

DataValue|数据价值赋能 +

智慧质量

线索运营

智慧广告

Platform|云原生PaaS平台 +

云原生PaaS平台

容器引擎(QKP)

AI智能服务平台

API网关平台

低代码平台-QLCP

元宇宙技术探索平台

数据中台

智能运维平台

服务 +

咨询 +

车路协同解决方案

IT咨询

云原生技术架构规划与咨询服务

评测 +

网络安全等级保护测评

实施 +

电子电气检测服务

网联产品组装制造

运维 +

桌面及外围设备运维服务

云服务(IDC)

销贷服务

乘用车车联网运营服务

商用车车联网运营服务

客户联络中心运营服务

数据价值运营服务

K8s运维

关于米兰·(milantiyu) +

企业简介 +

企业简介

企业价值 +

企业荣誉

行业地位

资质认证

社会责任 +
企业文化 +
投资者关系 +
麾下企业 +
加入米兰·(milantiyu) +

业务发展规划

福利待遇

人才招聘

信息公开 +

企业基本信息 +

企业概况

经营范围

市场主体登记基本信息

组织机构

成员单位

资质荣誉

企业重大事项 +

股权信息

产权信息

研发成果

企业经营管理 +

财务与经营状况

品牌与产品

安全环保 +

安全信息

招标招募 +

招标信息

人力资源 +

招聘信息

社会责任 +
企业公告 +

上市公司

公告信息

投资者关系

加入米兰·(milantiyu)

客户留言

米兰·(milantiyu)中国官方网站-圆桌论坛:具身数据如何塑造行业未来?
2026-03-19 14:28:17

  

雷峰网(公家号:雷峰网)讯 高质量数据正于成为具身本体机能冲破及成本节制的瓶颈。于具身智能从技能演示走向范围落地的要害迁移转变期,对于在数据的需乞降争辩也变患上更加火热。从遥操作到UMI,从动捕到仿真数据,具身数据的将来于数采工场,还有是名为In-the-wild的夸姣愿景?

2025年12月13日,第八届GAIR年夜会的数据 一脑多形专场,举办了主题为具身数据的圆桌论坛。圆桌主持报酬英诺天使基金 ED,石麻条记主办人王建明,并约请了诺亦腾呆板人开创人戴若犁,极数迭代CEO、深圳AIRS拜候研究员佟显乔,鹿明呆板人CTO丁琰,配合缭绕具身数据的质量、收罗以和数据飞轮等议题,睁开了一场深度对于话。

对于呆板人而言,甚么是好的数据?王建明以数据质量切入,几位佳宾就“以终为始”告竣了共鸣,终极的模子机能、练习中呆板人的受益水平反应着数据的质量。丁琰进一步指出,收罗成本及各类数采方式对于在差别场景及硬件的适配与否,都是决议数据质量的要害环节。

将来的数据收罗方式或者将走向多元化。作为一家有数据能力的创业公司,丁琰暗示,鹿明呆板人正于筹建本身的数采厂。出在成本思量,现阶段采用 UMI方式举行数据收罗,但将来仍可能引进更多方案。“遥操作、 UMI(Universal Manipulation Interface)、动捕、仿真数据,存于即合理。”丁琰夸大。

戴若犁就In-the-wild的数据收罗方式发出了提示,他指出这是一种高度磨练技能程度的方案,其落地需要前后降服软硬件易用性、构造治理能力两道难关,而于当前的时间节点,迈过前者的技能门坎无疑更为主要。

详细而言,于收罗阶段需要低磨擦、高精度、多模态的数采装备,野采数据的使用,还有需要从稀少原始数据中获得浓厚信息的技能方案。戴若犁认为,一条可行的链路是经由过程世界模子举行先验预计,输出更富厚的模态和维度数据。相较之下,远未到比拼人力构造能力的时间。

佟显乔认为,数据收罗行业仍处在初期阶段,数据、本体、模子公司仍于彼此磨合。差别的模子公司提出了差别的需求,这象征着数据公司不克不及逗留在堆人力的体力活阶段,而是要懂模子、给建议。“模子公司也需要你的knowledge”,佟显乔夸大,“一个个批次以后,各人才能一路做患上更好。”

如下是这次圆桌会商的出色分享,AI科技评论举行了不转变原意的编纂收拾:

王建明:咱们这个panel的话题是数据,以是我的第一个问题,是想请列位先界说一下,对于在呆板人来讲甚么是好的数据?请戴博先最先吧。

戴若犁:我感觉还有因此终为始,终极于练习模子、呆板人的时辰可以或许得到收益,并且收益比力高的数据是好数据。

佟显乔:我感觉这必然是从末了的模子出发,甚么数据末了能练习出一个比力好的模子,就是好的数据。咱们今天基本上是如许界说,可是由于今天模子的状况没有收敛,用甚么样的数据能练习出甚么样的模子,不知道,以是实在也很难界说哪一个是好的数据。

丁琰:第一数据必需要能练习出一个模子,才是比力好的数据。第二点是数据网络成本要比力低,假如尤其高,那整个行业还有是接管不了。还有有一点,就是数据的收罗要顺应场景、顺应硬件。

王建明:适才各人都提到,好的数据起首对于在模子练习要有好的效果,那末于这个条件下,数据公司怎么知道怎样提供好的数据?

凡是来讲,这些数据都是提供应模子公司或者者本体公司,模子效果把握于客户的手上。是客户知道本身想要甚么样的数据,找到数据公司来定点运营,还有是数据公司本身知道甚么样的数据对于模子公司好,来反哺给模子公司?你们认为于整个具身智能的链路里,数据公司跟模子、本体或者者运用公司之间,关在数据这件工作的认知,是一个甚么样的一个链路呢?

戴若犁:今朝于前端贸易实践上,我看到的是反过来的。不是说模子公司想患上尤其透辟,就可以给出命题作文,而是假如有充足体量的数据,且里边蕴含的信息充足多,就可以训出效果。假如训不出效果实在有许多缘故原由,多是模子架构不合错误,可能练习要领不合错误,这个锅纷歧定是数据来违。以是我今朝看到的是,假如你有足量且明确知道这一类数据内里蕴含充足多的信息有待挖掘,那实在对于在模子是有反向影响能力的。好比你有一个尤其大要量的数据集,纵然这个数据集的模态、维度、精度及传感器的方式要领选择跟模子方原有的期待其实不同样,他们也会愿意去转变练习的方式,甚至在让模子的架构去顺应数据集自己。

佟显乔:我看到的实在跟戴总看到的比力近似,许多时辰模子公司找到咱们是说,如许做行不行,那样做行不行,他们实在也需要你的knowledge。于这个历程中,各人还有有一个磨合,好比一最先说如许采,极可能采完这一批次之后,下一批他说我感觉如许做应该更好。

以是实在今朝来看,可能由于行业还有是初期阶段,以是没有一个同一的方式,各人都是于彼此磨合。甚至你会发明差别模子公司,需求可能千差万别,提的要求也很纷歧样。以是作为一个数据公司,我感觉不克不及只是纯粹做labor的事情,你还有是要懂一些模子,你需要跟他们去交流,给他们建议,如许各人才能一路做患上更好。

丁琰:我还有是比力认同佟博士的不雅点,我认为就是做数据及做算法的公司是分不开的,数据及算法是不拆家的。到底甚么是算法?你要弄一些很是高妙的模子架构,做一些很立异的摸索,可能没有到这类级别。可是你假如要把市道上常见的主流算法及数据模子全数玩熟,我感觉还有长短常很是须要的。否则的话,你采出来的数据许多是很脏的,基本上不克不及用。

跟行业里的人举行交流的时辰,我就发明许多公司没有练习基础模子的能力,他们对于在数据的理解长短常简朴的,认为只要根据指令把数据给采了就行。但实在这些数据往往是不克不及用的。

每一个使命都需要举行一些特定的使命设计,好比各人城市叠衣服,但实在这内里技巧性很是强。你这个技巧怎么来的?实在是于采了一堆数据以后训,发明有一些问题,然后再去改良收罗技巧,再来训,终极才能获得一个比力好的效果。于这个数据收罗及算法迭代的历程中,你会得到许多know-how及insight,这些工具是于数据公司长短常要害的,这些工具才是真正名贵的价值,而不是只是把这个数据采完交付给客户,客户爱怎么训怎么训就患了。这个是彻底纷歧样的。

别的一点就是,说究竟是数据决议,我认为现阶段做算法的人及做数据的人要不停地举行迭代,末了才能去完成这个工具。像咱们公司就是,咱们本身也做一些基础模子的练习,然后会对于数据自己有一些 know-how 及insight,知道怎么采。可是咱们本身获得的这些经验教训,可能只能针对于在部门使命,好比说pick and place,或者者是针对于在工业场景,由于咱们还有是做工业场景比力多。但若是做邃密化的使命,好比我今天跟客户去聊,系鞋带、叠衣服、叠纸盒子,这些使命就是别的一种 know-how及insight了。可能患上跟客户一路发展,才能得到很好的know-how及堆集。

王建明:据我本身不雅察,行业实在阶段性地对于差别类型数据的偏重点是纷歧样的。好比从2023年下半年最先,同构遥操这类数据收罗范式被带火了。 UMI这个事情是23年年底地,但现实上它近期被Sunday Robotics 还有有 the generalist 带火了。24年我感觉数采还有因此同构遥操为主,到了本年上半年,有一些动捕的数据收罗范式也被带火了,我觉得必定也有一些北美进展的渊源。

就列位的不雅察,今朝中美于数据这个问题上面,你们感觉最年夜的非共鸣是甚么?共鸣又是甚么?你们或者多或者少跟北美的一些客户有接洽,你认为他们此刻重点的这个数据收罗范式又是甚么?

戴若犁:起首我感觉此刻中美之间于呆板人上彻底没有代差。他们不是恶作剧吗,说Our Chinese better than your Chinese。我年夜概每一两个月于湾区待两周,于湾区谈买卖需要说英文的时间还有是挺少的,实在都是统一拨人,同窗、伴侣、师兄、师弟、学生,一路谈天。以是起首我没有感觉中美有尤其年夜的,共鸣方面的差异,各人实在都还有挺同样的。但我感觉中美于数据上面实在有一个尤其年夜的区分,就是美国似乎没有处所当局的助力。数据这件工作,尤其是数采厂,有处所当局助力,就会比力偏向在本体公司及处所当局互助,然后获得很是年夜的时机,拿到当期收入去建以遥操作为主的数采中央,也就比力少有时机孵化出来像 generative 或者者Sunday 如许In-the-wild或者者 UMI的方式去采数据。

以是这个分水岭我感觉颇有意思。就是假如没有这么多尤其eager地想要帮忙创业者,帮忙企业招商引资之处当局,可能就不会有这么多的数采中央用遥操作去采数据,可能也就会促使像 UMI如许的方式早一点于中国落地。

这件工作彻底不是由于技能的共鸣有差异或者有代差致使的,我感觉反而是一种资源咒骂。我小时辰打篮球,弹跳很是好,双手随意抓筐哐哐地扣,可是我技能很是差。我此刻岁数年夜了,打球打患上愈来愈差,被本来打球没我打患上好的人随意过,我这就是资源咒骂,由于我小时辰资源太富厚了。以是我感觉这就可能不是代差,而是资源咒骂。

王建明: UMI如许的方式去年出来,我觉得其时可能也有一些人于存眷,但现实上是本年有一些北美公司把它release出来,才遭到更广泛的存眷。

戴若犁: UMI就是很合理呀。 UMI实在是human-centric,它只是结尾履行器end effector 被置换了的human-centric,以是说它就是很合理,它somehow可以跨本体。

王建明:丁博士, UMI是你以前一个比力闻名的事情,可能于这类数据收罗方式上面,你们应该是第一批存眷,而且于这个基础上去迭代做工程化的。可以聊聊你们对于 UMI的见解吗?

丁琰:这项事情实在咱们于24年3月份就最先做了,其时于上海 AI Lab的时辰就启动了这个项目,做到此刻一直没有换过。我确凿看到了数采方式从遥操作到 UMI,一起于迭代的历程。

实在我觉得中美之间是有代差的,至少于模子,或者者是引领具身智能成长标的目的上有,可能北美何处的模子或者者资源还有是比力多。由于以前咱们做 UMI的时辰还有是比力默默无闻的,没有人存眷,整个年夜陆似乎只有咱们一家公司,或者者只有咱们这一个团队于做这件事,也是咱们本身一直于迭代。直到Sunday Robotics发布出一个很是牛逼的模子,基本上全中国或者者全球的存眷点才转向 UMI。咱们的产物恰好于这个时间点工程化出来了,基本上整个具身智能圈子的偕行都于疯狂地采购及咨询,以是我感觉确凿美国那块的人还有是于引领一些潮水及标的目的。尤其是 UMI这个工具,假如只有咱们一家公司来做,实在我很难想象到底何时能火起来。虽然咱们本身很坚信 UMI,可是可能整个中国的偕行其实不是很坚信。很感激美国的这些公司引领这些潮水。

然后关在非共鸣,于一些技能线路上实在是有一点点非共鸣,可是gap很小,可能很快就填补上来了。比及Sunday Robotics出来以后,中国的公司就蜂拥而上地摸索 UMI,很快就把这个非共鸣给填起来了。

咱们本身于做 UMI的时辰,实在也会有一些本身的know-how 及insight。举个例子,Sunday Robotics实在更倾向在一种后处置惩罚的方式,它把装备分发给Airbnb那些事情职员,或者者是众包职员去采,采完以后再把它网络回来处置惩罚。咱们感觉这类方式轻微有一点点不太合理,由于我本身于建数采厂的历程中,发明职员长短常难治理的。假如是经由过程这类方式去做,后续处置惩罚流程的时间及耗损是异样的巨年夜。以是咱们本身是拔取的前处置惩罚,前处置惩罚的意思就是把时间花于前面,不要花于后面,于收罗历程中我就和时评估及反馈数据到底好还有是欠好,有甚么问题就地就处置惩罚失,末了网络起来的数据100%是及格的。

方才阿谁戴博士说的human-centric data实在有一点点像 UMI,可是 UMI又很非凡,它更多针对于在二指夹爪这一块。真实的human-centric更多地倾向五指,二指比力非凡,可是二指又是一个很主要的范畴,由于整个中国利用二指夹爪的这个比例份额我认为还有是年夜在99.9% 的,用五指灵巧手的份额今朝来看偏少。重要是这个硬件自己不是尤其不变,以是各人用起来,真正落地的还有是二指为主, UMI就于这个生态内里盘踞了一个比力主要位置。虽然它属在human-centric这个分支,可是它又跟五指有区分,这是咱们对于 UMI的认知。

固然 UMI实在还有有许多问题,好比说active perception,要不要带头部视角?咱们于跟客户聊的历程中就会发明,由于原始的 UMI只有两个夹爪,只有手部这两个相机,这类configuration的配置它对于硬件设计就会有一些要求,它会但愿这个腕部相机的画面是轻微比力年夜的,它可以得到更多environment的feature,如许就利在练习嘛。

可是假如你加之一个头部相机,那还有需不需要这么年夜的一个画面?这也是一个问题。你假如加之一个头部的画面,它又会引伸出一些其他的问题。好比坐标系之间的对于齐,或者者是你用哪一个坐标系。还有有头部要不要动?对于在轮式双臂来讲,头部通常为固定的,没有这个自由度。假如你想引入一个active perception,有一些事情是于头上加了一个小机械臂,把这个小机械臂上挂一个摄像头,这就会填补active perception所带来的自由度问题。可是如许又激发一些其他的问题,好比市道上没有这类呆板人,头上还有长一个机械臂,以是说这些问题实在都没有被解决。这个 UMI的摸索之路实在还有是很长很长的,至少今朝来讲,咱们感觉整个中国年夜陆或者者全球的具身智能圈子,对于这方面的摸索基本上属在空缺,或者者说没有做许多。我感觉于这方面,可能中美之间城市有一些这个共鸣或者非共鸣于内里。

王建明:对于。适才戴博也说到了资源禀赋的问题,我确凿也不雅察到,北美它有许多配套模子公司的数采或者者数据处置惩罚公司,或者者装备公司,可能它们都是专门去办事某一些至公司的。那海内的话,咱们今朝固然看到了有一些数据有关的创业公司,但更多的还有是当局撑持的数采工场。

以是我的一个问题是,这类这类当局撑持的数采工场是否是真的可以解决数据问题?于这个历程中,作为有必然数据能力的创业公司,你们感觉应该怎么跟这些数采工场互助?或者者有甚么建议给到这些有资源禀赋的单元?

佟显乔:我感觉中国这两年,各个处所当局年夜量地建练习厂,对于行业必定是有促成作用。可是此刻建的年夜量练习场都是用的遥操方式,那7这是否是准确的?这个也很难说。

再一个,当局必定是滞后的。假如之后的标的目的变了,以这类In-the-wild的方式做数采,可能他也会转变。以是就适才会商的这个问题,我感觉假如之后通用呆板人的能力要到来的话,必然是需要In-the-wild这类方式的数据,由于起首它肯定要跨本体,第二必然是要年夜量数据。那用任何一个本体去采,纵然你有那末多练习场,也不太可能到达这个方针。

各地练习场是处所当局投资,然后买本体,给许多做本体的公司带来了收入。当局必定也不想做赔钱的买卖,采完的数据要卖归去,那数据卖归去之后,各人拿数据练习模子,多是形成为了如许的一个小闭环,我感觉短时间内对于这个行业必定是有促成的作用。但这件事是从贸易上的考量,是否是致使了技能的标的目的纷歧定一直于准确的标的目的上,也是有可能的。不外这个行业因成长很快,实在去年的标的目的及本年也纷歧样,以是这个我感觉都是走一步看一步。

丁琰:实在咱们鹿明公司本身也正于筹建数采厂,今朝有两个正于筹建历程中。咱们本身是采用的 UMI这类方式,重要的缘故原由还有是于在成本。此刻的数采厂设置装备摆设成本里,有70% ~ 80%可能都是买呆板人硬件的花消,这方面的成本会造成整个数据成本异样昂扬。那有无人能耗损这些数据,实在还有是有点未可知。由于这类年夜范围的批量建的数采厂,自己假如数据治理做不到位,数据基本上都是废的,没有人会买。我跟偕行去交流,各人对于这些数据的吐槽还有是挺多的,重要就是于在邃密化治理没有做到位。

我感觉这也是前期的一种正常状况,跟着后面的成长,可能会各人会对于数据治理会更邃密,或者者引进差别的数采方式,填补数采厂数据的多元化问题。我感觉不论是遥操作也好, UMI也好,动捕也好,仿真数据也好,存于即合理,只是差别份额的问题。我感觉将来的数采可能会越发多元化一点。

戴若犁:我于北京有办公室,有团队,于深圳也有,北京市及深圳市的带领来调研,我实在给他们都写过如许的建议。实在他们也很体贴,到底应该怎么费钱,怎么帮忙企业是最有价值的。我感觉实在就是要看终极数据的成本组成。

好比咱们说两类数据。一种是数采工场的,阿谁数据的成本年夜概有50%是装备的摊销折旧。假如根据5年摊销,年夜概有50%是人力的工时,剩下的均可以纰漏。假如是适才说的野采,年夜概60%是人力,年夜概40%是场景的协调,好比租500个Airbnb或者者途家的屋子去采糊口办事,于这边硬件摊销又可以被纰漏了。

以是我其时跟双方当局带领说的就是,不论是做数据的公司,还有是做模子本体的公司,假如可以帮忙他们于需要数据的时辰,可以或许于人力的补助或者者是场景的协调上降成本,或者者于前置的装备投入上可以或许帮忙企业的话,那实在就直接于成本里头帮忙了各人。也能够思量请咱们如许的数据办事公司,来收罗一些普适的,可以跨本体的数据集,把这个数据集开放给各人,让各人于初期试错的时辰不消每一一家都本身花许多钱去做。这个可以帮忙所有人,我是这么认为的。

王建明:此刻许多卖本体的公司,他们常常会有ToG这类发卖模式,实在很年夜一个点就是耗损他们的本体用来做数据收罗。我感觉戴博提到的In-the-wild这个数据收罗方式上,假如当局部分可以调动一些,好比国有的超市,或者者当局部分可以或许参与的一些人力操作的部门,让In-the-wild这个数据收罗的能力构造起来,实在不需要投入太多的这个资金,更可能是资源的调理。如许跟数据公司共同起来,可能会比采办一堆本体来患上更直接,及对于行业的鞭策会更有作用一点。

实在咱们适才也提到了,于工场内里收罗数据对于量有必然的需求,可是可能更需要的是In-the-wild这个数目级的数据收罗。列位于In-the-wild的数据收罗上面有一些甚么样的不雅察及思索?我先说说我的设法。我感觉In-the-wild这类数据,实在更可能是运营能力的问题。那末是否是像美团、饿了么这一类公司,会更合适做这类数据的运营?作为数据公司来讲怎么看这个问题?

戴若犁:In-the-wild的数据,分两部门。一部门是你说的,美团、饿了么这类人力带动,高效卷人力的能力,别的一部门多是装备能力,就是说你要有优质的、对于在操作的磨擦很低的 low-friction 装备,并且可以或许采到充足的modality,就是模态及精度,那这是两部门。别的一部门是数据的使用,In-the-wild采回来的数据最年夜的问题是稀少,模态稀少,维度也稀少,信息也稀少,那有无措施从稀少的数据里边挖出来浓厚的信息,甚至在增广出浓厚的信息?这也是很磨练程度的。好比世界模子,此刻有一条链路就是稀少性信息进到一个世界模子,经由过程年夜量的先验预计出来更富厚的模态跟维度,这些实在都跟阿谁美团、饿了么的人力构造就不太相干了。

以是我感觉实在In-the-wild也是一个很是磨练技能程度的工作,假如只是靠人力构造的能力,那你的买卖就是人力构造。到末了实在你拿出来甚么能力,你赚到甚么钱,这长短常公允的一个工作。

佟显乔:我感觉In-the-wild于此刻这个时间点实在属在很是初期的阶段,今朝来看人力治理那部门还有是第二步。第一步是怎么收罗,硬件装备、软件的易用性,及数据的处置惩罚,无论你是online处置惩罚还有是后处置惩罚,都患上先让人可以很快地用起来。

这些工具成熟之后,后面拼的才是人力构造能力。这就有点像主动驾驶行业,此刻数据标注就酿成了标框了,可是初期阶段,各人用差别的东西,标注的效率及数据收罗效率实在是纷歧样的。到后边这个工具成熟之后,各人就酿成比拼谁人力成本弄患上低,谁构造患上好,这个是第二步。以是In-the-wild于具身这块,实在还有是初期阶段。今朝来看还有是从技能的角度,要把收罗装备这些技能角度做患上更好,才能到下一个阶段。

丁琰:我跟阿谁佟博的设法还有是比力一致的。Collect data In-the-wild 确凿是一个很好的愿景,可是我预计年夜范围需求应该还有是于来岁下半年才会起来。由于此刻整个模子的架构还有不是很清晰,对于数据的摸索,实在还有于经由过程样本数据或者者是小批量数据去实验的阶段。各人虽然嘴上说collect data In-the-wild,但实在并无要那末多的数据,年夜部门数据应该还有是出自在数采工场。

我感觉collect data In-the-wild 必定是要做的,可是如许对于在数采装备会提出更高的要求。举个例子,咱们便携版本及全功效版本之间的区分就是,便携版本没有激光。由于激光没有措施于野外举行收罗,它不成能随时随地给你提供一个电源及基站,而且激光可能还有会受强光、红外线等等的影响,还有有遮挡之类的各类环境,实在就相称在有些装备In-the-wild是彻底不克不及用的,以是怎么去设计一个数采装备是重中之重,这是第一步。

第二步是,我感觉野外收罗并无想象中那末简朴,不是说你随意雇一个工人,他拿着装备乱采,这个数据就能用了。咱们对于在数据质量的要求始终是很高的,假如数据量很是很是年夜的话,可能数据质量脏一点也无所谓,可是假如你的数据量还有没有到达必然级别,实在数据质量要比数据数目主要患上多患上多。以是怎么于In-the-wild这个历程中包管数据的质量,怎么培训这些工人,实在也不是那末简朴的。

像美团或者饿了么,他们有年夜量的场景及平凡的工人,但我感觉他们其实不能于一最先就作为主力军去收罗数据,至少于很长一段时间里是不成能的。前期阶段应该还有因此一些比力well train的,有许多收罗技巧的工人,拿着这个及格的数采装备于野外举行收罗为主。

王建明:我还有有末了两个问题。适才也提到,除了了工场的数据收罗,In-the-wild的数据收罗,实在还有有一种是有模子能力而且解决场景问题的公司,本身去做数据收罗。举个例子来讲,主机厂本身有数据处置惩罚能力及模子能力,我觉得这一类公司确凿也有趋向,近来一段时间有多是受北美一些公司的影响,他们可能于解决场景的问题的历程中同时堆集数据及模子,把本身的小飞轮滚起来。一个一个场景解决了以后,就由小飞轮酿成年夜飞轮。那你们感觉于这个历程中,这种公司会不会更易堆集数据?这些数据跟数据公司没有甚么瓜葛,这会让你们感觉很担心吗?

戴若犁:我感觉这是一个很好的期待,但很年夜的问题就是,是否是真的可以或许落地。我切身履历了好几个很年夜的革命,好比说主动驾驶、年夜语言模子, AR、VR。率直来讲,具身智能此刻每一年是 200 亿美元、300 亿美元的钱撒到这个行业,可是假如跟以前的AR、VR、年夜语言模子及主动驾驶比拟,百亿级另外钱进到这个行业的时辰,那三个行业的成熟度比此刻具身智能的成熟度要高很是很是多。各人想一想看,百亿范围的钱进到 VR 行业的时辰,Oculus已经经可以做成一个350美元的装备卖给你,你回家可以玩过山车了,但此刻是没有如许的呆板人的。然后主动驾驶,07年的时辰,美国的DARPA挑战赛就有六支步队可以彻底无人干涉干与地完成几十英里的主动驾驶,那是18 年之前。

以是具身智能此刻的状况,实在我感觉很希奇。建明也是投资人,为何你们入场会这么早?投资都投到年夜学传授内里去了。这实在是很希奇的一件工作,我是高度思疑,包括海内的一些公司,真的可以或许进到人类的家庭,让小飞轮转起来吗?我尤其但愿可以,可是我不信。

佟显乔:我的不雅点也是。举个例子,从最早的深度进修去做感知,到厥后感知的范式酿成了BEV,再到厥后的端到端、VLA,实在具身就是处于一个很是初期的阶段,末了是甚么样?很难说。像你说的一些垂直范畴的呆板人,可能它们干的活相对于比力简朴。好比到车厂里边去拧螺丝,训一个如许的小模子。或许以今天的能力,他们本身采数据就能解决,但这可能也不是具身呆板人的终极寻求。究竟是哪条路能先来?这个事实在很难判定,但咱们必定都是冲着阿谁最年夜的,或者者是最终阶段去的。从数据的角度来讲,无论你是垂直范畴还有是通用范畴,你采的数据,你需要的工具及训的模子布局实在还有是那些。此刻这个初期阶段,各人也只能follow着准确的标的目的走,我感觉很难判定末了哪一个能成。

丁琰:实在我是很羡慕及服气那些公司的。好比说方才提到一个例子是Dyna,咱们公司必定没有他们那种资源,他们是可以完成一个数据收罗、数据练习,反哺反馈,然后再落地的整个闭环,有点像一个自力的王国于运行这件事。他们的know-how及insight的堆集速率长短常快的。

绝年夜部门公司不克不及相比这个历程。可是他们也会有一个小问题,就是除了非资源很是多才能把整套逻辑及这个王国搭建起来,否则资源太分离的话可能弄不定。好比有些公司可能把90%资源全数投来训模子,但若每一个环节都想做,你又想采数据,又想训模子,又想去真机部署,那你患上破费许多的资源去安插每个阵地,这是很累的。他们假如能守患上住,那必定是最佳,但数据公司的一个缺陷就是,他对于在模子的理解必定没有另外公司强,假如你不是年夜量地训模子,这个know-how及insight总偿还是会比模子公司少。

可是他还有有个活下去的路径。好比你做一个叠衣服的使命,阿谁know-how及insight 是针对于在叠衣服这个使命自己而言的。可是对于在其它使命,好比系鞋带,这个know-how就没有了。他不成能把所有的场景、所有的小使命、小场景全给弄定,他不成能有那末年夜的know-how。

可是做数据的公司就会有一条生路,这是我忽然想出来的。咱们是否是可以于及差别客户打交道地历程中,有些客户是叠衣服的,有些客户是系鞋带的,有些客户是做饭的,帮忙他们去获取know-how。他们本身可能也没有那末多资源,以是咱们结合起来,做数据的公司及做模子的公司拼于一路,就能够把每一个小场景做闭环。这可能也是一个数据公司活下来的一个路子之一

王建明:末了一个问题。列位可以说说于呆板人这个行业,小我私家的vision、你们开办公司的vision,以和你们感觉年夜概到甚么时间点,这个vision是可以够患上着的吗?

戴若犁:咱们公司的slogan叫做 we don t make robots,we make them Intelligent。咱们这个呆板人公司不造呆板人,我最年夜的期待,也不是vision,就是期待真的造呆板人的那些卓异的企业及人,他们能活患上好,他们可以或许融到年夜钱,做年夜买卖,如许咱们好好地做个副角就好了。

佟显乔:我说一下我的vision。为何做具身数据这个行业,我感觉从数据切入是于这个不确定的行业里边,最确定性的一件工作。今天这个行业还有于初期阶段,末了是甚么样?long way to go。可能十年,可能20年,于这个历程中,我感觉数据是独一确定的工作,并且数据堆集的know-how,现实就是模子堆集的。以是为何我及深圳AIRS一路去做这件工作?也是由于感觉,从数据的角度切入,去follow开始进的标的目的,做具身智能这件事,是一个持久偏确定性的创业时机。

丁琰:呆板人的场景很是很是多,咱们鹿明就但愿守住本身这一块地,于这一块地里做到top1的级别。咱们本身于做 UMI数据的时辰,今朝来讲还有是最快的一家,咱们想守住本身的阵地,把各类工具探大白、弄清晰,然后办事各人。咱们的理解是, UMI这块还有有很多多少问题没有解决,甚至没几家可以或许把它真正用起来,还有有比力长的路要走。别的从于工场里采到于野外采数据,又是别的一个超过。于工场里采,采完下一步实在就到要实现落地的阶段了,这可能还有是一个比力长的历程,要于两到三年以内完成,这是我小我私家及公司的愿景。

王建明:谢谢列位佳宾,那末数据环节的切磋就先到这里。

雷峰网文章

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-米兰·(milantiyu)中国官方网站


地址:长春净月高新技术产业开发区百合街1009号

版权所有:米兰·(milantiyu)信息技术股份有限公司

电话:0431-85861717/ 4001182299