有医院曾经采购过护理机器人,想要让机器人来护理医院的病人。

  可结果呢?

  医院采购的护理机器人,反而是成为了被护理的对象!

  机器人拿起一只杯子,展现了跟人类一样的抓握能力。

  在很多人看来可以说是相当的厉害,是一项巨大的突破。

  可事实上呢?

  就这么一个镜头,事先就需要几十次,乃至于上百次的彩排。

  在各个公司的宣传视频里面,他们的机器人都是多么多么的厉害。

  一副上山能打虎,下水能擒龙的样子。

  一拳,就能够给人的头盖骨给砸碎。

  可你要是真的买回一个宣传片里面的机器人来,那么你就会发现……

  当一个人无语的时候,真的会笑!

  有个关于这方面的笑话是怎么说的来着?

  如果你的家里面没有老人的话,那你可以买个机器人回去,学着照顾一下。

  现在的机器人,如果说预先设计好程序的话,确实是可以模仿一些人类的动作。

  比如说,跳一支舞,或者打一套拳之类的。

  只要是多给几次机会,那肯定是能够在视频里面表现的惟妙惟肖,给人一种震撼的感觉。

  可是,你要是真的想要用它来进行生产,代替人力,成为下一代的“劳动力”……

  呵呵。

  不说是会被搞的完全一团糟,基本上也差不了多少。

  动作迟缓的关节,漏洞百出的AI系统……

  别说是跟一个正常接受过九年义务教育的成年人相比了。

  就算是跟一些小学生比起来,在很多方面,都是要逊色不少。

  具身智能这个领域,听起来好像没有元宇宙,冬眠舱之类的技术那么的夸张,好像是拥有着很大的可能。

  像是元宇宙,冬眠舱之类的技术,可能需要几十年,乃至于上百年的时间。

  而具身智能……也就是人形智能机器人……在很多人看来,好像在几年之内,就能够实现真正落地。

  从而为社会的发展,提供强有力的支持!

  毕竟机器人这方面,已经是研究了几十年了,在很多人眼里面,算是已经拥有了相当的技术积累。

  而人工智能,也在这些年里面,突飞猛进!

  几年之前,那些所谓的人工智能,只能够进行几句傻傻的对话。

  而现在的人工智能,已经具备了一定的生产能力。

  这些技术加起来……或许太过于先进的人形机器人,像是电影终结者里面那种T-800,T-1000之类的,以目前的技术水平,很难生产,还有相当长一段路需要走……

  可是一些简单的人形机器人,应该是不存在什么太大的问题。

  比如说进入家庭,充当保姆的角色,比如代替人力,进行挖矿,救灾之类的高危工作……

  可事实上呢?

  目前的人形机器人,大多数的动作,都是依赖于遥控器操作。

  真正展现人形机器人面对不特定物理环境中的物体,进行灵活交互的例子……几乎可以说是没有。

  你让他去生产,总不能够每一台机器人,还要专门配备一个操作手吧?

  真要是这样做的话,也不是完全不可以。

  只不过怎么看,都好像是在……脱裤子放屁!

  而那种流水线式的生产,已经可以算得上是相当没有技术含量的生产活动了。

  像是照顾孩子,照顾病人之类的,能够随时遇到各种突发情况的工作,那就是更加不用说了。

  到时候,是机器人照顾孩子病人,还是病人孩子照顾机器人……那就是真的很难说了。

  目前来看,人形机器人的结构,已经不再是机械结构和控制算法。

  这两点,随着几年来,各个公司,大财团,还有研究所的倾力投入,发展的非常快,已经取得了不小的突破。

  就当下的机器水平而言,可以说已经是相当的不错了。

  现在。

  人形机器人的瓶颈,主要集中在……智能,和感知!

  虽然说,相比于之前的时候,已经有了不小的进步。

  但是,距离技术成熟,能够真正的实现应用……明显还有相当大的一段距离要走。

  这就好像是一个人,他的四肢跟小脑没有什么问题。

  但它的大脑跟感官……都是完全的不及格。

  那这个人,在日常生活中的表现,会是什么样子,那自然是……可想而知!

  而且这个不及格,还不是一般的不及格,不是那种差几分就能够及格的不及格。

  而是……距离及格还差着十万八千里!

  这跟学校里面考试不及格还不太一样。

  学校里面考试不及格,你努力就行了,毕竟各种各样的知识点都摆在那里,都有着现成的答案。

  或许优秀,满分之类的,还需要一定的天分在里面。

  但及格之类的,跟天分……基本上是扯不上太大的关系。

  可是,在机器人这方面的及格呢?

  可没有什么知识点,也没有什么答案给你去抄。

  只能够一点点的去摸索,一点点的去研究。

  而这个过程……肯定是伴随着数之不尽的人力,物力的投入!

  就现在的技术,别说是物理世界的多模态大模型了。

  连多模态感知和动作的耦合训练数据,都是相当的稀少。

  而且,获取数据的成本,可以说是相当的高!

  想要搭建一个物理世界的多模态大模型。

  成本可以说是要远远的超过像是ChGPT这样的纯文本大语言模型。

  而且,难度也不能够同日而语。

  毕竟,后者能够在短时间内,找到大量合适的数据喂进去,让纯文本大语言模型在极短的时间里面,就成长到一个相当不错的高度。

  而前者呢?

  先不说技术方面的问题,仅仅是想要获取足够的数据,就需要费不少的时间,投入不少的资源。

  物理世界的多模态大模型,对准确率的要求,也要超过纯文本的大语言模型很多很多……

  就目前的技术而言,想要实现这一点,跟人类要直接登陆火星,在火星上修建起一座可以适宜人类生存的城市差不了多少……

  怎么说呢。

  基本上……两者都是遥遥无期。

  就好像是一个小目标,跟一百个小目标,对于大多数普通人来说,基本上没有什么区别。

  因为……都拿不出来。