徐扬生院士:机器人,从动作到智能
2015-07-26 中国人工智能学会
摘要:中国工程院院士、香港中文大学(深圳)校长徐扬生以视频形式现场演示了爬树机器人、书法机器人、救援机器人、服务机器人等。他深度分享了目前他一直思考的问题,包括如何向自然学习,智能从哪里来,智能可扩展吗。
为了更好地引导和推动我国人工智能领域的发展,由中国人工智能学会发起主办,CSDN承办的2015中国人工智能大会(CCAI2015)于7月26-27日在北京友谊宾馆召开。本次会议的主旨是创办国内人工智能领域规模最大、规格最高的高水平学术和技术盛会,汇聚国内外顶级的专家学者及产业界人士,围绕当前最新热点和发展趋势的话题进行交流与探讨,并针对“机器学习与模式识别”、“大数据的机遇与挑战”、“人工智能与认知科学”和“智能机器人的未来”四个主题进行专题研讨,努力打造国内人工智能前沿技术和学术交流的平台。
中国工程院院士、香港中文大学(深圳)校长徐扬生
中国工程院院士、香港中文大学(深圳)校长徐扬生发表了题为《机器人:从动作到智能》的演讲,他提到机器人应该具备三个方面的能力:动作、感知、认知,而机器人的动作包括爬、抓、行、跳、飞……等等,关于从动作到智能的几个问题,他详细介绍了爬树机器人、书法机器人、救援机器人、服务机器人、全方位转向车的研究目标、动作实现并以视频形式做了现场演示。
另外,他表示科学家五十年来集中在机器人的动作,现在是时候考虑智能问题了,他还谈了自己现在一直正在思考的问题包括:第一是如何向自然学习,比如人类需要的不仅是在结构上,而且还要在运动上,提供灵活性,减少能耗,在这方面人工智能研究者应该如何向自然学习。第二个问题是智能从哪里来,例如各种各样的智能学习算法是否应该向模型学习;关于learningby demonstration是否应该向人学习。再者,人工智能研究是否应该向动物学习?关于collectivebehavior是否应该向人群学习。关于大数据与智能,他认为这是一个火车的两个轮子,两者缺一不可,所以这两件事情是联结在一起的。最后,第三个问题是智能可扩展吗,人的智能可不可以扩展?这个扩展如何将它形式化。他分别就上述三个方面展开分析,谈了自己的看法。
以下是演讲速记整理:
各位朋友,各位同事,早上好。非常高兴人工智能学会邀请我做这个报告,我搞机器人大概30多年吧,所以跟大家分享一下机器人里面跟智能有关的事情的感悟。
平常我是很少就人工智能做什么报告,因为我以前在工作的时候在我们那个地方人工智能是在机器人里面,这里面大牌的很多人工智能的专家,我们当时的乔纳不在这边,其他的几个专家都在这里。所以人工智能技术专家,同时它的技术是很强的,所以我们每次中午吃饭的时候讨论人工智能是机器人的一部分还是机器人是人工智能的一部分。当时很多人说人工智能是机器人的一部分,人工智能这个技术时需要机器人做这个事情,但是同时有些人感觉到,我后面主要会讲到机器人包含三个部分内容其中一部分内容是人工智能部分。好像是人工智能是机器人的部分的样子。所以我们机器人是很少在人工智能这个学界做报告,今天我试试看讲一下。
现在的医学上告诉我们人体所有器官当中,人体上面两个东西是基本上不更新的,一个东西是什么?心肌,心脏的机构更新大概一生当中是1.5次,有的人两次,有的人是没有的。还有一个地方是眼睛后面的沿着那个脑神经是基本上不更新的,脑的那些细胞是不更新,基本上一辈子不更新,有的只更新一次。所以我说定义你今天是不是李院士,你怎么叫做李院士,定义的不是你的肉体,是你的心理,是你的心脑部分。
什么叫机器人
今天我想跟大家讲,从机器人的角度上讲,什么叫机器人?我们称之为一个机器人包含三个内容的东西,一个叫做我们的动作,一个叫我们的感知,感知就是传感这部分,还有一个就是认知,就是靠我们人工智能的部分。比如说今天起风了,起风了这件事情,你知道起风了吗?这是感知问题。起风了以后要不要加衣服,这是判断,认知问题。下面决策点要加衣服,加衣服吧,加衣服就是一个动作领域。所以实际上是这三个,感知、认知、动作。机器人这门科学在前面50年当中都是围绕着穿衣服这件事情,没有在想着前面的风来了吗?我需不需要要加衣服这个问题上,而人工智能主要是应不应该加衣服这件事情。
我们先回到这个动作,动作是什么,爬、抓、走路、跳、飞这些是动作的问题。昨天是因为我左边这个膝盖有点扭伤,所以昨天有个专门的医生,骨科这方面做了很多年。后来我跟他讨论学术问题,他跟我讲人的动作大概分哪几个部位。我说人的动作,人的行为就是分为两种。我跟他讲我自己的突发,所以我今天跟大家炫耀炫耀,我觉得人一部分就是原始的动作,一部分是文明动作。原始,走路,吃饭,睡觉,爬地,其他的这些靠想象的原始人都要做的这些东西,农民都做的这些动作。文明的动作是什么?开会就是文明的动作,你上网也是文明的动作,手机都是文明的动作。文明社会给你带来的那些动作。我昨天跟他争论的地方是什么?我跟他讲,我们现在这个时代,文明的动作比原始的动作要太多了,我说100年前原始动作跟文明动作比,我个人认为肯定是原始动作好。原始和文明是80比20,现在我个人认为反过来了。
各位有兴趣看看基因的那些书里面,你就发现人的基因基本上不变的。这说明什么意思?就是说100年到现在这个基因基本上不变,什么叫基本上?来自于万分之一,是这种概率。基因实际上变了这么一点点,你的行动,你的动作,变化了这么多。所以我觉得是从认识上。你就看现在很多人的举动100年前的人肯定没有,这是为什么?是跟你的动作特征有关系。所以机器人要完成这些动作。我做了很多年研究,一开始在美国做机器人研究,到现在30多年了。主要做机器人动作研究。动作里面有很多智能问题。所以我跟他讲,你这个人不动,你的智能是有问题的。最简单的,我们这么多年轻朋友,我是鼓励所有学工科的学生、嘉宾回家做家务,你如果不动作的话,你可能很多时候体会不了它的智能在里面。所以今年香港中国大学第二年招生,在广东和浙江两个地方出考试题的时候,我们出的题目是家务里面的题,我可以跟大家分享,这个题目是我出的,明年不会考。我的题目就是这样:晚上晚饭以后洗碗的时候油腻很多,正好洗洁精没有了,水也是冷的,你怎么办?你如果不动手,家务不做,你动手很难动手。
所以实践这个动作对智能是非常重要的。为什么重要?我后面一点点讲下去,没有动作你是做不到的。我们现在讲动作的东西,我们做了很多,围绕着动作里面爬的、行的这些机器人,飞的机器人,我们讲一下,我们30年当中我至少做了50多个机器人,所以讲不完,我们今天就是对机器人总的讲反应问题在哪里。
爬树机器人
一个是爬树机器人,树是一个很好玩的东西,我是小时候最喜欢爬树,我到美国自己的房子里面,我后面里面看人家不在的时候我也爬树。爬树机器人有很多挑战的地方,挑战哪里?挑战在几个方面,第一下面的树枝是粗的,上面的树枝是细的。你要粗细都爬。第二个它不能太重,因为要轻轻地感触。有很多弯曲性在里面。还有你是爬树斜着爬还是竖着爬。爬小树跟爬大树是完全不同的概念,一种是竖爬,一种是斜爬。当时有几个人也做爬树,我今天跟大家讲你人的智能领域学习重要的问题。我们的爬树是什么能爬什么不能爬。就看毛毛虫是怎么爬的,这是我当年下乡最怕的东西。毛毛虫是多膝的爬树,它是什么感知?它没有什么视觉。明天微软的杨洋院士,他讲vition,我讲是vition这个玩意儿能不能避过去,谭教授也是搞vition,所以这个玩意儿是vition可以避过去。我们就是从灵活度角度上讲。这个爬树的灵活,因为机器人要爬上去。被动的东西比它机器人重量大十倍。这是一个机构的问题,机械实现得问题。我个人是搞机械,后来搞控制,搞航天。机械一点点有一行柔性在里面,这个是跟树型的承建在里面。这个稍稍多说几句话,可能有些人忽略了。自动的东西是被动的,不是主动的。人类往往忘记了,是被动的,我看医学书里面,明朝的时候讲的,书里讲的,他说是叫平起平下,什么意思?所有东西都是这样走路,你所有膝盖都是保证,这个是爬树机器人的概念。你去看人装一个支架,很容易,为什么?这是有很多道理在里面。VCR
我们看看它是怎么爬的?这个是在我们学校的校园里面。你两节的,你也可以搞三节,你看它背着很重的东西在上面。16节,根本没有vition,它没有粗细之分,照样爬。
书法机器人
下面讲讲书法机器人,会场有些人是练书法的,我自己本身比较喜欢练书法,所以搞个机器人。我这边只是一个学生。书法怎么在里面描述出来?谭院士非常清楚。比如说很简单,我们说人的脸总是可以达到的参数,比如说你跟你儿子像不像,你儿子也可以是一个参数。这个参数倍数里面20空间还是25空间里面,也是有一个点在里面,你儿子的点也在里面,你儿子同学点也在里面,你说你和你儿子比较像,你们两个点的参数大概就比较近。书法也是这样子,不同的书法参数点,你可以找到其中一点。我们就说建造一个机器人来实现这些东西,这个机器人当然也有很多要求,这个其实是一个动作很有关系,刚刚讲到的动作是有关系的。我看到在座的是好几个做笔记,做笔记的朋友们停下来,手不要动。你看你的手臂形状基本上都是呈90度。这个是有道理的。为什么呈90度?我在美国前面有几篇论文在里面,动作是有智能在里面的,第二,人写字的时候一般是呈90度的。你写字不可能这样去写,也不可能这样写,你可能是这样子写,所以有好的配合。
再一个怎么把书体分类,篆书、隶书、楷书,动作是作为学习在里面。它每个有元素在里面。比如说像苏东坡,苏东坡的横一般是怎么写?苏东坡的竖一般是怎么写的?比如苏东坡要写李字,李院士的李字怎么写。它是从仓库里面把苏东坡的参数拿出来写。所以说它能够做一件很美妙的事情,我说黄庭建的字写的好,他是宋代人,他说所有的字都有,这个“能”字没写,怎么办?我们就猜下来,黄庭建如果活着“能”字怎么写?这个是宋代的书黄李灿,它的写法,你也可以帮它叫。你写的侧它也写的侧,你写的好一点它也写的好一点。所以它这个书法机器人里面讲到几点在里面,一个是动作的智能,它是有些智能动作,我们称之为SG,学机械的都知道,是工艺的问题。工艺最难,工艺确确实实代表了你的智能在里面,你看它用笔都用的很好,这个不是苏东坡教它的,它自己解决。有一点我跟大家讲故事,我有一篇文章,骑自行车到哪里,但是不掉下来不翻倒是你的问题,书法也是这样,骑自行车也是这样,这个是动作智能的问题。
救援机器人
再一个讲救援机器人,这个当时为救援做机器人,我的想法是做全世界最好的机器人,什么样的机器人,室内室外全部能开,我们当时选三角菱形的机器人。你看下面那个图?它是怎么做的?红色那个轮是怎么进去的?蓝色的挡住的,红的一上去蓝色就上去。再看,这个完全没有控制。你再看左边那个图,它是怎么爬上去得?它是挤上去得,没办法挤上去的,它不是控制上取得。你看,我们就把它做出来,这个机器人没有力量,什么样的事情都可以做。这个是实地拍摄的。这个轮子做的很轻,都能快速的翻上去,它是挤上去的,不是控制上去得,控制是要很大力气的。它可以翻,高的部分也可以翻上去,一点问题都没有。
服务机器人
我们再看看服务机器人。比如说家庭里面的,服务机器人当时我们开发了大概十几种,我们随便讲几种,服务机器人家庭里面,给一些老人家拿一些东西,这里面会有一些动作在里面,年纪大了有的时候不知道东西放在那里,最智慧的就是机器人找到在哪里。我们有很多,这个是家庭监控机器人。你们家里有什么人来,它自己看你们家里来了陌生人,它会给你发短信。这个还可以做一个宠物的,你用苹果手机你可以跟它对话,说家猫家狗在那里哪里。狗听到了主人的声音,但是它不知道主人在哪里。它哇哇叫。比如说我们上海一个院士,家里面有一只狗,老是跑不出去。两三天有一个会议你说带好还是不带好。这个东西也是我很喜欢的,这是一只假狗,它跟老人玩,玩什么?跟它扯淡,老人在家里很闷,我们家里都有老人,老人你给他吃他不愿意,你给他穿也不愿意,他到底要什么?他要找人给他陪伴,所以我们找个机器人就是跟特他玩,拍拍马屁,对你好一点。跟它下棋,对它稍稍好一点也能让你赢几把。或者是你不唱歌了,我陪你唱歌玩。我的机器人就是三千到四千的智力就可以了。它还可以跳不同的舞,说你睡觉吧,它就不玩了。
全方位转向车
下面跟大家讲讲全方位转向车,这个也是说到机器人的事儿。这个是蛮奇怪的事儿,因为开车是一件非常好的手跟眼睛很好的协调在里面,所以我说年纪大起来的人其实开车是很好的一件事情。我到李院士那里,前几年李院士他带我开车,我觉得开车是防止老年人协调非常好的东西。开车里面最难的一件事情是什么?叫停车,停车为什么难?这个转向机构,我们叫做传动系统,这个系统是1917年改变的,我们现在用混电动汽车机器人能做吗?我们做四轮电动,横着开始转。这个不是很简单,一下子就进去了。我不知道北京这层里面的停车场里面,一天不知道多少钱。最贵的地方一个小时多少钱?停车场,100块钱可能要。所以你看最贵的几个停车场调查,我发现停车场里面停车只占到40%几,50%是倒车的,不是停车。我把你这个倒车的问题不是就解决了吗。这个我觉得是非常有意义的一件事情。这个里面也是一个我们叫做全方位转向的一个动作。
现在我讲到了第一部分,我要讲的动作部分。给大家看一下我们做的几个机器人的视频在里面,当然有很多今年主要是我的学生在里面,我作为导师在里面。我说从动作到智能,50年的科学家主要集中在动作这个领域,没有回答在智能领域。玩人工智能那帮人基本上讲到算法,所谓的智能算法。现在是时候考虑智能的。为什么呢?有很多原因在里面,其中有一件事情当年我们在20年之前已经开始讨论什么叫分布智能,这件事情以前不可能,或者说很难。现在是有可能。我跟你讲,智能是不是在脑袋里面?离开脑袋能不能智能?我们说可以。我现在机器人在喝茶我现在口渴了,给我倒一杯水,一拿很烫,我怕烫着,我的手里面本身就是智能。每个人手里面都有智能在里面。所以第一句话是智能可以利用脑袋的。第二句话是智能可不可以利用人体。比如说讲虚一点,人体外的有没有智能在里面?我跟你说很难说有,也很难说无。这个很难说。我当年在纽约我们一个很有名的实验室叫BRSLN,全世界第一台计算机是在这个实验室诞生的,我们当时做什么课题?做一个打乒乓球机器人,它打比人很好,我打乒乓球不算最好,李院士打乒乓球最好。打乒乓球的时候一个小时,基本上都是他赢。这个好的机器人在哪里?它有36个眼睛,这个是欺负我们。但是眼睛这个事情不仅如此,这个说起来像谭院士讲,它的眼睛不是装在脑袋里面,它的眼睛是装在你乒乓球打过的那个入手,36只,它是分布在哪里,能挡以外的地方。我告诉你就是智能的东西,智能的东西如果把它做分布式的,分布在里面,可以做到非常智能。这件事情很少有人做研究,现在有人做研究是因为网络上来了。
再看看感知的问题。感知,我刚刚讲,穿衣服,起风了,应该穿衣服了吧。所有人都围绕着应该穿衣服这件事情上去,为什么不想想起风了这件事情也是重要的事情,这件事情蛮难做的。我们说人眼、耳、鼻有很多的协调功能在里面,你现在这些都没有做下去,这些东西本身带着智能的。今天这些应该带着智能,不要想我做个鼻子,闻东西,做个传感器很难做。我告诉不是传感器的问题,或者是说不只是传感器的问题。我希望做人工智能的朋友们多做一点感知的层面在里面。当年我做学生的时候,我当时是有一篇文章,有一个东西很简单,比如说这个地方是人工智能大会,我现在在这里有个点,比如我在这边要看看那边的东西,我要看到那边的东西,我的视觉在这里地方我应该取我自己的动作来过去看看那个东西到底是什么。明白我的意思,这就是在里面。这件事情联系完全在一起。问题是当时做到这里为止吗?我说应该继续做下去。
对人工智能的思考
下面我想谈谈几个问题,这几个问题是跟动作有关的智能。我跟我的学生说我大概做研究做到今天为止,我说我怎么会马上感觉到碰到的问题越来越多了?我说我希望写一本书,这本书就是写我的问题,没解决的问题,或者我个人感觉没解决的问题,或者说我不知道人家解决了我自己还不知道。我当时在思考,有些是做了有些还没有做,有些做了还没做好。所以就讨论讨论,供大家参考。
第一是如何向自然学习。我们人和动物都是跟自然界协调。人为什么成立行走,原来是爬的,这个世界需要我们人走在里面。以后所有人可能背都是驼的,因为大家都是拿手机嘛。所以人是智能的变迁在里面,动物是这么进化过来的。但是人的智能的学习,动作的学习在里面,实际上是智能的东西在里面。第一件是人可能向自然学习,人的很多动作是可以向自然学习。当我们机器人沙滩走路走不舒服的时候,我们有没有去想过龙虾是怎么走?螃蟹是怎么走?龙虾跟螃蟹的智能为什么在那里?它代表什么意义在里面?你可以代表它去走,同时有智能在里面。我们再看鸟跟飞机,所有两千多年来,人类,回事,飞机是做大的鸟,中间把它做动作,做到鸟的肚皮里面去坐在里面,当初跟人的梦想是不一样。人的梦想是你脚怎么动起来,就像游泳一样游起来。我是一直在想这件事情,很多年。我甚至有的时候梦里出来,我就好像变成了一个游泳的东西,虽然这个游泳室里面没有水。岸上一推就蹦上去了,为什么现在做不出来?我告诉你,还是向自然界学习不够,自然界有很多智能的东西还没有学习到。
我们再看看,一个是结构上一个是运动上,结构上是学习问题,运动上是智能问题。你是怎么走路?李院士知道,我问一下我的亲戚,他们也知道。现在所有病人,你只要在家里面老是在那里爬,你的腰都会好起来,我跟你说这绝对是一个科学在里面。你就想说刚刚把人的行动转化成两类。人类离文明太近了,这个需要代价。人类离文明动作太多了,爬是原始动作在里面,你如果把它掌握好了以后,它实际上机构也好,运动也好,都能够体现灵活性。
我们说机器人跟机器的动物,为什么你要做机器人?我跟你说,大家都知道机器人有一个词叫人形机器人,这是现在做的最火的。我跟你说一开始的时候美国机械学界非常看不起这个东西,日本人在搞什么名堂?为什么要做人形机器人?做机器人的目的是什么?做机器人是做人很难做的事情。我现在要上去,我上不去。做一个人一样的东西干什么?没有这个必要,对不对?所以说我们是不是应该围绕做机器的动作?很多人把Robot翻译成机器人,这个翻译本身是错误。Robot是向人的概念来拓展,跟人一点关系都没有。所以这个机器动物我个人感知大家其实可以好好想想,包括行动智能的东西。包括人是不是可以向动物学习的智能。
第二个问题就是智能从哪里来的问题,我们在座的朋友很熟悉算法,算法是向模型学习,你要有模型,这个模型你到最后做好。我个人这些东西我是知道的,我没做过任何研究,也几乎在这个领域没有发表过任何文章,但是我个人比较倾向“向人学习”,你不要向模型学习,模型实际上是人把它堆集起来蛮难的,也许堆集好也许堆集不好。你为什么不向人学习呢?比如我们开个车,自动车,我们说从门进来,我一直走到这个台上,我们把所谓的空间可不可以给机器人,这个很简单,所有大学都可以算,马上可以出来。这个就是模型。我说我不是看模型,我看人怎么走过来,我看两三个人我就知道怎么走过来。这就是向人学习。我们叫Learningbydemonstration,是可行的,而且是比较快的能够过去。到最后,很简单,比如我刚刚说的那个例子,按照三个人走,我按照哪个人走?最简单的办法就是把三个人平均下来。大概就是讲中庸,中国人讲中庸,中庸之道就是平均。所以这是向人学习。
可不可以向动物学习?我们说动物有很多智能,为什么不能向动物学习呢?现在人们研究动物的人太少了,尤其是动物的智能。我这里刚刚讲一个主题。这里讲第二个主题。在座的各位有为的青年朋友们有没有向动物学习,向动物的智能学习?我觉得绝对是有意思的,非常非常有意思的。我跟大家讲一件事情,我们在美国当时有一个人民日报海外报,里面有一个很小的新闻,说是四川一个老头在深山30几年,他能够做鸟的50种声音,所以老头想把这个教给儿子,他把儿子请上山,教给儿子。儿子觉得山上非常枯燥,不耐烦。大概两三个月以后回来儿子回来了。过了两三年以后老头死了我当时看了这个新闻以后觉得非常遗憾,就是绝了,没有人继承下来这个声音。我觉得狗与狗之间一定有学习,人是不懂的,但是我不排斥人会懂。再一个是人群的智能。这不是人的智能,是人群的智能。所有人是跟风的,最简单的就是上个月大家都知道中国的股票市场,股票市场标准就是人,就是集体行动在里面。很简单,这个时候我们在这里开会,下次这个角落里面两三个人往外面跑,旁边两三个人跟着往外面跑,后面有人不知道什么事儿也往外面跑。人就是这样子,我们研究过天安门广场里面的研究,有很多问题在里面,大家也不知道在做什么,但是它是集体的行为在里面。这个里面有智能的。
再一个是大数据与智能,下午还有人讲大数据。大数据跟智能的东西,这是一个火车的两个轮子,我个人感觉到缺了一个都不行。大数据有了以后,你没有智能的玩意儿的话,没用,反映过来智能也要靠大数据,所以这两件事情是联结在一起的。数据没有智能就是没用的。
第三个事情我想跟大家讲一下智能的扩展性,智能的可扩展性。我在做机器人动作控制老想这件事情,是不是可以扩展?人的智能可不可以扩展?这个扩展,当你可以把它形式化,我知道李院士明天讲形式化的问题在里面。可以做头一个形式化,但是也可以抛出形式化。比如我们开车,开一个大卡车,大卡车学会了。说开个小车吧,大卡车学会了肯定也会开小车吧。但是开大卡车学会以后开小车比刚刚开车学会容易一点。我说yes。再说开飞机,是不是开车的朋友开飞机也容易?我跟你说,我不知道。我们做了半天研究以后没觉得这件事情有用。就是说从控制角度上讲有帮助,这个帮助蛮难定。所以这件事情也是很值得搞智能的人好好去想想。这个可扩展的条件到底是什么?是硬件还是软件?还是数据?我们原来跟你说所有人说数据不够,我估计是歪理,但是也不一定。大家可以去想一想,特殊的智能和通用的智能到底在哪里。很多说所谓的特殊智能,特殊智能很重要,你要做一件事情,国内很多竞赛,智能机器人是很容易做的。那是通用机器人,我说通用机器人大概在哪个层面上?这是学习的有效性。就是你学习和有效性总是相反的,有效性很重要,我能不能做好?不一定。有的说人的记忆长期记忆和短期记忆不一样,我也不知道。谢谢大家!
更详细的会议日程和相关信息请随时关注大会官网(持续更新中):http://ccai2015.csdn.net/。