新智慧生物的诞生

2020-05-20 17:48发布

下面的想象就更狂野了,真正要实现,估计至少是我们十辈子或者一百辈子以后的事情。那时候,我们已经是祖宗了哈。大家就当科幻小说来看好了。

从最近一位微软副总裁的演讲说起。瑞克·拉希德(Rick Rashid)是微软研究院的高级副总裁,有一天,他在中国的天津迈上讲台,面对2000名研究者和学生,要发表演讲,他非常非常紧张。这么紧张是有原因的。问题在于,他不会讲中文,而他的翻译水平以前非常糟糕,似乎注定了这次的尴尬。

“我们希望,几年之内,我们能够打破人们之间的语言障碍,”这位微软研究院的高级副总裁对听众们说。令人紧张的两秒钟停顿之后,翻译的声音从扩音器里传了出来。拉希德继续说:“我个人相信,这会让世界变得更加美好。”停顿,然后又是中文翻译。

他笑了。听众对他的每一句话都报以掌声。有些人甚至流下了眼泪。这种看上去似乎过于热情的反应是可以理解的:拉希德的翻译太不容易了。每句话都被理解,并被翻译得天衣无缝。令人印象最深的一点在于,这位翻译并非人类。

这就是自然语言的机器翻译,也是长期以来人工智能研究的一个重要体现。人工智能从过去到未来都有清晰而巨大的商业前景,是以前IT业的热点,其热度一点不亚于现在的“互联网”和“大数据”。但是,人类过去在推进人工智能的研究遇到了巨大的障碍,最后几乎绝望。

当时人工智能就是模拟人的智能思考方式来构筑机器智能。以机器翻译来说,语言学家和语言专家必须不辞劳苦地编撰大型词典和与语法、句法、语义学有关的规则,数十万词汇构成词库,语法规则高达数万条,考虑各种情景、各种语境,模拟人类翻译,计算机专家再构建复杂的程序。最后发现人类语言实在是太复杂了,穷举式的做法根本达不到最基本的翻译质量。这条道路最后的结果是,1960年代后人工智能的技术研发停滞不前数年后,科学家痛苦地发现以“模拟人脑”、“重建人脑”的方式来定义人工智能走入一条死胡同,这导致后来几乎所有的人工智能项目都进入了冷宫。

后来有人就想,机器为什么要向人学习逻辑呢,又难学又学不好,机器本身最强大的是计算能力和数据处理能力,为什么不扬长避短、另走一条道路呢?这条道路就是IBM“深蓝”走过的道路。1997年5月11日,国际象棋大师卡斯帕罗夫在和IBM公司开发的计算机“深蓝”进行对弈时宣布失败,计算机“深蓝”因此赢得了这场意义深远的“人机对抗”。 “深蓝”不是靠逻辑、不靠所谓的人工智能取胜的,就是靠超强的计算能力取胜:思考不过你,但是算死你。

类似的逻辑在后续也用到了机器翻译上。谷歌、微软和IBM都走上了这条道路。就是主要采用匹配法,同时结合机器学习,依赖于海量的数据及其相关相关统计信息,不管语法和规则,将原文与互联网上的翻译数据对比,找到最相近、引用最频繁的翻译结果做为输出。也就是利用大数据以及机器学习技术来实现机器翻译。现有的数据量越是庞大,那么这个系统就能越好地运行,这也正是为何新的机器翻译只有在互联网出现以后才有可能重新取得突破性进展的原因所在。

因此,目前这些公司机器翻译团队中,有不少计算机科学家,但却连一个纯粹的语言学家也没有,只要擅长数学和统计学,然后又会编程,那就可以了。

总而言之,利用这种技术,计算机教会自己从大数据中建立模式。有了足够大的信息量,你就能让机器学会做看上去有智能的事情,别管是导航、理解话语、翻译语言,还是识别人脸,或者模拟人类对话。英国剑桥微软研究院的克里斯·毕肖普(Chris Bishop)打了个比方:“你堆积足够多的砖块,然后退上几步,就能看到一座房子。”

这里我们假设这种技术能够持续进步,未来基于大数据和机器学习基础上的人工智能达到比较流畅地模拟人类对话,就是人类可以和机器进行比较自如的对话。事实上,IBM的“沃森”计划就是这样科技工程,比如试图让计算机当医生,能够对大部分病进行诊断,并和病人进行沟通。另外,也假设目前刚刚兴起的穿戴式计算设备取得巨大的进展。这种进展到什么程度呢?就是你家的宠物小狗身上也装上了各种传感器和穿戴式设备,比如有图像采集,有声音采集,有嗅觉采集,有对小狗的健康进行监控的小型医疗设备,甚至还有电子药丸在小狗的胃中进行消化情况监控。小狗当然也联上网,也一样产生了巨大的数据量。这时,我们假设基于这些大数据建模,能够模拟小狗的喜怒哀乐,然后还能够通过拟人化的处理进行语音表达,换句话说,就是模拟小狗说人话,比如主人回家时,小狗摇尾巴,旺旺叫,那么这个附着于小狗身上的人工智能系统就会说,“主人,真高兴看到你回家”。不仅如此,你还可以和小狗的人工智能系统进行对话,因为这个人工智能系统能基本理解你的意思,又能够代替小狗拟人化表达。以下我们模拟一下可能的对话: 

你:“小狗,今天过得好?”

小狗:“不错啊,主人你今天换的新狗粮味道很好,总觉得没有吃够。”

你:“那很好。我们以后继续买这种狗粮。对了,今天有什么人来吗?”

小狗:“只有邮递员来投递报纸。另外,邻居家的小狗玛丽也来串门,我们一起玩了一下午。”

你:“那你们玩的怎么样?”

小狗:“很开心啊。我好像又进入了初恋呢。”

……

我们可以把上面的模拟对话当成一个笑话。但其实,我们这个时候就会发现一个惊人的事实,就是你其实是面对了两只小狗,一只是物理意义上的小狗,一只是基于大数据和机器学习的人工智能虚拟小狗,而且虚拟小狗比物理小狗还要聪明,真正善解人意。那么,这个虚拟小狗是不是新的智慧生物呢?

我们继续把这个故事来做延伸,把小狗换成未来的人,人在一生中产生大量的数据,根据这些数据建模可以直接推演出很多的结论,比如喜欢看什么样的电影啊,喜欢什么口味的菜啊,在遇到什么问题时会怎么采取什么行动啊。

这样的数据一直累积下来,直到这个人去世。我们有个大胆的想象,这些巨大的数据能否让这个人以某种方式继续存在下去呢?后代有什么问题需要寻求答案的时候,比如在人生的关键抉择时,比如大学要上什么专业、该不该和某个姑娘结婚,可不可以问问这个虚拟的人(祖先)有什么建议呢?答案是当然可以。在这种情况下,数字化生存不仅在人生前存在,也可以在人死后继续存在。人死了,可以在虚拟空间中继续存在。一辈子、一辈子的人故去,这些虚拟的智慧都可以继续存在,假设很多年过去了,这些虚拟智慧的祖宗们太多太多了,活着的子孙们甚至可以组建一个“祖宗联席参谋委员会”,优选那些考得好的(比如中过状元),当过国家高级公务员(比如太守)、当过企业高管(比如CEO)、当过教授、当过作家的等等当过成功人士的祖宗,专门用于后代的咨询、解惑。让这些祖宗死后还有竞争,别死了就没有事情干了。这个场景是不是很熟悉啊?就是迪斯尼动画片《花木兰》中出现过的场景啊,花木兰在面临是否代父参军的重大人生时刻,就向“祖宗联席参谋委员会”倾诉过困惑,得到了指点。

这些说明什么呢?就是随着大数据和机器学习的进一步进展,这个世界出现了新的智慧生物!大数据和机器学习在改变、重构和颠覆很多企业、行业和国家以后,终于到了改变人类自身的时候了!人类的演进出现了新的分支!

有科学家画了下面一张图,来描述这两者智慧生物。一种是基于生物性的,经过几百万年的进化而来;一种是基于IT技术,基于大数据和机器学习,通过自模拟、自学习而来。前者更有逻辑性,更有丰富的情感,有创造力,但生命有限;后者没有很强的逻辑性,没有生物上的情感,但有很强的计算、建模和搜索能力,理论上生命是无限的。

当然,这些事情要发生都会非常非常遥远。反正我们活着的时候是见不到了,死了也见不到,因为我们死的时候,我相信这种建立在大数据和机器学习之上的虚拟生命还不会存在。