人工智能不智能,听谷歌工程师讲孩子长大后要面对的这个最大竞争对手

网友投稿 2019-05-21 09:13

2019年3月27日,堪称“计算机界诺贝尔奖”的图灵奖被授予了三位在人工智能,特别是深度学习领域作出杰出贡献的计算机科学家:Yann LeCun,Geoffrey Hinton,Yoshua Bengio.

https://cdn.china-scratch.com/timg/190523/091313F09-0.jpg

人工智能在最近几年是国内外炙手可热的话题,它切实地为我们的生活带来许多便利。同时,对于人工智能的迷思也弥漫在大众认知中。有人觉得它无所不能,影视作品中的机器人管家即将兑现;有人担忧人类的命运,惧怕计算机脱离人类的束缚将它们的造物主清洗殆尽。

这些过分的乐观与毫无必要的担忧都来源于人们对当下技术的原理知之甚少。特别是当我们听到“深度学习”时,总感觉计算机在进行深刻的沉思与学习,就像人类通过学习与反思能够获得一切知识与智慧一样。

那么,如何给孩子解释机器究竟如何“学习”?它和人的学习一样吗?“深度学习”深在哪儿?要回答这些问题,我们先将视线拉回到二十年前。 

01

机器究竟如何“学习”?

1997 年 5 月,美国纽约,IBM 的超级计算机“深蓝”击败国际象棋世界冠军卡斯帕罗夫。

2017 年 5 月,中国乌镇,Google 的人工智能围棋软件 AlphaGo 击败排名世界第一的柯洁。

https://cdn.china-scratch.com/timg/190523/091313EK-1.jpghttps://cdn.china-scratch.com/timg/190523/09131442G-2.jpg

可能在公众看来,这两场比赛没有本质的区别。电脑花二十年变得更聪明了,能在更难的棋类上战胜人类,好像也没什么大不了的。但是,从计算机的角度来看,它们有着天壤之别。

对弈双方脑子里的句式通常都是:“如果我走这步,你可以这样或那样走,如果你那样走的话,我可以这么这么走……”。这就像顺着一棵树往上爬,每个枝桠都是分岔选择,脑容量越大的人爬得越高、看得越广,也就更可能击败对手。

另一方面,经验丰富的玩家脑中保存了许多“残局”或“定势”,当他们看到局面呈现出某种特征时,就知道这个局势对自己是否有利,而不需要浪费时间继续在这片枝桠上探索。

计算机毫无疑问有着远超人类的“脑容量”。他们能在短时间里进行成千上万次准确无误的“分支检索”。然而,再快的计算机也无法穷尽所有可能(这正是这些复杂棋类的迷人之处),于是经验丰富的人类就有了打败计算机的机会。

那如果将计算机的算力和顶级棋手的经验结合起来呢?

深蓝就是这样一件杰作。它在许多象棋大师的帮助下,记录了海量必胜或必败的残局,并且设计出一系列计分方法来判断局面是否有利,进而避免将算力浪费在不利分支上。深蓝是象棋大师和计算机专家共同的智慧结晶。

AlphaGo 走的完全是另一条道路。和深蓝相同的是,它也需要进行大量分支检索和对局面的判断。但不同的是,它做这些并不需要专家的知识,而是通过大量自我博弈收集海量案例之后,构造一个庞大、复杂但又精确的数学函数,将当前局面转化成一个“分数”(比如必胜是100分,必败是0分,大部分情况介于两者之间),再选择分数最高的那个分支走下一步棋。

注意,这个分数不是专家赋予它的,而是它自己“学习”获得的。

计算机的学习,是基于大量棋局样本和每个样本对应的分数,产生一个函数,这个函数用于一个没有见过的样本时,猜出的分数八九不离十。

打个比方,我想卖一套房子,但不清楚定价多少合适;于是我搜集许多市场上最近卖出的房子,看看房价与哪些因素有关(比如地段、面积、新旧、学区、层高等),然后设计一个函数,将这些因素设置为函数的输入值(或者说自变量),并且使得函数套到每个案例上时输出的结果和实际房价非常接近,那我就很有信心把这个函数用在我自己的房子上,预测它大概值多少钱。

如果熟悉数学的话,你知道函数的种类五花八门,什么四则运算、平方开方、正弦余弦、微分积分……我应该选什么函数呢?其实,AlphaGo 用的函数形式并不复杂,主要是加法、乘法和一些逻辑判断(比如是正数还是负数)。重要的是,这个函数中的参数必须是可以调整的。

打个比方,函数是一台机器,参数是上面的开关和旋钮,你每次调整参数的值,就得到不同的函数,尽管函数的形状没有变化。参数变了,对同样的输入值,结果自然不一样。机器学习的过程,就是随着输入样本的积累,不断调整参数,让输出结果总体上的准确率达到最高。随着样本积累越来越多,参数会趋于稳定,那这个函数就训练地差不多了,可以用来预测没有见过的样本了。

https://cdn.china-scratch.com/timg/190523/0913142264-3.jpg

02

“深度学习”深在哪儿?

我们经常听到的“深度学习”,其实就是这样一大类函数的总称,也是 AlphaGo 使用的函数类型。在下图中,黄点是输入值,红点是输出值,蓝点是中间计算结果。每条线都代表一个参数。实际应用的深度学习网络比这个要复杂得多,多达成千上万个参数,处理百万甚至上亿个样本。

“深度学习”之深,就体现在这个网络结构的庞大上。这对于普通计算机来说是无比庞大的任务,不过借助于图像处理器和并行运算等先进的计算机软硬件技术,这项工作成为可能。 

https://cdn.china-scratch.com/timg/190523/0913151329-4.jpg

深度学习在图像识别、语音识别和自然语言处理上表现非常突出。图像识别的简单情形是给计算机许多被标注的照片,计算机将每张照片转换成一系列数字,训练一个深度学习模型,来预测没有见过的照片里的物品。在每年一度的 ImageNet 图像识别比赛里,计算机的准确率已经高达 95% 以上,比许多人类做的还要好。

https://cdn.china-scratch.com/timg/190523/0913151944-5.jpg

03

机器学习和人的学习一样吗?

“机器学习”与“人工智能”常被混用,但有着本质区别。

机器学习归根到底是构造一个复杂精巧的函数。它是非常强有力的武器,但需要非常高超的技巧才能用好它。如果套用人的“学习”概念,它相当于是原始的归纳总结。

和人相比,尽管计算机运算很快,但效率却非常低。小孩可能看了十张猫和狗的照片后就能分辨出下一张照片是猫还是狗,但计算机可能需要花成千上万张照片。

人类的智能远不止归纳总结,还包括逻辑推演、类比、反事实条件分析等等复杂的思维模式,这些在目前的机器学习领域还是非常困难的问题,机器还远远没有达到“智能”的标准。

https://cdn.china-scratch.com/timg/190523/0913164X4-6.jpg

目前的机器学习还有许多被人诟病的地方。比如,深度学习的诠释性很差,像个黑盒子。人们知道它性能很好,但不知道为什么好,而且时不时出现一些低级错误。

另外,机器学习很难构建统一的“常识”,每一个任务都有一套独立的模型,这个模型是为这个特定的任务惊现调试的,稍微有点超纲就不灵了,更不用说沿用到其他领域了。

近十几年机器学习取得了许多惊人的成就,但它只在非常初级的意义上实现了“学习”,离“智能”还差得很远。人类的“学习”是非常引人入胜的行为,人类对此知之甚少。

或许,他山之石可以攻玉,机器学习的进步可以帮助人们反思人类学习的本质,进而让机器学得更好。

https://cdn.china-scratch.com/timg/190523/09131LI8-7.gif

雯心草少儿之家乐高班期待您的到来~

https://cdn.china-scratch.com/timg/190523/09131R348-8.jpg

--end--

声明:本文章由网友投稿作为教育分享用途,如有侵权原作者可通过邮件及时和我们联系删除:freemanzk@qq.com