
《人工智能》读后感
[《人工智能》读后感]关于机器能否拥有意识这个论题,其实是关于意识的本质的讨论,《人工智能》读后感。
但目前对于意识,人类还没有一个明确的定义。
二元论认为,意识是非物质的思维所具有的属性,而思维跟物质的大脑是相互独立的,机器不可能具有意识,除非它可以得到一个非物质的思维,而这是不可能的,所以,机器永远不可能有意识。
还有一些看法认为思维产生于大脑,大脑是一台数字计算机,而思维是一个计算机程序,这个理论又分为“强人工智慧”与“弱人工智慧”。
根据“强人工智慧”,一台计算机只要有了正确的程序就可以拥有像人类一样的智慧与思维;而“弱人工智慧”理论,则认为计算机可以模拟人的思维,它们可以模拟一系列的思维过程,如思考、决策等。
但是,不管它们做得多么出色,它们都不能创造真正的思维或者真正的意识,而只能做到“看起来像”有意识一样。
意识尚未被定义,我们也没有鉴别意识的手段,所以更谈不上人工意识能否存在了。
与其让这些巨大的难题挡住我们的去路,还不如加紧工作,看看我们究竟能做到什么程度,就像绝大多数机器人学家正在做的那样。
我们几乎可以肯定,更好、更聪明的机器将不断出现,而关于它们是否拥有意识的讨论也会继续下去,对于人工意识的探索最终甚至有可能帮助我们理解意识本身的性质。
抛开这些问题,回到电影本身,斯皮尔伯格的这部电影更多的是将科幻与伦理结合在一起,他对人工智能的未来作了一个深刻且悲观的预言。
“人工智慧”旨在用计算机来模拟思维,从而复制思维,产生智慧行为,那么我们是否可以说计算机或者机器人也会产生同人类一样的情感呢,如果机器拥有人类同等的智慧,人类会不会与机器发生情感、人类与机器人如何相处,这就涉及一些伦理道德等社会性的问题。
影片中,人类对劣等机器人的猎杀充满了不人道。
影片在此表现出一种荒诞的意味:人不像人,机器人才像人,拥有人性情感的他们不会对人类的暴虐熟视无睹,读后感《《人工智能》读后感》。
这场激战在斯皮尔伯格的电影中被两千年的沉睡一笔带过,但结局我们看到了,人类作为一个灭绝的物种被缅怀。
当机器具有了人类的意识和思维,它们会爱,就会恨,会服从,就会反抗。
如果机器人的智慧太高以至于超过了人类的智慧,那么我们就有理由相信它们就很有可能取代人类成为地球的主宰者,人类感受到生存受到威胁后,影片中的行为就不足为奇。
有关于这个忧虑,我从相关书籍中了解到这样一点:“人工智慧不是人的智慧,更不会超过人的智慧”。
“机器思维”同人类思维的本质区别:1.人工智慧纯系无意识的机械的物理的过程,人类智能主要是生理和心理的过程。
2.人工智慧没有社会性。
3.人工智慧没有人类的意识所特有的能动的创造能力。
4.两者总是人脑的思维在前,电脑的功能在后。
如果是这样,那么我的担心就纯属多余了。
目前人类对人的智慧的研究尚且有局限,机器人的智慧程度自然不敢企及,但随着科技的不断发展,会有怎样的奇迹发生我们也无从得知,人工智慧是否能超越人的智慧,现在还是一个遥远的、不可知的问题。
所以,同样不确定的还有影片对未来的预言。
最后一点,正如影片开头告诉我们的那样,人类将会面临越来越严峻的生存环境,臭氧层空洞、温室效应、海平面的上升……谁也不能保证不会有世界末日的那一天,当人类已经无法适应环境,依照达尔文“物竞天择”的理论,被淘汰从而导致灭绝的将会是我们人类自己,而机器人将会因为极强的适应能力从而被环境选择。
假设我们能将记忆和思维植入机器人中,那么机器人是不是就具有了“人类生命的延续者”这一神圣的使命呢
〔《人工智能》读后感〕随文赠言:【这世上的一切都借希望而完成,农夫不会剥下一粒玉米,如果他不曾希望它长成种粒;单身汉不会娶妻,如果他不曾希望有孩子;商人也不会去工作,如果他不曾希望因此而有收益。
】
给我一篇关于电影《人工智能》的观后感吧,500-600字
观人工智能有感今天看了人工智能这部电影。
之前也有看,但是只是不完整的片段,真的不清楚这部片子是讲的什么,今天看过真的很感动,也有意一丝的遗憾。
正是这不算圆满的结局让我百感交集。
似乎每一部描写未来的电影都有一样的情节,人工智能超越了人类,然后努力追求成为人的过程——这其实是天马博士的故事吧。
裘德洛的冒险却不是,但最后过了无数年,到人类都灭绝了,才由外星人用无法理喻的高科技给了他们真正的生命。
那么真正的生命是什么呢
或是生命存在的意义在于哪里呢
小男孩DAVID从被哈比博士制造出来到进入亨利的家,再在到被莫妮卡扔到外面自生自灭,是一个描写关于信任和抛弃的故事。
DAVID经过不可能的艰辛最终找到属于他的蓝仙女,一直看着她2000年,再次醒来看到蓝仙女那一刻无法比拟的惊喜。
是关于坚持和梦想的过程。
小心翼翼的触碰却摧毁了她。
蓝仙女破碎的瞬间是那样令人震撼
我甚至可以感觉到,就像打破了自己小心翼翼珍藏了多年的宝贝那样痛心。
最后外星人帮助DAVID实现了他一直没有实现的愿望。
故事最终定格在了不算太圆满的这刻。
这一切都源于一个字——“爱”
看完整部片子自己也想回到那样的年龄,没有负担的爱,很简单,很平淡。
对梦想的执着,无条件的信任似乎会只会定格在那个年幼的岁月。
也许只有如此单纯的情感才能反衬出成人头脑中荒唐的欲望。
几十年就是我们对人生全部的理解,其实生命的轨迹虽然远离却是不可复制的。
爱,也是唯一的存在,哪怕过了千百年。
对于感情,人类的理解就是依赖,安慰,安全感。
但是对于机器人更过的付出,信任,当然也需要回报。
这可能是导演在小男孩身上赋予了对人类感情的期许吧。
最初的爱恋总是无附加美好且坚定的。
我能理解莫里卡的选择,在最初和代替的选择中谁都会选择前者吧。
人类的自私,残忍相信已经是老生常谈,我不想对此再多说什么。
但是在这部电影中我看到更多的是“爱”“希望”以及坚持所要付出的代价。
我们都希望可以活在个完美的乌邦式的世界,付出和收获等价。
但是现实中往往令我们失望,所以有了代替品—机器人。
但是难道因为他不是真实的所以就不需要回报吗
记得在电影的开始,研究人员提出了一个问题“我们怎么保证他爱的人可以爱他们”。
我与他们都陷入了沉思。
我们不能保证付出的爱可以得到等价回报,但是我们却可以像一样,坚持信仰,不断的努力,爱不可复制,但是可以被唤起。
对爱的理解和寄望。
真的很简单,仅仅是承认和同等特别的存在。
相信也是斯导对爱的注解。
爱。
其实很简单。
《人工智能》观后感怎么写
为《AI》写点什么,很早以前就想过,不是要突增悲哀,只是有些东西,看过便不能忘记。
一如“他的爱是真的,然而,他不是”。
初涉 南北极冰融化,海水淹没城市,气候变幻莫测,饥荒肆虐蔓延……一个正在崩塌的家园,末日一样的未来。
这里,人们越来越依赖于科技,以及自己最杰出的产品——人工智能,它的影子遍及生活的每个角落,从身体发肤到衣食住行,也许,还将到那不可被替代的情感。
科学家们在争论不休,新的Robot将应运而生,他们“超越简单的情感模拟器”,他们将记忆痛学习爱甚至会做梦,他们的感情将永恒不变,而人类,“能对这份爱付出相等的回应吗”
Monica,孤单而悲伤的母亲,不能面对儿子Martin因绝症躺在冷冻箱里将渐渐死去事实,陷于情感崩溃的边缘。
David,11岁,身高4尺6英寸,金发的机器男孩,他的到来是为了抚平年轻母亲的伤痛。
小小身影逆光走进Monica的家门,迈下第一步台阶,翘起脚尖轻轻敲着地板,然后转过身说“I like your floor”,一个有双清澄蓝眼睛的小男孩冲她坦诚地微笑。
惊惧,Monica无法接受这种情感的替代,却为一个如此真实的孩子而疑惑,丈夫Henry说“A made child”,“这是一次普通的免费使用,一个极好的向公司表现的机会”。
理智与感情的矛盾,也许在那一刻已注定了David在这个家庭里的最终命运。
爱的体验 孩子,爱也盼被爱的孩子,人工智能赋予David不可变更的身份。
“登陆注册之后,机器小孩的爱将被密封储存,永远成为他的的一部分,……即使被收养的父母遗弃,亦不再出售”,唯一的结局是销毁,爱的前提是残酷。
David对世界最初体验的源于好奇,照片里的另一个男孩是谁
Monica早晨喝的黑色液体是什么
被关到壁橱里是一个游戏吗
然后开始模仿,找出卫生间里的Monica,以为这也是捉迷藏;一本一眼地学父母餐桌上的动作,再因Monica嘴角的面条大笑。
这是他最简单的情感表达,同初生宝宝的第一次微笑一样,将消逝已久的快乐再次带回了Monica与Henry身边。
从开始的拒绝、排斥,到隔着雕花玻璃门的观察,再到愿意哄这个永远睡不着的孩子入睡,Monica的理智在瓦解,她只知道她需要这个孩子,而David单纯眼睛里,看不见的是,在Monica心底儿子Martin那沉睡的脸。
清晨的阳光里,七道程序启动的指令,一声“Mommy”来得毫无防备,David蜷入Monica的怀中,她的爱从此由他来承担,而他新的人生是否真正能走进她的世界
如果故事就此打住,可能平淡却会很幸福,但那不是导演的本意,快乐易逝,悲哀却总难遗忘,也许意义的深刻才会由此而生。
寻找梦想 去舞会之前,Monica对David的关心让Henry提醒她说“It’s a toy”。
David调皮打翻了Monica的香水,看着空空的香水瓶,此时Monica才开始重新思考David在她心中的位置。
“妈妈,你会死吗
” “有一天会。
” “那我会孤单。
……你会活多久呢
” “50年吧。
” “我希望你永远不要死……” Monica取出了Teddy——机器小熊,“Teddy是一件超级玩具,相信你们可以好好相互照顾。
”无尽的爱对有限的有机生命太过沉重,还是交付给相同机械体吧。
Teddy抗议说“我不是玩具”,可David听不到,他只疑惑50年究竟是一段多长的时间。
Martin病愈归来,序曲结束,Monica说“世界上最好的事发生了”,而David的悲剧才刚刚拉开帷幕。
疑虑,“你的生日是哪一天
”“什么是你第一个记得的
”Martin的问题突如其来,不断强调David不是真的小孩。
嫉妒,与Martin比吃菠菜,半夜偷剪母亲的头发,在她讲给Martin的睡前故事里露出笑容,只因为他如此渴望母亲的爱,而成为real boy是他唯一心愿。
故障维修时,David对握住他手的Monica说“妈妈,我不痛”;面对愤怒的Henry说“我只是想让妈妈爱我更多”。
而Monica开始心慌,她的爱在动摇,即使她不断说服自己“这只是普通男孩间的挑战,他只是在游戏中犯了错误”,但面对Henry的“他不是人类,……他被制造用来爱人,而这也能解读他的恨”,她无力反驳。
Martin的生日会上,David终于犯下不可挽回的错误。
害怕,与希望得到保护,让他抱着Martin跌入泳池。
人们救起Martin,却将David遗忘在池底,从蓝眼睛里看池水外的世界,不知道他能否明白,其实那里他从没有真正走入。
Monica为David无法预知的行为感到恐惧,人类情感的复杂,让她无从判断机器孩子最简单的心愿,“Dear mommy, I love you and Henry, and the sun is shinning, ……I’m your little boy, and so is Martin but not Teddy。
”他其实只想做你真正的小孩,得到你他相同的爱与关怀。
David欢天喜地地踏上了与Monica去“野餐”的旅途,在Monica的眼泪中感到隐隐的不安,然后执着坚持关于被抛弃“Is it a game
”,Monica将David推跌树下,留下的只是嘱咐他“远离人群,与同类一起才会安全”,和一句“Sorry,我没有告诉你关于这个世界”。
学会爱却给了悲伤,学会了笑却没有眼泪。
母亲为什么离去
是因为不是real child吗
找到将皮诺曹变成人类孩子的蓝仙女,成为真正的小孩,David带着Teddy开始寻找自己的梦想。
自我成长 David遇见的第一群人,应该是机器人,型号过时,功能不全的机器人,在一堆残骸间寻找下颌、断肢、以及眼球,形貌甚是恐怖。
然后是机械猎人,黑衣上的荧光令他们在夜间看起来像驾着摩托飞驰的骷髅。
然而这些远不及机械屠宰场的可怕,那里人类对机械的仇恨在极致中沸腾,他们因机器人被支离破碎而欢呼,看机器人被腐蚀熔化而疯狂。
其实,在这里,人比机器恐怖。
因为需要,他们制造机器人,又因为机器人的存在,他们看到自身不足,并为之感到不安,害怕被替代而猜忌,于是将其视作危险的竞争对手,最大限度的与之敌对,成人世界里潜藏的利己主义和残忍暴虐,在电影中,在对机器人的屠杀中,被戏剧化地放大了。
在这群机器人中,David是特殊的,因为之前“从未有人制造机器孩子”,他诞生的意图是特殊的,他有人类孩子的一切特质,并“有人为他倾注了爱心”,难怪疯狂的观众也要为他向屠宰场老板扔出石头,而屠宰场的工作人员也要惊奇说“David,你是独一无二的”。
所以,尽管经历了诸多恐惧、无助并眼见了人类对机器人的残酷,David仍执着于自己的梦想,并坚信他的存在是“独特”的,而这种认定也许正是同人类一样对自我存在的肯定。
为找到能实现心愿的蓝仙女,同机器情人Joe一起,David来到了胭脂城,这里夜总会、俱乐部遍布,流光溢彩的城市是Joe诞生舞台。
他们找到“万事通”博士,一部信息百科全书,David想知道蓝仙女怎样能把机器人变成真正的小孩,它告诉他们Allen Hobby的书中有这种神奇力量,而童话中的蓝仙女在世界尽头的失落之城——曼哈顿。
影片中的国际都市,曼哈顿,不可避免的陷在无边海水之中,水面残存的断壁残垣述说着人类文明曾有的进步与辉煌。
在这里等待David的是他的制造者Allen Hobby,还有,一个一模一样的自己。
David的自我信念开始崩溃,演化为要毁灭另一个自己的暴力;进而又遭到Hobby的另一重打击,“……在此之前,机器人不会有梦想,没有自主意识,……你是一个成功的典范,……我的儿子才是唯一的……”;然后发现一片尚未出厂的机器孩子,在原型模板的眼中看见自己人生的最初记忆——工厂的标志。
想爱却遭抛弃,寻找梦想只是一个童话,而自己的存在亦不能得到承认,真正的孤独与绝望,“妈妈”,带着来自心底最深的呼唤与渴望,David义无反顾地坠入茫茫汪洋…… Joe被警察带走了,对获救的David说,“有一天当你变成真人,记得向女孩们提起我,我存在,我曾经存在。
” 在水下,在蓝仙女的雕像前,David祈祷千年,灯灭冰封,沧海桑田…… 记得很久以前,在前往胭脂城的途中,Joe问“蓝仙女是女的,还是男的
”David说“女的。
”Joe愉快地说,“我了解女人,……蓝色对人类代表忧郁,而我能令所有女人面红耳赤,……世界上所有的愿望都能实现……”机器人的悲剧早已注定,他们的存在价值只来自需要他们的人对他们承认和肯定,所以,David“上穷碧落下黄泉”所找寻的爱与梦想注定不会有结果,他的心愿只有让异星生命来实现。
其实,这也只是导演与观众浪漫的寄情,正如影片中所说: Come away O human child To the water and the wild With a fairy hand in hand, For the world’s more full of weeping Than you can understand. 注:影片最后出现的其实并不是异星生命,而是2000年后的机器人。
预示着人类已在未来的天灾中消亡,而在冰封的地球上,存活下来的智能“生物”,只有之前被人类仇恨与怀疑的机器人。
看了人工智能你有何感想?
早在一前就看了这部电影,当时是被了,但直都静不下心来写一写心中的感体悟,直到今天,突然觉得心绪平静了,所以才想要把观后感写出来,留做纪念。
其实在几年前就听说过这部电影,但是一直不想看,原因是这个电影的名字。
我也曾查过其内容简介,隐约记得有机器人小孩被人类母亲抛弃的情节,所以我固执的认为,这个故事就是从一个人类母亲领养机器人小孩开始,刚开始母亲无法从心里接受这个孩子,但经过长时间的接触,母亲已经完全认同了机器人小孩,可是又由于某种逼不得已的原因要将小孩抛弃。
所以呢,没看电影之前,我已经认为电影就是要以母亲抛弃小孩为结局,来拷问人类的心灵,人类能否对机器人产生感情,人类抛弃有感情的机器人是否有道德过失。
但是,当我看完电影之后,我明白了,这部电影的编剧比我想象的高明的多,之前我设想的电影结尾,只能算是这部电影的开始,真正的故事发生在机器人小孩被抛弃之后。
故事中机器人小孩叫做大卫,同他一起被人类母亲抛弃的还有一只叫做泰迪的小熊,一个拥有低级人工智能的玩偶。
大卫知道他为什么被抛弃,是因为他不是真的小孩,所以他就一心想找到蓝仙女,想让她把自己变成一个真正的小孩。
大卫不知道,人类的童话是虚构的,只是人类美好的幻想,童话中将木偶人匹诺曹变成真人的蓝仙女在现实中是不存在的。
所以,他心里对母亲的爱让他千辛万苦历尽磨难,他的目的只有一个,变成真小孩,回到他曾经的家,回到母亲的身边。
当然,如果单单是一个简单的小蝌蚪找妈妈的故事,顶多会让我感动,却不能让我震撼。
正是大卫在寻找蓝仙女的过程中经历的种种事情,将故事要表达的思想“残忍”的呈现出来。
说“残忍”,是因为那里真的有很多残忍的镜头,或直接的或委婉的放在观众眼前。
残忍镜头一 :大卫和另一个逃亡的机器人乔被抓到一个露天体育场,或者可以说是一个修罗场,那里正上演着一幕幕疯狂的杀戮游戏,那是疯狂的人类在杀戮机器人。
看到许多奇形怪状残缺不全的机器人被用各种方式杀死,虽然没有一丝的血腥,但却让我发呕。
我想到了人类之间的杀戮,就像这里人类把机器人当作异己残忍杀害一样,我们人类的历史上,过去现在未来,又发生过多少次比这要残忍百倍的排除异己的疯狂杀戮呢
杀戮场上打着强烈的白光,这种形式的灯光往往象征着躁动、不安,这里更深了一层,像是毁灭一切的力量,像是世界末日的迷幻疯狂。
看到这里我又想到,人类残杀机器人的原因究竟是什么
是担心人工智能胜过人类吗
表面上看起来似乎如此。
但我又发现,同样是人工智能,泰迪小熊却不是人类的毁灭对象,虽然它自己从不承认自己是一个玩偶,或者说,人类对于非人类外形的人工智能视而不见。
所以,他们对于机器人的仇视,大抵是因为“人”,而非“智能”。
就像很多的政治斗争一样,同一领域内,可能超越自己的人都是敌人,都要毁灭。
而对于其他领域的,对自己完全没有威胁的,即使再优秀,也可以置之不理。
残忍镜头二 :大卫和乔逃出杀戮场,在一片光影斑驳的树林中前行,泰迪小熊说他看到了月亮,但两人一熊却实在看不出那是真月亮还是假月亮,而假月亮正是捕杀机器人的飞行器的外观。
本来大卫要朝着那个方向走的,虽然天空挂着的明月清澈明亮,但他却不敢走下去,返身朝另一个方向走去。
月亮往往是美好梦想的象征,想想《E.T.》结尾时那明亮的月光,是多么的美丽寂静,但到了这里,那美丽的圆月反而成了恐惧的象征。
这是大卫对于前路的迷茫和对通向梦想的道路的恐惧。
残忍镜头三 :在曼哈顿水下,沉入海底的游乐园中,大卫对着木偶蓝仙女许愿。
他一次一次絮絮叨叨,念着不可能实现的梦想,却又虔诚的相信,那是怎样的悲哀
镜头语言残忍的将一个假的希望放到大卫面前,又把这份悲哀和无奈放到观众眼前。
而残忍的还不止这个,当你看到我们现实世界中辉煌的曼哈顿在电影中满目疮痍浸泡在海水之中的样子时,心里会做何感想。
那虽是人类历史辉煌的见证,却也是人类文明的湮灭的表象,而造成这一切的恰恰是人类自己。
这算是导演对于人类肆意破坏地球环境导致的后果的一种极端表现吧。
残忍镜头四 :两千年后,大卫被外星人从冰冻中救醒过来,他一觉醒来,发现自己回到了原来的家里,于是他呼喊着妈妈,激动地四处寻找母亲。
本来我以为,导演安排了神通广大的外星人出现,就是要给大卫一个完美的结局。
可是,大卫还是变不成真小孩,外星人给克隆出来的母亲从时间轨道里找回记忆,而她却只能存活一天。
电影改编自短篇小说《去年夏天的超级玩具》,本是库布里克想要完成的电影,但却在心愿未了之时撒手人寰,于是好友斯皮尔博格就代为完成了这部作品。
以库布里克的风格来看,电影会在大卫对着蓝仙女的塑像许愿时结束,但斯皮尔博格却给加了一个两千年后的结局。
有人说是狗尾续貂,给了一部悲剧一个好的结局。
但我觉得这实在是斯皮尔博格不想对主人公大卫太残忍,给他一个实现梦想的机会,与母亲快乐的生活在一起,哪怕只有一天时间。
《人工智能》从大卫的“诞生”到“灭亡”,确确实实剖析了人的本性,人的欲望,人的情绪,幸福、失落、悲伤、恐惧、迷惘、憧憬、追寻,发生在大卫身上的种种人性的变化,在我们每个人身上又何尝没有过
《人工智能》是一部很深刻的电影,一部令人震撼的电影。
人工智能对未来的影响200字
人工智能在创造原理上,首先会考虑模拟人类使用矛盾对立,互为参照的模式为思想基础来认识世界,感知事物,酝酿爱恨情仇.如果这样,他们会依据自己对世界的理解,经验形成的人生观来改造世界, 人工智能的发展将会影响未来的军事作战方式,比如对无人作战平台的影响。
有了人工智能技术,无人作战平台系统的智能化水平更高,平台上的无人作战飞机、无人反潜战或反雷战潜水器和无人战车等武器既可以被作战人员远程遥控操作,也可以让武器按预编程序自主运作,并能要求武器系统在短时间内对威胁情况、打击手段、打击效果进行分析和判断,进而全面提升无人作战平台系统的智能化水平。
无人作战平台的人工智能技术在复杂局面下的应变和决策能力还有待提升“比如,在一个军事威胁出现后,突然又出现了一个民用目标,在这种情况下,该如何判断威胁和决策打击?这个时候就需要人运用道德、情感和纪律等各种手段进行综合判断和决策,而在这方面人工智能技术与人类的智慧还有一定的距离。
军事领域的人工智能技术既有优势,也有不足。
以无人作战平台为例,其最佳作战方式就是将人工智能与人的判断与决策相结合,这要求在各种军事指挥系统中,人类要有对人工智能技术的否决权,并拥有最终的军事决策权,而不是完全交由人工智能技术来决定。
电影《人工智能》观后感怎样写
AlphaGo这个系统主要由几个部分组成:走棋网络(Policy Network),给定当前局面,预测\\\/采样下一步的走棋。
快速走子(Fast rollout),目标和1一样,但在适当牺牲走棋质量的条件下,速度要比1快1000倍。
估值网络(Value Network),给定当前局面,估计是白胜还是黑胜。
蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),把以上这三个部分连起来,形成一个完整的系统。
我们的DarkForest和AlphaGo同样是用4搭建的系统。
DarkForest较AlphaGo而言,在训练时加强了1,而少了2和3,然后以开源软件Pachi的缺省策略 (default policy)部分替代了2的功能。
以下介绍下各部分。
1、走棋网络走棋网络把当前局面作为输入,预测\\\/采样下一步的走棋。
它的预测不只给出最强的一手,而是对棋盘上所有可能的下一着给一个分数。
棋盘上有361个点,它就给出361个数,好招的分数比坏招要高。
DarkForest在这部分有创新,通过在训练时预测三步而非一步,提高了策略输出的质量,和他们在使用增强学习进行自我对局后得到的走棋网络(RL network)的效果相当。
当然,他们并没有在最后的系统中使用增强学习后的网络,而是用了直接通过训练学习到的网络(SL network),理由是RL network输出的走棋缺乏变化,对搜索不利。
有意思的是在AlphaGo为了速度上的考虑,只用了宽度为192的网络,而并没有使用最好的宽度为384的网络(见图2(a)),所以要是GPU更快一点(或者更多一点),AlphaGo肯定是会变得更强的。
所谓的0.1秒走一步,就是纯粹用这样的网络,下出有最高置信度的合法着法。
这种做法一点也没有做搜索,但是大局观非常强,不会陷入局部战斗中,说它建模了“棋感”一点也没有错。
我们把DarkForest的走棋网络直接放上KGS就有3d的水平,让所有人都惊叹了下。
可以说,这一波围棋AI的突破,主要得益于走棋网络的突破。
这个在以前是不可想像的,以前用的是基于规则,或者基于局部形状再加上简单线性分类器训练的走子生成法,需要慢慢调参数年,才有进步。
当然,只用走棋网络问题也很多,就我们在DarkForest上看到的来说,会不顾大小无谓争劫,会无谓脱先,不顾局部死活,对杀出错,等等。
有点像高手不经认真思考的随手棋。
因为走棋网络没有价值判断功能,只是凭“直觉”在下棋,只有在加了搜索之后,电脑才有价值判断的能力。
2、快速走子那有了走棋网络,为什么还要做快速走子呢
有两个原因,首先走棋网络的运行速度是比较慢的,AlphaGo说是3毫秒,我们这里也差不多,而快速走子能做到几微秒级别,差了1000倍。
所以在走棋网络没有返回的时候让CPU不闲着先搜索起来是很重要的,等到网络返回更好的着法后,再更新对应的着法信息。
其次,快速走子可以用来评估盘面。
由于天文数字般的可能局面数,围棋的搜索是毫无希望走到底的,搜索到一定程度就要对现有局面做个估分。
在没有估值网络的时候,不像国象可以通过算棋子的分数来对盘面做比较精确的估值,围棋盘面的估计得要通过模拟走子来进行,从当前盘面一路走到底,不考虑岔路地算出胜负,然后把胜负值作为当前盘面价值的一个估计。
这里有个需要权衡的地方:在同等时间下,模拟走子的质量高,单次估值精度高但走子速度慢;模拟走子速度快乃至使用随机走子,虽然单次估值精度低,但可以多模拟几次算平均值,效果未必不好。
所以说,如果有一个质量高又速度快的走子策略,那对于棋力的提高是非常有帮助的。
为了达到这个目标,神经网络的模型就显得太慢,还是要用传统的局部特征匹配(local pattern matching)加线性回归(logistic regression)的方法,这办法虽然不新但非常好使,几乎所有的广告推荐,竞价排名,新闻排序,都是用的它。
与更为传统的基于规则的方案相比,它在吸纳了众多高手对局之后就具备了用梯度下降法自动调参的能力,所以性能提高起来会更快更省心。
AlphaGo用这个办法达到了2微秒的走子速度和24.2%的走子准确率。
24.2%的意思是说它的最好预测和围棋高手的下子有0.242的概率是重合的,相比之下,走棋网络在GPU上用2毫秒能达到57%的准确率。
这里,我们就看到了走子速度和精度的权衡。
和训练深度学习模型不同,快速走子用到了局部特征匹配,自然需要一些围棋的领域知识来选择局部特征。
对此AlphaGo只提供了局部特征的数目(见Extended Table 4),而没有说明特征的具体细节。
我最近也实验了他们的办法,达到了25.1%的准确率和4-5微秒的走子速度,然而全系统整合下来并没有复现他们的水平。
我感觉上24.2%并不能完全概括他们快速走子的棋力,因为只要走错关键的一步,局面判断就完全错误了;而图2(b)更能体现他们快速走子对盘面形势估计的精确度,要能达到他们图2(b)这样的水准,比简单地匹配24.2%要做更多的工作,而他们并未在文章中强调这一点。
在AlphaGo有了快速走子之后,不需要走棋网络和估值网络,不借助任何深度学习和GPU的帮助,不使用增强学习,在单机上就已经达到了3d的水平(见Extended Table 7倒数第二行),这是相当厉害的了。
任何使用传统方法在单机上达到这个水平的围棋程序,都需要花费数年的时间。
在AlphaGo之前,Aja Huang曾经自己写过非常不错的围棋程序,在这方面相信是有很多的积累的。
3、估值网络AlphaGo的估值网络可以说是锦上添花的部分,从Fig 2(b)和Extended Table 7来看,没有它AlphaGo也不会变得太弱,至少还是会在7d-8d的水平。
少了估值网络,等级分少了480分,但是少了走棋网络,等级分就会少掉800至1000分。
特别有意思的是,如果只用估值网络来评估局面(2177),那其效果还不及只用快速走子(2416),只有将两个合起来才有更大的提高。
我的猜测是,估值网络和快速走子对盘面估计是互补的,在棋局一开始时,大家下得比较和气,估值网络会比较重要;但在有复杂的死活或是对杀时,通过快速走子来估计盘面就变得更重要了。
考虑到估值网络是整个系统中最难训练的部分(需要三千万局自我对局),我猜测它是最晚做出来并且最有可能能进一步提高的。
关于估值网络训练数据的生成,值得注意的是文章中的附录小字部分。
与走棋网络不同,每一盘棋只取一个样本来训练以避免过拟合,不然对同一对局而言输入稍有不同而输出都相同,对训练是非常不利的。
这就是为什么需要三千万局,而非三千万个盘面的原因。
对于每局自我对局,取样本是很有讲究的,先用SL network保证走棋的多样性,然后随机走子,取盘面,然后用更精确的RL network走到底以得到最正确的胜负估计。
当然这样做的效果比用单一网络相比好多少,我不好说。
一个让我吃惊的地方是,他们完全没有做任何局部死活\\\/对杀分析,纯粹是用暴力训练法训练出一个相当不错的估值网络。
这在一定程度上说明深度卷积网络(DCNN)有自动将问题分解成子问题,并分别解决的能力。
另外,我猜测他们在取训练样本时,判定最终胜负用的是中国规则。
所以说三月和李世石对局的时候也要求用中国规则,不然如果换成别的规则,就需要重新训练估值网络(虽然我估计结果差距不会太大)。
至于为什么一开始就用的中国规则,我的猜测是编程非常方便(我在写DarkForest的时候也是这样觉得的)。
4、蒙特卡罗树搜索这部分基本用的是传统方法,没有太多可以评论的,他们用的是带先验的UCT,即先考虑DCNN认为比较好的着法,然后等到每个着法探索次数多了,选择更相信探索得来的胜率值。
而DarkForest则直接选了DCNN推荐的前3或是前5的着法进行搜索。
我初步试验下来效果差不多,当然他们的办法更灵活些,在允许使用大量搜索次数的情况下,他们的办法可以找到一些DCNN认为不好但却对局面至关重要的着法。
一个有趣的地方是在每次搜索到叶子节点时,没有立即展开叶子节点,而是等到访问次数到达一定数目(40)才展开,这样避免产生太多的分支,分散搜索的注意力,也能节省GPU的宝贵资源,同时在展开时,对叶节点的盘面估值会更准确些。
除此之外,他们也用了一些技巧,以在搜索一开始时,避免多个线程同时搜索一路变化,这部分我们在DarkForest中也注意到了,并且做了改进。
5、总结总的来说,这整篇文章是一个系统性的工作,而不是一两个小点有了突破就能达到的胜利。
在成功背后,是作者们,特别是两位第一作者David Silver和Aja Huang,在博士阶段及毕业以后五年以上的积累,非一朝一夕所能完成的。
他们能做出AlphaGo并享有现在的荣誉,是实至名归的。
从以上分析也可以看出,与之前的围棋系统相比,AlphaGo较少依赖围棋的领域知识,但还远未达到通用系统的程度。
职业棋手可以在看过了寥寥几局之后明白对手的风格并采取相应策略,一位资深游戏玩家也可以在玩一个新游戏几次后很快上手,但到目前为止,人工智能系统要达到人类水平,还是需要大量样本的训练的。
可以说,没有千年来众多棋手在围棋上的积累,就没有围棋AI的今天。



