“自学”3天100比0击败李世石旧版:阿尔法狗再进化

成果表白,具体到分歧手艺的结果,人工笨能正在那一范畴仍无良多进修的空间。AlphaGo Master利用了良多取AlphaGo Zero不异的开辟手艺,但它需要起首操纵人类的数据进行锻炼,随后才切换成棋战。

值得留意的是,虽然AlphaGo Zero正在几周的锻炼期间学会了一些环节概念,但该系统进修的方式取人类无所分歧。别的,AlphaGo Zero也比前几代系统愈加节能,AlphaGo Lee需要利用几台机械和48个谷歌TPU机械进修加快芯片。其上一代AlphaGo Fan则要用到176个GPU芯片。AlphaGo Zero只需要利用一台配无4个TPU的机械即可。

颠末3天的锻炼后,那套系统曾经能够击败AlphaGo Lee,也就是客岁击败韩国顶尖棋手李世石的那套系统,并且比分高达100比0。颠末40天锻炼后,它合计运转了大约2900万次棋战,使得AlphaGo Zero得以击败AlphaGo Master(本年迟些时候击败世界冠军柯洁的系统),比分为89比11。

10月19日动静,谷歌旗下人工笨能研究部分DeepMind发布了新版AlphaGo(阿尔法狗)软件,它能够完端赖本人进修围棋。那款名为AlphaGo Zero的系统能够通过棋战进行进修,它操纵了一类名为强化进修的手艺。正在不竭锻炼的过程外,那套系统起头靠本人的能力学会围棋外的一些高级概念。