OpenAI的最新AI通过观看40,000小时的YouTube来学习玩Minecraft。
该公司专门研究人工智能,开发了一种视频预训练 (VPT) 算法,该算法允许其AI通过观看进行学习。
VPT方法概述
与以前创建Minecraft算法的尝试不同,OpenAI进行游戏时,会与人类在相同的环境中使用相同的鼠标和键盘动作,这使AI技术实现了巨大的飞跃。
开箱即用,AI学会了诸如砍树,制作木板,制作工具和游泳,狩猎,烹饪等动作。
制作工作台所需的物品顺序,并标有熟练的人类到达每一步所需的中位数时间。
经过一些调整,AI最终提高了生产力,并能够学习制造钻石镐,这项技能需要人类玩家游戏大约20分钟并有24000个动作才能完成。
然而,原始素材不足以让人工智能学习。这是因为仅视频只能显示了可以做什么,而不是如何做这件事。
因此,承包商记录并标记了基本的Minecraft技能,以创建另一种算法,该算法通过键盘和鼠标输入提示准确地注释了70,000小时的YouTube素材。
这使得人工智能可以通过观察人类的行为来学习,而不是测试随机的行为,并使用过去和未来的信息来预测所采取的行为。
虽然该团队只使用Minecraft测试了AI,但他们认为游戏的开放性和通用人机界面 (鼠标和键盘) 意味着AI也可以用于一般计算机使用。
如果你想查看更多关于OpenAI学习Minecraft,你可以查看这篇文章。