加入收藏 | 设为首页 | 会员中心 | 我要投稿 平顶山站长网 (https://www.0375zz.cn/)- 分布式云、数据处理、媒体处理、图像分析、基础存储!
当前位置: 首页 > 站长资讯 > 动态 > 正文

正式提案将泛型特性加入 Go 语言

发布时间:2021-01-29 17:21:04 所属栏目:动态 来源:互联网
导读:我们设计了基于强化学习(利用 CNN+A2C)和蒙特卡洛树搜索(MCTS)的算法来解决这个问题。其中一个难点是并行 MCTS 算法。因为有多个 worker 在同时执行选择(selection)-扩展(expansion)-仿真(simulation)-反向传播过程(backpropagation),某一个 worker 在进行

我们设计了基于强化学习(利用 CNN+A2C)和蒙特卡洛树搜索(MCTS)的算法来解决这个问题。其中一个难点是并行 MCTS 算法。因为有多个 worker 在同时执行选择(selection)->扩展(expansion)->仿真(simulation)->反向传播过程(backpropagation),某一个 worker 在进行选择的时候,其他 worker 未结束的仿真结果是无法获取的,这导致大量 worker 只能看到过时且类似的信息,严重影响了搜索树选择节点的好坏,破坏了串行状态下的探索 - 利用平衡(exploration-exploitation balance)。

为解决这一问题,我们提出了 WU-UCT 算法(Watch the Unobserved in UCT)。这个算法借用了异步并行算法的思想,其核心在于维护一个额外的统计量用于记录每个节点上有多少个正在对其进行仿真的 worker,并用其对选择算法进行调整。此外,我们使用了主 - 从工作模式的系统。由主进程维护一个完整的搜索树,并进行选择和反向传播操作。同时,主进程负责将扩展和仿真的任务分配给对应的子进程,由子进程完成后将结果返还主进程。这样做的好处在于很好地保证了统计信息对于每次选择都是完整的,同时避免了进程间共享内存和访问冲突等问题。

最终,我们用以上方法训练的 AI,对超过 1000 关进行自动难度验证,以用户实测的通关率为标准,我们的 AI 难度评估系统的误差在 8.6% 以内。在 WU-UCT 的帮助下,我们的系统可以准确地预测某一关卡上线后玩家的预期通关率,为关卡设计师提供了很好的指导,达到了不需要人工测试即可得到反馈,大幅降低了开发成本,也改变游戏制作方式。另外,我们也把这项工作总结成论文发表在 ICLR2020[1] 并被大会选为 Oral 报告论文。

自动关卡生成

当我们通过 AI 解决了给定关卡难度自动评测的问题后,一个自然的需求是能否连关卡生成也自动化?于是我们在快手自研的《爱游斗地主》上的残局玩法做开始了新的尝试。
 

区块链是密码等信息技术的融合创新

据霍炜介绍,区块链创新应用了密码学、对等网络、共识机制、智能合约等多种技术,构造出有别于单一信任主体的多信任主体应用环境下的新型数据组织管理解决方案,其实质是基于密码学原理的分布式账本技术。狭义来讲,区块链是一种按照时间顺序将数据区块以链条方式组合成的特定数据结构,以密码学方式保证数据不可篡改和不可伪造。广义来讲,区块链是利用加密链式区块结构来验证与存储数据、利用分布式节点共识算法生成和更新数据、利用自动化脚本代码编程和操作数据的一种去中心化基础架构与分布式计算范式,是一种分布式的基础架构和计算规则。

霍炜说,区块链创新构造了一个实用化的分布式信任模式,提供在弱中心/多中心下的账本共识信任基点,在需要多方协商共识的业务场景中具有特殊应用价值。区块链基于共识机制对外提供真实可信的存储与计算服务,正从“以数字加密货币为特征”向“以通用的数据存储及处理为特征”演化,是未来可能的大数据存储和算法自动执行平台,是可能的新一代互联网体系架构的核心技术与基础设施。区块链将是网络世界的认知革命,促使我们思考如何去创建交易、存储数据和交换资产。

当前,国家已将区块链纳入新型信息基础设施建设,区块链技术应用和产业融合正处于快速发展阶段。清华大学计算机科学与技术系霍炜博士对记者表示,我国在区块链核心技术方面与发达国家还有一定差距,基于自主密码和自主代码的区块链平台研发与应用还较为欠缺。密码是区块链的核心技术和基础支撑,为保障区块链在各领域的安全有序应用,必须依法依规加强区块链密码应用管理,积极推动区块链密码自主创新,夯实筑牢区块链的安全基石和信任纽带。

(编辑:平顶山站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读