博客
关于我
OpenAI Gym简介及初级实例
阅读量:333 次
发布时间:2019-03-04

本文共 389 字,大约阅读时间需要 1 分钟。

  • OpenAI

    是一个非营利的人工智能(AI)研究组织,旨在通过促织和发展友好的人工智能,而使人类整体受益。OpenAI成立于2015年底,总部位于旧金山,组织目标是通过与其他机构和研究者的“自由合作”,向公众开放专利和研究成果。创始人伊隆·马斯克以及萨姆奥特曼的动机是出于对普遍的人工智能潜在风险的担忧。

    简单来说,就是钢铁侠奥特曼合作拯救地球的一个小计划。

    OpenAI在机器学习方面关注两个关键点:无监督学习和强化学习

  • Gym

    是OpenAI在2016.5.4发布的研究和比较强化学习算法工具集。

  • 基本教程

    • 基本概念
      1. agent:智能体
      2. environment:环境,gym内包含多种环境
      3. action:行动
      4. state:状态,智体做出一个行动,环境会相应的给出反应,返回一个状态和奖励
      5. reward:奖励,根据游戏规则的得分,对智体的反馈修正其行动。

  • Reference

转载地址:http://jiwr.baihongyu.com/

你可能感兴趣的文章
深度优先遍历(DFS)和广度优先遍历(BFS)
查看>>
LeetCode之二叉树的所有路径(257)、路径总和(112、113、437)、二叉树的直径(543)
查看>>
轮播图——旋转木马(Jquery)
查看>>
普通平衡树板子
查看>>
操作DOM(二):删除节点、、复制节点、替换节点
查看>>
vue(7):表单输入绑定
查看>>
JSP内置对象:操作cookie、session对象
查看>>
【数算-27】多路查找树【了解】
查看>>
【数算-31】【十大常用算法-03】动态规划算法与背包问题
查看>>
【SE-02】多线程-02
查看>>
$set的使用(视图不能实时更新)
查看>>
Spring知识小汇(6)——Bean的自动装配
查看>>
一、硬件防火墙
查看>>
Javaweb jQuery功能练习
查看>>
余生,愿你能靠近那些正能量的人——
查看>>
初学QT
查看>>
IOC容器_Bean管理xml方式
查看>>
python+Aritest自动化—02—app_util.py—app驱动
查看>>
蓝桥杯入门练习题斐波那契数列
查看>>
(Java基础类库 )System类
查看>>