学习笔记（9）- 对话生成：深度强化学习 - 润新知

学习笔记（9）- 对话生成：深度强化学习

对话生成：深度强化学习
Deep Reinforcement Learning for Dialogue Generation

强化学习的目的是：构建状态到行为的函数。

当前状态、动作、奖励（惩罚）函数
相关阅读:
linux常用命令
 chattr无法删除某个文件
 centos如何卸载软件
 linux命令行下的ftp 多文件下载和目录下载
 yum -y upgrade 和 yum -y update 区别
 Pureftpd
centos rar安装
 linux系统数据盘挂载教程
 anyexec
_variant_t
原文地址：https://www.cnblogs.com/xuehuiping/p/12205396.html

Copyright © 2020-2023 润新知