一种具有自适应能力的高效强化学习策略模型

一种具有自适应能力的高效强化学习策略模型

技术类型 : 专利

专利所属地 :中国

公开号 :CN201910410197.9

技术成熟度 :正在研发

转让方式 :技术转让

交易价格:面议

应用领域 : 学前教育

技术领域 :集成电路设计技术

联系咨询
成果概况
简介
在传统的策略搜索强化学习方法中,为了快速得到有效的策略,策略模型一般都是为特定任务专门设定的低维空间策略模型,而这种策略模型在实际应用表现力十分有限,泛化能力差,很难适应其他的任务。根据以上问题,本发明提出一种具有自适应能力的高效强化学习策略模型,所提出的策略模型以感知状态的低维表示及智能体对自身行动所引发的环境变化的预测作为策略的输入。这种策略所建立的策略模型具有较高的泛化能力,即使任务发生了细微变化,智能体仍然能够根据自身对未来的预测进行自适应地调整策略,从而得到泛化能力强的高效策略。
专利基本信息
专利名称 一种具有自适应能力的高效强化学习策略模型
专利状态 其他 公开号 CN201910410197.9
申请号 CN111950690A 专利申请日期 2019-05-15
专利授权日期 0001-01-01 专利权届满日 -
专利所属地 中国 专利类型 实用新型
发明人 天津科技大学
权利人 赵婷婷,韩雅杰,杨巨成,陈亚瑞,任德华,王嫄
专利摘要 在传统的策略搜索强化学习方法中,为了快速得到有效的策略,策略模型一般都是为特定任务专门设定的低维空间策略模型,而这种策略模型在实际应用表现力十分有限,泛化能力差,很难适应其他的任务。根据以上问题,本发明提出一种具有自适应能力的高效强化学习策略模型,所提出的策略模型以感知状态的低维表示及智能体对自身行动所引发的环境变化的预测作为策略的输入。这种策略所建立的策略模型具有较高的泛化能力,即使任务发生了细微变化,智能体仍然能够根据自身对未来的预测进行自适应地调整策略,从而得到泛化能力强的高效策略。