深度神经网络训练方法、相关装置、设备和存储介质

深度神经网络训练方法、相关装置、设备和存储介质

技术类型 : 专利

专利所属地 :中国

公开号 :CN202111224883.0

技术成熟度 :正在研发

转让方式 :技术转让

交易价格:面议

应用领域 : 通用仪器仪表制造

技术领域 :科学分析仪器/检测仪器

联系咨询
成果概况
简介
本发明实施例提供了一种深度神经网络训练方法,其包括:S1、对神经网络中预设的第一参数进行设定;S2、启动训练神经网络;S3、获取深度神经网络训练中更新的第二参数;S4、对更新的第二参数是否满足预设条件进行判断:若是,则实施预设的批量大小下降措施,并计算出当前的批量大小;若否,则继续训练神经网络,并计算出当前的批量大小;S5、根据计算出的当前的批量大小继续完成当前回合的训练神经网络;S6、执行S3至S5,直至训练神经网络结束。本发明实施例还提供了一种深度神经网络训练装置、深度神经网络训练设备和计算机可读存储介质。采用本发明的技术方案可以调整噪声、提升泛化能力并所需的硬件资源少。
专利基本信息
专利名称 深度神经网络训练方法、相关装置、设备和存储介质
专利状态 实审 公开号 CN202111224883.0
申请号 CN113935468A 专利申请日期 2021-10-21
专利授权日期 0001-01-01 专利权届满日 -
专利所属地 中国 专利类型 发明
发明人 天津科技大学;深圳市安软科技股份有限公司;
权利人 张传雷,姚敏达,闫潇宁,许能华,李建荣
专利摘要 本发明实施例提供了一种深度神经网络训练方法,其包括:S1、对神经网络中预设的第一参数进行设定;S2、启动训练神经网络;S3、获取深度神经网络训练中更新的第二参数;S4、对更新的第二参数是否满足预设条件进行判断:若是,则实施预设的批量大小下降措施,并计算出当前的批量大小;若否,则继续训练神经网络,并计算出当前的批量大小;S5、根据计算出的当前的批量大小继续完成当前回合的训练神经网络;S6、执行S3至S5,直至训练神经网络结束。本发明实施例还提供了一种深度神经网络训练装置、深度神经网络训练设备和计算机可读存储介质。采用本发明的技术方案可以调整噪声、提升泛化能力并所需的硬件资源少。