利用交叉验证进行评定数据标注结果的方法

利用交叉验证进行评定数据标注结果的方法

技术类型 : 专利

专利所属地 :中国

公开号 :CN201910400742.6

技术成熟度 :正在研发

转让方式 :技术转让

交易价格:面议

应用领域 : 通用仪器仪表制造

技术领域 :其他

联系咨询
成果概况
简介
本发明涉及一种基于交叉验证(Cross Validation)原理的众包数据标注模型。主要步骤包括:平台对标注员和标注数据以及数据类别进行分类、经由标注员标注数据、继而其标注结果与相同标注数据的不同标注结果进行集中交叉验证来检验标注结果并且选择最优、最优标注结果的标注员将获得报酬。通过标注员之间多次的交叉验证大大的提高了标注数据的准确性和可用性,更有利于降低数据训练过程中由数据拟合程度低、数据准确度低而引起的误差。标注与验证都在平台内部进行而无需其他数据专家来对数据标注结果进行评定,大大降低了获取精确数据的成本。
专利基本信息
专利名称 利用交叉验证进行评定数据标注结果的方法
专利状态 实审 公开号 CN201910400742.6
申请号 CN111950732A 专利申请日期 2019-05-14
专利授权日期 0001-01-01 专利权届满日 -
专利所属地 中国 专利类型 发明
发明人 天津科技大学;
权利人 李孝忠,王瑞睿,王立凡
专利摘要 本发明涉及一种基于交叉验证(Cross Validation)原理的众包数据标注模型。主要步骤包括:平台对标注员和标注数据以及数据类别进行分类、经由标注员标注数据、继而其标注结果与相同标注数据的不同标注结果进行集中交叉验证来检验标注结果并且选择最优、最优标注结果的标注员将获得报酬。通过标注员之间多次的交叉验证大大的提高了标注数据的准确性和可用性,更有利于降低数据训练过程中由数据拟合程度低、数据准确度低而引起的误差。标注与验证都在平台内部进行而无需其他数据专家来对数据标注结果进行评定,大大降低了获取精确数据的成本。