一种网络在线话题大数据检测方法

一种网络在线话题大数据检测方法

技术类型 : 专利

专利所属地 :中国

公开号 :CN201711489608.5

技术成熟度 :正在研发

转让方式 :技术转让

交易价格:面议

应用领域 : 自然科学研究和试验发展

技术领域 :网络应用技术

联系咨询
成果概况
简介
本发明涉及一种网络在线话题大数据检测方法,其主要技术特点:大数据网络文本在线爬取;提取文本特征和表达;使用Single#Pass聚类算法,选取多个相似度因子,进行话题检测。本发明设计合理,其在现有Single#Pass算法的基础上,通过分析文本特点,采用多相似度计算方法,通过赋予不同权重因子的取值,加权组合获得到文本的相似度,能够使用漏检率、误检率以及耗费函数值上均有所下降,聚类效果明显改善。
专利基本信息
专利名称 一种网络在线话题大数据检测方法
专利状态 授权 公开号 CN201711489608.5
申请号 CN108197259A 专利申请日期 2017-12-30
专利授权日期 2024-03-05 专利权届满日 2044-03-05
专利所属地 中国 专利类型 发明
发明人 天津科技大学
权利人 马永军, 柴梦瑶, 刘洋
专利摘要 本发明涉及一种网络在线话题大数据检测方法,其主要技术特点:大数据网络文本在线爬取;提取文本特征和表达;使用Single#Pass聚类算法,选取多个相似度因子,进行话题检测。本发明设计合理,其在现有Single#Pass算法的基础上,通过分析文本特点,采用多相似度计算方法,通过赋予不同权重因子的取值,加权组合获得到文本的相似度,能够使用漏检率、误检率以及耗费函数值上均有所下降,聚类效果明显改善。