2025年2月25日
星期二
|
欢迎来到鞍山市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
姜雪
作品数:
1
被引量:3
H指数:1
供职机构:
中国工程物理研究院计算机应用研究所
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
梁燕
中国工程物理研究院计算机应用研...
陶以政
中国工程物理研究院计算机应用研...
万正景
中国工程物理研究院计算机应用研...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
语义
1篇
指纹
1篇
文本
1篇
互信息
1篇
基于语义
机构
1篇
中国工程物理...
作者
1篇
万正景
1篇
陶以政
1篇
梁燕
1篇
姜雪
传媒
1篇
电脑知识与技...
年份
1篇
2016
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于语义指纹的海量文本快速相似检测算法研究
被引量:3
2016年
相似检测算法在海量文本信息处理中具有广泛的应用,尤其是Simhash算法因其指纹局部敏感特性、检测效率高在文本查重、网页检测等大规模数据处理中都十分常见。针对传统Simhash算法无法支持近义词、多义词等自然语言处理上的语义问题,通过对现有同义词扩展方案的研究,提出基于语义指纹的相似检测算法。在Simhash算法基础上,融入同义词扩展编码信息,生成文本语义指纹进行匹配检测,以提高文本相似度检测性能。另外,根据文本语义指纹建立多层分段索引,实现在海量文本信息中快速匹配出相似文档。通过与传统的Simhash算法进行实验对比,体现出该方法在准确率、效率等方面的优势。
姜雪
万正景
梁燕
陶以政
关键词:
互信息
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张