2025年8月6日
星期三
|
欢迎来到鞍山市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
徐凯
作品数:
1
被引量:0
H指数:0
供职机构:
江西农业大学计算机与信息工程学院
更多>>
发文基金:
国家自然科学基金
国家科技支撑计划
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
沙瀛
中国科学院信息工程研究所
王晓岩
中国科学院信息工程研究所
李阳
中国科学院计算技术研究所
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
TWITTE...
机构
1篇
中国科学院
1篇
江西农业大学
作者
1篇
李阳
1篇
王晓岩
1篇
沙瀛
1篇
徐凯
传媒
1篇
计算机工程与...
年份
1篇
2014
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
Twitter中重复消息的分析和处理
2014年
Twitter已经成为微博中的代表性应用,但是通过分析发现twitter上的消息(推文)有很多完全一致或相似,这对后续对推文的分析和存储都带来很大的问题。为了处理这些内容完全一致或相似的消息(推文),针对推文特有的短文本的特点,基于规则处理完全一致的推文,采用simhash的方法来处理相似性的推文。实验采用实际抓取的240万条推文数据进行分析和处理,分别对中文和英文的推文重复情况进行了分析,实验结果发现重复的推文占总推文的10%左右。
徐凯
沙瀛
李阳
单既喜
王晓岩
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张