王荣波
作品数: 64被引量:223H指数:8
  • 所属机构:杭州电子科技大学
  • 所在地区:浙江省 杭州市
  • 研究方向:自动化与计算机技术
  • 发文基金:教育部人文社会科学研究基金

相关作者

黄孝喜
作品数:47被引量:148H指数:8
供职机构:杭州电子科技大学
研究主题:隐喻 复杂网络 文本 自然语言理解 图像检索
谌志群
作品数:48被引量:365H指数:10
供职机构:杭州电子科技大学计算机学院
研究主题:文本挖掘 自然语言处理 中文信息处理 网络舆情 复杂网络
王小华
作品数:74被引量:257H指数:9
供职机构:杭州电子科技大学
研究主题:卷积神经网络 拷贝 图像检索 图像检测 图像分类
姚金良
作品数:63被引量:82H指数:5
供职机构:杭州电子科技大学
研究主题:图像 图像检索 视觉词汇 拷贝 卷积神经网络
陆蓓
作品数:26被引量:93H指数:5
供职机构:杭州电子科技大学
研究主题:网络舆情 聚类算法 数据挖掘 聚类技术 中文信息处理
一种结构与内容相结合的XML文档聚类方法被引量:5
2009年
XML(可扩展标记语言)正在成为Web数据交换的标准格式。随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点。XML文档聚类作为XML数据处理的重要课题,是指将具有类似特征的XML文档聚集成簇。现有的大部分XML文档聚类是基于文档结构特征的。本文提出了一个新的结构与内容相结合的XML文档聚类方法。首先从文档中抽取构件向量,并把文档转换为向量化的表示。然后,在文档相似度计算的基础上,引入一个层次聚类方法对XML文档进行聚类。在DBLPXML记录集上进行的实验表明该方法具有可行性并且性能明显优于已有方法。
谌志群王小华王荣波
关键词:XML文档聚类层次聚类
基于改进CFSFDP算法的电信投诉文本聚类方法被引量:3
2017年
为了提高电信服务质量,增强企业竞争力,对电信投诉文本进行聚类,方便电信运营商分析投诉原因,文中提出了基于改进CFSFDP算法对电信投诉文本进行聚类的方法。通过差分进化算法寻找CFSFDP算法中最优密度阈值和距离阈值,降低密度及距离阈值的随机性选取对聚类准确率造成的影响。该算法使用Gaussian Kernel计算数据点密度,降低参数对密度计算的影响。在电信投诉文本数据集上的实验结果显示,改进CFSFDP算法聚类结果达到了与KMeans算法、CFSFDP算法、Agglomerative Clustering算法更好或者相当的效果,证明了算法的有效性。
张天宇谌志群黄孝喜王荣波
关键词:文本聚类差分进化
一种新的基于蚁群和凝聚的混合聚类算法被引量:3
2010年
在经典蚁群算法和经典聚合算法的基础上,该文在改进蚁群算法的同时提出了一种新的基于蚁群和凝聚的混合聚类算法。该算法首先在蚂蚁放置物体时采用紧凑算法,其次对于可被蚂蚁负载的物体采用基于评估函数的调度算法,最后将凝聚算法融入蚁群算法的迭代过程。实验通过与其它聚类算法比较表明,该算法在继承了蚁群算法固有优点的同时,提高了时间效率,获得了较好的结果。
王小华沈杰王荣波
关键词:聚类算法蚁群聚类凝聚聚类
维基百科人物关系知识网络的复杂性分析
维基百科作为一个开放的网络百科全书,目前已成为知识网络的重要知识来源,维基百科知识网络已成为知识网络领域的研究热点之一。从维基百科中抽取人物关系知识网络,计算其多种网络参数,研究其小世界性和无标度性,发现人物关系知识网络...
董瑜谌志群王荣波黄孝喜
基于孪生神经网络的中文医疗文本信息匹配方法及系统
本发明公开了一种基于孪生神经网络的中文医疗文本信息匹配方法及系统。本发明采用双向长短期记忆网络构建用于实现医疗中文文本信息匹配的孪生神经网络,使得它能够同时捕获长距离和短距离的依赖,从而将问句对中的两个句子的表达输出为句...
黄孝喜童伟王荣波谌志群姚金良
文献传递
一种基于语义匹配和密度聚类的中文隐喻释义方法
本发明公开了一种基于语义匹配和密度聚类的中文隐喻释义方法,包括步骤:对于一个隐喻句,我们首先确定源域和目标域;针对目标域和源域构建候选词集合;将候选词集合中的候选词、目标域和源域获取词向量表示,然后分别计算候选词与目标域...
黄孝喜郭樊容王荣波谌志群姚金良
一种便携式外语教学用词义对照装置
本发明涉及教学辅助附属装置的技术领域,特别是涉及一种便携式外语教学用词义对照装置;方便进行移动和携带,给使用者带来便利,实用性较高;并且,工作模式较为多样,教学辅助效果较强,从而提高其使用可靠性;包括板体、框架、多组磁力...
黄孝喜王荣波谌志群
文献传递
一种句子级别的中文文本复制检测方法被引量:2
2009年
该文提出了一种句子级别的中文文本复制检测方法。该方法以句子为基本复制检测单位,运用最长公共子序列算法计算两篇文本之间的重复度,根据所得的重复度值来检测两篇文本是否存在复制现象以及复制的程度。在方法中,剔除句子的其他成分,提取句子中的名词作为句子的文本特征,增加了算法的鲁棒性;建立句子与文档的倒排索引,可快速索引得到存在该句子的所有文档的集合,提高了算法的速度,为大规模文本复制检测提供了一种可行的方法。实验表明,该算法对于普通网页文本复制检测能取得很好效果。
卢小康王小华王荣波
关键词:倒排索引中文信息处理
基于最小方差的K-means用户聚类推荐算法被引量:10
2018年
协同过滤推荐算法是一种传统的推荐技术,具有简单高效的特点,在实际中有广泛的应用,获得了大量研究者的青睐。虽然传统的协同过滤推荐算法在一定程度上缓解了用户当前所面临的信息超载问题,但其在处理大数据时存在的数据稀疏性和扩展性等问题却日益突出。于是,提出了一种基于最小方差的K-means用户聚类推荐算法。在缓解数据稀疏性方面,利用Weighted Slope One算法对初始用户—项目评分矩阵进行有效填充,降低了数据稀疏性;在提高算法扩展性方面,采用基于最小方差的K-means算法对用户评分数据进行聚类,将相似的用户聚到一起,减小目标用户的最近邻搜索空间,提高了算法扩展性。通过在Movie Lens数据集上的对比实验,结果表明,相比于传统的协同过滤推荐算法,改进算法具有更高的推荐准确度。
杨大鑫王荣波黄孝喜谌志群
关键词:信息过载协同过滤算法SLOPE最小方差
基于TD-SCDMA手机的商品砼网络实时监控方法
本发明涉及一种基于TD-SCDMA手机的商品砼网络实时监控方法。现有方法采用大型仪表进行监视并通过操作盘来进行集中式操作。本发明所采取的具体步骤如下:采集数据并将数据进行格式转换;建设中心站点网站;手机远程监控。采集数据...
童孟军陈勤王荣波张雷李强周旭
文献传递