谌志群
- 作品数:48 被引量:360H指数:10
- 供职机构:杭州电子科技大学计算机学院更多>>
- 发文基金:教育部人文社会科学研究基金国家自然科学基金浙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理更多>>
- 基于Web的虚拟实验系统研究与实现被引量:19
- 2002年
- 依托互联网的现代远程教育正迅猛发展,基于Web的虚拟实验系统是现代远程教育的重要组成部分。给出了网上虚拟实验系统的体系结构,讨论了网上虚拟实验系统的一些主要特点,总结了实现网上虚拟实验系统的一些基本技术。最后介绍了一个部分实现的网上虚拟实验系统———TDN-CM+《计算机组成原理》虚拟实验系统。
- 谌志群曾文华丁颖
- 关键词:WEB虚拟实验远程教育计算机
- 网上购物系统若干关键技术研究被引量:5
- 2003年
- 建立在Internet上的网上购物系统是电子商务的一种重要形式。该文对构建网上购物系统的几个关键技术分别进行了较详细的分析与讨论,包括购物车设计、订单管理、网上支付等,并给出了相应的实现模型。
- 谌志群王大全
- 关键词:电子商务网上购物购物车网上支付订单管理
- 基于最小方差的K-means用户聚类推荐算法被引量:10
- 2018年
- 协同过滤推荐算法是一种传统的推荐技术,具有简单高效的特点,在实际中有广泛的应用,获得了大量研究者的青睐。虽然传统的协同过滤推荐算法在一定程度上缓解了用户当前所面临的信息超载问题,但其在处理大数据时存在的数据稀疏性和扩展性等问题却日益突出。于是,提出了一种基于最小方差的K-means用户聚类推荐算法。在缓解数据稀疏性方面,利用Weighted Slope One算法对初始用户—项目评分矩阵进行有效填充,降低了数据稀疏性;在提高算法扩展性方面,采用基于最小方差的K-means算法对用户评分数据进行聚类,将相似的用户聚到一起,减小目标用户的最近邻搜索空间,提高了算法扩展性。通过在Movie Lens数据集上的对比实验,结果表明,相比于传统的协同过滤推荐算法,改进算法具有更高的推荐准确度。
- 杨大鑫王荣波黄孝喜谌志群
- 关键词:信息过载协同过滤算法SLOPE最小方差
- 基于改进蚁群聚类的热点主题发现算法研究被引量:4
- 2010年
- 针对热点主题发现是在聚类算法的基础上实现的特点,将改进后的蚁群聚类算法引入到该研究中,同时提出类别关注度(CAD)的概念,以此来判定类别的热门程度并区分出热门类别和冷门类别,在此基础上抽取热点主题集。实验结果表明改进后的蚁群聚类算法对热点主题的发现有一定的效果,对其他仿生优化聚类算法的引入有借鉴意义。
- 陆蓓程肖谌志群
- 关键词:网络舆情蚁群聚类主题
- 基于LDA模型的移动投诉文本热点话题识别被引量:9
- 2017年
- 【目的】运用中文信息处理和话题识别与追踪的方法,从大量移动投诉文本中找出有价值的信息。【方法】从分析投诉文本的特点入手,使用k-means先对文本聚类。利用LDA对每个类进行建模,提取话题,并从词频、词跨度和词长三方面计算每个话题中词的权值,把权重最大的词作为该话题的标签,并计算每个话题的文档分布概率均值。对具有相同标签的话题,先按照均值最大的原则去掉重复标签话题,再对所有话题计算文档支持率,并将文档支持率作为话题的热度,通过热度区分热点话题和一般话题。【结果】对投诉文本进行时间上的建模,通过对比一般话题和热点话题,得出热点话题的支持文档率至少是一般话题的3倍,支持文档率变化趋势也比一般话题高,说明本文算法是有效的。【局限】没有考虑到话题之间的语义关系。【结论】利用LDA模型对移动投诉话题检测初探的方法是比较合理和有效的,对今后此领域的研究具有一定的借鉴意义。
- 方小飞黄孝喜王荣波谌志群王小华
- 关键词:K-MEANSLDA模型
- 文本挖掘与中文文本挖掘模型研究被引量:54
- 2007年
- 文本挖掘,又称为文本数据挖掘或文本知识发现,是指在大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先对文本挖掘进行了概述,给出了文本挖掘的定义、特点和研究现状。然后对国内中文文本挖掘的研究现状进行了分析,指出了当前中文文本挖掘研究中存在的主要问题和主要研究方向。最后提出了一个统一的中文文本挖掘模型——UCT-MF。该模型具有层次性、开放性和可扩展性,为中文文本挖掘系统提供了基本体系框架。
- 谌志群张国煊
- 关键词:文本挖掘数据挖掘中文信息处理
- 基于动态规划的汉语句子相似度算法被引量:8
- 2013年
- 传统汉语句子相似度计算算法在处理大量专业词汇时准确率较低。为此,提出一种基于动态规划的汉语句子相似度算法。通过获取2个句子的公共子串集合,结合链表消重机制,从集合中获取2个句子的所有最长公共子串,并以此计算相似度。实验结果表明,对于含有大量专有名词的问题集合,该算法的测试正确率达93.6%,计算效率较高。
- 冯凯王小华谌志群
- 关键词:句子相似度动态规划最长公共子串
- 一种结构与内容相结合的XML文档聚类方法被引量:5
- 2009年
- XML(可扩展标记语言)正在成为Web数据交换的标准格式。随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点。XML文档聚类作为XML数据处理的重要课题,是指将具有类似特征的XML文档聚集成簇。现有的大部分XML文档聚类是基于文档结构特征的。本文提出了一个新的结构与内容相结合的XML文档聚类方法。首先从文档中抽取构件向量,并把文档转换为向量化的表示。然后,在文档相似度计算的基础上,引入一个层次聚类方法对XML文档进行聚类。在DBLPXML记录集上进行的实验表明该方法具有可行性并且性能明显优于已有方法。
- 谌志群王小华王荣波
- 关键词:XML文档聚类层次聚类
- 基于改进CFSFDP算法的电信投诉文本聚类方法被引量:3
- 2017年
- 为了提高电信服务质量,增强企业竞争力,对电信投诉文本进行聚类,方便电信运营商分析投诉原因,文中提出了基于改进CFSFDP算法对电信投诉文本进行聚类的方法。通过差分进化算法寻找CFSFDP算法中最优密度阈值和距离阈值,降低密度及距离阈值的随机性选取对聚类准确率造成的影响。该算法使用Gaussian Kernel计算数据点密度,降低参数对密度计算的影响。在电信投诉文本数据集上的实验结果显示,改进CFSFDP算法聚类结果达到了与KMeans算法、CFSFDP算法、Agglomerative Clustering算法更好或者相当的效果,证明了算法的有效性。
- 张天宇谌志群黄孝喜王荣波
- 关键词:文本聚类差分进化
- 基于微信的自动问答系统研究被引量:8
- 2014年
- 自动问答是计算机与人类以自然语言的形式进行交流的一种方式,是人工智能研究的一个分支。介绍了微信公众平台的特点及其开发接口,研究了Lucene全文检索工具包和IK Analyzer中文分词工具包,并最终实现了一个基于微信的自动问答系统,可为用户提供自动问答服务。测试结果表明,该系统具有一定的实用性。
- 石凯谌志群
- 关键词:LUCENEANALYZER