您的位置: 专家智库 > >

张云

作品数:4 被引量:39H指数:3
供职机构:西安交通大学电子与信息工程学院更多>>
发文基金:国家高技术研究发展计划国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 2篇搜索
  • 2篇聚类
  • 1篇遗传算法
  • 1篇蚁群
  • 1篇蚁群算法
  • 1篇搜索结果
  • 1篇搜索结果聚类
  • 1篇群算法
  • 1篇字符
  • 1篇字符串
  • 1篇字符串匹配
  • 1篇网页
  • 1篇网页搜索
  • 1篇文本聚类
  • 1篇文本聚类算法
  • 1篇结果聚类
  • 1篇聚类方法
  • 1篇聚类算法
  • 1篇类方
  • 1篇WEB

机构

  • 4篇西安交通大学

作者

  • 4篇张云
  • 2篇薛晔伟
  • 2篇沈钧毅
  • 2篇冯博琴
  • 1篇鲍军鹏
  • 1篇麻首强
  • 1篇刘连梦

传媒

  • 3篇西安交通大学...
  • 1篇Journa...

年份

  • 1篇2009
  • 2篇2008
  • 1篇2007
4 条 记 录,以下是 1-4
排序方式:
一种编辑距离算法及其在网页搜索中的应用被引量:17
2008年
针对传统方法不能很好地处理网页中简短域与用户查询之间的相关性排序问题,提出一种基于改进的编辑距离排序算法.将以词为单位的用户查询和简短网页域通过匹配编码转化为2个字符串,再利用改进的编辑距离计算2个字符串之间的相似性.由于在用户查询与待比较的简短网页域之间引入了查询词分布的位置、顺序和距离等,以及含有查询词修饰关系的重要信息,所以编码字符串之间的相似程度可以衡量对应的查询与简短网页域之间的相关性.经大规模真实搜索引擎实验表明,该算法较之传统的相关性排序算法,可以显著地提高网页搜索中的简短网页域相关性排序性能,尤其适用于简短域与用户查询之间的相关性比较.
薛晔伟沈钧毅张云
关键词:网页搜索字符串匹配
蚁群-遗传融合的文本聚类算法被引量:17
2007年
针对蚁群算法容易出现停滞现象而不能对解空间进行全面搜索的问题,提出了一种蚁群-遗传融合的文本聚类算法.该算法将影响蚁群算法性能的4个参数作为遗传算法中的染色体进行编码,基于此又设计出相应的适应度函数以及选择交叉变异算子,通过多次迭代找出最优的参数组合,并将其应用到文本聚类问题上.经与经典的k均值聚类算法、基本的蚁群聚类算法的仿真比较,结果表明所提出算法的聚类效果更好,在3个测试集上的F度量值要比k均值聚类算法分别提高5.69%、48.60%、69.60%,所以更适合于处理较大规模的数据集.
张云冯博琴麻首强刘连梦
关键词:蚁群算法遗传算法文本聚类
Method of acquiring web features and its application in web search被引量:1
2008年
Focusing on the problem that it is hard to utilize the web multi-fields information with various forms in large scale web search,a novel approach,which can automatically acquire features from web pages based on a set of well defined rules,is proposed.The features describe the contents of web pages from different aspects and they can be used to improve the ranking performance for web search.The acquired feature has the advantages of unified form and less noise,and can easily be used in web page relevance ranking.A special specs for judging the relevance between user queries and acquired features is also proposed.Experimental results show that the features acquired by the proposed approach and the feature relevance specs can significantly improve the relevance ranking performance for web search.
薛晔伟沈钧毅张云鲍军鹏
利用标签的层次化搜索结果聚类方法被引量:6
2009年
为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出文档集,并对每一个文档进行词干化、去除停用词等操作.然后,根据词共现信息来发现文档集中的频繁2元组,再将2元组扩展为n元组,对所有元组进行去冗余、重要性排序,从而获得候选聚类标签.最后,基于该标签对返回结果中的文档进行分配与聚集,形成层次化聚类结果.实验结果表明,所提方法可以通过获得的准确、可读性较好的聚类标签,帮助用户有效地浏览搜索引擎返回的结果.与Vivisimo、STC、Lingo算法比较,以及在多个评价指标上的综合实验结果也表明,该方法是有效的.
张云冯博琴
关键词:搜索结果聚类词共现
共1页<1>
聚类工具0