李锐
- 作品数:9 被引量:26H指数:2
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于文档序号处理的倒排索引表示方法及系统
- 本发明提供了一种基于文档序号处理的倒排索引表示方法及系统,其中方法包括:步骤1.将倒排记录表按文档序号升序或降序排列,获得排序后的倒排记录表,从排序后的倒排记录表提取多个文档序列;步骤2.计算所述多个文档序列的序列长度,...
- 史亮王斌李鹏李锐卫冰洁张帅
- 文献传递
- 一种数字信息推荐预测模型的训练方法和系统
- 本发明提供一种数字信息推荐预测模型的训练方法和系统,该方法包括:1)接收打分数据;2)确定数字信息的不同类别,每个类别中包括多个项目,其中所述类别之间存在关联关系;3)基于所述关联关系建立所述模型并训练获得所述模型,其中...
- 鲁凯王斌史亮李文娜李锐徐飞
- 文献传递
- 一种数字信息推荐预测模型的训练方法和系统
- 本发明提供一种数字信息推荐预测模型的训练方法和系统,该方法包括:1)接收打分数据;2)建立模型并利用所述打分数据训练所述模型,其中所述模型中包括打分时间段对用户的影响参数。本发明所训练的预测模型考虑到用户打分的时间与所打...
- 鲁凯王斌史亮李文娜李锐徐飞
- 文献传递
- 文本处理中的MapReduce技术被引量:18
- 2012年
- 用于文本处理的很多数据集已经达到TB、PB甚至更大规模,传统的单机方法难以对这些数据进行有效处理。近年来出现的MapReduce计算框架能够以简洁的形式和分布式的方案来解决大规模数据的并行处理问题,得到了学术界和工业界的广泛认可和使用。目前,MapReduce已经被用于自然语言处理、机器学习及大规模图处理等领域。该文首先对MapReduce做了简单的介绍,并分析了其特点、优势还有不足;然后对MapReduce近年来在文本处理各个方面的应用进行分类总结和整理;最后对MapReduce的系统和性能方面的研究也做了一些介绍与展望。
- 李锐王斌
- 关键词:文本处理MAPREDUCE分布式计算HADOOP
- 一种基于作者建模的微博检索模型被引量:8
- 2014年
- 近年来,微博的发展令人瞩目,微博检索已经成为一个重要的研究课题。而微博具有文本内容短、更新快、融合社交网络等特点,这些特点使微博的检索不同于传统的web检索。该文首先分析了传统的向量空间模型、概率模型以及基本的语言模型直接用于微博检索将面临的问题;接着在语言模型框架下提出了利用作者信息对微博内容进行扩展的思想,即利用作者信息重新估计微博的语言模型;然后针对话题模型在短文档训练中存在的问题,提出了使用作者的文档话题模型来进一步扩展微博的内容;最后在TREC公开数据集上进行了实验。实验结果表明,可以通过合理使用作者信息来有效的提高微博检索的效果。
- 李锐王斌
- PSIM模拟器性能优化技术研究
- 在计算机技术发展过程中,模拟一直是一个重要的研究方法.模拟器由于其灵活性,被广泛用于体系结构研究、系统软件的开发和调试、复杂应用程序的性能评测以及软件的移植等诸多方面.随着计算机系统的日益复杂,模拟技术越来越重要,相应地...
- 李锐
- 关键词:模拟器二进制翻译
- 文献传递
- 回归预测方法及装置
- 本发明提供一种回归预测方法,不仅考虑自变量X之间相似度,还考虑了原数据中因变量Y之间的相似度,从近邻和近邻的历史的角度考虑了输出值y发展的模式。相比以往未考虑数据发展模式的模型,该方法在数据集上,只增加了一个预处理的阶段...
- 李锐张帅王斌李鹏张冠元鲁凯
- 文献传递
- 一种数字信息推荐预测模型的训练方法和系统
- 本发明提供一种数字信息推荐预测模型的训练方法和系统,该方法包括:1)接收打分数据;2)确定数字信息的不同类别,每个类别中包括多个项目,其中所述类别之间存在关联关系;3)基于所述关联关系建立所述模型并训练获得所述模型,其中...
- 鲁凯王斌史亮李文娜李锐徐飞
- 一种数字信息推荐预测模型的训练方法和系统
- 本发明提供一种数字信息推荐预测模型的训练方法和系统,该方法包括:1)接收打分数据;2)建立模型并利用所述打分数据训练所述模型,其中所述模型中包括打分时间段对用户的影响参数。本发明所训练的预测模型考虑到用户打分的时间与所打...
- 鲁凯王斌史亮李文娜李锐徐飞