赵立永
- 作品数:6 被引量:3H指数:1
- 供职机构:北京科技大学更多>>
- 发文基金:国家高技术研究发展计划国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种面向e-Science环境的多领域Web文本特征抽取系统及方法
- 本发明涉及一种面向e-Science环境的多领域Web文本特征抽取系统及方法。该方法包括:步骤1,统计目标文本中的字符频度;步骤2,以字符为基本处理单位,逐一抽取以该字符为起点,以频度为1的字符为终点间的字符串;步骤3,...
- 胡长军赵冲冲翁彧赵立永
- 一种面向e-Science环境的多领域Web文本特征抽取系统及方法
- 本发明涉及一种面向e-Science环境的多领域Web文本特征抽取系统及方法。该方法包括:步骤1,统计目标文本中的字符频度;步骤2,以字符为基本处理单位,逐一抽取以该字符为起点,以频度为1的字符为终点间的字符串;步骤3,...
- 胡长军赵冲冲翁彧赵立永
- 文献传递
- 领域无关性的分布协同话题检测分析技术
- 赵立永
- 话题案例知识库动态模型及优化策略
- 2012年
- 传统的话题检测方法仅通过最初几篇话题相关报道的特征来表示话题,不能适应话题动态变化的特点。为此,提出一种话题案例知识库的动态模型。采用资源描述框架,实现话题案例知识表示,并在层次语义树基础上,利用案例融合策略实现话题案例知识库的动态更新,使用最大容忍优化策略解决话题质心漂移问题。实验结果表明,通过提高话题案例知识的全面性和内聚性,该模型能够改进话题检测和追踪的效果。
- 赵立永李爱民
- 关键词:案例知识库动态模型
- 半监督二次划分聚类算法及其报表系统应用被引量:3
- 2011年
- 在基于B/S结构的Web报表系统中,报表单元格之间往往存在着复杂的依赖关系,某一单元格的求值过程会进行大量的涉及到其它单元格的公式计算,而在多用户访问的情况下,这种计算开销更为可观,导致服务器负载过重,响应速度变慢.优化报表的计算任务,可以有效减少计算量和减轻服务器端负载.为此本文提出一种半监督二次划分聚类算法,在单元格聚类的基础上,以报表单元格为顶点,以单元格之间的引用关系为有向边建立有向最大无环子图,然后通过协同计算各有向最大无环子图的拓扑序列,从而获得较优的计算顺序,达到提高Web报表计算效率,减轻服务器负载的目的.通过该算法与常规算法的对比试验,验证了其能有效降低计算量,提高系统响应速度.该算法已经成功应用于实际的Web报表系统中,表现出良好的实用性.
- 赵立永赵冲冲时鹏胡长军
- 关键词:WEB报表有向无环图拓扑排序
- 一种面向博客群的主题倾向性处理方法及系统
- 本发明涉及一种面向博客群的主题倾向性处理方法及系统。该方法包括:步骤1,计算目标文本T中每个中文字C<Sub>i</Sub>符倾向性权重S<Sub>Ci</Sub>,如果S<Sub>Ci</Sub>的绝对值小于或等于中性...
- 胡长军赵冲冲翁彧赵立永
- 文献传递