于浩
作品数: 56被引量:356H指数:9
  • 所属机构:哈尔滨工业大学
  • 所在地区:黑龙江省 哈尔滨市
  • 研究方向:自动化与计算机技术
  • 发文基金:国家自然科学基金

相关作者

赵铁军
作品数:388被引量:1,083H指数:16
供职机构:哈尔滨工业大学
研究主题:机器翻译 自然语言处理 翻译 统计机器翻译 句子
郑德权
作品数:125被引量:326H指数:9
供职机构:哈尔滨商业大学
研究主题:机器翻译 多文档文摘 文本 BLOG 神经网络
李生
作品数:248被引量:2,350H指数:23
供职机构:黑龙江工程学院
研究主题:机器翻译 自然语言处理 句法分析 汉语 信息检索
陈学允
作品数:186被引量:3,151H指数:34
供职机构:哈尔滨工业大学
研究主题:电力系统 故障测距 输电线路 励磁控制 变结构控制
刘瑞叶
作品数:48被引量:585H指数:14
供职机构:哈尔滨工业大学电气工程及自动化学院
研究主题:电力系统 风电场 变结构控制 模糊变结构 励磁控制
基于链接分块的相关链接提取方法被引量:3
2006年
每个网页都包含了大量的超链接,其中既包含了相关链接,也包含了大量噪声链接。提出了一种基于链接分块的相关链接提取方法。首先,将网页按照HTML语言中标签将网页分成许多的块,从块中提取链接,形成若干链接块;其次,根据相关链接的成块出现,相关链接文字与其所在网页标题含相同词等特征,应用规则与统计相结合的方法从所有链接块中提取相关链接块。相关链接提取方法测试结果,精确率在85%以上,召回率在70%左右,表明该方法很有效。
王芳于浩谭红叶赵铁军
关键词:网页分块
基于查询向量的英语话题跟踪研究被引量:8
2007年
通过分析英语新闻报道的特点,提出了一种基于词汇区分和位置特征相结合的特征项抽取算法.词汇区分是指将单词分为首字母是大写的单词和首字母不是大写的单词,位置特征利用新闻报道的倒金字塔式的结构特点决定单词的重要性.提出了一种基于多个特征项抽取算法融合的特征项权值计算方法,该方法认为被越多的特征项抽取算法选中的特征项越重要.提出了一种基于多数投票策略的双重过滤算法,对报道和话题是否相关进行两次过滤,大大降低了系统的误报率.实验表明提出的3种算法不但取得了很好的效果,而且具有很好的可扩展性.
赵华赵铁军于浩郑德权
基于元学习策略的分类器融合方法及应用被引量:5
2007年
提出了基于元学习策略的分类器融合的新模型,使用了两类元学习策略将4种分类算法即Generalized Winnow算法、支持向量机算法、条件随机域算法和最大熵算法进行融合,并根据具体领域的应用任务和分类器特点选择了有效特征信息,在面向生物医学文本命名实体识别的应用中取得了较高识别精度。实验结果表明基于元学习策略的分类器融合方法明显优于单分类器方法,并且也优于基于判别规则的分类器融合方法。
王浩畅赵铁军郑德权于浩
关键词:元学习分类器融合命名实体识别
生物文本中蛋白质名称的识别被引量:2
2007年
随着基因和蛋白质序列的发布和分子生物学研究的发展,其相关的数据呈指数级增长,因此如何从海量的相关文献中直接获取生物学家研究领域的相关信息变得迫在眉睫,识别生物文献中的命名实体如蛋白质、基因、脱氧核糖核酸名称等成为生物信息学中信息抽取的最基本任务。介绍了国际同类研究中生物命名实体识别的各种方法,重点介绍了蛋白质名称识别的相关方法、所用资源、实验结果及与国际同类研究的比较结果。
王浩畅赵铁军于浩
关键词:生物信息命名实体识别
结合本体论和统计方法的跨语言信息检索模型被引量:6
2008年
为了更有效地提高跨语言信息检索的性能,结合本体论和统计方法的特性,提出一种混合的跨语言信息检索模型.在该语言模型的结构上,提出一种本体描述框架,构造了一个形式化的语言本体知识表示,通过典型语料学习,融合了语法、语义、句法等多元信息,建立了源语言本体知识库.在跨语言信息检索的实际应用中,利用本体表示,获得初始的检索文档集,再基于源语言本体知识库,对全部候选文档重新排序,以提高TopN排列的精确度.利用NTCIR-3Workshop中的中英文跨语言信息检索数据集对该语言模型进行了评价,相关实验结果表明,该方法取得了较满意的实验效果.
郑德权李生赵铁军于浩
关键词:跨语言信息检索语言模型知识获取
等极槽有限转角电机力矩特性优化与热问题研究
有限转角电机在航空航天、机器人等高精度电气伺服系统中均有着十分重要的作用,其具有可靠性高、结构简单以及易于控制等优点。本文的研究对象为等极槽有限转角电机,针对该电机的转矩特性、运行特性、铁芯损耗、流体场和温度场等问题进行...
于浩
关键词:转矩特性铁芯损耗流体场电磁性能
文献传递
基于文本的生物信息获取
随着基因和蛋白质序列的发布和分子生物学研究的发展,其相关的数据呈指数级增长.因此如何从海量的相关文献中直接获取生物学家研究领域的相关信息变得迫在眉睫.我们的研究主要致力于两方面的内容:一个是命名实体的识别,另一个是实体关...
王浩畅赵铁军于浩
关键词:生物信息命名实体识别实体关系抽取
文献传递
面向动态演化的话题检测研究被引量:18
2006年
受CURE聚类算法的启发,在分析了动态演化特性的基础上,提出了一种面向动态演化特性的双质心话题模型,以解决话题动态演化特性对话题检测的影响。该模型动态地建立分界点,以其为界将话题表示成初始质心和当前质心两个质心。初始质心代表分界点之前话题所关注的内容,当前质心表示从分界点到当前时间之间话题所关注的内容。提出了基于时间和词分布密度两种不同的分界点确定方法。详细描述了分界点、初始质心、当前质心的建立及更新方法。最后对基于双质心话题模型的英语话题检测算法进行了研究探讨,通过实验证明了该算法的有效性。
赵华赵铁军于浩张姝
关键词:分布密度
基于链接分析的重要Blog信息源发现
本文提出了一种基于链接分析的对 Blog 信息源进行量化评估的方法,在此基础之上发现重要 Blog 信息源,既体现了 Blog 信息的特点,又在一定程度上减小了作弊链接对链接分析结果的影响,能为用户阅读信息提供方便,并可...
杨宇航赵铁军郑德权于浩
关键词:链接分析评价指标
文献传递
基于融合上下文的移动用户行为过程挖掘与预测被引量:4
2016年
针对移动环境中单个用户个性化行为过程的挖掘和预测问题,考虑不同类型上下文对行为过程的影响,研究将行为过程中不同类型的上下文融合成统一的整体(情景),提出上下文融合过程模型。进而将上下文融合过程模型融入移动用户的行为过程中,提出一种基于融合上下文的行为过程模型。在此基础上提出一种挖掘算法ASCF-Mine,利用行为过程中存在的情景周期和时间属性来挖掘频繁的行为过程。结合频繁的行为过程,提出一种基于协同过滤的预测方法来自主构建满足用户个性化需求的行为过程。通过具体的实验分析,验证了所提方法的有效性。
王佳秋于浩王忠杰
关键词:上下文