郝天永
- 作品数:12 被引量:107H指数:2
- 供职机构:香港城市大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家科技部专项基金更多>>
- 相关领域:自动化与计算机技术哲学宗教更多>>
- 基于PADL的古代人物简历知识获取被引量:4
- 2005年
- 领域文本知识获取是目前人工智能中的一个关键问题。本文探讨如何从人物简介中获取人物知识。由于自然语言技术目前尚不足支持自动的知识获取,某种形式的人机交互或半自动方法是一种可行的折衷方案。本文在总结人物知识描述的特点基础上,提出了一种中间标记语言,它是自然语言到目标知识表示语言的过渡桥梁。同时,我们还介绍使用该方法在宗教古代人物知识在取中的应用。
- 郝天永曹存根
- 关键词:人工智能
- 简繁中文转换中的标识追踪方法及装置
- 本发明公开一种简繁中文转换中的标识追踪方法,应用于利用映射数据库将第一语言的输入文本转换成第二语言的输出文本的转换过程,第一语言和第二语言分别为选自简体中文和繁体中文中的一种,该方法包括:在转换过程中,判断是否已将第一语...
- 朱纯深郝天永
- 文献传递
- 生成简繁转换模板及基于模板进行简繁转换的方法、系统
- 本申请提供了一种生成简繁转换模板的方法及系统、基于模板的中文简繁转换的方法及系统。该中文简繁转换的方法包括:获取第一混合词组;用数字标识符取代所述第一混合词组中的数字以获取第一中间混合词组;从预先生成的模板中查找所述第一...
- 朱纯深郝天永
- 文献传递
- 局域网信息管理和共享系统的设计和实现被引量:1
- 2007年
- 随着计算机网络的快速发展,如何在局域网环境下实现信息的统一管理和共享对于整个企业的信息资源应用有着至关重要的意义。从局域网环境下信息共享的思路出发,提出了局域网环境下管理数据、共享数据、分析数据相结合的思想,并结合实际应用需要,将总体设计分为数据层、共享层、应用层、和分析层4个层次,使系统不但具有快速、高效的信息管理和共享功能,而且可以对已有数据进行分析,挖掘出一些隐含的有用信息。
- 王小刚韩虎郝天永
- 关键词:数据管理数据索引数据清理
- 标点符号转换方法及装置
- 本发明涉及一种标点符号转换方法,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,所述方法包括以下步骤:S1.查找所述文本中以第一语言和/或第二语言输入的标点符号;S2.判断...
- 朱纯深郝天永
- 文献传递
- 依存关系树在文本多语义约束检测中的运用被引量:2
- 2010年
- 提出一种运用依存关系树比对来检测文本中多语义约束的方法.对每一类语义约束,搜集信号词以及相应的例句组成案例库,并定义部分依存关系树(PDT)核函数来计算两个对象之间的相似度.Apriori算法的运用,降低了计算该核函数的复杂度.在问答系统的问题分析中的应用结果表明,该方法比带有语义特征的字符串匹配方法精确度提高了18.05%,召回率提高了16.98%.另外,在三个TREC问题集上的实验结果表明,该方法在较大规模文本问题集上也可取得较稳定的结果.
- 李欢刘文印陈小平郝天永
- 关键词:树核
- 简繁中文转换中的标识追踪方法及装置
- 本发明公开一种简繁中文转换中的标识追踪方法,应用于利用映射数据库将第一语言的输入文本转换成第二语言的输出文本的转换过程,第一语言和第二语言分别为选自简体中文和繁体中文中的一种,该方法包括:在转换过程中,判断是否已将第一语...
- 朱纯深郝天永
- 文献传递
- 校正处理方法及装置
- 本申请公开了一种校正处理方法及装置,应用于同一种语言内不同地区变体之间的转换,装置所执行的方法包括:接收用户输入的开始校正的指示信息;从执行完所述转换后的文档中查找待校正的单字或词组;显示该待校正的单字或词组的相关信息以...
- 朱纯深郝天永
- 文献传递
- 生成简繁转换模板及基于模板进行简繁转换的方法、系统
- 本申请提供了一种生成简繁转换模板的方法及系统、基于模板的中文简繁转换的方法及系统。该中文简繁转换的方法包括:获取第一混合词组;用数字标识符取代所述第一混合词组中的数字以获取第一中间混合词组;从预先生成的模板中查找所述第一...
- 朱纯深郝天永
- 文献传递
- 汉语自动分词的研究现状与困难被引量:99
- 2005年
- 汉语自动分词是信息提取、信息检索、机器翻译、文本分类、自动文摘、语音识别、文本语音转换、自然语言理解等中文信息处理领域的基础研究课题。尽管已被研究了二十多年,分词仍然是中文信息处理的瓶颈问题。基于对汉语自动分词研究的现状分析,构建了自动分词的形式化模型,论述了影响分词的诸多因素,分析了分词中存在的两个最大困难及其解决方法。最后指出了目前分词研究中尤其是在分词评测方面存在的问题以及未来的研究工作。
- 张春霞郝天永
- 关键词:汉语自动分词未登录词