陈晓丹 作品数:3 被引量:30 H指数:3 供职机构: 南京师范大学地理科学学院虚拟地理环境教育部重点实验室 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 天文地球 更多>>
面向网页文本的地理要素变化检测 被引量:15 2013年 地理要素变化检测已成为国家地理信息"十二五"规划和全国地理国情普查的重要组成部分。网页文本中蕴含海量的地理要素信息,尤其是新闻、政府、社交平台等网站的网页文本更新频繁,可为地理要素变化检测提供现势性的数据源。本文针对网页文本中地理要素变化的语言描述特点,构建了表达地理要素变化的语义知识库,设计了搜索引擎和通用主题相结合的网页爬虫,实现了相关网页文本的高效获取;采用规则模型和条件随机场模型,分别进行网页文本中地理要素变化信息抽取,包括地理要素名称、位置(地名)、时间和属性等。实验结果显示,本文设计的网页爬虫具有较高的相关网页文本获取能力,地理要素变化信息抽取的准确率能够达到70%以上,但是,语义知识库的完备程度对于信息抽取性能具有较大影响。研究成果表明,以网页文本为数据源的地理要素变化信息获取方法,能提供一种快速检测地理要素变化的新途径,与实地调绘和遥感影像检测等方法结合应用具有较好的优势互补性,可作为有力的辅助手段解决地理要素的持续更新和实时更新问题。 王曙 吉雷静 张雪英 赵仁亮 陈晓丹 余浩关键词:网页文本 信息抽取 文本解析 中文文本的事件时空信息标注 被引量:12 2016年 基于文本数据源的地理空间信息解析研究侧重于地名实体、空间关系等空间语义角色的标注和抽取,忽略了丰富的时间信息、主题事件信息及其时空一体化信息。该文通过分析中文文本中事件信息描述的语言特点和事件的时空语义特征,基于地名实体和空间关系标注研究成果,制定了中文文本的事件时空信息标注体系和标注模式,并以GATE(General Architecture for Text Engineering)为标注平台,以网页文本为数据源,构建了事件时空信息标注语料库。研究成果为中文文本中地理信息的语义解析提供标准化的训练和测试数据。 张春菊 张雪英 王曙 廖建平 陈晓丹关键词:中文文本 时空信息 标注语料库 面向自然语言的空间位置信息形式化表达方法 如何以计算机可以直接理解的形式对空间位置信息进行系统、规范的抽象与表达,是地理信息科学的重要基础理论问题。解决问题的关键在于如何将计算机求解问题的途径和地学问题求解的信息需求进行有机结合。空间位置信息作为地理信息最为基础... 陈晓丹关键词:自然语言 文献传递