张雪英
- 作品数:103 被引量:642H指数:16
- 供职机构:南京师范大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划江苏省普通高校研究生科研创新计划项目更多>>
- 相关领域:天文地球自动化与计算机技术文化科学政治法律更多>>
- 城市犯罪时空同现模式的非参数检验方法被引量:3
- 2019年
- 采用时空同现模式分析方法挖掘多元犯罪事件之间的关联关系,可为犯罪事件防控问题提供科学指导。现有方法依赖人为设置的频繁度阈值,应用部门若缺乏先验知识则可能导致决策错误。因此,基于非参数统计思想,提出一种面向城市犯罪的时空同现模式显著性检验方法。首先通过重建每类犯罪事件的时空分布,构建多元犯罪事件分布独立的零模型;然后根据零模型下多元犯罪事件同现频率的试验分布,判别候选时空同现模式的显著性。最后设计具有预设模式的模拟数据实验验证该方法的有效性;在多个分析尺度(时空半径)下识别S市2016年13种犯罪事件间时空同现模式,并以时空同现模式{扰乱治安,盗窃电动自行车,扒窃}为例,结合公共设施空间分布,对该模式形成机理进行深入分析。结果表明:①该方法充分顾及了单元犯罪事件自相关特征的影响,能够有效识别具有统计特性的时空同现模式;②犯罪事件时空同现模式随分析尺度的变化而存在差异;③具有相似建成环境和社会环境的犯罪事件容易形成时空同现模式。
- 陈袁芳蔡建南刘启亮邓敏张雪英
- 关键词:城市犯罪非参数统计
- 基于网络爬虫的地名数据库维护方法
- 本发明公开了一种基于网络爬虫的地名数据库维护方法,主要包括两个部分:基于网络爬虫的空间敏感网页获取和网页文本中地名信息解析。具体步骤分为:基于Google搜索引擎服务的空间敏感网页获取;基于空间主题相关度的空间敏感网页过...
- 张雪英张春菊杜超利朱少楠
- 地理空间关系描述的句法模式识别
- 地理空间关系是地理信息科学的重要问题之一。自然语言中包含着大量的空间关系,是空间关系研究的一种重要途径。句法模式是自然语言中地理空间关系描述的重要语言特征,在自然语言中空间关系信息抽取、GIS自然语言空间关系查询和理解、...
- 朱少楠张雪英张春菊
- 关键词:句法模式识别
- 基于预训练语言模型与文本特征融合的空间关系抽取方法
- 本发明公开了基于预训练语言模型和文本特征融合的空间关系抽取方法,首先对文本数据进行清洗和预处理,利用预训练语言模型实现单条或批量文本数据向低维字向量的转化,保证不同长度的文本数据转化而来的低维字向量维度能保持一致;然后由...
- 张雪英吴恪涵王益鹏
- 文献传递
- 基于云原生的地理空间知识库管理关键技术与服务方法研究
- 2024年
- 地理空间知识的本质在于揭示地理事物和现象的时空分布、时空变化过程及其相互作用规律。地理空间知识库管理系统(GeoKGMS)以“图-文-数”一体化的地理空间知识库引擎为核心,致力于支撑地理空间知识资源的高效汇聚、地理空间知识图谱的自动构建和一站式地理空间知识工程建设,旨在形成新一代地理信息系统(GIS)的重要基础平台。本文重点阐述了基于云原生的地理空间知识库管理关键技术,包括云原生的地理空间知识库微服务统一调度技术、人机协同的地理空间知识图谱构建技术、地理空间知识图谱时空混合编码技术、以及多模态地理空间知识存储技术。在此基础上,设计了GeoKGMS的服务框架,实现了地理空间知识库管理、多模态地理空间知识抽取、地理空间知识图谱人机协同构建、地理空间知识推理、地理空间知识图谱质量评估和地理空间知识可视化六大管理服务功能。以喀斯特地貌知识图谱为例,充分发挥机器挖掘和专家知识的优势,实现了可持续的地理空间知识图谱工程化协同共建。
- 仲腾张雪英许沛曹敏曹敏刘启亮陈碧宇刘启亮
- 关键词:知识库管理知识推理知识检索知识存储
- 基于BERT-BiLSTM-CRF的中文地址解析方法被引量:6
- 2021年
- 中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面。但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题。为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基于BERT-BiLSTM-CRF深度学习模型的中文地址解析方法:依据中文地址要素多级分类体系,扩展BIOES标注方法并进行地址语料标注;基于预训练语言模型,构建融合BERT、BiLSTM和CRF的综合深度学习模型,通过BERT预训练语言模型获取富含语义信息的字符向量,弥补静态词向量特异性缺失的问题,提高复杂地址要素的提取能力。以2019年深圳市地址数据为例进行模型性能评估,该方法对于多数中文地址要素的解析准确率达90%以上;相比IDCNN-CRF和BiLSTM-CRF等深度学习模型,该方法对只具有小规模地址语料时的地址解析效果更优,且在解析多种地址要素类型时能保持良好的性能。
- 吴恪涵张雪英张雪英怀安叶鹏
- 关键词:中文地址
- 地理命名实体分类体系的设计与应用分析被引量:24
- 2010年
- 自然语言是一种重要的空间数据来源,从自然语言中获取地理空间信息是地理信息科学的重要研究议题。完善的地理命名实体分类体系,有助于实现自然语言中地理空间信息的解析、存贮、组织、管理、分析及共享应用。现有的基础地理要素分类体系、地名分类体系和组织机构分类体系,分别侧重于不同的应用领域,只能表达自然语言中的部分地理命名实体,没有考虑时空关联特性。本文在参照大量相关标准的基础上,根据大量自然语言文本的标注结果,以地理命名实体所指代的空间位置、地理特征和属性作为分类标准,采用主分表和复分表相结合的方式,设计了地理命名实体分类体系(简称"GNEC")。采用定量和定性相结合的方法,分析了GNEC与GB/T18521-2001,GB/T13923-2006,CHG IS的地名分类体系、ADL的FTT词表之间的兼容性,并以中文文本的地理命名实体解析和地图服务为例,验证了GNEC的应用性能。多样性是自然语言中地理实体描述的重要特征,而分类体系主要实现地理命名实体的概念化操作。因此,在GNEC基础上构建本体,将成为解决这一问题的有效途径。
- 张雪英张春菊闾国年
- 关键词:地理信息系统信息共享
- 自然语言空间关系及其在GIS中的应用研究被引量:25
- 2007年
- 智能GIS的最终目标是实现用户与GIS的自然语言交互。如何从自然语言中自动抽取空间信息,消除GIS中结构化空间信息与自然语言中非结构化空间信息之间的语义障碍,已成为智能GIS面临的两大难题。目前的相关研究主要集中于自然语言空间关系。空间词汇及其句法模式是自然语言空间关系研究的核心问题。本文首先阐述了自然语言空间关系研究的几个基本问题,然后详细讨论了汉语中描述各种空间关系的空间词汇及其句法模式。最后,探讨了GIS中自然语言空间关系查询请求表达的句法模式及其解析方法。
- 张雪英闾国年
- 关键词:句法模式地理信息系统
- 台风事件信息聚合方法
- 本发明涉及一种台风事件信息聚合方法,主要步骤如下:步骤1、采集社交媒体中与台风事件相关的消息文本,并从中抽取台风事件信息,并转换为结构化的信息元组形式;步骤2、基于多特征相似度的对象信息聚合;步骤3、基于时空特征的状态信...
- 张雪英叶鹏怀安
- 文献传递
- 一种基于候选标签评估的3D地图建筑物标注方法
- 本发明公开了一种基于候选标签评估的3D地图建筑物标注方法,采用WebGL技术,基于多边形中心计算获取每座建筑物的最高点作为标签放置瞄点,在瞄点周围的潜在位置集合中选取具有代表性的候选标签,构成建筑物的候选标签集合,基于标...
- 张雪英张慧峰王益鹏