国家高技术研究发展计划(2011AA120300) 作品数:13 被引量:83 H指数:7 相关作者: 钟志农 陈荦 景宁 熊伟 吴烨 更多>> 相关机构: 国防科学技术大学 中国科学院 中国人民解放军 更多>> 发文基金: 国家高技术研究发展计划 湖南省自然科学基金 国家教育部博士点基金 更多>> 相关领域: 自动化与计算机技术 天文地球 更多>>
一种随机游走中心性的快速算法 被引量:7 2013年 自然网络都具有一定的聚簇结构,聚簇之间的节点称之为桥节点,桥节点对网络的流通性有着重要的作用。发现桥节点,能够找到网络最为脆弱的部分。在随机游走中心性的基础上,提出一种计算网络桥节点的快速算法。通过人工合成以及在自然网络上进行实验,结果表明算法能够很好地发现各种网络的桥节点。 李星 钟志农 李洋关键词:网络分析 随机游走 适于社区挖掘分析与可视化的布局算法 社区挖掘算法能够在复杂社会网络中发现社区,却无法精确区分社区边界点,也没有考虑挖掘结果可视化.力导引布局算法是社会网络信息可视化领域的主流布局算法,但是无法反映网络中社区的聚簇特性.因此,提出了社区挖掘分析布局(comm... 伍勇 钟志农 景宁 李星关键词:可视化 文献传递 社区挖掘技术研究 被引量:1 2012年 复杂网络分析已成为近年来的一个热点研究领域。如何快速有效地对复杂网络进行社区划分,并在社区划分的基础上找出网络中的重要节点有很强的现实意义。本文分析比较了近年来复杂网络分析中社区结构挖掘算法和社区节点等级排序算法的原理和特征,最后对复杂网络分析的发展进行了总结和展望。 李星 钟志农 景宁 伍勇关键词:网络分析 高性能计算环境下地理计算服务流程并行处理方法 被引量:4 2012年 地理计算是地理信息科学中重要的高级计算模式,是新一代地理信息系统(Geographic Information System,GIS)中不可缺少的组成部分。地理计算过程涉及数据处理、空间分析、过程模拟等多个流程,过程繁复且耗时,计算复杂且运算量大。高性能计算(High Performance Computing,HPC)是解决复杂地理计算问题的有效方法。针对高性能计算环境中地理计算服务流程并行执行问题,提出一种简洁的地理计算服务流程建模方法和基于多线程的并发流程处理策略,设计并实现了高性能计算环境下地理计算服务流程执行引擎原型系统,实现了并发条件下地理计算服务流程的自动执行与负载均衡。通过在真实高性能计算环境中的实验,验证了所提出的方法能够有效解决地理计算服务流程建模、执行优化问题,具有良好的性能、准确性及应用前景。 吴佳妮 刘露 陈荦 景宁关键词:地理计算 地理栅格数据的并行访问方法研究 被引量:8 2012年 在海量地理栅格数据处理中,数据I/O性能是影响处理算法程序整体性能的关键。目前针对地理栅格数据I/O优化问题的研究成果还很有限,通过对并行程序中的数据I/O模式进行深入分析,结合栅格数据逻辑模型和物理模型的特点,提出了面向地理栅格数据的并行I/O框架;基于消息传递模型,实现了4种并行访问方法。实验证明,并行访问方法优于传统的串行访问方法和分时多进程访问方法。该研究成果可以提高并行栅格处理程序的I/O访问效率,进而提高其整体并行性能。 欧阳柳 熊伟 程果 陈宏盛 陈荦关键词:消息传递模型 基于MapReduce的中文词性标注CRF模型并行化训练研究 被引量:5 2013年 针对条件随机场模型面对大规模数据传统训练算法单机处理性能不高的问题,提出一种基于MapReduce框架的条件随机场模型训练并行化方法,设计了条件随机场模型特征提取及参数估计的并行算法,实现了迭代缩放算法的并行。实验表明,所提出的并行化方法在保证训练结果正确性的同时,大大减少了训练时间,效率得到较大提升。 刘滔 雷霖 陈荦 熊伟关键词:词性标注 条件随机场 MAPREDUCE 基于地物光谱矢量空间的遥感图像大气影响校正 被引量:2 2012年 星载传感器对地观测成像过程中,由于大气干扰,图像质量明显降低,可见光波段更甚.如何去除大气影响,并准确还原地物真实反射率,便成为提高遥感图像质量的重要环节.提出了一种基于地物光谱矢量空间的遥感图像大气影响校正方法.首先用辐射传输方程反演各波段地物反射率图像,然后用红外波段地物反射率图像构建光谱矢量空间,根据像元点在光谱矢量空间中的位置纠正可见光波段反射率残余误差.用Landsat-7 ETM+图像进行了大气影响校正实验,该方法与目前流行的大气影响校正软件比较,校正的可见光波段地物反射率精度更高,图像更清晰. 陈春 刘成玉 张树清多核处理器支持的频繁访问B+-Tree 2012年 传统B+-Tree自顶向下访问模式不适应于频繁访问应用模式,面向多核处理器支持,提出了针对频繁访问的FAB+-Tree(Frequent Access B+-Tree)。在B+-Tree的基础上增加了Hash辅助索引,使得访问B+-Tree是可以直接定位到叶结点,并利用基于内存的直接访问表及位矢量列表提高更新性能。同时基于共享L2-Cache多核处理器,提出了基于流水线的FAB+-Tree多线程访问模块,并优化了该模块的共享Cache访问性能。基于开源数据库Ingres实现了FAB+-Tree和多线程访问模块,实验结果表明B+-Tree的访问性能得到显著提高。 熊伟 吴烨 陈荦 景宁关键词:多核处理器 海量图数据可视化研究 被引量:11 2012年 图的可视化技术可以帮助人们更好地展现和探索数据的内部关系,然而随着数据规模的不断变大,传统的图的可视化技术已不适合海量数据的可视化要求。概括了传统的图的可视化技术,分类阐述了当前主流的海量图可视化布局算法的基本原理和特征,分析比较了相关的软件工具,并对海量图数据可视化技术的研究方向进行了展望。 伍勇 钟志农 景宁 李星关键词:可视化技术 交互技术 主动学习与自学习的中文命名实体识别 被引量:15 2014年 命名实体识别是信息抽取中的一项基础性任务,如何利用丰富的未标注语料来提高实体识别的指标是该领域一个重要的研究方向。基于条件随机场提出一种将主动学习与自学习相结合的方法——SACRF,通过设置置信度函数和2-Gram频度阈值来选取样本,并采用人工与自动相结合的方式进行标注来扩展训练语料。实验表明,该方法在提高实体识别的精确率和召回率的同时,能够显著地降低人工标注的工作量。 钟志农 刘方驰 吴烨 伍江江关键词:自学习 条件随机场 命名实体识别