耿志华
- 作品数:7 被引量:14H指数:2
- 供职机构:复旦大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术医药卫生更多>>
- 一种支持高效XML路径查询的自适应结构索引被引量:10
- 2009年
- 提出了一种新的自适应结构索引:AS-Index(adaptive structural index),能够克服现有静态索引和自适应索引的缺陷,具备高效的查询和调整性能.AS-Index建立在F&B-Index的基础之上,其索引结构包括F&B-Index,Query-Table和Part-Table.Query-Table能够记录频繁查询,避免了查询过程中的冗余操作.并且,在Query-Table的基础上提出了自底向上的查询处理过程,能够充分利用现有的频繁查询高效地回答非频繁查询.Part-Table用于优化包含祖先后裔边的查询,进一步提高了查询性能.现有的自适应结构索引的调整粒度是XML元素节点,调整过程往往需要遍历整个文档.而AS-Index是基于F&B-Index节点的增量调整,其过程是局部的,高效的,并且能够支持复杂分支查询的调整.实验结果表明,AS-Index在查询和调整性能上优于现有的XML结构索引.同时,相比于现有的自适应结构索引,AS-Index针对大规模文档具有更加优良的可扩展性.
- 张博耿志华周傲英
- 关键词:XML结构索引查询处理
- 基于文件差异的XML文档压缩算法
- 伴随着网络技术的飞速发展,XML已经成为了事实上的网络数据表示和传输的标准。从数据库研究的角度来看,XML的查询语言,XML的数据编码和索引结构一直是研究的重点。但是,随着现有XML文档数据量的增加,如何进行高效的存储和...
- 耿志华
- 关键词:XML压缩
- 文献传递
- XDrill:基于文件差异的XML文档压缩算法被引量:3
- 2007年
- XML已成为网络传输、信息交换领域数据交换和存储的标准.由于XML文档的自描述性,导致信息冗余,特别是在一些特殊的应用场合,如PDA,Smart Phone等网络资源受限的系统中,网络性能受到较大影响.虽然目前很多研究者提出了通过对XML文档进行压缩,来缓解系统负担,但是大部分的压缩方法关注单个文档的压缩,而对文档集合压缩效果较差.分析了已有的XML压缩算法在实际使用中的潜在问题,提出了一种新的基于文件差异的XML文档压缩算法--XDrill. 该算法通过对XML文档树进行划分来挖掘文档内部以及文档间的冗余信息,得到了良好的压缩效果.通过对XDrill系统的理论分析以及对实际数据集的测试表明,XDrill在压缩单个文档的性能上与XMill接近,对文档集合的压缩效果明显优于XMill压缩方法.同时,相比已有的XML压缩算法,XDrill支持增量式存储,并可以降低更新操作的系统开销.
- 耿志华王晓玲周傲英
- 关键词:XML压缩
- 端粒酶催化亚单位在非小细胞肺癌中的表达及C-MYC基因相关性研究
- 耿志华
- 关键词:非小细胞肺癌端粒酶催化亚单位C-MYC基因反义寡聚脱氧核苷酸
- XDrill:基于文件差异的XML文档压缩算法
- XML已成为网络传输、信息交换领域数据交换和存储的标准.由于XML文档的自描述性,导致信息冗余,特别是在一些特殊的应用场合,如PDA,Smart Phone等网络资源受限的系统中,网络性能受到较大影响.虽然目前很多研究者...
- 耿志华王晓玲周傲英
- 关键词:XML压缩
- 文献传递
- 端粒酶催化亚单位在非小细胞肺癌中的表达及其与C-MYC基因相关性研究
- 目的:为了明确端粒酶催化亚单位(hTERT)在非小细胞肺癌表达的临床意义及其与c-myc基因的相关性,探讨肺癌hTERT激活的可能调节机制.结论:研究显示端粒酶催化亚单位hTERT的激活是非小细胞肺癌发生的关键步骤之一,...
- 耿志华
- 关键词:非小细胞肺癌端粒酶催化亚单位C-MYC基因反义寡聚脱氧核苷酸A549肺癌细胞
- 文献传递
- 一种基于文件差异的XML文档压缩方法
- 本发明属数据库技术领域,具体提出了一种新型的XML文档压缩算法,该方法步骤是:a.将XML文件划分为64K的XML文档片断;b.计算XML文档片断之间的差异;c.压缩文档片断之间的差异。解压缩步骤与该过程相反。这是一种高...
- 周傲英耿志华王晓玲
- 文献传递