您的位置: 专家智库 > >

王习特

作品数:9 被引量:242H指数:4
供职机构:东北大学信息科学与工程学院更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家教育部博士点基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇期刊文章
  • 2篇会议论文
  • 1篇学位论文

领域

  • 8篇自动化与计算...

主题

  • 3篇查询
  • 2篇调度
  • 2篇任务调度
  • 2篇数据库
  • 2篇吞吐
  • 2篇吞吐量
  • 2篇共享
  • 2篇共享环境
  • 2篇NOSQL
  • 2篇KEY-VA...
  • 2篇MAPRED...
  • 2篇查询处理
  • 2篇大数据
  • 1篇倒排索引
  • 1篇点检测算法
  • 1篇有向图
  • 1篇社交
  • 1篇社交网
  • 1篇社交网络
  • 1篇数据抽取

机构

  • 8篇东北大学
  • 1篇东北师范大学

作者

  • 9篇王习特
  • 7篇寇月
  • 7篇聂铁铮
  • 7篇于戈
  • 7篇申德荣
  • 3篇白梅
  • 1篇信俊昌
  • 1篇李英军
  • 1篇李延龙
  • 1篇单菁
  • 1篇王国仁
  • 1篇刘桐

传媒

  • 3篇计算机学报
  • 2篇计算机研究与...
  • 1篇软件学报
  • 1篇第30届中国...
  • 1篇第29届中国...

年份

  • 2篇2016
  • 1篇2015
  • 3篇2013
  • 1篇2012
  • 2篇2011
9 条 记 录,以下是 1-9
排序方式:
Key-Value数据库上连接操作的查询处理与优化
伴随着互联网技术的高速发展,各种类型的应用层出不穷,在这个云计算的大环境下,数据存储技术出现了新的特点:支持海量的数据和流量,更低的读写延迟,强大的可用性,较低的运营成本等。在过去的几十年中,传统数据库虽然已经在业界占据...
王习特
关键词:NOSQL
文献传递
支持大数据管理的NoSQL系统研究综述被引量:195
2013年
针对大数据管理的新需求,呈现出了许多面向特定应用的NoSQL数据库系统.针对基于key-value数据模型的NoSQL数据库的相关研究进行综述.首先,介绍了大数据的特点以及支持大数据管理系统面临的关键技术问题;然后,介绍了相关前沿研究和研究挑战,其中典型的包括系统体系结构、数据模型、访问方式、索引技术、事务特性、系统弹性、动态负载均衡、副本策略、数据一致性策略、基于flash的多级缓存机制、基于MapReduce的数据处理策略和新一代数据管理系统等;最后给出了研究展望.
申德荣于戈王习特聂铁铮寇月
关键词:NOSQL
数据流上动态轮廓查询处理技术的研究被引量:8
2016年
轮廓查询(Skyline)是一种典型的多目标优化问题.动态轮廓查询(Dynamic Skyline)是轮廓查询的一个重要变种,其目标是对于一个给定的查询点q,返回在各维度上最接近q的所有点.对比轮廓查询,动态轮廓查询根据查询点q的位置变动,可以更加灵活地返回查询结果.文中关注数据流上动态轮廓查询处理,此问题在多目标决策方面具有非常重要的应用.为有效地解决该问题,首先提出了一种组合式索引结构来管理数据流上的点,该索引结构包括两个部分:对整体数据使用分层次划分结构进行维护;对子划分内部数据采用倒排索引结构进行维护.该组合式索引结构具有更新快、过滤性能高、适合任意数据分布等优点,可以提高动态轮廓的查询处理效率.然后,基于该组合式索引结构,提出了基础的数据流上动态轮廓查询算法(Basic Dynamic Skyline Query over Data Stream,BDS2).通过维护少量的数据,BDS2可以快速地计算出数据流上的动态轮廓集合.然而BDS2在处理个别更新时,会有较大的时间延迟,为了更稳定地计算数据流上的动态轮廓,避免更新某些点时计算量急剧增加,进一步提出了改进的数据流上动态轮廓查询算法(Improved Dynamic Skyline Query over Data Stream,IDS2).最后,通过一系列的实验验证了文中所提出算法的有效性.
白梅信俊昌王国仁王习特
关键词:数据流倒排索引
共享的MapReduce环境下批量作业的调度算法研究被引量:2
2013年
MapReduce作为当前最热门的并行数据处理系统之一,已经被广泛应用在生产、研究等多个领域中.任务调度策略作为MapReduce的核心技术之一,直接关系到系统的性能.但是,在多用户(部门)共享的MapReduce环境下处理批量作业时,已有的调度算法不能够保证系统良好的吞吐能力.针对此问题,一种在共享的MapReduce环境下的吞吐量驱动的任务调度算法(简称TD调度算法)被提出.首先结合共享的MapReduce环境下批量作业调度的特点,给出了调度框架,并根据处理过程中作业的参数变化,将作业归为4种状态并给出状态间的转换规则,避免了系统中资源浪费并保证了资源分配的公平性;其次,总结了在处理批量作业时提高吞吐量的主要手段,进而提出了TD调度算法,有效地降低了网络开销并显著的提高了系统的吞吐能力.最后通过大量的实验对TD调度算法的性能进行了验证.实验结果表明,TD调度算法能够有效地提高在共享的MapReduce环境下处理批量作业时系统的吞吐能力,符合实际应用的需求.
王习特申德荣聂铁铮寇月于戈
关键词:共享环境MAPREDUCE任务调度吞吐量
支持Deep Web数据库集成的图书搜索系统被引量:1
2011年
图书搜索系统以DeepWeb数据库的信息集成为背景,旨在为用户提供一个统一的查询接口,用户通过向统一接口提交查询,可获得各个图书网站集成的查询结果.主要介绍了系统框架、关键技术和主要演示过程.
单菁王习特刘桐李延龙李英军聂铁铮寇月申德荣于戈
关键词:数据抽取数据集成
MapReduce集群中最大收益问题的研究被引量:8
2015年
MapReduce是目前最为流行的用于大数据分析的并行系统之一.许多企业已经搭建了自己的MapReduce集群,为广大用户提供计算服务.用户可以向集群提交具有完成时限要求的MapReduce作业,若作业被按时完成,则企业可以获得一定的收益.针对这种应用场景,该文首次提出了MapReduce集群中的最大收益问题.为有效地解决该问题,首先提出了一种基于序列的任务调度策略(简称为SEQ策略),并证明了在处理具有完成时限约束的作业时SEQ策略存在优势.基于SEQ策略,该文提出了最大收益的调度算法(Scheduling Algorithm for Maximum Benefit,简称AMB算法),该算法可以快速地确定可接收作业,并给出有效的执行方案,以达到最大化收益的目的.另外,针对在实际应用中的某些异常情况(如节点宕机),该文也设计了有效的超时处理策略,进一步增加了算法的实用性.最后,通过大量的实验验证了该文所提出算法的有效性.
王习特申德荣于戈白梅聂铁铮寇月
关键词:大数据
一种基于增量分区的社交网络数据管理与维护方法
社交网站作为在线交流的最新形式,吸引了数以亿计的用户,同时产生了海量数据.为此,如何存储大量的用户及其交互信息成为了社交网站的一个挑战.在深入分析了社交网络数据的特点之后,提出了一种用来描述社交网络中用户交互行为的交互关...
白帆申德荣王习特聂铁铮寇月于戈
关键词:社交网络
文献传递
BOD:一种高效的分布式离群点检测算法被引量:29
2016年
离群点检测是数据管理领域中的热点问题之一,在许多方面都有着广泛应用,如信用卡诈骗、网络入侵检测、环境监测等.目前现有的离群点检测算法大多针对集中式的处理环境.但随着数据规模的不断增长,传统的集中式算法处理效率受限,无法满足用户日益增长的需求.针对上述问题,文中提出了一种新型的分布式离群点检测算法.首先,在数据存储阶段(即预处理),提出了BDSP(Balance Driven Spatial Partitioning)数据划分算法.该算法可以有效地均衡每个计算节点的工作负载,并实现良好的过滤效果.此外,为划分所得到的每个块设计了一种全新的编码方式,可以快速地确定块与块之间的相邻关系,降低网络开销.基于BDSP算法,提出了BOD(BDSP-based Outlier Detection)分布式离群点检测算法.该算法包括2个步骤:在每个计算节点本地,利用R树索引进行批量过滤,快速地计算离群点并得到本地候选集;利用BDSP中提供的块编码确定需要相互通信的节点,使用少量的网络开销得到最终结果.最后,通过大量实验验证了文中所提出的BDSP和BOD算法的有效性.实验结果表明,相对于现有算法,文中算法可以显著地提高计算效率并大幅降低网络开销.
王习特申德荣白梅聂铁铮寇月于戈
关键词:离群点检测分布式计算数据划分大规模数据
共享的MapReduce环境下批量作业的调度算法研究
MapReduce作为当前最热门的并行数据处理系统之一,已经被广泛应用在生产、研究等多个领域中任务调度策略作为MapReduce的核,心技术之一,直接关系到系统的性能但是,在多用户(部门)共享的MapReduce环境下处...
王习特申德荣聂铁铮寇月于戈
关键词:共享环境MAPREDUCE任务调度吞吐量
共1页<1>
聚类工具0