王悦 作品数:60 被引量:229 H指数:6 供职机构: 北京大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家科技支撑计划 更多>> 相关领域: 自动化与计算机技术 医药卫生 经济管理 理学 更多>>
干预规则挖掘的任务分类和三项技术进展 被引量:4 2010年 介绍了亚复杂系统中干预规则的基本概念和挖掘方法,提出了干预规则挖掘技术的分类准则,综述了三项干预规则挖掘技术的最新进展,包括疾病状态干预技术、基于数据流的未知干预发现技术和基于并行事件序列的干预规则挖掘。在实践基础上分析了干预规则挖掘的难点,展望了进一步的研究工作。 唐常杰 段磊 王悦 杨宁 朱军 代礼关键词:数据挖掘 一个基于IPv6的域内主机Anycast原型系统 IP Anycast作为一种新兴的网络服务和IPv6的新特性,具有广阔的应用前景.目前它处在研究的初期阶段,几乎没有被实现.该文的目标是研制一个基于IPv6的域内主机Anycast原型系统.在这个目标下,该文试图解决两个... 王悦关键词:ANYCAST IPV6 路由协议 一种快速检测化学品内分泌干扰活性的试剂盒及方法 本发明公开了一种快速检测化学品内分泌干扰活性的试剂盒,包含重组人核受体配体结合域hNR‑LBD蛋白溶液、重组人核受体共激活因子‑EcoR I融合蛋白溶液、特异性Taqman探针、A‑DTT缓冲液和B缓冲液。本发明同时还公... 张照斌 贾晓静 王悦 杨磊 肖寒文献传递 “无薪实习”存在即合理? 2021年 不久前,某大学研究生一年级在读的李泽(化名)向同学发出抱怨,他原本想找知名企业的实习工作,但点开招聘信息一看,不少实习都标明了没有薪资,这让他觉得十分为难,一方面想体验大企业的工作状态,另一方面,并不想被当成"免费劳动力"。采访中,我们发现,不少同学都有与李泽一样的经历,参与一些名头响亮、业内知名的企业实习,付出时间精力却没有任何经济上的回报。无薪也要去,缘何?通过采访,我们了解到,目前"无薪实习"的市场仍处于供过于求的状态。 王悦关键词:供过于求 招聘信息 劳动力 基于干预规则挖掘因果关系与分段干预事件及对比不等式 被引量:1 2011年 为揭示亚复杂系统(SCS)在干预下的特殊行为,提出了对比不等式概念,提出并实现了分段干预规则的挖掘算法;通过在亚复杂系统中施加扰动式干预并分析其动力学效应,提出并实现了基于扰动因果关系挖掘算法。在真实数据上的实验表明,分段干预规则发现了传统挖掘方法难以发现的新干预事件,因果挖掘算法发现了传统方法难以发现的因果关系。 唐常杰 段磊 郑皎凌 杨宁 王悦 朱军关键词:因果关系 离子液体中铀酰配合物的光谱与电化学研究 近年来,核电在中国大规模发展,可以预计到未来数年内核燃料的供应量将会增长。出于可持续发展的考虑,需要经过核燃料循环过程将乏燃料重复利用。而离子液体作为绿色溶剂,将其应用于乏燃料后处理过程中,尤其是电化学分离方面的应用得到... 王悦关键词:乏燃料后处理 离子液体 循环伏安 铀酰配合物 基于流信息距离的多文本流热点挖掘 被引量:5 2011年 把文本流中的热点区分为局部热点和全局热点,分析了二者的相关性,并将Kolmogorov复杂度应用于多文本流中的热点挖掘.首先,定义了基于Kolmogorov复杂度的冗余信息的概念,并论证了文本流存在局部热点的必要条件是冗余信息超过某个阈值;其次,基于条件Kolmogorov复杂度提出了一个相似性度量指标——流信息距离(stream information distance,简称SID),以衡量不同文本流之间的相似度;并借鉴计算生物学领域中的种系发生树的思想,提出了一种基于层次聚类的多文本流全局热点挖掘启发式算法.在合成和真实数据集的实验,验证了算法的收敛性、有效性和规模可伸缩性. 杨宁 唐常杰 王悦 陈瑜 郑皎凌 李红军关键词:冗余信息 在不确定数据集上挖掘优化的概率干预策略 被引量:6 2011年 提出了不确定干预分析模型,主要工作包括:(1)建立了用于多维不确定数据分析的不确定监测点模型(uncertain surveillance);(2)建立了基于不确定监测点的不确定干预策略及挖掘评价算法;(3)在真实数据及仿真数据上对所提出的两种算法作了大量实验比较,验证了所提出的干预策略评价优化算法具有较高精度,效率比朴素方法高出3个数量级,适合在实际系统中处理海量干预评价. 王悦 唐常杰 杨宁 张悦 李红军 郑皎凌 朱军关键词:不确定数据 数据挖掘 海量数据分析 基于基因表达式编程的进化模式定理 被引量:11 2009年 基因表达式编程(GEP)从提出迄今尚无完整的理论体系,严重阻碍了GEP的发展。为解决该问题,首先从理论上深入地研究了GEP计算模型:定义了GEP基因模式及相关的概念,采用概率办法详细分析了单基因GEP应用实例在进化过程中各算子的作用,根据分析结果推导出GEP模式定理,通过实验验证了GEP模式定理的正确性。GEP模式定理的提出,为GEP算法改进评估提供了量化的依据。 王悦 唐常杰 杨宁 陈瑜 徐开阔关键词:基因表达式编程 基于谱聚类的多数据流演化事件挖掘 被引量:8 2010年 为解决从多数据流挖掘演化事件这一难题,提出了一种多数据流上的谱聚类算法SCAM(spectral clustering algorithm of multi-streams),其相似矩阵基于耦合度构造,而耦合度衡量了两个数据流的动态相似性.提出了算法EEMA(evolutionary events mining algorithm),该算法基于聚类模型的演变挖掘多数据流的演化事件.定义了聚类模型凝聚度,用以衡量聚类的紧凑程度,并证明了凝聚度的上界.基于到上界的距离和规范化相似矩阵的特征间隙,定义了聚类模型质量,并作为EEMA的优化目标自动地确定聚簇数k.设计了O-EEMA作为EEMA的优化实现,其时间复杂度为O(cn2/2).在合成和真实数据集上的实验结果表明,EEMA和O-EEMA是有效的、可行的. 杨宁 唐常杰 王悦 陈瑜 郑皎凌关键词:多数据流