山西大学智能信息处理研究所 作品数:28 被引量:101 H指数:6 相关作者: 郭炳 更多>> 相关机构: 太原师范学院教育学院 更多>> 发文基金: 国家自然科学基金 国家教育部博士点基金 教育部“新世纪优秀人才支持计划” 更多>> 相关领域: 自动化与计算机技术 经济管理 社会学 理学 更多>>
基于PU学习的链接预测方法 2019年 基于分类的链接预测方法中,由于链接未知节点对的大规模性与不确定性,选择可靠负例成为构造链接预测分类器的难点问题.为此,文中提出基于正例和无标识样本(PU)学习的链接预测方法.首先,提取节点对的拓扑信息以构造样本集.再利用社区结构确定候选负例的分布,基于分布进行多次欠采样,获得多个候选负例子集,集成多个负例集与正例集中构建的分类器选择可靠负例.最后基于正例与可靠负例构造链接预测分类器.在4个网络数据集上的实验表明文中方法预测结果较优. 李琦 王智强 梁吉业关键词:链接预测 基于最短路径的关键蛋白质识别研究 被引量:1 2011年 关键蛋白质的识别有助于从系统水平上理解生命活动过程,基于蛋白质相互作用网络拓扑特征的关键蛋白质识别可以有效地提高识别精度和速度。通过蛋白质节点的最短路径数和点介数可以作为衡量其节点中心度的方法,但计算速度和计算规模有限。根据所预测蛋白质相互作用网络的特点,提出了基于最短路径技术的关键蛋白质识别方法,选择合理的识别阈值和拓扑参数,对全蛋白质相互作用网络的关键蛋白质进行预测。实验表明,所提出的识别方法可以有效描述蛋白质节点的重要性,在不影响计算精度的前提下,可对连通性好,边密度大的全蛋白质相互作用网络进行关键蛋白质识别。 嘉泽宁 杨贵 郑文萍关键词:蛋白质相互作用网络 最短路径 介数 依据节点贡献的链路预测方法 被引量:9 2016年 链路预测是复杂网络的一个重要研究方向,基于节点对的相似性指标进行预测是最为常用的一种方法.已有的链路预测方法通常是基于节点对的共同邻居节点的个数或度值来定义它们之间的相似性度量.然而,节点间的关系不仅与公共节点自身的性质有关,节点间联系的紧密程度也会起到一定作用.基于这个观点,提出一种新的节点对相似性指标,称为依据节点贡献(Node Contribution)的相似性指标.该指标主要通过定义节点的贡献来刻画共同邻居节点之间的联系紧密程度,进而给出节点相似性的计算方法.在六组实际数据集上的实验分析表明该方法比三种经典的链路预测方法具有更好的链路预测性能. 陈佳璐 钱宇华 张晓琴 梁新彦关键词:链路预测 非对称的异质信息网络推荐算法 被引量:9 2020年 异质信息网络作为一个新的研究方向,近年来在推荐系统领域引起了广泛的关注。目前基于异质信息网络的大部分相似度计算方法认为用户的相似关系是对称的,但是在实际中由于不同用户评分的物品数量不同,有时会导致相似关系出现非对称情况。为了能够更好地度量用户之间的相似关系,首先在均方差相似度公式的基础上,引入非对称系数刻画相似度的非对称性;然后根据元路径的特征赋予不同元路径权重,并将不同元路径的相似度结果进行加权以提高用户相似度的准确性;最后通过在矩阵分解模型中融合相似度信息与评分信息实现基于异质信息网络的评分预测推荐。在数据集上的实验结果表明,该算法在平均绝对误差和均方根误差两个评价指标上优于传统算法。 赵传 张凯涵 梁吉业关键词:相似度 矩阵分解 融合知识的多视图属性网络异常检测模型 被引量:1 2023年 属性网络异常检测在网络安全、电子商务和金融交易等领域中具有重要的理论与现实意义,近年来受到了越来越多的关注.大多数异常检测方法凭借网络有限的属性或结构信息进行决策生成,往往难以对异常模式做出可靠的描述.此外,网络节点对应的实体往往关联着丰富的领域知识,这些知识对于异常的识别具有重要的潜在价值.针对上述情况,提出一种融合知识的多视图网络异常检测模型,在多视图学习模式下通过数据与知识的互补融合实现了对异常节点的有效识别.首先,使用TransR模型由领域知识图谱抽取知识向量表示,并借助输入网络的拓扑关系构造其孪生网络.接着,在多视图学习框架下构建属性编码器和知识编码器,分别将属性网络及其孪生网络嵌入到各自的表示空间,并聚合为统一网络表示.最后,综合不同维度上的重构误差进行节点异常分数评价,从而识别网络中的异常节点.在真实网络数据集上的对比实验表明,提出的模型能够实现对领域知识的有效融合,并获得优于基线方法的异常检测性能. 杜航原 曹振武 王文剑 白亮关键词:异常检测 知识融合 一种双通道半监督网络表示学习模型 2024年 在半监督网络表示学习中,节点标签对于网络在不同空间中映射关系的建立具有重要指导意义。然而在很多实际任务中,可用标签信息往往比较有限或难以获取,这导致在学习网络低维表示的过程中无法提供充分有效的监督。针对这一问题,提出了一种双通道半监督网络表示学习模型,该模型以自编码器为基本框架,由自监督和半监督两个信息传递通道构成。自监督信号与标签信息分别在两个通道中对网络表示映射关系的建立提供指导,同时二者之间形成信息互补与增强。考虑到两个通道间可能存在信息冗余,在互信息视角下设计了冗余识别与消除机制。在此基础上,构造了一体化优化模型,实现自监督学习与半监督学习的协同,使学习到的网络表示更好地捕捉和保持网络的结构和特性。在真实数据集上的实验结果表明,提出的模型学习的网络表示在节点分类、聚类和可视化等任务中能够获得优于基线方法的性能。 杜航原 谢富中 王文剑 白亮关键词:互信息 基于邻域粗糙集的企业财务危机预警指标选择 被引量:21 2009年 财务危机预警由于其在经济管理实践中的重要性,日益受到广泛关注。就财务危机预警问题而言,首要问题是如何从大量备选指标中科学地选择预警指标。本文在对已有研究进行分析的基础上,应用邻域粗糙集模型对预警备选指标进行属性约简,得到利益相关者重点观测和预警建模所需的预警指标。研究结果显示,邻域粗糙集约简明显优于经典粗糙集约简,能够以较少的特征变量实现较高的分类精度。 宋鹏 梁吉业 曹付元关键词:邻域粗糙集 财务危机预警 融合二连通模体结构信息的节点分类算法 2024年 节点表示学习将图结构数据信息编码到低维的潜在空间中,在节点分类、聚类、链路预测等机器学习任务中被广泛应用。在复杂网络中,节点与节点之间不仅存在直接相连的低阶结构,也存在以特殊连接模式形成的高阶结构,称为模体。提出一种融合二连通模体结构信息的节点分类算法(FMI),利用节点间高阶二连通模体信息学习节点表示,完成节点分类任务。首先,统计网络中的二连通模体,利用其中信息提出一个节点重要性的度量指标——模体比值。根据模体比值计算采样概率进行邻域采样;构造一个带权辅助图以融合网络节点连接的低阶关系与高阶关系,对节点进行加权邻域聚合以得到节点表示。在5个数据集Cora、Citeseer、Pubmed、Wiki和DBLP上执行节点分类任务,与5种经典基准算法进行对比,所提算法FMI在准确度和F1-分数等指标上表现良好。 郑文萍 葛慧琳 刘美麟 杨贵自主确定社区个数的二模网络社区发现算法 被引量:8 2015年 现有算法虽然能发现二模网络的社区结构,但由于实际网络的多样性或复杂性,往往不能预知社区个数及相关信息,无法相对准确地发现真实的社区结构.针对此问题,文中提出自主确定社区个数的二模网络社区发现算法——聚类分配算法(CAA).该算法有效利用二模网络中两类节点的交互信息,解决确定社区个数的难题.对网络中的T类节点进行聚类,再将B类节点按照某种分配机制分配到已有类中.实验表明,CAA比基于资源分布矩阵的算法和基于边集聚系数的算法有更高的准确性,能获得更高质量的社区划分. 郭改改 钱宇华 张晓琴 李烨斌关键词:模块度 基于Self-Attention的句法感知汉语框架语义角色标注 2022年 框架语义角色标注(Frame Semantic Role Labeling,FSRL)是基于FrameNet标注体系的语义分析任务。语义角色标注通常对句法有很强的依赖性,目前的语义角色标注模型大多基于双向长短时记忆网络Bi-LSTM,虽然可以获取句子中的长距离依赖信息,但无法很好地获取句子中的句法信息。因此,引入Self-Attention机制来捕获句子中每个词的句法信息。实验结果表明,该模型在CFN(Chinese FrameNet,汉语框架网)数据集上的F_(1)值得到了提升,证明了融入self-attention机制可以改进汉语框架语义角色标注模型的性能。 王晓晖 李茹 王智强 柴清华 韩孝奇关键词:语义角色标注