陈友
- 作品数:17 被引量:210H指数:5
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家高技术研究发展计划国家重点基础研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理电子电信文化科学更多>>
- 基于决策树的递归包分类算法
- 提出了一种新的包分类算法sensitive recursive classification(SRC).它建立在决策树基础之上,在以防火墙、访问控制列表为种子的规则库中进行实验.实验结果表明,SRC内存使用比hierar...
- 张艳军陈友郭莉程学旗
- 关键词:包分类决策树映射
- 文献传递
- 一种高效的面向轻量级入侵检测系统的特征选择算法被引量:56
- 2007年
- 特征选择是网络安全、模式识别、数据挖掘等领域的重要问题之一.针对高维数据对象,特征选择一方面可以提高分类精度和效率,另一方面可以找出富含信息的特征子集.文中提出一种wrapper型的特征选择算法来构建轻量级入侵检测系统.该算法采用遗传算法和禁忌搜索相混合的搜索策略对特征子集空间进行随机搜索,然后利用提供的数据在无约束优化线性支持向量机上的平均分类正确率作为特征子集的评价标准来获取最优特征子集.文中按照DOS,PROBE,R2L,U2R4个类别对KDD1999数据集进行分类,并且在每一类上进行了大量的实验.实验结果表明,对每一类攻击文中提出的特征选择算法不仅可以加快特征选择的速度,而且基于该算法构建的入侵检测系统在建模时间、检测时间、检测已知攻击、检测未知攻击上,与没有运用特征选择的入侵检测系统相比具有更好的性能.
- 陈友沈华伟李洋程学旗
- 关键词:遗传算法禁忌搜索线性支持向量机入侵检测系统
- 面向网络论坛的突发话题发现被引量:16
- 2010年
- 每天有大量的信息涌现在论坛上,用户可以通过论坛获知目前国际国内正在发生的一些突发事件。如何使用机器自动化的方法检测论坛中的突发话题已经成为搜索引擎以及网络挖掘系统的一项基础任务。话题检测与跟踪模型(TDT)可以很好的解决话题发现问题,但是TDT处理的对象是新闻语料,与论坛内容相比,新闻语料更准确、严谨、规范。TDT中使用的方法不适合用语随意的论坛。因此在网络论坛这种噪音环境下的话题检测面临着一定的困难与挑战。文中提出一种基于噪音过滤的话题发现模型,它从内容和用户参与度两个角度来检测论坛话题。在"水木社区"的"水木特快"上进行了相关的实验,实验结果表明该文提出的模型不仅可以检测突发话题,而且可以检测与这些话题相对应的用户社区。
- 陈友程学旗杨森
- 关键词:计算机应用中文信息处理网络论坛时间序列
- 基于决策树的递归包分类算法
- 包分类速度已经成为网络传输的瓶颈,提高算法性能是解决传输瓶颈的必然要求。该文提出了一种新的包分类算法SRC(sensitive Recursive Classification)。它建立在决策树基础之上,其基本思想是:根...
- 陈友张艳军程学旗
- 关键词:包分类算法决策树映射技术网络传输
- 文献传递
- 面向社会信息网络的社区分析研究
- 程学旗刘悦沈华伟陈海强吕建明陈友黄俊铭王雷
- 根据项目的研究计划,围绕社会信息网络的社区分析,课题组从网络压缩、结构统计显著性、网络动力学、概率统计推断等多个角度研究了网络层次化、重叠、多尺度社区结构以及其在信息推荐方面的应用,形成了突出的研究成果。主要研究成果包括...
- 关键词:
- 面向网络论坛的突发话题抽取
- 每天有大量的信息涌现在论坛上,用户可以通过论坛获知目前国际国内正在发生的一些突发事件。这些突发事件或话题在论坛中并不是显而易见的,它们需要通过人工的总结与归纳。这需要花费大量的人力资源,并且效率低下。如何使用机器自动化的...
- 陈友程学旗杨森
- 关键词:网络论坛时间序列
- 文献传递
- 面向网络论坛的高质量主题发现被引量:25
- 2011年
- 提出了一种通用的高质量主题发现框架.在该框架下,利用特征抽取技术提取内容特征,利用结构特征去发现高质量主题.提出了一种基于遗传算法、禁忌搜索与机器学习的特征选择算法,用来评价被抽取特征的重要性.在腾讯论坛数据集上进行了大量的实验.实验结果表明,该框架能够很好地发现高质量主题.提出的特征抽取算法、特征选择算法以及高质量主题发现框架能够在很多Web2.0领域得到应用,例如,博客、社会网络平台等.
- 陈友程学旗杨森
- 关键词:网络论坛特征抽取
- 基于直推式方法的网络异常检测方法被引量:32
- 2007年
- 网络异常检测技术是入侵检测领域研究的热点和难点内容,目前仍然存在着误报率较高、对建立检测模型的数据要求过高、在复杂的网络环境中由于"噪音"的影响而导致检测率不高等问题.基于改进的TCM-KNN(transductive confidence machines for K-nearest neighbors)置信度机器学习算法,提出了一种网络异常检测的新方法,能够在高置信度的情况下,使用训练的正常样本有效地对异常进行检测.通过大量基于著名的KDD Cup1999数据集的实验,表明其相对于传统的异常检测方法在保证较高检测率的前提下,有效地降低了误报率.另外,在训练集有少量"噪音"数据干扰的情况下,其仍能保证较高的检测性能;并且在采用"小样本"训练集以及为了避免"维灾难"而进行特征选取等优化处理后,其性能没有明显的削减.
- 李洋方滨兴郭莉陈友
- 关键词:奇异值
- 基于决策树的递归包分类算法
- 提出了一种新的包分类算法sensitive recursive classification(SRC).它建立在决策树基础之上,在以防火墙、访问控制列表为种子的规则库中进行实验.实验结果表明,SRC内存使用比hierar...
- 张艳军陈友郭莉程学旗
- 关键词:包分类决策树映射
- 文献传递
- 基于MRMHC-LSVM的IP流分类被引量:1
- 2009年
- 提出了一种构建轻量级的IP流分类器的wrapper型特征选择算法MRMHCLSVM。该算法采用改进的随机变异爬山(MRMHC)搜索策略对特征子集空间进行随机搜索,然后利用提供的数据在无约束优化线性支持向量机(LSVM)上的分类错误率作为特征子集的评价标准来获取最优特征子集。在IP流数据集上进行了大量的实验,实验结果表明基于MRMHC-LSVM的流分类器在不影响分类准确度的情况下能够提高检测速度,与当前典型的流分类器NBK-FCBF相比,基于MRMHC-LSVM的IP流分类器具有更小的计算复杂度与更高的检测率。
- 李文法段洣毅陈友程学旗
- 关键词:流分类