您的位置: 专家智库 > >

吴文鹏

作品数:2 被引量:14H指数:1
供职机构:江南大学数字媒体学院更多>>
发文基金:国家自然科学基金江苏省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇隐私
  • 1篇隐私保护
  • 1篇源域
  • 1篇社交
  • 1篇社交网
  • 1篇社交网络
  • 1篇数据采集
  • 1篇数据采集技术
  • 1篇爬虫
  • 1篇网络
  • 1篇网络爬虫
  • 1篇鲁棒
  • 1篇鲁棒性
  • 1篇模糊聚类
  • 1篇聚类
  • 1篇PYTHON
  • 1篇API
  • 1篇采集器

机构

  • 2篇江南大学

作者

  • 2篇刘渊
  • 2篇吴文鹏
  • 2篇徐雁飞

传媒

  • 1篇计算机应用研...
  • 1篇计算机科学

年份

  • 2篇2017
2 条 记 录,以下是 1-2
排序方式:
具备跨源域学习能力的模糊聚类算法研究
2017年
针对传统迁移学习聚类算法因单一源域到单一目标域且两者类别数必须一致的约束而达不到良好的聚类效果问题,提出了一种跨源域学习的聚类算法。该算法具有三大优点:a)仅扩大源域数目且取消了源域类别数的限定,算法可以自适应选择源域进行学习,所以算法的迁移学习能够得到较大的提升;b)由于所利用的源域知识不会暴露原数据,所以算法具有良好的源域数据隐私保护性;c)通过调节平衡参数可以使算法退化为传统的聚类算法,因此该算法的聚类性能是有所保障的。通过在模拟数据集和真实数据集上的实验,验证了该算法较之现有迁移学习聚类算法具有更好的迁移能力,且聚类性能及鲁棒性也有较大的提升。
吴文鹏刘渊徐雁飞
关键词:隐私保护鲁棒性
社交网络数据采集技术研究与应用被引量:14
2017年
随着社交网络的快速发展,对其研究也逐步深入。显然,社交网络基础数据的获取对研究具有非常重要的意义。针对目前已有的数据采集方案,根据新浪授权标准以及最新的微博加密方式,研究了两种采集方案:1)经OAuth2.0认证后,通过微博API接口获取数据;2)在RSA2加密方式下模拟登录微博,再通过网络爬虫抓取数据。同时,还研究了通过网页采集器针对微博编写适当的采集规则进而实现对数据的获取。3种数据采集方案都能有效地对数据进行采集且各具特点,针对数据的采集需求,提出融合不同的采集方案的策略。经实验研究,方案的融合策略可快速、高效地实现大数据量的采集。
徐雁飞刘渊吴文鹏
关键词:PYTHON网络爬虫采集器
共1页<1>
聚类工具0