元方
- 作品数:3 被引量:12H指数:1
- 供职机构:中国传媒大学更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 一种基于网格的多类散点图类级别可抽象方法
- 本发明提供一种基于网格的多类散点图类级别可抽象方法,属于数据处理技术领域。包括:1、根据预设规则对网格进行筛选得到目标网格,通过执行多次闭运算和开运算对目标网格间的空白网格进行填充处理;2、根据处理结果的网格的填充情况进...
- 元方 王紫毓 李菲孙子涵李月
- “大数据时代”的自动化新闻写作的历史、实践与未来被引量:12
- 2017年
- 大数据时代已经到来,而大数据的一个显著特点,就是分析的对象正在从结构化数据向半结构化数据、非结构化数据转变。这正和新闻文本的特点相契合,因此,大数据中文本挖掘、情感分析的相关方法必将在新闻业中发挥重要作用。
- 沈浩元方
- 基于无监督技术的中文新闻事件数据构建与分析
- 2023年
- 本文针对面向媒介和传播学研究的中文新闻事件数据构建任务进行探索,利用自然语言处理、深度学习和无监督聚类等技术,构建了一套开放性的新闻事件提取框架。构建中文新闻事件数据库的过程可以概括为将原始的新闻文本进行处理,然后进行句法分析和语义角色识别,从中提取三元组,再提取动词并转换为向量表示,之后通过降维和聚类结合人工标注形成结构化数据,最后提出了事件重要性得分以评估新闻中事件的分布情况。利用《人民日报》的新闻数据进行了实验,验证了本文研究的理论与实践价值。
- 元方卢伟沈浩
- 关键词:新闻事件事件数据无监督学习