徐月梅 作品数:15 被引量:48 H指数:5 供职机构: 北京外国语大学 更多>> 发文基金: 中央高校基本科研业务费专项资金 国家自然科学基金 北京市社会科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 政治法律 更多>>
大语言模型与多语言智能的研究进展与启示 被引量:6 2023年 针对大语言模型(LLM)在高资源语言上表现优异而在低资源语言上表现欠佳的现状,深入分析LLM在多语言场景下的研究现状、技术与局限。首先,从2018年至今以Multi-BERT(multi-lingual Bidirectional Encoder Representations from Transformers)、GPT(Generative Pre-trained Transformer)和ChatGPT(Chat Generative Pre-trained Transformer)等语言模型为代表,综述LLM的发展脉络;然后,具体分析了大语言模型在多语言智能上的探索,总结现有LLM在多语言智能的研究局限及其改进方向;最后,探讨LLM未来的多语言智能应用场景。分析指出现有LLM受限于多语言训练语料不均衡,存在语言文化的伦理偏见、语言模型的风格趋同化、多语言能力评估基准缺乏以及多语言场景下的模型幻象输出等问题,未来可采用同一语系家族语言的联合训练、多语言适配器技术、跨语言迁移学习技术、提示语工程技术、基于人工智能反馈的强化学习技术等策略实现多语言智能的LLM。 徐月梅 胡玲 赵佳艺 杜宛泽 王文清情感分类方法及系统 本发明涉及一种情感分类方法及系统。该分类方法包括:对待测样本进行数据预处理操作,获得待测样本的特征词集合;运用朴素贝叶斯算法对待测样本的特征词集合进行运算,生成待测样本的特征集合所属类别的概率;运用支持向量机对待测样本的... 徐月梅 王子厚 冯驿 曾颖菲 刘苗苗情感分类方法及系统 本发明涉及一种情感分类方法及系统。该分类方法包括:对待测样本进行数据预处理操作,获得待测样本的特征词集合;运用朴素贝叶斯算法对待测样本的特征词集合进行运算,生成待测样本的特征集合所属类别的概率;运用支持向量机对待测样本的... 徐月梅 王子厚 冯驿 曾颖菲 刘苗苗文献传递 基于深度融合特征的政务微博转发规模预测模型 被引量:6 2020年 【目的】预测政务微博的转发规模,研究及评估影响政府微博传播规模的重要特征,把握政务微博的信息舆论走向。【方法】针对政务微博的特点,提出一种深度融合特征的政务微博转发预测方案,引入卷积神经网络(CNN)和梯度提升决策树(GBDT)将发布者特征、时间特征及内容特征深度融合,预测政务微博的转发规模并对影响转发规模的特征进行重要性排序,找出影响政务微博转发规模的最重要特征。【结果】引入文本语义特征显著提升了转发规模的预测准确率,所提模型将政务微博转发规模的预测准确率提升至0.933。特征重要性实验结果表明,文本语义特征在影响政务微博转发规模的所有特征中最为重要。【局限】未考虑间接转发对整体转发规模的影响。【结论】深度融合发布者特征、时间特征及内容特征的CNN+GBDT模型能够显著提高政务微博转发规模预测的准确率。 徐月梅 刘韫文 蔡连侨关键词:卷积神经网络 文本分类 一种基于CNN-BiLSTM多特征融合的股票走势预测模型 被引量:12 2021年 【目的】在传统基于股市数值分析的基础上,研究新闻对股票市场的影响,提高股票走势预测的准确率。【方法】引入卷积神经网络和双向长短时记忆模型挖掘财经新闻中的新闻事件类型和新闻情感倾向,提出一种深度融合股市财务数据、新闻事件特征及新闻情感特征的股票预测模型。为了验证所提模型对不同行业个股走势的可行性,分别选取家用电器行业和通信行业的两只股票作为实验对象。【结果】引入新闻事件和情感特征后,模型的预测准确率进一步提升,家用电器行业准确率提高了11.6%,通信行业准确率提高了25.6%。【局限】模型未考虑不同预测周期对股票预测的影响。【结论】引入新闻事件类型和情感倾向能够提高股票走势预测的性能。本文评估影响股票走势的因素,并对影响股票走势预测的特征重要性进行排序。 徐月梅 王子厚 吴子歆关键词:情感倾向 股票走势 基于流形学习的新闻主题关系构建和演化研究 被引量:2 2016年 【目的】通过对以互联网为媒介的新闻报道的主题演化研究,分析新闻主题的产生、发展和演变过程,把握媒体舆论方向。【方法】引入流形学习构建全局时间跨度的新闻主题关联关系,挖掘由LDA主题模型识别得到的各个时间窗口的高维主题向量间的关系,在低维平面上实现主题聚类和相互关联的可视化,提出利用社会网络理论指标分析主题的演化结果。【结果】利用2015年美国有线电视新闻网对中国的新闻报道进行主题关系构建和演化,结果表明该方法能够发现主题在全局时间跨度的演化趋势。【局限】时间窗口长度对主题演化的效果和可变时间窗口长度机制没有涉及。【结论】新闻主题演化分析方法能够在低维可视平面上描绘主题在全局时间跨度的演化,避免主题由于相邻时间窗口关联失效而导致全局演化路径的断裂。 徐月梅 李杨 梁野 蔡连侨关键词:流形学习 基于标签嵌入注意力机制的多任务文本分类模型 [目的]将文本分类算法根据不同分类任务的特征进行动态调整,使文本分类算法的性能与任务特征紧密相关.[方法]提出一种基于标签的注意力权重学习,通过标签嵌入的方法同时对文本语义的词向量和文本的TF-IDF 分类矩阵进行学习,... 徐月梅 樊祖薇 曹晗关键词:文本分类 多任务 基于标签嵌入注意力机制的多任务文本分类模型 被引量:3 2022年 【目的】将文本分类算法根据不同分类任务的特征进行动态调整,使文本分类算法的性能与任务特征紧密相关。【方法】提出一种基于标签的注意力权重学习,通过标签嵌入的方法同时对文本语义的词向量和文本的TF-IDF分类矩阵进行学习,为文本中的单词赋予不同的权重提取与分类任务更相关的特征,改进文本的注意力权重学习。【结果】所提方法相比现有的LSTMAtt、LEAM和SelfAtt方法在准确率上平均提高了3.78%、5.43%和11.78%,并通过可视化结果分析验证所提方法的文本分类性能。【局限】未比较不同词向量表示对文本分类任务的性能影响。【结论】为多任务文本分类算法的设计提出了有效的改进和优化方案。 徐月梅 樊祖薇 曹晗关键词:文本分类 多任务 一种基于情感特征表示的跨语言文本情感分析模型 被引量:5 2022年 基于深度学习的跨语言情感分析模型需要借助预训练的双语词嵌入(Bilingual Word Embedding, BWE)词典获得源语言和目标语言的文本向量表示。为了解决BWE词典较难获得的问题,该文提出一种基于词向量情感特征表示的跨语言文本情感分析方法,引入源语言的情感监督信息以获得源语言情感感知的词向量表示,使得词向量的表示兼顾语义信息和情感特征信息,用于跨语言文本的情感预测。实验以英语为源语言,分别以汉语、法语、德语、日语、韩语和泰语6种语言为目标语言进行跨语言情感分析。实验结果表明,该文所提模型与机器翻译方法、不采用情感特征表示的跨语言情感分析方法比较,能够分别提高约9.3%和8.7%预测准确率。该模型在德语上的跨语言情感分析效果最好,英语与德语同属日耳曼语族,在语法和语义上更为接近,符合实验预期。实验部分对影响跨语言情感分析模型的相关因素进行了分析。 徐月梅 施灵雨 蔡连侨大语言模型的技术应用前景与风险挑战 被引量:7 2024年 针对大语言模型(LLM)技术的快速发展,剖析它的技术应用前景和风险挑战,对通用人工智能(AGI)的发展和治理有重要参考价值。首先,以Multi-BERT(Multilingual Bidirectional Encoder Representations from Transformers)、GPT(Generative Pre-trained Transformer)和ChatGPT(Chat Generative Pre-Trained Transformer)等语言模型为代表,综述LLM的发展脉络、核心技术和评估体系;其次,分析LLM现存的技术局限和安全风险;最后,提出LLM在技术上改进、政策上跟进的建议。分析指出作为发展阶段的LLM,现有模型存在非真实性及偏见性输出、实时自主学习能力欠缺,算力需求庞大,对数据质量和数量依赖性强,语言风格单一;存在数据隐私、信息安全和伦理等方面的安全风险。未来发展可从技术上继续改进,从“大规模”转向“轻量化”、从“单模态”走向“多模态”、从“通用”迈入“垂类”;从政策上实时跟进,实施有针对性的监管措施,规范应用和发展。 徐月梅 胡玲 赵佳艺 杜宛泽 王文清