文继荣 作品数:106 被引量:330 H指数:8 供职机构: 中国人民大学 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 文化科学 电子电信 政治法律 更多>>
大语言模型时代下的信息检索研究发展趋势 被引量:2 2023年 以ChatGPT为代表的大语言模型带来了人工智能技术的新一轮发展浪潮,获得了广泛的社会关注。大语言模型通过大规模无标注数据预训练、指令微调、人类对齐等关键技术途径,学习到了丰富的世界知识,具有较好的文本理解与生成能力,能够有效求解各种复杂任务。这一重要技术进展对于信息检索领域的发展带来了新的机遇。本文从大语言模型对于已有信息检索架构的改进以及现有检索技术如何改进大语言模型两个方面进行阐述,针对相关科学问题的可行技术方法进行了梳理与展望,探讨大语言模型时代下的信息检索发展趋势,旨在推动信息检索领域的科研进步。 赵鑫 窦志成 文继荣关键词:信息检索 AIGC时代网络信息内容的法律治理——以大语言模型为例 被引量:7 2023年 大语言模型是发展人工智能生成内容(AIGC)最为关键的技术之一。它在推动AIGC发展的同时,也会带来生成违法和不良信息的风险。大语言模型生成违法和不良信息的原因较为复杂,造成的风险程度更为严重,因而给网络信息内容的法律治理带来挑战。为此,中国在立法上细化相关主体在网络信息内容生成过程中的义务,新增对人工智能生成内容进行标识的义务,但相关规则仍存在着继续完善的空间。未来,中国应进一步明确人工智能生成内容致害的侵权责任规则,确定侵权责任的主体和归责原则,基于现行法构造合理的解释论;合理界定网络信息内容服务平台对内容的注意义务,将AIGC技术发展和产业状况纳入考量因素;完善对人工智能生成内容进行标识的要求,区分场景规定不同的标识要求,增加服务使用者和内容传播者的标识义务。 李铭轩 文继荣基于多任务学习的位置倾向性得分预测算法 被引量:1 2023年 用户搜索时产生的点击数据分布,在不同的搜索场景下存在较大差异.现有算法如融合上下文的位置模型(contextual position based model,CPBM)往往只通过单个模型预测多种场景下的位置倾向性得分,不可避免地降低了模型在不同场景下的预测准确性,影响去除位置偏置的效果.基于上述问题提出一种基于多任务学习的多门专家混合位置倾向性得分预测模型(multi-gate contextual position based model,MCPBM),在CPBM模型的基础上加入信息筛选结构,解决了多场景数据联合训练时预测准确性不佳的问题.同时,为了缓解不同任务收敛速度不一致的问题,提出了指数加权平均权重动态调整算法,在加速模型训练的同时提升了模型整体预测性能.实验结果表明提出的MCPBM模型在多场景数据联合训练时,预测准确性优于传统的CPBM;在使用MCPBM模型去除位置偏置后,基于生成的无偏数据训练得到的排序模型,在AvgRank排序指标上有1%~5%的提升. 曹泽麟 徐君 董振华 文继荣关键词:多任务学习 一种基于知识增强记忆网络的序列推荐方法 本发明提供一种基于知识增强记忆网络的序列推荐方法,利用GRU获取用户的序列偏好表示,利用KV‑MN来存储知识库信息,并通过KV‑MNs构建基于属性的用户偏好表示,将所述序列偏好表示和所述基于属性的用户偏好表示合并生成最终... 赵鑫 黄瑾 文继荣文献传递 基于记忆网络的个性化搜索方法及系统 本发明涉及一种基于记忆网络的个性化搜索方法及系统,该方法的具体过程为:S1、基于记忆网络,根据用户当前需求从查询内存和文档内存中动态寻找相关的历史行为;S2、基于记忆网络,从意图内存中寻找与查询和文档相关的会话信息;S3... 窦志成 文继荣对话生成方法和装置 本发明提供一种对话生成方法和装置,方法包括:对用户输入语句进行检索处理以获得检索结果集和评分集;其中,检索结果集包括第一检索结果,评分集包括第一评分,第一检索结果对应一个第一评分;根据第一检索结果和第一评分确定第一检索结... 窦志成 朱余韬 文继荣文献传递 一种计算大图节点邻近度的TopPPR方法 本发明涉及一种计算大图节点邻近度的TopPPR方法,其特征在于包括以下步骤:1)确定Top‑k节点集和候选集的初始值;2)对当前候选集执行前向搜索,并根据前向搜索结果对当前Top‑k节点集和候选集进行更新;3)以前向搜索... 魏哲巍 何晓东 肖小奎 王思博 商烁 文继荣文献传递 一种利用个人词向量消除关键词歧义的个性化搜索模型 本发明通过人工智能领域的方法,实现了一种利用个人词向量消除关键词歧义的个性化搜索模型,包括预训练词向量模块、个性化排序模型、在线更新模块三部分。通过为每个用户设置用户个人的词向量矩阵,得到查询和文档的个性化词向量表示,再... 窦志成 姚菁 文继荣文献传递 一种基于深度匹配模型的跨平台商品匹配方法 本发明涉及一种基于深度匹配模型的商品匹配方法,其包括以下步骤:定义两个商品X、Y的标题相似度和属性相似度;计算得到两个商品X、Y的商品标题相似度和商品属性相似度;将两个商品X、Y的商品标题相似度SIM<Sub>t</Su... 窦志成 李娟 文继荣文献传递 一种提高预训练模型性能的过参数化方法 本发明公开了一种提高预训练模型性能的过参数化方法,其包括:S1:获取预训练模型;S2:根据打分函数Iw来确定模型的不同结构是否过参数化;S3:对需要过参数化的结构中的矩阵进行MPO分解,得到高阶张量;S4:利用梯度下降法... 高泽峰 赵鑫 文继荣 刘沛羽 周昆