郭燕 作品数:9 被引量:7 H指数:1 供职机构: 中国科学技术大学软件学院 更多>> 发文基金: 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 电子电信 更多>>
PSwin:基于Swin Transformer的边缘检测算法 被引量:1 2023年 边缘检测作为一种传统的计算机视觉算法,已经被广泛应用于车牌识别、光学字符识别等现实场景。当边缘检测作为更高层级算法的基础时,比如目标检测、语义分割等算法,又可以应用于城市安防、自动驾驶等领域。好的边缘检测算法能够有效提升上述计算机视觉任务的效率和准确度。边缘提取任务的难点在于目标的大小以及边缘细节的差异性,因此边缘提取算法需能够有效处理不同尺度的边缘。PSwin首次将Transformer应用于边缘提取任务,并提出了一种新型特征金字塔网络,以充分利用骨干网络多尺度和多层次的特征。PSwin使用自注意力机制,相比卷积神经网络架构,可以更有效地提取图像中的全局结构信息。在BSDS500数据集上进行评估时,PSwin边缘检测算法达到了最佳水平,ODS F-measure为0.826,OIS为0.841。 胡名扬 郭燕 郭燕关键词:边缘检测 基于大语言模型的命名实体识别 被引量:1 2024年 虽然以ChatGPT为代表的自然语言生成(NLG)大语言模型在自然语言处理中的大多数任务中取得了良好的表现,但其在序列识别任务,如命名实体识别任务中的表现暂且不如基于BERT的深度学习模型.针对这一点,本文探究性的通过将现有的中文命名实体识别问题改造成机器阅读理解问题,提出并设计了基于情境学习和模型微调的新方法,使NLG语言模型在识别命名实体达到了更好的效果,并且该方法不同于其他方法需要改变基层模型的预训练参数.同时,由于命名实体是模型生成的结果而不是对原始数据的分类,不存在边界问题.为了验证新框架在命名实体识别任务上的有效性,本文在多个中文命名实体识别数据集上进行了实验.其中,在Resume和Weibo数据集上的F1分数分别达到了96.04%和67.87%,相较于SOTA模型分别提高了0.4和2.7个百分点,从而验证了新框架能有效利用NLG语言模型在文本生成上的优势完成命名实体识别任务. 叶名玮 汤嘉 郭燕 吴桂兴关键词:命名实体识别 情境学习 克莱门森大学计算机教育对中国软件学院发展的启示 教学质量决定人才培养质量,培养体系和机制在很大程度上决定教学质量.文章对美国克莱门森大学(Clemson University)计算机科学专业硕士研究生的培养体系进行分析和研究,并结合中国科学技术大学软件学院的教育体系现... 郭燕 李曦 周学海关键词:计算机专业 教育教学 文献传递 面向多视角对比学习和语义增强的多模态预训练方法 被引量:1 2024年 视觉语言预训练(VLP)模型通过对比学习等方法,在多模态任务上表现出了优异的性能。然而现有研究忽视了多视角描述带来的好处,以及语义和语法的重要性。为了解决这一问题,文中提出了多视角对比学习和语义增强多模态预训练(Multi-view learning and Semantic Enhancement for Multimodal pre-training,MulSE)模型。MulSE主要分为3个部分:1)在融合编码器模型中,引入带有生成器的多视角对比学习;2)提出了一种新的自监督视觉语言预训练任务——多模态文本重排序;3)增加并探寻最优MLM掩码比例,最大化利用视觉信息的能力。通过改进预训练任务,采取多种最优策略,并通过实验验证MulSE增强了模态内部和模态间的理解能力以及对文本语法和语义的理解能力。预训练仅用4×106的数据量,在图文检索任务中就达到了先前大型数据集的效果,且其在视觉问答和视觉蕴含任务上的评估效果优于先前的理解式VLP模型。 汤嘉 郭燕 叶名玮 吴桂兴关键词:计算机视觉 多模态 克莱门森大学计算机教育对中国软件学院发展的启示 2013年 教学质量决定人才培养质量,培养体系和机制在很大程度上决定教学质量。文章对美国克莱门森大学(Clemson University)计算机科学专业硕士研究生的培养体系进行分析和研究,并结合中国科学技术大学软件学院的教育体系现状,总结出可参考和借鉴的建议。 郭燕 李曦 周学海关键词:计算机学科 基于USB-Key的iSCSI身份验证安全加固 被引量:1 2015年 主要介绍了iSCSI身份认证中的安全措施及其不足,讨论其面对的安全风险,并针对协议身份验证实现中出现的问题提出了改进方案。考虑了在用户名和密码丢失的情况下,如何通过结合USB-Key的方式改进身份认证方案CHAP,提高iSCSI协议的安全等级和稳定性。实验结果证明,使用USB-Key的CHAP认证可以有效地解决多点登录,并有效提高安全等级。 郭燕 李永堂 李春杰关键词:ISCSI USB-KEY 网络存储 基于信息熵-切分概率模型的新词发现方法 2023年 新词发现是中文自然语言处理的基本任务,对于提升各种下游任务的性能至关重要。文中提出了一种基于信息熵-切分概率模型的新词发现方法,该方法首先基于信息熵从待处理文本中生成候选词集,然后对候选词集进行切分概率计算,从而筛选出真正的新词。针对有无待处理文本相关的标注语料,提出了两种不同的模型。在缺少待处理文本相关标注语料的情况下,使用通用的分词基准数据集训练了多标签Transformer-CRF模型;在具有专业标注语料的情况下,则引入了基于键值的记忆神经网络,以充分融合词语成词信息。实验结果表明,多标签Transformer-CRF模型在Top900词中法律相关词的MAP高达54.00%,较无监督方法生成的候选词集提升了2.15%;在对法律专业语料提取新词时,键值记忆神经网络的表现进一步超过了多标签Transformer-CRF模型,达到了3.43%的效果提升。 祝钰莹 郭燕 郭燕 田凯关键词:新词发现 信息熵 条件随机场 一种两阶段的漫画自动着色模型 被引量:2 2020年 近年来对抗生成网络广泛应用于诸如风格迁移、黑白照片着色等很多图像生成的场景中.本文根据生成网络观点提出了一种新的基于深度学习的漫画着色算法.由于漫画原始的线稿中并没有漫画人物的纹理细节、阴影等信息,所以相比于现有的照片着色生成任务,漫画着色的难度大大增加.为了解决上述问题,文中提出了一个两阶段的漫画自动着色模型.首先,在第一阶段中,网络模型根据线稿和颜色提示信息来丰富漫画的细节信息对漫画主题进行勾勒,并对漫画的整体进行着色;然后第二阶段会对第一阶段的着色错误的信息进行迭代修正,并最终产生满意的漫画着色的结果.在相关的漫画数据集上进行的测试验证了本文算法的有效性.同时为了便于自动化测试,条件信息使用了提示色的方法. 郭燕 郭燕 何彦辉车联网络协议的模糊测试研究综述 被引量:1 2023年 随着网络通信技术和汽车产业的快速发展,车联网内数据交互日益频繁,同时,车联网的安全问题也日益严重.本文首先介绍了针对车联网的多个攻击案例,并引入模糊测试这一解决方案.其次,介绍智能车联网架构,从车载有线网络协议和车载无线通信技术进行分析.之后,介绍模糊测试在车联网中的流程与分类,从测试用例的生成、异常检测手段和测试评估指标三方面分析车联网模糊测试的发展现状.最后展望了车联网模糊测试的未来发展方向. 张翼 郭燕 周继祥 龚汉文 唐顺成 薛吟兴关键词:车联网