费仲超
- 作品数:7 被引量:8H指数:2
- 供职机构:上海贝尔股份有限公司更多>>
- 发文基金:上海市博士后科研资助计划资助上海市科委科研计划项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 移动互联网视频传输优化的架构研究被引量:2
- 2012年
- 随着3G移动互联网的快速发展,在手机等移动终端上看视频成为一种日常应用。但互联网上的大部分视频对于移动用户而言,其码率相对较大,而且移动用户的可用带宽受环境影响变化大,不稳定,影响了用户观看视频的体验。提出一种针对移动互联网的视频传输优化解决方案的系统架构,该架构从缓存和压缩两个方面入手,通过缓存缓解运营商的骨干网流量压力,通过视频压缩降低视频码率以满足用户的实际接入带宽。该架构既为运营商节约了带宽、降低了运营成本,同时也保证用户观看视频的连续性,提高用户体验。
- 张世乐魏芳费仲超
- 关键词:移动互联网缓存视频压缩
- 口语对话中非名词指代的消解
- 2012年
- 代词指代消解是全面理解口语对话不可缺少的一部分。根据口语不同于书面语的特点以及非名词指代先行项的特点,在前人工作的基础上提出了一套适合于在口语对话生语料上消解非名词指代的算法。算法基于非名词指代的右边界规则理论,给出了判断候选先行项属于"线性紧邻"还是"层次紧邻"的判别方法,同时给出了候选先行项的过滤规则。算法在公开发布的口语对话语料Tran is-93上进行了测试,实验结果表明,算法提高了消解的正确率和召回率,能消解更多不同的代词,且适用于口语对话生语料。
- 费仲超魏芳朱鲲鹏
- 关键词:指代消解
- WSAM:互联网UGC文本主观观点挖掘系统被引量:3
- 2012年
- 互联网上的用户生成内容UGC(User Generated Content)中蕴含的用户主观观点信息对分析用户行为、用户需求等工作有着重要的价值。设计一套基于自然语言理解的互联网UGC文本主观观点分析系统WSAM,该系统能挖掘出用户主观观点所蕴含的关注对象和主观成分。分析了互联网UGC现象和生成原因,总结出UGC中用户主观观点中的四种主要类型。挖掘用户主观观点过程中,将用户主观观点的挖掘转化为句子中主观观点关注对象的识别和主观成分的判断。算法结合基于词语类、结构类等相关特征,采用最大熵分类器挖掘用户主观观点。实验验证,WSAM系统所采用的算法性能较好,且还能够灵活扩充出情感分析(Opin-ion Mining)等相关应用,同样也能达到较好的结果。
- 费仲超朱鲲鹏魏芳
- 关键词:用户生成内容UGC自然语言处理情感分析
- 基于代理的互联网用户行为分析研究被引量:1
- 2011年
- 在互联网智能化的过程中,互联网用户行为的分析是一个必要的工作。通过架设网络代理,记录用户在互联网上发出的HTTP请求,建立用户行为日志库,并根据Web访问的特性对用户行为日志进行过滤、聚类,缩减数据规模,最后利用开放式分类目录ODP(Open Directory Project)对用户行为进行分类统计,将没有语义信息的用户Web访问记录转化为体现用户偏好的统计直方图。该分析结果可用于互联网信息的个性化推荐,如新闻、商品、广告等,具有较高的商业价值。
- 张世乐魏芳费仲超
- 关键词:用户行为聚类
- 口语对话中的代词指代消解被引量:2
- 2011年
- 提出一套分为两步的代词指代消解算法,算法不需要人工清洗语料及预定义规则.算法第1步采用一些新特征和机器学习算法对名词性指代代词和非名词性指代(non-anaphoric)代词分类,第2步分别对两类代词进行消解.针对名词性代词指代消解,提出了适用于口语对话的特征抽取及表示方法,如代词和候选先行词的距离、语法、语义等的抽取和表示方法,然后通过综合这些特征来选择先行词.针对非名词性指代,将右边界规则(right frontier rule)改进为可以在口语对话中自动抽取的形式,并根据该规则选择先行项.在Byron于2004年发布的语料上测试,消解正确率达到77.0%,召回率达到66.0%.与Byron的工作相比,该方法在保证系统能够自动完成的同时还提高了消解性能.
- 费仲超周雅倩黄萱菁吴立德
- 基于短语模式的文本情感分类算法及其在邮件过滤中的应用
- 文本情感分类是文本分类一个新的研究分支,其目的是判断一篇文章对评价对象所持有的情感倾向是支持还是反对。它可以广泛应用在文本检索、文本过滤等领域中。
对情感分类的研究,目前国外有些学者初步提出了一些方法,同时还建...
- 费仲超
- 关键词:自然语言处理文本分类语义分析邮件过滤
- 文献传递
- 基于语义的特定内容检查与过滤技术及其应用研究
- 吴耿锋黄萱菁刘宗田吴绍春郑宇张博锋周雅倩刘悦刘健闵锦孙晓斌费仲超黄美丽赵林金耀华武晓春张奇吴中勤
- 海量信息过滤技术是一项非常困难的研究任务,是当前国际国内信息领域中的研究热点。该课题完成的网页和邮件过滤器利用本题理论进行基于预计语义的信息过滤,达到了良好的过滤效果,可成为限制不良信息传播的利器。目前,互联网已经进入高...
- 关键词:
- 关键词:语义