陈巧
- 作品数:5 被引量:31H指数:3
- 供职机构:华东师范大学更多>>
- 发文基金:国家社会科学基金更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 朴素贝叶斯算法与Bootstrapping方法相结合的中文物种描述文本语义标注研究被引量:9
- 2014年
- 【目的】降低中文物种描述文本语义标注的学习成本。【方法】设计基于Bootstrapping的弱监督学习方法,以少量数据为基础,迭代执行学习和标注过程。在迭代过程中,利用置信度最高的标注数据扩充知识库,提升标注能力。【结果】运用15 041条数据测试算法效率,F-value的平均值达到0.911 2。【局限】对过于稀疏的数据,标注效率相对较低。【结论】本研究设计的方法不仅有效降低系统学习对训练数据规模的要求,而且可提高标注效率。
- 段宇锋朱雯晶陈巧崔红
- 关键词:朴素贝叶斯语义标注
- CEO特征对R&D投入的影响——基于我国制造业上市公司的实证分析
- 在激烈的市场竞争环境下,研究开发(R&D)活动作为技术创新的源泉,已成为了获取企业核心优势,生存和发展的关键。越来越多的企业认识到R&D增强市场竞争能力的作用,并将R&D管理提到企业的战略高度。随着R&D实践的开展,相关...
- 陈巧
- 文献传递
- 未登录中文领域术语识别研究 ——以系统生物学领域为例
- 术语是特定学科领域基本概念的语言单元,是学科领域最核心的知识。随着技术的进步,涌现出海量的科技文献,各学科领域的术语也在不断发展变化,传统由人工获取术语的方式已不再可行,利用计算自动获取术语成为当前的发展趋势。领域术语的...
- 陈巧
- 关键词:未登录词识别条件随机场模型
- 文献传递
- CEO特征对R&D投入的影响——基于中国制造业上市公司的实证分析被引量:18
- 2014年
- 研究与开发(R&D)投入作为企业的一项战略选择,受到企业处于战略决策层高层管理者的有限理性和认知模式的制约。以中国制造业上市公司2009—2011年的R&D投入数据为研究样本,探讨CEO能力、动力及权力等特征与R&D投入的关系,结果发现:CEO工作背景、政治关联、持股比例与研发投入存在显著正相关关系。因此,选择具有创新意识、能够发现创新机会、辨别投资风险的CEO并提高其持股比例,有助于企业的R&D投入,进而有助于企业迅速发展;而减少政府对经济的干预,才有利于激发更多企业参与公平公正的市场竞争,减少企业通过政治关联进行寻租的机会,促使企业自主提高R&D投入的比例。
- 薛跃陈巧
- 关键词:R&D投入R&D强度
- 条件随机场与领域本体元素集相结合的未登录词识别研究被引量:3
- 2015年
- 【目的】建立未登录词识别模型,提升发现自然科学领域文本中未登录词的能力,同时降低人工干预成本。【方法】在假设的基础上,构建条件随机场(CRFs)与领域本体元素集相结合的未登录词识别模型。以生物多样性文本为样本,通过比较不同模型性能的差异,检验假设,验证模型的合理性。【结果】实验结果表明,CRFs模型选择单纯的字、字词混合序列、字词混合序列及默认词性、字词混合序列及含自定义语义功能标记的词性为特征时,未登录词识别能力依次提升。该结果证明研究假设为真,本文建立的模型科学、合理。【局限】模型标注未登录词的准确性有待提升。【结论】该模型具有更强的未登录词识别能力,同时可以极大地降低人工建立训练集的成本。
- 段宇锋朱雯晶陈巧刘伟刘凤红
- 关键词:条件随机场领域本体未登录词识别