找回密码
 注册
关于网站域名变更的通知
查看: 1015|回复: 1
打印 上一主题 下一主题

[毕业设计] 中英命名实体识别及对齐中的中文分词优化

[复制链接]
  • TA的每日心情
    奋斗
    2020-9-8 15:12
  • 签到天数: 2 天

    [LV.1]初来乍到

    跳转到指定楼层
    1#
    发表于 2021-4-27 10:58 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

    EDA365欢迎您登录!

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    摘 要: 中文分词结果对中英命名实体识别及对齐有着直接的影响,本文提出了一种命名实体识别及对齐中的 中文分词优化方法.该方法利用实体词汇的对齐信息,首先修正命名实体识别结果,然后根据实体对齐结果调整分词 粒度、修正错误分词.分词优化后的结果使得双语命名实体尽可能多地实现一一对应,进而提高中英命名实体翻译抽 取和统计机器翻译的效果.实验结果表明了本文优化方法的有效性. . E- Q0 ?6 o# |+ E

    - q& _3 K& H; b4 |4 H关键词: 分词;命名实体识别;双语对齐;机器翻译
    6 n* R' N4 }2 m3 m2 r1 {: ^) {7 g; ~/ U% Q
    1 X# n3 W+ S# L5 V
    ' n9 \- z8 A8 H+ |+ j% s
    在自然语言中,命名实体(人名、地名、组织机构名 等)传递着重要信息,命名实体的识别是自然语言处理 中的一项重要工作.对于跨语言的自然语言处理应用而 言,除了命名实体的识别,命名实体的翻译对于提升机 器翻译质量、跨语言信息检索效果等也有着重要的作 用.命名实体随着时代变化,层出不穷,因此,大多数的 命名实体都属于词典的未登录词(OutofVocabulary, OOV),这为命名实体识别和翻译带来了困难.很多研究 都试图借助于双语平行语料来提升命名实体的识别和 翻译效果., C8 e. p" D0 F" Y0 `' B3 g( W& _- S

    - L0 o9 s, P% `  M# X

    ; X% g" E- J  B; B, H7 P附件下载:
    游客,如果您要查看本帖隐藏内容请回复

    ! P+ `6 M/ h3 O! t. {7 S2 Q
  • TA的每日心情
    奋斗
    2020-9-2 15:06
  • 签到天数: 2 天

    [LV.1]初来乍到

    2#
    发表于 2021-4-27 13:07 | 只看该作者
    尽可能多地实现一一对应
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-7-22 06:47 , Processed in 0.109375 second(s), 26 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表