找回密码
 注册
关于网站域名变更的通知
查看: 401|回复: 1
打印 上一主题 下一主题

[毕业设计] 基于 Mealy机的藏文字构件分解

[复制链接]
  • TA的每日心情
    开心
    2020-8-28 15:14
  • 签到天数: 2 天

    [LV.1]初来乍到

    跳转到指定楼层
    1#
    发表于 2021-1-26 10:51 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

    EDA365欢迎您登录!

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    摘 要: 藏文字构件分解是藏文信息处理的基础,具有重要的理论价值和广阔的应用前景.针对藏文字构件的 复杂性与多样性,文章通过分析现代藏文字的构字规则和结构特点,研究了藏文字构件的分解过程,利用 Mealy机的 输出字符与移动一一对应的特性描述了藏文字构件的行为语义,给出了对于任意字符串能否被 Mealy机分解的判定 定理及基于 Mealy机的藏文字构件分解算法,并设计实现了基于 Mealy机的藏文字构件分解系统,验证了算法的可行 性.关键词: 藏文信息处理;Mealy机;构件;构字分解3 W/ m$ g% Y5 }

    , b  q5 y( r4 ?  D       藏文信息处理中,凡与字相关的研究都不仅需要分 析字结构,而且需要确定构件的位置特征.因此,藏文字 构件分解是藏文信息处理的基础.藏文字是以基字、前 加字、上加字、下加字、后加字、重后加字及元音等 1至 7个藏文字符为构件的二维拼音文字,其中前加字、后 加字和重后加字与基字横向拼写,上加字、下加字和元 音与基字纵向拼写[1].前加字、基字、上加字、下加字、后 加字、重后加字和元音是构成藏文字的最小单位构件, 简称构件;上加字、下加字及元音与基字纵向排列而成 的字符组合称组合构件.藏文字构件的复杂性与多样性 是丰富而严谨的现代藏文文法的产物,同时也是藏文信 息处理的重点和难点.长期以来,对藏文字构件的研究 一直被业内人士所关注,文献[2,3]以藏语口语材料中 3926个常用字为研究对象,统计了藏文字长和构词频 度、声、韵母结构方式及组合构件频度;文献[4]对《中华 大藏经·丹珠尔》中藏文字频度和构件进行了统计;文献 [5]从字符、构件、音节和词汇的角度统计了词典中的词 汇;文献[6]对特定藏语语料做了字频、音节频度的统 计;文献[7]对 19380个藏文字的字长、结构方式、构件 的频度及组合构件进行了统计;文献[8]基于常用词典 对藏文字及构件频度进行了统计.上述研究为藏文字构 件分解提供了重要的参考数据,但还存在如下缺憾:(1) 研究范围局限于特定词典或语料中,不具有普遍性;(2) 研究成果为小语料库上以手工与计算机辅助方式结合 得到的构件频度,没有解决构件自动分解问题,不具有 广泛的应用性。: L! v  x3 \5 D0 H
    4 U% F% u* P2 R; W1 j0 M3 c
    # L& S7 y) o0 ?' m3 v+ Y
    附件下载:
    游客,如果您要查看本帖隐藏内容请回复

    ' T8 C  |$ ^) G& M' D7 ]. c; c

    该用户从未签到

    2#
    发表于 2021-1-26 13:11 | 只看该作者
    分析现代藏文字的构字规则和结构特点
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-6-24 05:00 , Processed in 0.062500 second(s), 26 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表