找回密码
 注册
关于网站域名变更的通知
查看: 304|回复: 1
打印 上一主题 下一主题

[毕业设计] 基于码书索引变换的高通量DNA序列数据压缩算法

[复制链接]
  • TA的每日心情
    慵懒
    2020-8-28 15:16
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    跳转到指定楼层
    1#
    发表于 2021-1-29 14:30 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

    EDA365欢迎您登录!

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    摘 要: 提出一种高通量 DNA序列数据的压缩算法.该算法先采用码书索引变换模型,将传统码书索引值的表 示方法变换成由四个标准碱基字符替代的四进制数值方式,并采用一种界定替换串与非替换串的简明编码方法,接着 通过信息熵的大小来决定是否进行块排序压缩变换(BWT),最后进行前移编码变换和 Huffman熵编码.在多种测序数 据集上的实验结果表明,CITD在大多数情况下可以获得比本文所对比的高通量 DNA专用压缩方法更优的压缩性能. 关键词: 高通量 DNA序列;码书索引变换模型;块排序压缩变换;前移编码;信息熵;数据压缩算法
    # ?. I9 ^! I7 ~# D3 O
    5 I0 C3 v4 G5 t( D      目前实施的千人基因组计划、国际单体型图计划、 孟德尔遗传疾病等项目,利用“下一代测序”技术产生了 海量 DNA测序数据.如何存储和传输高通量 DNA测序 产生的数据,成为决定 DNA研究发展的重要因素之一. 数据压缩是有效解决 DNA序列存储和传输的一种重要 方法[1,2].
    : |- s5 B# n( ~1 g, |$ H
    0 M% n  C! P( Z" Z: P* ^9 d
    1 z8 r. I2 f* m$ _
    附件下载:
    游客,如果您要查看本帖隐藏内容请回复

    % O" j) r6 m: y3 I! o# s$ [

    该用户从未签到

    2#
    发表于 2021-1-29 15:01 | 只看该作者
    多谢分享 厉害了
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-6-22 07:06 , Processed in 0.078125 second(s), 26 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表