找回密码
 注册
关于网站域名变更的通知
查看: 232|回复: 1
打印 上一主题 下一主题

opencl写的程序运行在FPGA上反而比CPU上差,为什么???

[复制链接]
  • TA的每日心情
    擦汗
    2019-11-19 15:26
  • 签到天数: 1 天

    [LV.1]初来乍到

    跳转到指定楼层
    1#
    发表于 2019-5-16 16:58 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

    EDA365欢迎您登录!

    您需要 登录 才可以下载或查看,没有帐号?注册

    x

    最近在学习opencl,写了一段smith-waterman算法计算得分矩阵的程序,运行在FPGA上反而比CPU上性能差。因为是初学,不知道写的哪里有问题。5 f, w- H4 J: p; `
    附上代码:

    __kernel void __attribute__ ((reqd_work_group_size(512,512,1)))krnl_sw(     __global int* ref,     __global int* alt,     __global int* sw,     __global int* btrack,     const int overhangStrategy,     const int match,     const int mismatch,     const int open,     const int extend,     const int ncol,     const int nrow     ) { int col = get_global_id(0); int row = get_global_id(1); for (k = 2;k<ncol+nrow-1;k++){    if(col + row == k)    {             up_score = sw[(row - 1)*ncol + col] + extend*(row-1) + open ;            left_score = sw[row*ncol + col - 1] + extend*(row-1) + open ;            up_left_score = sw[(row - 1)*ncol + col - 1] + diag_score(ref[col - 1], alt[row - 1], match, mismatch);            sw[row*ncol + col] = max(up_score, left_score);            sw[row*ncol + col] = max(up_left_score, sw[row*ncol + col]);    }}  return;}

    大致的计算过程是初始化矩阵第一行和第一列,然后延对角线放向逐次计算斜对角上矩阵的得分。
    ( o$ H5 p. N9 j7 H" e" f" {

    计算512*512的矩阵,运行10次,CPU上耗时100ms不到,FPGA上反而是几十秒,慢了近1000倍....


    4 R- n$ D" m- m# E# T  g% u

    该用户从未签到

    2#
    发表于 2019-5-16 17:49 | 只看该作者
    有代码就是好啊
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-8-3 11:53 , Processed in 0.125000 second(s), 23 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表