免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3137 | 回复: 5

[ 生物学难题 ] 小伙伴们 ~这是什么问题 ? [复制链接]

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
发表于 2014-08-07 13:57 |显示全部楼层
本帖最后由 pitonas 于 2014-08-07 08:57 编辑

my $师傅  jason680 's  铭言:
  1. 问题本不难,你又不举例,
  2. 描述又乱写,让人费疑猜?
复制代码
我发现了一个小伙伴们,他问了这个问题:

寻找定长为8的字符串组合在目标文件中至少出现1次的分析
here:
http://bbs.perlchina.org/thread-392-1-1.html
  1. 大家好,

  2. 今天的想请问的是:
  3. 寻找定长为8的字符串组合在目标文件中至少出现1次的程序。希望能给一个分析思路。

  4. 1,关于字符串组合的解释。
  5. 该字符串由A,T,G,C这四种字符构成,其最后长度为8.比如ATGCATGC,TTTAATCG等等。根据统计来思考,组合应该有4**8=65536种可能性。
  6. 2,目标文件
  7. 目标文件为2列信息,列1和列2分别是由A,T,G,C四种字符构成的不定长的字符串。比如
  8. TGAGTTCGTTTTTCACCAAACCGTTTTGTGGCCCGCCAGTTTGGTCTGTA      AAGTATTGGAACTATCATCAACGATTTAAATAAAGAGATG
  9. 3,问题的再次介绍:
  10. 假设从65536种可能性里找到了定长为8的字符串组合:TTTTGTGT和TTTAAATA。目标文件是
  11. TGAGTTCGTTTTTCACCAAACCGTTTTGTGTGCCCGCCAGTTTGGTCTGTA      AAGTATTGGAACTATCATCAACGATTTAAATAAAGAGATG
  12. 可以看到该组合能在列1和列2分别出现,如下划线标出。那么这种组合是可以的。===========================================================================
  13. 实际情况是:
  14. 目标文件很大,假设如下:
  15. TGAGTTCGTTTTTCACCAAACCGTTTTGTGTGCCCGCCAGTTTGGTCTGTA      AAGTATTGGAACTATCATCAACGATTTAAATAAAGAGATG
  16. TGAGTTCGTTTTTCACCAAACCGTATCTGGTCTGTA      AAGTATTGGAACTACTTTTAAATAAAGAGATG
  17. TGAGTTCGTTTTTCACCAAACCGTTTTGTGTGTAGTTTGGTCTGTA      AAGTATTGGAACTATAAAAGAGATG
  18. TGAGTTCGTTTTTCACCAAACCGAAACAGTTTGGTCTGTA      AAGTATTGGAACTATCATCAACGACAGAGATG
  19. TGAGTTCGTTTTTCACCAAACCGTTTTGTGTTTAGTTTGGTCTGTA      AAGTATTGGAACTATCATCAACGATAAAATAAAGAGATG
  20. 那么此时之前所假设的字符串组合:TTTTGTGT和TTTAAATA就不能满足要求了。下划线为该组合能出现的地方。
  21. 因为除了第一行的记录,该组合能分别出现在两列。其余4行记录中,该组合都不能在列1和列2同时出现。因此这种组合会被pass。

  22. 4,我想用程序去编写,现在的问题是如何找出这种可能性组合,后续的验证程序已编写。

  23. 谢谢
复制代码
我绝对无法理解 ~ {:2_170:}  {:2_170:}

小伙伴们,这是什么问题 ?  {:2_172:}

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
发表于 2014-08-07 14:24 |显示全部楼层
{:2_169:}学生物的也不明白~

论坛徽章:
130
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
发表于 2014-08-07 14:25 |显示全部楼层
本帖最后由 jason680 于 2014-08-07 14:36 编辑

回复 1# pitonas

let it be & let it go if you couldn't understand what they said

example: nobody can understand what he said in 1L(1楼)
求教~~~~~~~~~~~~~~~~~~~shell
http://bbs.chinaunix.net/forum.p ... mp;fromuid=24785593

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
发表于 2014-08-07 15:42 |显示全部楼层
那好 ~ {:2_168:}
因为无法理解这问题, 让我觉得我笨

论坛徽章:
1
程序设计版块每日发帖之星
日期:2015-10-07 06:20:00
发表于 2014-08-08 07:23 |显示全部楼层
回复 4# pitonas


    刚想回复说看懂了一点,发现又晕了....
    嗯,又一个学bioinfo的我没看懂...
    看来看晕很正常.

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
发表于 2014-08-08 13:23 |显示全部楼层
看来看晕是正常的 ~ {:2_170:}



回复 5# chenhao392


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

DTCC2020中国数据库技术大会 限时8.5折

【架构革新 高效可控】2020年8月17日~19日第十一届中国数据库技术大会将在北京隆重召开。

大会设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕数据架构、AI与大数据、传统企业数据库实践和国产开源数据库等内容展开分享和探讨,为广大数据领域从业人士提供一场年度盛会和交流平台。

http://dtcc.it168.com


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP