免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12345下一页
最近访问板块 发新帖
查看: 10605 | 回复: 48
打印 上一主题 下一主题

两道题,问了N多人,没结果,再问一下看看  关闭 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2004-12-10 16:25 |只看该作者 |倒序浏览
1) Write a program to identify all the repetitive patterns in a string of
charaters (INPUT).  The string is only composed of A,C,G,T characters.  The
maximum length of string is 10000.  The minimum length of repeat is 10
characters.   Output: position, size, and patterns.  Here is an example:
1)写一个程序,识别字符串中所有的重复片段(重复模式),字符串由A,C,G,T组成,字符串最长为10000,随机产生。重复的片段最小是10个符串。输出:位置,大小,和片段。如下:
String:
TAAAAACTCGGGGT AAAAACTCGGGGAAAA
Repeat:
Repeat: AAAAACTCGGGG, Size: 12, Start Positions: 2, 15

解释:如这就就有两个重复(空格格开了):T  AAAAACTCGGGG  T AAAAACTCGGGG AAAA
这两个重复位置分别在字符串的2和15位,大小为12



2) Write a program to identify all the INVERTED repetitive patterns (e.g.
TAACCG => GCCAAT) in a string of character (INPUT).  The string is only
composed of A,C,G,T characters.  The maximum length of string is 10000.  The
minimum length of repeat is 10 characters.   Output: position, size, and
patterns.   Here is an example:

写一个程序识别所有的反向重复,如TAACCG => GCCAAT,也就是前面的反过来就是后面的字符串。和上面一样,字符串最长为10000,随机产生,最小反向重复片段为10,输出位置,大小,和片段,如下:
String:
CAAAAACGAGGGGTTTGGGGAGCAAAAA
Inverted Repeat:
Inverted Repeat: AAAAACGAGGGG, Size: 12, Start Positions: 17, 2

解释:如上面,C  AAAAACGAGGGG  TTT   GGGGAGCAAAAA
AAAAACGAGGGG和GGGGAGCAAAAA分别是反向重复,分别在2和17位上,大小为12。

论坛徽章:
0
2 [报告]
发表于 2004-12-10 23:13 |只看该作者

两道题,问了N多人,没结果,再问一下看看

哈, 学生物的吧。 去 perl.com 有 total solution, 如 bioperl.

或用 awk 自己写, 要讲效率的话, 还是 C 好。

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
3 [报告]
发表于 2004-12-10 23:21 |只看该作者

两道题,问了N多人,没结果,再问一下看看

最近问问题怎么都是这种标题啊

论坛徽章:
0
4 [报告]
发表于 2004-12-10 23:24 |只看该作者

两道题,问了N多人,没结果,再问一下看看

文革 MM, 你帮他一下如何?

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
5 [报告]
发表于 2004-12-10 23:47 |只看该作者

两道题,问了N多人,没结果,再问一下看看

那俺想想,不一定做得出来

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
6 [报告]
发表于 2004-12-10 23:51 |只看该作者

两道题,问了N多人,没结果,再问一下看看

第一个的思路:
先用xargs -1n把所有的字符弄成一列
再用变量读进每一行,用awk (match判断)
应该可以弄出重复行,
用index返回重复行的位置。得用到循环,不过我现在还没看到循环语句

而且目前没有环境只能明天试验

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
7 [报告]
发表于 2004-12-10 23:57 |只看该作者

两道题,问了N多人,没结果,再问一下看看

看不明白 关注ing

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
8 [报告]
发表于 2004-12-11 00:06 |只看该作者

两道题,问了N多人,没结果,再问一下看看

[quote]原帖由 "寂寞烈火"]看不明白 关注ing[/quote 发表:


你看不明白?那我     

用match判断不知道行不行。。。

论坛徽章:
0
9 [报告]
发表于 2004-12-11 07:50 |只看该作者

两道题,问了N多人,没结果,再问一下看看

这种东西用C还会快一点吧
而且模式是不定长匹配的……
嗯……用給的最长的字符串作初始值、递减长度?

论坛徽章:
0
10 [报告]
发表于 2004-12-11 08:29 |只看该作者

两道题,问了N多人,没结果,再问一下看看

应该用最小字符串作初始值还是最长的呀???
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP