免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: 黎溪
打印 上一主题 下一主题

Perl随机产生多肽序列 [复制链接]

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
21 [报告]
发表于 2014-03-25 23:29 |只看该作者
回复 20# Monox


    真是苦口婆心啊

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
22 [报告]
发表于 2014-03-26 02:10 |只看该作者
回复 20# Monox
  1. 任务很简单,师傅给了徒弟两条3肽序列,一条是AEY,另一条是DEC,师傅让徒弟统计组成这两条3肽的二十种氨基酸是如何分布的。
复制代码
Bu dong le~{:3_188:}
  1. 这两条3肽的二十种氨基酸是如何分布的。
复制代码
example is good, 3Q~{:3_188:}
应该是如何分布的 ~~{:3_202:}  {:3_202:} must

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
23 [报告]
发表于 2014-03-26 14:47 |只看该作者
突然觉得
yinyuemi, Monox 师傅

{:2_172:} 真是太强悍了。都好强。

论坛徽章:
0
24 [报告]
发表于 2014-03-27 13:58 |只看该作者
回复 1# 黎溪


老實講我對於這個結果很疑惑

因為有1000條sequence

所以在每個amino-acid出現的比例上應該是小數點以下三位而已

舉個簡單的例子

假設只有(A,C,D)三種,產生10次5個amino-acid

ACCDC
CAACC
CDACC
AACDC
DCACD
CADDD
DACAA
DCADD
ACCDA
DCAAC

你可以得到這個array像這樣

A 0.3 0.4 0.5 0.2 0.2
C 0.3 0.5 0.4 0.3 0.5
D 0.4 0.1 0.1 0.5 0.3

算法就是這個位置出現的個數(N)除上總個數(10)

所以在原來的題目裡面

N/1000應該就是小數點下三位而已

因此原來那個題目有點矛盾

或是我的理解錯誤?

论坛徽章:
0
25 [报告]
发表于 2014-03-27 14:07 |只看该作者
回复 24# afukada
我的20种氨基酸在七个位置的分布情况是分析一个原始文库得到的,这个文库的序列多样性高达10^9数量级,并不是由1000条序列分析得到的结果。


   

论坛徽章:
0
26 [报告]
发表于 2014-03-27 14:11 |只看该作者
回复 25# 黎溪


那這樣只要隨機產生1000條7個amino-acid的sequence就好了

與這個7 * 20的array關係不大

還是你有其他的需求

比方說要分布近似

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
27 [报告]
发表于 2014-03-27 14:12 |只看该作者
{:2_172:}
ACCDC
CAACC
CDACC
AACDC
DCACD
CADDD
DACAA
DCADD
ACCDA
DCAAC

怎么出现这样的这array

A 0.3 0.4 0.5 0.2 0.2
C 0.3 0.5 0.4 0.3 0.5
D 0.4 0.1 0.1 0.5 0.3


回复 24# afukada


   

论坛徽章:
0
28 [报告]
发表于 2014-03-27 14:18 |只看该作者
回复 27# pitonas


ACCDC
CAACC
CDACC
AACDC
DCACD
CADDD
DACAA
DCADD
ACCDA
DCAAC

這是一個5*10的array

把他想像成做統計(先統計每個位置A, B, C分別出現的個數)

A 3 4 5 2 2
C 3 5 4 3 5
D 4 1 1 5 3

然後有10條sequence

所以可以把他換成比例

A 0.3 0.4 0.5 0.2 0.2
C 0.3 0.5 0.4 0.3 0.5
D 0.4 0.1 0.1 0.5 0.3

论坛徽章:
0
29 [报告]
发表于 2014-03-27 14:22 |只看该作者
回复 26# afukada
我就是要求分布近似,如果直接产生1000条序列,分布肯定和之前的相差甚远。


   

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
30 [报告]
发表于 2014-03-27 16:21 |只看该作者
{:2_172:}
感激
回复 28# afukada


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP