1 234 / 4 页下一页

Perl随机产生多肽序列 [复制链接]

yinyuemi

大富大贵

论坛徽章:: 2

21楼 [报告]

发表于 2014-03-25 23:29 |只看该作者

回复 20# Monox

真是苦口婆心啊

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

rubyish

大富大贵

论坛徽章:: 7

22楼 [报告]

发表于 2014-03-26 02:10 |只看该作者

回复 20# Monox

任务很简单，师傅给了徒弟两条3肽序列，一条是AEY，另一条是DEC，师傅让徒弟统计组成这两条3肽的二十种氨基酸是如何分布的。

复制代码

Bu dong le~{:3_188:}

这两条3肽的二十种氨基酸是如何分布的。

复制代码

example is good, 3Q~{:3_188:}
应该是如何分布的 ~~{:3_202:} {:3_202:} must

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

pitonas

家境小康

论坛徽章:: 5

23楼 [报告]

发表于 2014-03-26 14:47 |只看该作者

突然觉得
yinyuemi, Monox 师傅

{:2_172:} 真是太强悍了。都好强。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

afukada

稍有积蓄

论坛徽章:: 0

24楼 [报告]

发表于 2014-03-27 13:58 |只看该作者

回复 1# 黎溪

老實講我對於這個結果很疑惑

因為有1000條sequence

所以在每個amino-acid出現的比例上應該是小數點以下三位而已

舉個簡單的例子

假設只有(A,C,D)三種，產生10次5個amino-acid

ACCDC
CAACC
CDACC
AACDC
DCACD
CADDD
DACAA
DCADD
ACCDA
DCAAC

你可以得到這個array像這樣

A 0.3 0.4 0.5 0.2 0.2
C 0.3 0.5 0.4 0.3 0.5
D 0.4 0.1 0.1 0.5 0.3

算法就是這個位置出現的個數(N)除上總個數(10)

所以在原來的題目裡面

N/1000應該就是小數點下三位而已

因此原來那個題目有點矛盾

或是我的理解錯誤?

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

黎溪

白手起家

论坛徽章:: 0

25楼 [报告]

发表于 2014-03-27 14:07 |只看该作者

回复 24# afukada
我的20种氨基酸在七个位置的分布情况是分析一个原始文库得到的，这个文库的序列多样性高达10^9数量级，并不是由1000条序列分析得到的结果。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

afukada

稍有积蓄

论坛徽章:: 0

26楼 [报告]

发表于 2014-03-27 14:11 |只看该作者

回复 25# 黎溪

那這樣只要隨機產生1000條7個amino-acid的sequence就好了

與這個7 * 20的array關係不大

還是你有其他的需求

比方說要分布近似

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

pitonas

家境小康

论坛徽章:: 5

27楼 [报告]

发表于 2014-03-27 14:12 |只看该作者

{:2_172:}
ACCDC
CAACC
CDACC
AACDC
DCACD
CADDD
DACAA
DCADD
ACCDA
DCAAC

怎么出现这样的这array

A 0.3 0.4 0.5 0.2 0.2
C 0.3 0.5 0.4 0.3 0.5
D 0.4 0.1 0.1 0.5 0.3

回复 24# afukada

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

afukada

稍有积蓄

论坛徽章:: 0

28楼 [报告]

发表于 2014-03-27 14:18 |只看该作者

回复 27# pitonas

ACCDC
CAACC
CDACC
AACDC
DCACD
CADDD
DACAA
DCADD
ACCDA
DCAAC

這是一個5*10的array

把他想像成做統計(先統計每個位置A, B, C分別出現的個數)

A 3 4 5 2 2
C 3 5 4 3 5
D 4 1 1 5 3

然後有10條sequence

所以可以把他換成比例

A 0.3 0.4 0.5 0.2 0.2
C 0.3 0.5 0.4 0.3 0.5
D 0.4 0.1 0.1 0.5 0.3