论坛徽章:: 0

1楼 [报告]

发表于 2016-03-28 19:27 |显示全部楼层

核苷酸序列文件中应该是三个字母算一个密码子？那么第二个文件中的点位是否是：
TTT-AGG-GTT-TCC-GGC-GCC-CCG-TCA-GGG-AAA-ACC-AAA-TTA-GGG-TTT-CGA-TTT-AAA-ATC-GCA-
AAA
如何与score.txt对应？

第一段中，氨基酸序列中如何算一个点位？又如何与score.txt对应？
FRVSGAPSGKTKLGFRFKIAK-----PHKRSRETLLKEAGAEARGEDKAQVGRMTTRLKK
NRKKRGHVSAGHGRIGKHRKHPGGRGNAGGMHHHRILFDKYHPGYFGKVGMRHFHKLRNH
YHCPIVNIEKLWSLIPEDVKAKAT----AESAPLVDVTQFGYFKVLGKGELP-KQPIVVK
AKLISKLAERKIKEAGGAVMLTA

hztj2005

家境小康

论坛徽章:: 0

2楼 [报告]

发表于 2016-03-28 20:32 |显示全部楼层

score.txt只有203个值，而上面每个片段有609个字母或-，看来氨基酸序列也是三个字母一个点位了。
那么2楼的代码应该也可以处理氨基酸序列，为何还要代码呢?

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

hztj2005

家境小康

论坛徽章:: 0

3楼 [报告]

发表于 2016-03-29 12:42 |显示全部楼层

回复 5# 56836430

你是生物专业的，在表达问题时要让非生物专业的人能理解。

我关心的问题：“氨基酸是一个位点一个值”，你这里“位点”是指一个字母吗？那么上面的氨基酸片段有609个字母，而score.txt只有203个值，两者之间是如何对应的？你要把这个问题解释清楚。

至于“核苷酸是三个字母一个值”，那么609个字母构成203个“位点”，刚好对应score.txt只有203个值，反而容易处理。