- 论坛徽章:
- 0
|
假设已知一个数组@allcdss=(2,8,12,16,18,25,28,35);
已知一个文件,(只是举例,这个文件大约有上亿个字母),如下:
>chr5
AGAACAATATCTCTGATGAACATAGATGCAAAAATCCTCAACAACATACTAGCTAAATAATCCAACAACT
CATCAAAAGGATAATACACCATGATCAAGTGGGTTCATCCTAGAGATGCAGGGATGGTTTAACACATGCA
AGTCAATAAATATGATACATCACATAAACGGAATTAAAACAAAAACCACATGATCATCTCAATAGATGCA
GGAAAAGCATTTGATAAAATCTAGCAGCCCTTTATGATAAAACCCCTCAAGAAACTAGGTAAAGAAGGGG
想要的结果是根据数组内的值,截取中间的序列。2-8, 12-16, 18-25, 28-35,共四段,然后连接起来,
预计结果是GAACAATTCTGAGAACATAGGCAAAAAT
我用bioperl写过程序,把这个大文件读入就需要一个小时,要处理的数组和文件都多,这样耗费时间不大现实。
求教快速的方法,非常感谢
|
|