- 论坛徽章:
- 0
|
求助!!Perl编程实现比较2个文件,筛选出基因名称相同的序列,留下基因名称不同的序列,输出到新的文件中。
sequence.rar
(9.52 KB, 下载次数: 7)
序列格式类似:>gnl|UG|Dr#S15906148 Danio rerio myelocytomatosis oncogene a, mRNA (cDNA clone MGC:64149 IMAGE:6797033), complete cds /cds=p(212,143 /gb=BC053281 /gi=31419571 /ug=Dr.1 /len=1869
CTGAGAGCTGCACGAGCGCGCAGGGTTGTTTATATTTTCCATCACTTTCCTTTCCACTTG
ACCGTGACTCTGACGCCACTTATGCTGCAAGTGACCGGAGCAAAAACTGTTGGATTTTAC
TTCTCGCTCCTTCTTTTTTGCTCTCTTTTCATTGCATTGCGTCTCGAAAGAAACAATTCT
GGAACGGCATTCGTTAAACACAAGTGTCAAAATGCCGGTGAGTGCGAGTTTGGCGTGTAA
AAACTACGATTACGACTACGACTCCATCCAGCCCTACTTCTACTTCGACAACGACGATGA
GGATTTTTATCACCATCAGCAAGGACAGACTCAACCTTCAGCCCCCAGCGAGGACATTTG
GAAGAAATTCGAACTGCTGCCCACACCGCCCCTCTCGCCCAGCCGGAGACAGTCGCTCTC
CACCGCGGAACAGCTGGAGATGGTCAGCGAGTTCCTGGGAGACGACGTGGTCAGCCAGAG
CTTCATCTGCGATGATGCGGACTACTCCCAGTCCTTCATCAAGTCCATCATCATCCAGGA
CTGCATGTGGAGCGGCTTTTCCGCCGCTGCCAAGTTGGAGAAAGTGGTTTCAGAGAGACT
GGCGTCTTTGCACGCTGAAAGGAAGGAACTGATGTCTGACAGCAACTCAAATCGACTAAA
CGCGAGCTATTTGCAGGATCTGAGCACCTCTGCATCAGAATGCATCGATCCCTCTGTGGT
CTTCCCATATCCTCTGACAGAGTGTGGGAAAGCCGGCAAGGTTGCATCACCACAGCCCAT
GCTGGTCCTGGACACTCCACCTAACAGCTCCAGCAGCAGTGGCAGCGATTCAgaagatga
agaagaagaggatgaggaggaggaagaagaagaggaggaggaagaagaggaggaagagga
需要根据myelocytomatosis oncogene a,也就是Danio rerio(物种名称)后面和第一个逗号前面之间的字符串来比较两个文件。相同名称的序列输出到一个same.out文件中,不同名称的序列输出到一个diff.out文件中。
求解答!!!
|
|