- 论坛徽章:
- 7
|
本帖最后由 rubyish 于 2014-03-09 23:34 编辑
有一组数据:
>1
GCGTGCGTAA
AAAATAAATCACCTTTCGGGCTAACTTTGCGGTCGAGAACTCATTACCCAAATCCTACAATCACAAATTTG
ACATACTTAGAATTAAAAAACCAAACCACACACAGAAACAAGGTTAAGATAAATGAACAAAGGAGAATGATTTAGTTAGTAACCTCAACATTAGAGAGCT
TTCCTTCGTTTAATACTTTGAAGATGGCAAAACCACCTGGCGTCTCAAACAGTATTAGCATTTTTACAAGCTCCTGAAAAGAAGAAAAAACAAGATTAAG
AGAAACCCTTGAATCAACTCAAAGTCACCAAACTTGCAAGTTAGTGTTTTACGAGCTAAAGCCATTAAGCTAGTACGAAACAATATTCAAGGTAAAACTT
TTTCCCTGTTTCGAAGTTTACAAATCAGAATAATAGTTAAGGCAGATACTCTGTTCAAATTCTTGAAAATCCGACAAAGAACAGAACTATACTTTGTCAA
AGTCTTAGAATTTTGGAAGCTTATTTGCCATAACAACGAAGAAAGAGAGGGCGAGAGAGATTCAGTACCTTAGAGGGTTAACGCACAACTACAGCTTTAG
AGAGAGCTAAAATCAGGAGCCGCGATTCTGCTAGGGTTTAAGATGGTTTTTA
>2
TAAAAAAAAAATAACATCATTATATAATATATAGAGTTTAAAACATCTCAAAAACAAATTCATCATATTTTGTGATTCGAAATTTTAAGAATGAACATAT
ATTAACTAATTGGCGAAAAATGCGTGGGTTCAACGTCCCGCAACGAATAAAATATTTTGACAATGATTCATAAACATATTATAAATAAGATCAACATTAA
TAAAATAAATAATTTTTTTTTGTGGATGGATTTGGTTTGGCAGGACGTTACTTAATAACAATTGTAAACTATAAAATAATTTACAAATTTT
ATATATATTAATTTAAAAAATGAATTGTCTACGCGGTGTACCGCATGTTAAAATTTAGTTTCTATATATTTTAGAAACAACTTTGAATTTATACTTTAAT
ATTGAATAAACAACACCAAACCCCCTATTATTCATGTTATCCATTTTTTGAAATAACAGAAAAATAGAAAATAATCATA
AGAAACCAAACAAAATATACACAACAAAAAATCAAATCATAAAGCTTTAAATACATATAAGTGAAAGATCAAATCATAAAACTATAAAGACATGAAGTAC
CTAAAACATAATATATGCTAAAAAGAAATTCAAAATACAAAATCTTCTACGTATTTGAATAATTCATCCAAACCTAAAACTGTATATCTGTTCACATATT
TGAATGAAAAATCAAATAAGCAAATCAAGCAAGAAATATTAATGATGTCTATGTGATTTTTTTTTTTGT
>3
TTAATCTGCTTTTTTTTTTTTTTTTTAATTTACTCATATTAGATTTAGCTTAATTTTGAGACTGTTAGCTTTCGGTGTGAACAAAAGAAATTTGTGAAAT
TTGATATTGTTGATACATTCTCTAGAAATTTTGGAAAGATTGTGTGTTTCTTTTCAAAATTCAAATATTAATAACGCACCAAAATATCTGAATAGAAAGA
ATAAATAATGCGCCAAAATATTGATATGATGAAAGGTTCCCGTCTCAATATGTTTTTAGACCCTAGGTAAAACTAAAT
TTACATATCCTTTTCACACGATTTTTTTTTTTTTTTTTTGACTCTTTTACTTAAAGGTTTTTTTAAAAAAATTTGCCATGCACCCTGGCAATGGCTTTTG
CCCCCACCTCCCCCACATTAAGCCAATCTTGTTGCATGGCCATCTCCCCTGACGAACACCATTAAAGATTCATCTATATGTGGTA
GCCACTGAGTAGACTTAATAGAGCATTAAATAAATGAAATTCGTGGATGCAAATTGTAGAAGAACTAGTATTTAACGGAGTGTTGCTTCATCACAAATTC
1: 想从每一条中挑选出GCGT**六个碱基(两个星号代表GCGT后面两个模糊匹配)的位置
2: Non-overlapping
>1
GCGTGCGTAA3: Overlapping
>1
GCGTGCGTAA4: 结果应该像这样
when Overlapping:- 1 GCGTGC 0, GCGTAA 4, GCGTCT 220
- 2 GCGTGG 121
- 3
复制代码 when Non-overlapping- 1 GCGTGC 0, GCGTCT 220
- 2 GCGTGG 121
- 3
复制代码 |
|