- 论坛徽章:
- 0
|
感谢论坛大神的多次帮助和分享,今天想求助一个文本处理问题。
因为程序太过繁琐,所以想寻求论坛各位大神的帮助,希望可以简化工作:
test.txt如下(共3列,tab键分隔,第3列为一大列,子集数目多少不定)
GO:0007399~nervous system development 3.864312016797873E-12 ENSMUSG00000009569, ENSMUSG00000003575, ENSMUSG00000058070, ENSMUSG00000048756, ENSMUSG00000033174, ENSMUSG00000043051, ENSMUSG00000031393, ENSMUSG00000028707, ENSMUSG00000043439, ENSMUSG00000006398, ENSMUSG00000015829, ENSMUSG00000006464, ENSMUSG00000075415, ENSMUSG00000024647, ENSMUSG00000013089
GO:0022008~neurogenesis 2.2492439537472514E-9 ENSMUSG00000003575, ENSMUSG00000009569, ENSMUSG00000058070, ENSMUSG00000048756, ENSMUSG00000033174, ENSMUSG00000043051, ENSMUSG00000031393, ENSMUSG00000043439, ENSMUSG00000006398, ENSMUSG00000015829, ENSMUSG00000006464, ENSMUSG00000013089, ENSMUSG00000062232, ENSMUSG00000039577
希望最后得到的文件是这样:就是把第三列的各个子集拆开打印成很多列,其中第1,2列不变,(tab键分隔)
GO:0007399~nervous system development 3.864312016797873E-12 ENSMUSG00000009569
GO:0007399~nervous system development 3.864312016797873E-12 ENSMUSG00000003575
GO:0007399~nervous system development 3.864312016797873E-12 ENSMUSG00000058070
...
GO:0022008~neurogenesis 2.2492439537472514E-9 ENSMUSG00000003575
GO:0022008~neurogenesis 2.2492439537472514E-9 ENSMUSG00000009569
...
O(∩_∩)O谢谢
|
|