大家好。
现有如下所示的文件,其中第三列是一些特定的字符串(最多3位,位置在第14-16个字符,如果是三个字母的话,和后面第四列之间就没有空格),第六列是一列数字(最多3位,位置在第24-26个字符,和前面第五列之间有空格),现在要做如下处理:
对于第六列数字相同的行,如果第三列中的字符串重复出现,则保留第一次出现的行,重复出现的行都删掉。比如在这个文本中,应删掉倒数两行和倒数第四行,其它的全部保留。
谢谢大虾帮忙!
xxxx xx A xxx x 8 xxxxxx xxxxxx xxxxxx x
xxxx xx B xxx x 8 xxxxxx xxxxxx xxxxxx x
xxxx xx C xxx x 8 xxxxxx xxxxxx xxxxxx x
xxxx xx D xxx x 8 xxxxxx xxxxxx xxxxxx x
xxxx xx AB xxx x 8 xxxxxx xxxxxx xxxxxx x
xxxx xx BC xxx x 8 xxxxxx xxxxxx xxxxxx x
xxxx xx CD xxx x 8 xxxxxx xxxxxx xxxxxx x
xxxx xx EFG xxx x 8 xxxxxx xxxxxx xxxxxx x
xxxx xx LMN xxx x 8 xxxxxx xxxxxx xxxxxx x
xxxx xx A xxxx x 9 xxxxxx xxxxxx xxxxxx x
xxxx xx B xxxx x 9 xxxxxx xxxxxx xxxxxx x
xxxx xx C xxxx x 9 xxxxxx xxxxxx xxxxxx x
xxxx xx D xxxx x 9 xxxxxx xxxxxx xxxxxx x
xxxx xx A xxxx x 10 xxxxxx xxxxxx xxxxxx x
xxxx xx B xxxx x 10 xxxxxx xxxxxx xxxxxx x
xxxx xx C xxxx x 10 xxxxxx xxxxxx xxxxxx x
xxxx xx D xxxx x 10 xxxxxx xxxxxx xxxxxx x
xxxx xx AB xxxx x 10 xxxxxx xxxxxx xxxxxx x
xxxx xx CD xxxx x 10 xxxxxx xxxxxx xxxxxx x
xxxx xx AB xxxx x 10 xxxxxx xxxxxx xxxxxx x
xxxx xx ABCxxxx x 10 xxxxxx xxxxxx xxxxxx x
xxxx xx ABCxxxx x 10 xxxxxx xxxxxx xxxxxx x
xxxx xx ABCxxxx x 10 xxxxxx xxxxxx xxxxxx x作者: 关阴月飞 时间: 2014-08-15 09:53