公司每个月都会产生一个很大的文件,现在想对文件进行一些压缩。
文件的格式大致如下:
W11-11111,dfdd01234faff,cc,1143,fafffad,fdasfsaf
w11-11111,ffss01234afdff,cc,,fasdfa,fdasfa
w22-88980,fasf57847fdafad,ca,98898,fasf,fadsas
w22-22222,fsaf23456fafdf,cc,,fasfa,fafaf
w22-22222,fdaf23456fasfd,cc,3232,fsadf,fsdad
w22-33333,fsaf23456fafdf,cc,,fasfa,fafaf
w22-33333,fdaf23456fasfd,cc,3232,fsadf,fsdad
w33-43734,ffsa32323faafa,cs,7878,dsa,fdsa
要求就是
相邻的两笔记录
第一个字段相同,第二个字段5-9位相同,第三个是CC的,第四个的要求就是其中一个有值,一个是空。
现在希望只要碰到这样的记录就删除掉
剩下的文件就是:
w22-88980,fasf57847fdafad,ca,98898,fasf,fadsas
w33-43734,ffsa32323faafa,cs,7878,dsa,fdsa |