Chinaunix

标题: 文件的拆分 [打印本页]

作者: inanin    时间: 2023-02-02 14:07
标题: 文件的拆分
本帖最后由 inanin 于 2023-02-02 14:11 编辑

文件a:
/FDFD-4-19/acr/baga6ea4seaqa3cr4x2txhoh7vkrox4mascqu3yq6uisfb5d4s5dsy55donjzgdy.acr
/FDFD-4-19/acr/baga6ea4seaqa3qg6kqptyivmitmmxkk6sintqohkdlvr7aptrn5apnrmx24cqea.acr
/FDFD-4-19/acr/baga6ea4seaqa3znevv7d3twlqixw3cntfzicbk7t4fa2lfaku7tjh4quuaelmoi.acr
/FDFD-4-19/acr/baga6ea4seaqa5l4yjvxmtfzfllzjwpvdjs6ii3rweagwsjbi6pkixf6caa75why.acr
/FDFD-4-19/acr/baga6ea4seaqa5yux3hre7zcsm5fmtjwswrh4r53ilxuy2zph3e73qe6n6joqcmy.acr


文件b:
T02445,771cd365-0a1a-4030-b7ef-b58dff429d22,baga6ea4seaqa3cr4x2txhoh7vkrox4mascqu3yq6uisfb5d4s5dsy55donjzgdy.acr,baga6ea4seaqa3cr4x2txhoh7vkrox4mascqu3yq6uisfb5d4s5dsy55donjzgdy,2583914,http://127.0.0.1/baga6ea4seaqa3cr4x2txhoh7vkrox4mascqu3yq6uisfb5d4s5dsy55donjzgdy.acr
T02445,2458f4b9-f9c5-450f-a980-73188ccbfa42,baga6ea4seaqa3qg6kqptyivmitmmxkk6sintqohkdlvr7aptrn5apnrmx24cqea.acr,baga6ea4seaqa3qg6kqptyivmitmmxkk6sintqohkdlvr7aptrn5apnrmx24cqea,2583914,http://127.0.0.1/baga6ea4seaqa3qg6kqptyivmitmmxkk6sintqohkdlvr7aptrn5apnrmx24cqea.acr
T02445,0f689b5d-dd23-4816-a71f-077ec3c2346b,baga6ea4seaqa3znevv7d3twlqixw3cntfzicbk7t4fa2lfaku7tjh4quuaelmoi.acr,baga6ea4seaqa3znevv7d3twlqixw3cntfzicbk7t4fa2lfaku7tjh4quuaelmoi,2583914,http://127.0.0.1/baga6ea4seaqa3znevv7d3twlqixw3cntfzicbk7t4fa2lfaku7tjh4quuaelmoi.acr
T02445,9138e90b-664c-4030-aa95-421b0e2ebf43,baga6ea4seaqa5l4yjvxmtfzfllzjwpvdjs6ii3rweagwsjbi6pkixf6caa75why.acr,baga6ea4seaqa5l4yjvxmtfzfllzjwpvdjs6ii3rweagwsjbi6pkixf6caa75why,2583914,http://127.0.0.1/baga6ea4seaqa5l4yjvxmtfzfllzjwpvdjs6ii3rweagwsjbi6pkixf6caa75why.acr
T02445,20eafee9-bed3-41bf-97ff-727b87ec77a1,baga6ea4seaqa5yux3hre7zcsm5fmtjwswrh4r53ilxuy2zph3e73qe6n6joqcmy.acr,baga6ea4seaqa5yux3hre7zcsm5fmtjwswrh4r53ilxuy2zph3e73qe6n6joqcmy,2583914,http://127.0.0.1/baga6ea4seaqa5yux3hre7zcsm5fmtjwswrh4r53ilxuy2zph3e73qe6n6joqcmy.acr
T02445,0e6d725b-387d-4d3e-890e-564c70272abd,baga6ea4seaqackvqbjrmur764uoas5i5hkeovukup3rea7cwbsqo6z5djf2b2oq.acr,baga6ea4seaqackvqbjrmur764uoas5i5hkeovukup3rea7cwbsqo6z5djf2b2oq,2583914,http://127.0.0.1/baga6ea4seaqackvqbjrmur764uoas5i5hkeovukup3rea7cwbsqo6z5djf2b2oq.acr
T02445,e7d120a9-1d96-4e05-8d30-ad4246766055,baga6ea4seaqag6clxgkl46ucdjo6ca7bm4cnjs6d7onrq2rluzc3iul7ti3j6gi.acr,baga6ea4seaqag6clxgkl46ucdjo6ca7bm4cnjs6d7onrq2rluzc3iul7ti3j6gi,2583914,http://127.0.0.1/baga6ea4seaqag6clxgkl46ucdjo6ca7bm4cnjs6d7onrq2rluzc3iul7ti3j6gi.acr


通过一个awk命令得到以下文件:
文件1
771cd365-0a1a-4030-b7ef-b58dff429d22,/FDFD-4-19/acr/baga6ea4seaqa3cr4x2txhoh7vkrox4mascqu3yq6uisfb5d4s5dsy55donjzgdy.acr
2458f4b9-f9c5-450f-a980-73188ccbfa42,/FDFD-4-19/acr/baga6ea4seaqa3qg6kqptyivmitmmxkk6sintqohkdlvr7aptrn5apnrmx24cqea.acr
0f689b5d-dd23-4816-a71f-077ec3c2346b,/FDFD-4-19/acr/baga6ea4seaqa3znevv7d3twlqixw3cntfzicbk7t4fa2lfaku7tjh4quuaelmoi.acr
9138e90b-664c-4030-aa95-421b0e2ebf43,/FDFD-4-19/acr/baga6ea4seaqa5l4yjvxmtfzfllzjwpvdjs6ii3rweagwsjbi6pkixf6caa75why.acr
20eafee9-bed3-41bf-97ff-727b87ec77a1,/FDFD-4-19/acr/baga6ea4seaqa5yux3hre7zcsm5fmtjwswrh4r53ilxuy2zph3e73qe6n6joqcmy.acr

文件2:
0e6d725b-387d-4d3e-890e-564c70272abd,/xxx/acr/baga6ea4seaqackvqbjrmur764uoas5i5hkeovukup3rea7cwbsqo6z5djf2b2oq.acr
e7d120a9-1d96-4e05-8d30-ad4246766055,/xxx/acr/baga6ea4seaqag6clxgkl46ucdjo6ca7bm4cnjs6d7onrq2rluzc3iul7ti3j6gi.acr


作者: wh7211    时间: 2023-02-13 16:54
本帖最后由 wh7211 于 2023-02-13 16:57 编辑
  1. awk -F"," 'FILENAME==ARGV[1]{split($0,a,"/");b[a[4]]=$0;next}{split($NF,c,"/");if(b[c[4]]){print $2","b[c[4]]>"1"}else{print $2",/xxx/acr/"c[4]>"2"}}' a b
复制代码


作者: inanin    时间: 2023-02-18 13:04
回复 2# wh7211

谢谢,版主,总能完美的解决问题,也向版主学习到awk更多的用法。
作者: lqs623    时间: 2023-02-19 17:39
版主对不起!我从这发帖求助,对不起!请指教感激!

原文.txt
→第1行 不定 不定 不定 不定
→第2行 不定 不定 不定 不定
→第3行 不定 不定 不定 不定
→第4行 不定 不定 不定 不定

需要得到:
注意:原文每行处理后可以是多行(即式中的{gsub(/^→/,"""——"""); print},可以换成输出多行的句子):
——第1行: 不定 不定 不定 不定
〓〓第2行: 不定 不定 不定 不定
——第3行: 不定 不定 不定 不定
〓〓第4行: 不定 不定 不定 不定

执行:gawk "(i=!i){gsub(/^→/,"""——"""); print}" 原文.txt>对奇数行处理.txt得到:
——第1行 不定 不定 不定 不定
——第3行 不定 不定 不定 不定
执行:
gawk "(i=!i){gsub(/^→/,"""——"""); print} && !(i=!i){gsub(/^→/,"""〓〓"""); print}" 原文.txt

得到:显示&& 错误,请指教




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2