免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 839 | 回复: 2

[文本处理] 统计文件中某字符的个数,从第10个位置分割文件 [复制链接]

论坛徽章:
0
发表于 2017-05-03 10:37 |显示全部楼层
假设某文件的格式如下,以“@”分段存储的:
  1. @
  2. abc
  3. dde

  4. @
  5. 123dab
  6. ww
  7. www

  8. @
  9. 232rsdf
  10. sd
  11. sds

  12. @
  13. sfsfsfs

  14. @
  15. sdefsf
  16. erwrf
  17. dsfsd
复制代码


查找该文件,当查找到第十个“@”的时候,分割保存到另外一个文件中

如何做到呢?




论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
发表于 2017-05-03 10:44 |显示全部楼层
  1. awk '/@/&&++a%10==1{++n}{print >n".txt"}'
复制代码

论坛徽章:
0
发表于 2017-05-03 11:13 |显示全部楼层
本帖最后由 linlone 于 2017-05-03 11:15 编辑

回复 1# linlone

我使用了csplit命令,但并不是我想要的效果,如何使用csplit,只取前5个“@”呢?
  1. $ cat tt.txt
  2. @
  3. abc
  4. dde

  5. @
  6. 123dab
  7. ww
  8. www

  9. @
  10. 232rsdf
  11. sd
  12. sds

  13. @
  14. sfsfsfs

  15. @
  16. sdefsf
  17. erwrf
  18. dsfsd

  19. @
  20. sssss

  21. @
  22. sssssse

  23. @
  24. 11111

  25. @
  26. 222222

  27. @
  28. 33333

  29. $ csplit tt.txt /^@$/ {4} -sz -n2 -f tt -b "%02d.log"

  30. $ cat tt00.log
  31. @
  32. abc
  33. dde


  34. $ cat tt01.log
  35. @
  36. 123dab
  37. ww
  38. www


  39. $ cat tt02.log
  40. @
  41. 232rsdf
  42. sd
  43. sds


  44. $ cat tt03.log
  45. @
  46. sfsfsfs


  47. $ cat tt04.log
  48. @
  49. sdefsf
  50. erwrf
  51. dsfsd

  52. @
  53. sssss

  54. @
  55. sssssse

  56. @
  57. 11111

  58. @
  59. 222222

  60. @
  61. 33333

复制代码


您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

SACC2019中国系统架构师大会

【数字转型 架构演进】SACC2019中国系统架构师大会
2019年10月31日~11月2日第11届中国系统架构师大会(SACC2019)将在北京隆重召开。四大主线并行的演讲模式,1个主会场、20个技术专场、超千人参与的会议规模,100+来自互联网、金融、制造业、电商等领域的嘉宾阵容,将为广大参会者提供一场最具价值的技术交流盛会。




----------------------------------------

大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP