免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 6264 | 回复: 23
打印 上一主题 下一主题

[文本处理] 文件夹目录提取问题求教 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-08-08 15:21 |只看该作者 |倒序浏览
列表是这样的
/home/html/kstw.com/cache
/home/html/kstw.com/cache/smarty
/home/html/kstw.com/cache/smarty
/home/html/kstw.com/cache12/ddd
/home/html/login-tw-dod-bf.com/log
/home/html/nmtw-kks-bf.com/cache
/home/html/nmtw-kks-bf.com/cache/smarty
/home/html/test-ks-bf.com/cache
/home/html/test-ks-bf.com/cache/smarty
/home/html/tw-dod-bf.com/cache
/home/html/tw-dod-bf.com/cache/smarty
/home/html/tw-dod-bf.com/log
/home/html/tw-kks-bf.com/cache
/home/html/tw-kks-bf.com/cache/smarty
/home/html/tw-ks-bf.com/cache
/home/html/tw-ks-bf.com/cache23
/home/html/tw-ks-bf.com/cache/hd
/home/html/tw-ks-bf.com/cache/smarty



取的是路径的最大值。

/home/html/tw-kks-bf.com/cache
/home/html/tw-kks-bf.com/cache/smarty
就把
/home/html/tw-kks-bf.com/cache/smarty
排除掉

最后得到的结果是

/home/html/kstw.com/cache
/home/html/kstw.com/cache12/ddd
/home/html/login-tw-dod-bf.com/log
/home/html/nmtw-kks-bf.com/cache
/home/html/test-ks-bf.com/cache
/home/html/tw-dod-bf.com/cache
/home/html/tw-dod-bf.com/log
/home/html/tw-kks-bf.com/cache
/home/html/tw-ks-bf.com/cache
/home/html/tw-ks-bf.com/cache23

各位大神,该如何处理

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
2 [报告]
发表于 2012-08-08 15:32 |只看该作者
回复 1# tianer


    取的是路径的最大值。


最大值?

/home/html/tw-kks-bf.com/cache
/home/html/tw-kks-bf.com/cache/smarty
就把
/home/html/tw-kks-bf.com/cache/smarty
排除掉


这不是最小吗?

论坛徽章:
0
3 [报告]
发表于 2012-08-08 15:36 |只看该作者
回复 2# blackold


    不好意思,我说错了,是最小值

论坛徽章:
0
4 [报告]
发表于 2012-08-08 15:46 |只看该作者
  1. [root@gjcfd-release01 songteng]# cat test
  2. /home/html/kstw.com/cache
  3. /home/html/kstw.com/cache/smarty
  4. /home/html/kstw.com/cache/smarty
  5. /home/html/kstw.com/cache12/ddd
  6. /home/html/login-tw-dod-bf.com/log
  7. /home/html/nmtw-kks-bf.com/cache
  8. /home/html/nmtw-kks-bf.com/cache/smarty
  9. /home/html/test-ks-bf.com/cache
  10. /home/html/test-ks-bf.com/cache/smarty
  11. /home/html/tw-dod-bf.com/cache
  12. /home/html/tw-dod-bf.com/cache/smarty
  13. /home/html/tw-dod-bf.com/log
  14. /home/html/tw-kks-bf.com/cache
  15. /home/html/tw-kks-bf.com/cache/smarty
  16. /home/html/tw-ks-bf.com/cache
  17. /home/html/tw-ks-bf.com/cache23
  18. /home/html/tw-ks-bf.com/cache/hd
  19. /home/html/tw-ks-bf.com/cache/smarty
  20. [root@gjcfd-release01 songteng]# awk -F "/" 'NF<6 {print $0}' test
  21. /home/html/kstw.com/cache
  22. /home/html/login-tw-dod-bf.com/log
  23. /home/html/nmtw-kks-bf.com/cache
  24. /home/html/test-ks-bf.com/cache
  25. /home/html/tw-dod-bf.com/cache
  26. /home/html/tw-dod-bf.com/log
  27. /home/html/tw-kks-bf.com/cache
  28. /home/html/tw-ks-bf.com/cache
  29. /home/html/tw-ks-bf.com/cache23
  30. [root@gjcfd-release01 songteng]#
复制代码

论坛徽章:
0
5 [报告]
发表于 2012-08-08 15:56 |只看该作者
beyond_st 发表于 2012-08-08 15:46


你好,过滤后的结果应该还有个
/home/html/kstw.com/cache12/ddd

论坛徽章:
0
6 [报告]
发表于 2012-08-08 16:04 |只看该作者
tianer 发表于 2012-08-08 15:56
你好,过滤后的结果应该还有个
/home/html/kstw.com/cache12/ddd


你这啥规律..不是按照目录深度?
sed  '/smarty/d' test 能满足么?

论坛徽章:
0
7 [报告]
发表于 2012-08-08 16:08 |只看该作者
beyond_st 发表于 2012-08-08 16:04
你这啥规律..不是按照目录深度?
sed  '/smarty/d' test 能满足么?

这个真没太多规律,目录深度也不是固定的。

假设只有这3个
/home/html/tw-ks-bf.com/cache/tt/tt
/home/html/tw-ks-bf.com/cache/tt/tt/ttt
/home/html/tw-ks-bf.com/cache/tt/tt/ttt/tt

最后剩下的应该是
/home/html/tw-ks-bf.com/cache/tt/tt

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
8 [报告]
发表于 2012-08-08 17:28 |只看该作者
还没解决啊, try
  1. awk '{for(i in a)if(index($0,i"/")==1) next;a[$0]}END{for(i in a) print i}' urfile
复制代码

论坛徽章:
0
9 [报告]
发表于 2012-08-08 17:35 |只看该作者
回复 1# tianer
  1. sed ':2;N;s/^\(.*\)\(\(\n.*\)*\)\n\1\/.*/\1\2/M;$!b2' file
复制代码

论坛徽章:
0
10 [报告]
发表于 2012-08-08 18:00 |只看该作者
回复 8# blackold


    可以的,谢谢了哈
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP