免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4476 | 回复: 16
打印 上一主题 下一主题

数据处理 [复制链接]

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2015-08-13 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-07-06 17:39 |只看该作者 |倒序浏览
本帖最后由 hover_sky 于 2011-07-06 17:43 编辑

  1. #cat tt.txt
  2. dddddddddddd
  3. ---Get upload info: /srv/add/ff/gg/hh/56/477/6517477/1987784/book/440205|440205|1|6517477|1987784|5|0|0|0
  4. fffffffffffffffffffffffffff
复制代码
用sed and awk要得到的结果:

  1. #file=`grep "Get upload info:" tt.txt|awk -F ":|\|" '{print $2;}'`;echo ${file%/*};
  2. /srv/add/ff/gg/hh/56/477/6517477/1987784/book/
  3. #sed -r 's/.*:(.*\/)[0-9]{2,}(|.*)*/\1/g' tt.txt   
  4. /srv/add/ff/gg/hh/56/477/6517477/1987784/book/
复制代码
请帮忙精简,谢谢

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
2 [报告]
发表于 2011-07-06 18:15 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
3 [报告]
发表于 2011-07-06 18:16 |只看该作者
本帖最后由 lionfun 于 2011-07-06 18:17 编辑

回复 1# hover_sky
  1. sed -ne '/info:/{s@[^/]*\(/.*/\)[^/]*@\1@g;p}' tt.txt
复制代码

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
4 [报告]
发表于 2011-07-06 23:33 |只看该作者
using bash
  1. $ echo 'dddddddddddd
  2. ---Get upload info: /srv/add/ff/gg/hh/56/477/6517477/1987784/book/440205|440205|1|6517477|1987784|5|0|0|0
  3. fffffffffffffffffffffffffff' |\
  4. while read line
  5. do
  6.     [[ $line =~ "---Get" ]] && file=${line##* /} && file=${file%/*} && echo $file
  7. done
  8. srv/add/ff/gg/hh/56/477/6517477/1987784/book
复制代码

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
5 [报告]
发表于 2011-07-07 01:37 |只看该作者
回复 1# hover_sky
  1. file=`awk -F '[:\\\|]' '/Get upload info:/{print $2;}' urfile`
  2. echo ${file%/*}
复制代码

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
6 [报告]
发表于 2011-07-07 08:16 |只看该作者
  1. awk '/info:/{split($NF,a,"|");system("dirname "a[1]"")}' infile
复制代码

论坛徽章:
0
7 [报告]
发表于 2011-07-07 09:30 |只看该作者
回复  hover_sky
Shell_HAT 发表于 2011-07-07 01:37



    能解释一下 F '[:\\\|]'  中括号里面的内容吗? 平时值看到一个符合,这次看到多个 看不懂。
   还有 ${file%/*} 里面的%/* 是什么意思?

论坛徽章:
0
8 [报告]
发表于 2011-07-07 09:51 |只看该作者
回复 1# hover_sky


sed -n 's#.*\(/s.*/\).*#\1#p' tt.txt

论坛徽章:
0
9 [报告]
发表于 2011-07-07 10:05 |只看该作者
本帖最后由 ywlscpl 于 2011-07-07 10:11 编辑

awk '/Get upload/{split($NF,m,"|");sub(/\/[^\/]*$/,"",m[1]);print m[1]}' file

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2015-08-13 06:20:00
10 [报告]
发表于 2011-07-07 10:08 |只看该作者
能解释一下 F '[:\\\|]'  中括号里面的内容吗? 平时值看到一个符合,这次看到多个 看不懂。
   ...
huang_wunix 发表于 2011-07-07 09:30



    1, 是用: \  |作为分隔符吧?但这里,不需要用\作为分隔符。。。有其他用意?

     2, 拿掉右边第一个/及其右边的字符串,详见   http://bbs.chinaunix.net/viewthr ... p;page=7#pid1617953
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP