免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: fufelixzh
打印 上一主题 下一主题

[文本处理] shell脚本面试题 [复制链接]

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
11 [报告]
发表于 2012-07-26 16:45 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
13
15-16赛季CBA联赛之同曦
日期:2016-01-28 19:52:032015亚冠之北京国安
日期:2015-10-07 14:28:19NBA常规赛纪念章
日期:2015-05-04 22:32:03处女座
日期:2015-01-15 19:45:44卯兔
日期:2014-10-28 16:17:14白羊座
日期:2014-05-24 15:10:46寅虎
日期:2014-05-10 09:50:35白羊座
日期:2014-03-12 20:52:17午马
日期:2014-03-01 08:37:27射手座
日期:2014-02-19 19:26:54子鼠
日期:2013-11-30 09:03:56狮子座
日期:2013-09-08 08:37:52
12 [报告]
发表于 2012-07-26 17:50 |只看该作者
  1. > cat domain.txt
  2. http://www.baidu.com/index.html
  3. http://www.google.com/index.html
  4. http://www.baidu.com/get.html
  5. http://www.baidu.com/set.html
  6. http://www.google.com/index.html
  7. http://www.yahoo.com.cn/put.html
  8. > cat domain.txt | cut -d'/' -f3 | sed 's/\([a-z]\{3\}.\)\([a-z0-9]*\)\(.[a-z]*\)/\2\3/g' | sort | uniq -c
  9.    3 baidu.com
  10.    2 google.com
  11.    1 yahoo.com.cn
复制代码

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
13 [报告]
发表于 2012-07-26 18:15 |只看该作者
哪家公司?

论坛徽章:
0
14 [报告]
发表于 2012-09-24 16:54 |只看该作者
more a.txt | sed -e 's/http:\/\///g' -e 's/\/.*//g' | sort | uniq -c | sort -rn -k 1 -t " "

论坛徽章:
0
15 [报告]
发表于 2012-09-25 11:32 |只看该作者
厉害!学习了

论坛徽章:
0
16 [报告]
发表于 2012-09-25 11:59 |只看该作者
  1. #!/usr/bin/env python  
  2. #-*- coding:utf-8 -*-  

  3. f = open('1.txt')
  4. data = []

  5. for i in f:
  6.     data.append(i.split('/')[2])

  7. for i in data:
  8.     print '%d %s' % (data.count(i),i)
  9.     data.remove(i)
复制代码

论坛徽章:
3
CU十二周年纪念徽章
日期:2013-10-24 15:41:34子鼠
日期:2013-12-14 14:57:19射手座
日期:2014-04-25 21:23:23
17 [报告]
发表于 2012-09-26 15:41 |只看该作者
  1. perl -lne 'if(/http:\/\/(\S+)(?=\/)/){$hash{$1}++}END{print "$hash{$_} $_" foreach (sort keys %hash)}' file
复制代码

论坛徽章:
0
18 [报告]
发表于 2012-10-06 11:23 |只看该作者
cat b.txt|awk -F / '{print $3}'|sort|uniq -c|sort -r

论坛徽章:
0
19 [报告]
发表于 2013-08-18 16:04 |只看该作者
  1. cat b.txt  |awk -F "/" '{print $3}' | sort | uniq -c |sort -rn
复制代码
真是百花争艳啊!

评分

参与人数 1可用积分 -1 收起 理由
expert1 -1 考古挖封贴

查看全部评分

论坛徽章:
0
20 [报告]
发表于 2013-08-18 16:36 |只看该作者
UNIX就是太灵活了,各种方法都有。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP