免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2588 | 回复: 9
打印 上一主题 下一主题

如何找出这个文件的前4个字符的distict和后三个字符的distinct的值是多少? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-08-06 15:27 |只看该作者 |倒序浏览
例如一个TXT文件包含

APU1_gl_tab13.dbf
APU1_sys03.rdo
APU1_sys04.ksp
APU1_too02.dbf
GPU1_sys05.dbf
KSU1_sys02.dbf

显示出前4个字符的distinct的数值是APU1 GPU1 KSU1
显示后3个字符的distinct的数值是dbf rdo ksp


应该怎么写脚本?

论坛徽章:
0
2 [报告]
发表于 2010-08-06 15:32 |只看该作者
回复 1# 奥巴牛


    没看明白,是要找出现次数?

论坛徽章:
0
3 [报告]
发表于 2010-08-06 15:33 |只看该作者
cut -b1-4 filename|sort -u
awk '{print substr($0,length($0)-3,4)}' filename|sort -u

论坛徽章:
0
4 [报告]
发表于 2010-08-06 15:37 |只看该作者
回复  奥巴牛


    没看明白,是要找出现次数?
好看的附件 发表于 2010-08-06 15:32



   

不是,是找出前4个字段和后3个字段有多少个不重复的值

论坛徽章:
0
5 [报告]
发表于 2010-08-06 15:42 |只看该作者
回复 4# 奥巴牛


   awk -F\_ '{print $1}' filename|sort -u
    awk -F\. '{print $2}' filename|sort -u

论坛徽章:
0
6 [报告]
发表于 2010-08-06 15:43 |只看该作者
本帖最后由 nomyself 于 2010-08-06 15:47 编辑

  1. perl -lne 'print "$1\t$2" if /([A-Z0-9]{4}).*\.([a-z]{3})/' txt

  2. while read a; do echo -e "${a:0:4}\t${a:1-4}"; done<txt
复制代码

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
7 [报告]
发表于 2010-08-06 16:46 |只看该作者
回复 6# nomyself


没有看清楼主的问题吧?

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
8 [报告]
发表于 2010-08-06 16:49 |只看该作者
  1. awk -F_ '{if(a[$1]==0)print $1;a[$1]++}' urfile
复制代码
  1. awk -F. '{if(a[$2]==0)print $2;a[$2]++}' urfile
复制代码

论坛徽章:
0
9 [报告]
发表于 2010-08-07 18:22 |只看该作者
去重用!a[$x]++,这是经了

awk -F_ '!a[$1]++{print $1}' file
awk -F. '!a[$2]++{print $2}' file

论坛徽章:
0
10 [报告]
发表于 2010-08-08 11:38 |只看该作者
回复 1# 奥巴牛

这样?
  1. [root@localhost lx]# sed 's/_\(.*\)\./ /g' urfile
  2. APU1 dbf
  3. APU1 rdo
  4. APU1 ksp
  5. APU1 dbf
  6. GPU1 dbf
  7. KSU1 dbf
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP