免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 3284 | 回复: 21
打印 上一主题 下一主题

[文本处理] 数据的筛选 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-10-10 12:30 |只看该作者 |倒序浏览
本帖最后由 gooderpan 于 2014-10-10 12:31 编辑

我有一个文件file1:(tab分隔)
chrY   145516        T        2        10        28.90        [0, 0, 0, 10]        -        0.00         1.0
chrY   145517        T        2        10        30.10        [0, 0, 0, 10]        -        0.00         1.0
chrY   145518        A        2        10        29.50        [10, 0, 0, 0]        -        0.00         1.0
chrY   145519        T        2        10        30.10        [0, 0, 0, 10]        -        0.00         1.0
chrY   145520        G        2        10        27.40        [0, 0, 10, 0]        -        0.00         1.0
chrY   145521        C        2        10        28.80        [0, 10, 0, 0]        -        0.00         1.0
chrY   145522        A        2        10        31.60        [10, 0, 0, 0]        -        0.00         1.0
chrY   145523        T        2        10        32.10        [0, 0, 0, 10]        -        0.00         1.0

我想要时第7列中“[]”内的数满足:第一个等于0 && 第四个等于0,想要的结果如下:
chrY         145520        G        2        10        27.40        [0, 0, 10, 0]        -        0.00         1.0
chrY         145521        C        2        10        28.80        [0, 10, 0, 0]        -        0.00         1.0

请大神们指点啊??感激!!

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
2 [报告]
发表于 2014-10-10 12:32 |只看该作者
  1. [root@localhost ~]# grep '\[0,.* 0\]' i
  2. chrY         145520        G        2        10        27.40        [0, 0, 10, 0]        -        0.00         1.0
  3. chrY         145521        C        2        10        28.80        [0, 10, 0, 0]        -        0.00         1.0
  4. [root@localhost ~]#
复制代码

论坛徽章:
0
3 [报告]
发表于 2014-10-10 12:35 |只看该作者
那如果要求第7列“[]”内的数满足:第二个和第四个等于0。那又该怎么写呢??谢谢回复 2# yestreenstars


   

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
4 [报告]
发表于 2014-10-10 12:45 |只看该作者
回复 3# gooderpan
  1. grep '\[.*, 0, .*, 0\]' a.txt
复制代码
希望第几个是0,就把那个 .* 改成 0

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
5 [报告]
发表于 2014-10-10 12:55 |只看该作者
回复 3# gooderpan

1 ==> $2
2 ==> $3
3 ==> $4
4 ==> $5

awk -F'[][,]' '$2==0&&$5==0'  urfile
awk -F'[][,]' '$3==0&&$5==0'  urfile

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
6 [报告]
发表于 2014-10-10 13:43 |只看该作者
本帖最后由 jason680 于 2014-10-10 13:45 编辑

回复 3# gooderpan

$ awk '{k=$7;gsub(/[][]/,"",k);split(k,a,", *");if(a[1]==0&&a[4]==0)print}' FS="\t" FILE
chrY        145520        G        2        10        27.40        [0, 0, 10, 0]        -        0.00        1.0
chrY        145521        C        2        10        28.80        [0, 10, 0, 0]        -        0.00        1.0

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
7 [报告]
发表于 2014-10-10 13:51 |只看该作者
本帖最后由 yestreenstars 于 2014-10-10 13:52 编辑

回复 3# gooderpan
  1. awk -F'\t' '{split($7,a,",")}+a[2]==0&&+a[4]==0'
复制代码

论坛徽章:
0
8 [报告]
发表于 2014-10-10 13:58 |只看该作者
请问:+a[2]==0&&+a[4]==0中“+”是什么意思呢??回复 7# yestreenstars


   

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
9 [报告]
发表于 2014-10-10 14:12 |只看该作者

论坛徽章:
0
10 [报告]
发表于 2014-10-10 15:13 |只看该作者
本帖最后由 gooderpan 于 2014-10-10 15:14 编辑

请问,如果我想要第七列“[]”中满足第一个数等于0。那么你写的:awk -F'\t' '{split($7,a,",")}+a[2]==0&&+a[4]==0' 这个需要怎么改呢??awk -F'\t' '{split($7,a,",")}+a[1]==0' 不行。回复 7# yestreenstars


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP