免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12345下一页
最近访问板块 发新帖
查看: 6071 | 回复: 42
打印 上一主题 下一主题

[文本处理] awk匹配字段有奇怪现象,请高手指点 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-06-04 08:58 |只看该作者 |倒序浏览
本帖最后由 lwlzflwl 于 2015-06-04 08:59 编辑

linux:~/all> cat aaa
0001000002013022008310010420130220083100201302200831000000000001                                       
201506021717179991015   10元包月        0       Free    1       Fee=600 20130220083430  20130220083430
201506021717179991025   10元包月        0       Free    1       Fee=700 20130220083430  20130220083430
201506021717179991035   10元包月        0       Free    1       Fee=800 20130220083430  20130220083430
201506021717179991045   10元包月        0       Free    1       Fee=900 20130220083430  20130220083430

linux:~/all> awk -F'\t' -v id='201506021717179991015' '{if($1==id){print $0;next}}' aaa
201506021717179991015   10元包月        0       Free    1       Fee=600 20130220083430  20130220083430
201506021717179991025   10元包月        0       Free    1       Fee=700 20130220083430  20130220083430
201506021717179991035   10元包月        0       Free    1       Fee=800 20130220083430  20130220083430
201506021717179991045   10元包月        0       Free    1       Fee=900 20130220083430  20130220083430


分拣结果不正确,全匹配上了,请高手看看是啥情况呢?

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
2 [报告]
发表于 2015-06-04 09:12 |只看该作者
回复 1# lwlzflwl


数值比较的问题,换成字符串比较就可以了。
  1. awk -F'\t' -vid='201506021717179991015' '$1==id""' file
复制代码

论坛徽章:
0
3 [报告]
发表于 2015-06-04 09:19 |只看该作者
感谢,果然是的回复 2# ly5066113


   

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
4 [报告]
发表于 2015-06-04 09:26 |只看该作者
回复 2# ly5066113

学习了,为什么会出现这种问题呢?
   

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
5 [报告]
发表于 2015-06-04 10:18 |只看该作者
回复 4# yestreenstars


猜测是超过整型变量的最大值了,内部统一存储成同一数值。
看看下面的结果, $1 进行任何计算,结果都一样。
  1. awk '{print $1,$1+0,$1/2,$1*10}' file
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
6 [报告]
发表于 2015-06-04 10:43 |只看该作者
回复 5# ly5066113

原来如此~
   

论坛徽章:
9
射手座
日期:2014-07-29 13:05:07双子座
日期:2015-01-11 17:01:522015年亚洲杯之朝鲜
日期:2015-02-01 16:14:282015亚冠之阿尔艾因
日期:2015-06-04 17:54:40数据库技术版块每日发帖之星
日期:2015-08-02 06:20:00数据库技术版块每日发帖之星
日期:2015-10-28 06:20:00数据库技术版块每日发帖之星
日期:2015-11-26 06:20:0015-16赛季CBA联赛之天津
日期:2016-06-20 17:09:2015-16赛季CBA联赛之青岛
日期:2017-02-26 15:54:19
7 [报告]
发表于 2015-06-04 11:41 |只看该作者
我也是来学习的

原来$1==t""  能把变量t变成字符类型

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
8 [报告]
发表于 2015-06-04 11:51 |只看该作者
也可以写成
  1. awk -F'\t' 'BEGIN{id="201506021717179991015"}$1==id' file
复制代码
这样也是字符串比较了!

awk 对类型的判断遵循的原则:
  1.  A numeric constant or the result of a numeric operation has the numeric attribute.
  2.  A string constant or the result of a string operation has the string attribute.
  3.  Fields, getline input, FILENAME, ARGV elements, ENVIRON elements, and the elements
  4. of an array created by match(), split(), and patsplit() that are numeric strings
  5. have the strnum attribute. Otherwise, they have the string attribute. Uninitialized
  6. variables also have the strnum attribute.
  7.  Attributes propagate across assignments but are not changed by any use.
  8.               STRING NUMERIC STRNUM
  9. STRING string string string
  10. NUMERIC string numeric numeric
  11. STRNUM string numeric numeric
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
9 [报告]
发表于 2015-06-04 11:59 |只看该作者
回复 8# reyleon

牛!学习了!为什么写在BEGIN里就会被当做字符串呢?
   

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
10 [报告]
发表于 2015-06-04 12:33 |只看该作者
回复 9# yestreenstars

跟BEGIN无关....

a==b  --> if a and b are numbers, then compare them by number

$ awk -vid='2' '$1==id' FILE
2
02

$ awk -vid='2' '$1==id""' FILE
2
id and ""(empty string) are combined together to be a string


$ cat FILE
1
2
01
02
01x
02a

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP