免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2307 | 回复: 7
打印 上一主题 下一主题

[文本处理] sort有bug还是我不会用呀 ? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-12-18 10:06 |只看该作者 |倒序浏览
文件1.txt;
  1. [kik@tivoli51 1217]$ cat 1.txt
  2. pbanthia;b
  3. pba;n
  4. pba;s
  5. pban;k
  6. pbanthia;c
  7. pbax;n
复制代码
排序后成

  1. [kik@tivoli51 1217]$ sort -t";" -f -i -k1 1.txt
  2. pba;n
  3. pban;k
  4. pbanthia;b
  5. pbanthia;c
  6. pba;s
  7. pbax;n
复制代码
我理解pba;s 应该在pba;n后面才对

然后调换了一下

  1. [kik@tivoli51 1217]$ awk -F";" '{print $2";"$1}' 1.txt  | sort -t";" -k2
  2. n;pba
  3. s;pba
  4. k;pban
  5. b;pbanthia
  6. c;pbanthia
  7. n;pbax
复制代码
这样就能排对了,

有人知道为什么么?

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
2 [报告]
发表于 2013-12-18 10:27 |只看该作者
回复 1# eachstep

just sort it without issue

$ cat 1.txt
pbanthia;b
pba;n
pba;s
pban;k
pbanthia;c
pbax;n

$ sort 1.txt
pba;n
pba;s
pban;k
pbanthia;b
pbanthia;c
pbax;n

   

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
3 [报告]
发表于 2013-12-18 10:29 |只看该作者
本帖最后由 yestreenstars 于 2013-12-18 10:31 编辑
  1. [root@localhost ~]# cat i
  2. pbanthia;b
  3. pba;n
  4. pba;s
  5. pban;k
  6. pbanthia;c
  7. pbax;n
  8. [root@localhost ~]# sort -t';' -fi -k1,1 i
  9. pba;n
  10. pba;s
  11. pban;k
  12. pbanthia;b
  13. pbanthia;c
  14. pbax;n
  15. [root@localhost ~]#
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
4 [报告]
发表于 2013-12-18 10:32 |只看该作者
回复 2# jason680
我这里的貌似跟你的不一样~
  1. [root@localhost ~]# cat i
  2. pbanthia;b
  3. pba;n
  4. pba;s
  5. pban;k
  6. pbanthia;c
  7. pbax;n
  8. [root@localhost ~]# sort i
  9. pba;n
  10. pban;k
  11. pbanthia;b
  12. pbanthia;c
  13. pba;s
  14. pbax;n
  15. [root@localhost ~]#
复制代码

论坛徽章:
0
5 [报告]
发表于 2013-12-18 10:36 |只看该作者
so weird ,
It doesn't work on both of these 2 versions. any ideas?

  1. [kik@tivoli51 1217]$ sort --version
  2. sort (coreutils) 5.2.1
  3. [upadmin@us70**** **]$ sort --version
  4. sort (GNU coreutils) 5.97
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
6 [报告]
发表于 2013-12-18 10:37 |只看该作者
产生这种情况的原因还是那个老问题,之前有人问过了~
       -k, --key=POS1[,POS2]
              start a key at POS1 (origin 1), end it at POS2 (default  end  of
              line
)
如果你不指定POS2,sort就默认以POS1到行尾的字符串来排序,这也是为什么直接sort不行的原因。

论坛徽章:
0
7 [报告]
发表于 2013-12-18 10:51 |只看该作者
回复 6# yestreenstars

明了, 非常感谢 :wink:


   

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
8 [报告]
发表于 2013-12-18 11:02 |只看该作者
本帖最后由 jason680 于 2013-12-18 11:04 编辑

回复 4# yestreenstars


I think there are some bug in some sort version

below sort on my system that didn't have issue
1. sort on solaris (can't get version)
2. sort (GNU coreutils) 8.13 (on Unbutu 12.04)

got some issue in sort 5.97(on RHEL 5.4), as below:

# sort  1.txt      
pba;n
pban;k
pbanthia;b
pbanthia;c
pba;s
pbax;n

# sort -t";" -k1,1 1.txt
pba;n
pba;s
pban;k
pbanthia;b
pbanthia;c
pbax;n

# sort --version
sort (GNU coreutils) 5.97
   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP