免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 9580 | 回复: 17
打印 上一主题 下一主题

[文本处理] 求助:如何检查一个数据文件中包含有多少列? [复制链接]

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-10-25 15:31 |只看该作者 |倒序浏览
一个从数据库中导出的数据文件,可能的内容格式如下:

1,1,"abcd","aass,125rpt","2013-09-01",1,"2013-09-01 13:11:24"
... ...

如何通过 shell 来判断这个文件有多少列。


有一批数据文件,有 3000 多个,如何才能快速检查这些文本文件所包含的列数。

行数可以通过 wc -l 来检查,但是列数如何检查不知道了。

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
2 [报告]
发表于 2013-10-25 15:37 |只看该作者
本帖最后由 关阴月飞 于 2013-10-25 15:38 编辑

回复 1# snow888

怎么样算是一列?分隔符是神马? 一个文件中的多行数据,出现列数不一样的怎么算?
   

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
3 [报告]
发表于 2013-10-25 15:37 |只看该作者
本帖最后由 huang6894 于 2013-10-25 15:37 编辑

awk -F"," '{print NF}' ufile
是你要的吗??

论坛徽章:
0
4 [报告]
发表于 2013-10-25 15:38 |只看该作者
回复 1# snow888


    awk -F',' '{print NF}'

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
5 [报告]
发表于 2013-10-25 15:40 |只看该作者
本帖最后由 huang6894 于 2013-10-25 15:40 编辑
  1. [huang@localhost ]$ cat test.txt
  2. 1,1,"abcd","aass,125rpt","2013-09-01",1,"2013-09-01 13:11:24"
  3. 1,1,"abcd","aass,125rpt","2013-09-01",1,"2013-09-01 13:11:24"
  4. 1,1,"abcd","aass,125rpt","2013-09-01",1,"2013-09-01 13:11:24"
  5. 1,1,"abcd","aass,125rpt","2013-09-01",1,"2013-09-01 13:11:24"
  6. 1,1,"abcd","aass,125rpt","2013-09-01",1,"2013-09-01 13:11:24"
  7. 1,1,"abcd","aass,125rpt","2013-09-01",1,"2013-09-01 13:11:24"
  8. 1,1,"abcd","aass,125rpt","2013-09-01",1,"2013-09-01 13:11:24"
  9. 1,1,"abcd","aass,125rpt","2013-09-01",1,"2013-09-01 13:11:24"
  10. 1,1,"abcd","aass,125rpt","2013-09-01",1,"2013-09-01 13:11:24"

  11. [huang@localhost ]$ awk -F"," '{print NF;if(NR>0)exit}' test.txt
  12. 8
复制代码

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
6 [报告]
发表于 2013-10-25 15:43 |只看该作者
回复 3# huang6894


    哎,不错,但有一个问题,如果文本字段中有 , 号的时候,这个检查出来的结果就不对了。

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
7 [报告]
发表于 2013-10-25 15:46 |只看该作者
回复 5# huang6894

如果文本的那个字段中有 , 号的时候,检查的结果就不对了呀。

比如某个字段中有 "abcd , 1234" 的时候,这个检查输出就有问题了呀。


   

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
8 [报告]
发表于 2013-10-25 15:48 |只看该作者
回复 5# huang6894

你这个正确的答案应该是 7 , 结果出来的是 8 啊。


   

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
9 [报告]
发表于 2013-10-25 15:54 |只看该作者
回复 2# 关阴月飞
你应该可以目测出分隔符是逗号~

   

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
10 [报告]
发表于 2013-10-25 16:01 |只看该作者
回复 7# snow888
纯粹统计列数又要防止字段里的逗号影响结果的话,也许这个可以帮到你:
  1. [root@localhost ~]# cat i
  2. 1,1,"abcd","aass,125rpt","2013-09-01",1,"2013-09-01 13:11:24"
  3. [root@localhost ~]# awk -F, '{gsub(/"[^"]*"/,"");print NF}' i
  4. 7
  5. [root@localhost ~]#
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP