免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3572 | 回复: 13
打印 上一主题 下一主题

固定格式,处理文本shell 新问题! 求解 [复制链接]

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2016-05-03 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-11-01 23:14 |只看该作者 |倒序浏览
问题缘由: 数据库中的数据已经导出到一个文本文件中, 要求按每个字段的长度在数据后面加 “|” 即每个字段中间都有“|”
   
     现有一文本文件数据如下:
                             a字段:‘aaa’         长度3
                             b字段:‘   ’            长度3
                             c字段:‘0000.1’     长度6
                             d字段:‘   ’            长度3
                             e字段:‘00000’     长度5
                             f字段:”    ”           长度4
                             g字段:“   b”        长度4

             由以上字段组成如下文件:        
                             ”aaa   0000.1   00000       b”              真实文件中没有双引号
   
                              这样的数据在文件中最多有上万行   
                              每行数据每个字段长度都一样(第一行第一个字段长度为3,第二行第一个字段长度也为3,以此类推)
                              文件中一行可能有上百个字段
               处理结果:
                              |aaa|   |00000.1|   |00000|    |   b|

              要求:   按给出的字段长度在每个字段后面加上”|“

    向各位大虾求解   不知道我问题表达清楚没有。 先谢过各位

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
2 [报告]
发表于 2011-11-01 23:42 |只看该作者
     现有一文本文件数据如下:
                             a字段:‘aaa’         长度3
                             b字段:‘   ’            长度3
                             c字段:‘0000.1’     长度6
                             d字段:‘   ’            长度3
                             e字段:‘00000’     长度5
                             f字段:”    ”           长度4
                             g字段:“   b”        长度4
             由以上字段组成如下文件:        
                             ”aaa   0000.1   00000       b”              真实文件中没有双引号
   
                              这样的数据在文件中最多有上万行   

需要处理的到底是哪个文件?

论坛徽章:
1
技术图书徽章
日期:2013-09-25 21:06:29
3 [报告]
发表于 2011-11-01 23:49 |只看该作者
awk  '{for(i=1;i<=NF;i++){gsub($i,\|$i\|,$i)}print}' testx2.txt   刚刚打算用这个得,但是奇怪的是为什么输出的却是
|$i| |$i| |$i| |$i|   坐等高手出现帮忙解答下!

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
4 [报告]
发表于 2011-11-01 23:51 |只看该作者
回复 3# yuloveban


gsub有这样的语法?

论坛徽章:
1
技术图书徽章
日期:2013-09-25 21:06:29
5 [报告]
发表于 2011-11-01 23:57 |只看该作者
回复  yuloveban


gsub有这样的语法?
Shell_HAT 发表于 2011-11-01 23:51



    gsub 没有用没有看到过,但是如果在域的两边都添加| 该如何添加呢?

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
6 [报告]
发表于 2011-11-02 00:19 |只看该作者
回复 1# 5itle


    try:
  1. awk 'BEGIN{FIELDWIDTHS="3 3 6 3 5 4 4"}NF+=0{print "|"$0"|"}' OFS="|"
复制代码

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
7 [报告]
发表于 2011-11-02 00:20 |只看该作者
awk  '{for(i=1;i
yuloveban 发表于 2011-11-01 23:49



    这样:awk  '{for(i=1;i<=NF;i++){gsub($i,"|"$i"|",$i)}print}'
    不过lz还有字段宽度的要求,这个可能不行

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
8 [报告]
发表于 2011-11-02 00:26 |只看该作者
回复 2# Shell_HAT


    lz需要处理的是“横着”的文本
  为了说清楚,先把文本分解成a..g个“竖着”的文本

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2016-05-03 06:20:00
9 [报告]
发表于 2011-11-02 08:00 |只看该作者
回复 2# Shell_HAT


    处理的是横着的文本  横着的文本是由那些字段组成的

论坛徽章:
0
10 [报告]
发表于 2011-11-02 15:12 |只看该作者
回复 6# yinyuemi


    学习了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP