免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4042 | 回复: 11
打印 上一主题 下一主题

[文本处理] 字符串分隔问题!! [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-07-18 12:36 |只看该作者 |倒序浏览
  1. 1,"FenAiXing","M"                                                                                                
  2. 2,"ZhangXueJiao","F"                                                                                             
  3. 3,"YeHongBO","M"                                                                                                
  4. 4,"oK","O"                                                                                                      
  5. 5,"J""TOM","M"                                                                                                   
  6. 6,"J,Tom",                                                                                                      
  7. 6,"J,Tom"," "  
复制代码
以上是DB2 import 出来的表数据,共三个字段,以逗号作为分隔的,但如果字段本身有逗号的则在引号里仍以逗号本身出现。
现在想把每条数据重新分隔成三个字段,对每个字段作处理,问题是字段本身里也有逗号所以不知用SHELL有什么好的办法??

论坛徽章:
0
2 [报告]
发表于 2012-07-18 12:58 |只看该作者
本帖最后由 personball 于 2012-07-18 12:59 编辑

回复 1# DIYBYPERL
  1.     personball@vostro:~$echo '6,"J,Tom",""'|sed 's/,\"/-\"/g'
  2. 6-"J,Tom"-""
  3. personball@vostro:~$
复制代码
将分隔符  ,   换 成    -

另,DB2导出数据时候不能自定义分隔符?

论坛徽章:
0
3 [报告]
发表于 2012-07-18 13:23 |只看该作者
这不已经分割成三个字段了  怎么还需要重新分吗

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
4 [报告]
发表于 2012-07-18 13:44 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
5 [报告]
发表于 2012-07-18 13:56 |只看该作者
  1. [root@182 name]# cat file
  2. 1,"FenAiXing","M"
  3. 2,"ZhangXueJiao","F"
  4. 3,"YeHongBO","M"
  5. 4,"oK","O"
  6. 5,"J""TOM","M"
  7. 6,"J,Tom",
  8. 7,"J,Tom"," "
  9. [root@182 name]# sed '/[^"]$/s/$/""/;s/,"/\t/g;s/"\t/\t/g;s/"$//' file |column -t
  10. 1  FenAiXing     M
  11. 2  ZhangXueJiao  F
  12. 3  YeHongBO      M
  13. 4  oK            O
  14. 5  J""TOM        M
  15. 6  J,Tom
  16. 7  J,Tom
复制代码
不知道这样能否满足。前提条件是数据库字段里没有\t制表符就行

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
6 [报告]
发表于 2012-07-18 14:01 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
7 [报告]
发表于 2012-07-18 14:03 |只看该作者
回复 1# DIYBYPERL
  1. $ echo '1,"FenAiXing","M"
  2. 2,"ZhangXueJiao","F"
  3. 3,"YeHongBO","M"
  4. 4,"oK","O"
  5. 5,"J""TOM","M"
  6. 6,"J,Tom",
  7. 6,"J,Tom"," "' |awk -F, '{for(i=1;i<=NF;i++){if(gsub(/"/,"&",$i)%2){j++;printf $i (j%2?",":"\t")}else{printf $i"\t"}};print "";j=0}'
  8. 1       "FenAiXing"     "M"
  9. 2       "ZhangXueJiao"  "F"
  10. 3       "YeHongBO"      "M"
  11. 4       "oK"    "O"
  12. 5       "J""TOM"        "M"
  13. 6       "J,Tom"
  14. 6       "J,Tom" " "
复制代码

论坛徽章:
0
8 [报告]
发表于 2012-07-20 16:08 |只看该作者
解决了,谢谢大家

使用的是yinyuemi的方法。。

论坛徽章:
3
IT运维版块每日发帖之星
日期:2015-12-30 06:20:00IT运维版块每日发帖之星
日期:2016-02-16 06:20:00每日论坛发贴之星
日期:2016-02-16 06:20:00
9 [报告]
发表于 2012-07-20 16:56 |只看该作者
  1. [root@localhost ~]# cat char | sed 's/,"/ "/g' | sed 's/",/" /g' > char1
  2. [root@localhost ~]# cat char1
  3. 1 "FenAiXing" "M"
  4. 2 "ZhangXueJiao" "F"
  5. 3 "YeHongBO" "M"
  6. 4 "oK" "O"
  7. 5 "J""TOM" "M"
  8. 6 "J,Tom"
  9. 6 "J,Tom" " "
复制代码
有点取巧了
只要是以引号开头或者结尾的逗号都给替换成空格

论坛徽章:
0
10 [报告]
发表于 2012-07-20 17:17 |只看该作者
本帖最后由 DIYBYPERL 于 2012-07-20 17:18 编辑

回复 9# w630866139


    DB2 导出的数据中可能会出现下面这种数据的(三个字段):
1,"TOM"",""","M"
也就是当字段中有"时,导出为""
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP