免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2033 | 回复: 6
打印 上一主题 下一主题

[文本处理] shell 能处理双字节的文本吗? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-07-19 22:39 |只看该作者 |倒序浏览
大家好,请教一个问题,
我想用shell 脚本处理一些文本,这些文本是双字节编码的,用shell脚本或sed编辑输出的文本是乱码,
设置LC_ALL = zh_CN.GBK 也试过了,输出的一样是乱码。

还有,awk 怎样设置记录分隔符为 0x0d, 0x0a ?

谢谢!

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
2 [报告]
发表于 2012-07-20 08:17 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
3 [报告]
发表于 2012-07-20 20:15 |只看该作者
回复 2# zooyo


    设置过了,命令行显示是没有问题,
但是我要用shell在一个双字节的文本中插入一些双字节的字符就会出现乱码,
不只是汉字,其它语言的文字也是这样的,
要是shell只能处理英文,那要来有何用?

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
4 [报告]
发表于 2012-07-20 22:14 |只看该作者
回复 1# 叶叶叶Yeah


    可以。设置正确就可以。

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
5 [报告]
发表于 2012-07-21 09:10 |只看该作者
叶叶叶Yeah 发表于 2012-07-20 20:15
回复 2# zooyo

还可以处理法文

论坛徽章:
11
摩羯座
日期:2013-09-16 11:10:272015亚冠之阿尔萨德
日期:2015-06-12 22:53:29午马
日期:2014-04-15 11:08:53亥猪
日期:2014-03-02 23:46:35申猴
日期:2013-12-06 22:07:00亥猪
日期:2013-11-28 12:03:13双鱼座
日期:2013-11-21 14:43:56亥猪
日期:2013-10-23 10:55:49处女座
日期:2013-10-17 18:15:43午马
日期:2013-09-27 17:40:4215-16赛季CBA联赛之青岛
日期:2016-06-22 00:45:55
6 [报告]
发表于 2012-07-31 10:50 |只看该作者
$ echo $! | sed 's/^0$/太棒了!是一个大零蛋耶!/'
太棒了!是一个大零蛋耶!

$ !! | sed 's/耶/叶叶叶Yeah/'
太棒了!是一个大零蛋叶叶叶Yeah!

$ !! | sed 's/叶\{3\}/♣/'
太棒了!是一个大零蛋♣Yeah!


论坛徽章:
1
巳蛇
日期:2013-10-28 15:55:33
7 [报告]
发表于 2012-08-01 08:42 来自手机 |只看该作者
不要处理gbk,很容易出错,除非你非常熟悉GBk编码,否则换成utf8
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP