论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2008-07-08 12:26 |只看该作者 |倒序浏览

有一段內容如下：

hello@tom@吃了吧@AAA
我在使用@作為分割符時，中文漢字所在的字段會出現亂碼的現象。不知道大家有沒有碰到過？
但是有時候又是正常的顯示漢字。很奇怪。
同一段 echo "hello@tom@吃了吧@AAA"|nawk -F@ '{print $3}' 代碼執行有時候是亂碼有時候又顯示漢字正常？
有沒有好的方法解決？

文库|博客

blackold

大富大贵

论坛徽章:: 5

2楼 [报告]

发表于 2008-07-08 12:34 |只看该作者

回复 #1 edei2004 的帖子

相同的代码结果不同？我环境没有这种问题。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

walkerxk

富足长乐

论坛徽章:: 0

3楼 [报告]

发表于 2008-07-08 13:12 |只看该作者

LZ的LANG和shell环境是什么？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

sdu_lizhipeng

家境小康

论坛徽章:: 0

4楼 [报告]

发表于 2008-07-08 13:16 |只看该作者

没事啊，在我这里显示没有问题啊

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

springwind426

小富即安

论坛徽章:: 0

5楼 [报告]

发表于 2008-07-08 13:36 |只看该作者

这样行不行？

echo "hello@tom@吃了吧@AAA"|LANG=C nawk -F@ '{print $3}'

复制代码

在我的系统中，加不加LANG=C 输出结果是一样的

不过，因为特殊的中文字符导致sed输出混乱的情况我遇到过，后来用LANG=C来处理就解决了(印象中是分析一个html文档，它的编码是GB2312，可是其中有少量字符的编码却是utf8的，用sed处理，在那些编码不一样的字符串就出现错误，后来添加LANG=C后就解决了。)

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

edei2004

稍有积蓄

论坛徽章:: 0

6楼 [报告]

发表于 2008-07-08 14:07 |只看该作者

试试......... 谢谢各位

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

edei2004

稍有积蓄

论坛徽章:: 0

7楼 [报告]

发表于 2008-07-08 14:26 |只看该作者

回复 #3 walkerxk 的帖子

我的LANG环境是 zh.GBK
sh 是 ksh

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

edei2004

稍有积蓄

论坛徽章:: 0

8楼 [报告]

发表于 2008-07-08 14:55 |只看该作者

我刚才用下面的这样的语句测试了一下：
echo "hello@tom@吃饭开始了@AAA"|nawk -F@ '{for(i=1;i<1000;i++){print $3,$2}}'|while read str1 str2;do echo "==["$str1"] ["$str2"]";done >t.dd

第一条打印出现乱码的频率较高，结果如下：
==[苑箍?剂薥] [tom]
==[吃饭开始了] [tom]
==[吃饭开始了] [tom]
==[吃饭开始了] [tom]　　．．．．．．．．．．

我用上面的语句连续执行了５次，其中有３次会在打印的第一条记录出现如上的乱码．有空的朋友可以帮我测试一下．　谢谢