免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1868 | 回复: 4
打印 上一主题 下一主题

[系统管理] linux字符集相关疑问 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-12-04 14:23 |只看该作者 |倒序浏览
本帖最后由 ivorning 于 2014-12-04 14:26 编辑

最近看了点字符集方面的东西,有了些自己的理解,请各位大虾看下我的理解有无偏差,顺便解决一个困扰我的问题,感谢
个人理解:
1、字符集与字符编码是两个概念,字符集是一群字符的集合,字符编码是对照某个字符集进行一定的编码,让字符集中的字符可以和其他东西的集合形成一个映射,比如数字、脉冲。一个字符集会有多种字符编码方式。
2、在linux中设置字符集比如设置为gbk仅仅是支持你可以输入中文,你的显示与你设置的字符集无关,即使你设置的不是gbk的字符集你一样可以显示中文,显示文本的过程类似于操作系统在查询一个密码本,你的本地拥有各种密码本,只要你要显示的内容指明了他的编码方式,操作系统都可以正确的显示出来,与你设置的当前字符集无关
疑问:
在linux操作系统上做了个小实验,vi了一个文本文件,里面输入了几个中文,目前的系统中环境设置如下:
LANG=POSIX
LC_CTYPE=zh_CN.gbk
LC_NUMERIC="POSIX"
LC_TIME="POSIX"
LC_COLLATE="POSIX"
LC_MONETARY="POSIX"
LC_MESSAGES="POSIX"
LC_PAPER="POSIX"
LC_NAME="POSIX"
LC_ADDRESS="POSIX"
LC_TELEPHONE="POSIX"
LC_MEASUREMENT="POSIX"
LC_IDENTIFICATION="POSIX"
LC_ALL=
编辑完成后,执行命令file -i 1.txt,结果显示如下:
localhost:/home/test/cn # file -i t.txt
t.txt: text/plain charset=iso-8859-1
各位大侠,请问这是为啥,问啥我的环境设置的是zh_CN.gbk,编辑出来的文件却是charset=iso-8859-1,求各位不吝赐教,感谢~~:hug:

论坛徽章:
0
2 [报告]
发表于 2014-12-04 14:56 |只看该作者
没人回答吗

论坛徽章:
0
3 [报告]
发表于 2014-12-04 15:22 |只看该作者
呼叫各路大侠啊~~~
不知道答案的童鞋也可以留言啊 互相交流呗~~

论坛徽章:
6
羊年新春福章
日期:2015-03-03 17:16:28双子座
日期:2015-03-03 17:16:56巳蛇
日期:2015-03-03 17:17:2415-16赛季CBA联赛之福建
日期:2016-03-11 09:05:00黑曼巴
日期:2016-07-07 16:58:1215-16赛季CBA联赛之吉林
日期:2016-11-14 09:23:07
4 [报告]
发表于 2014-12-04 16:30 |只看该作者
echo $LANG 你的是什么

论坛徽章:
0
5 [报告]
发表于 2014-12-04 16:45 |只看该作者
回复 4# jcdiy0601


    就是POSIX,上面locale显示的就是当前的配置,我就把LC_TYPE改成了zh_CN.gbk
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP