免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: gsging
打印 上一主题 下一主题

[分享]对各字符集编码范围的总结[更新日期2007-03-12] [复制链接]

论坛徽章:
0
11 [报告]
发表于 2007-03-11 00:02 |只看该作者
原帖由 perlpg 于 2007-3-9 21:10 发表
GB18030的有吗?现在操作系统都必需支持这个。


感謝提醒,參考了GB18030的編碼標準,將結果補充至原帖結尾.

论坛徽章:
0
12 [报告]
发表于 2007-03-11 00:32 |只看该作者
谢谢分享。

"测试123\nxxxxxx"
中怎么能象(\w+)一样把
"测试123"
分出来?
就是
"test123\nxxxxxx" /\w+/
得到 "test123" 一样。

论坛徽章:
0
13 [报告]
发表于 2007-03-11 00:39 |只看该作者
原帖由 perlpg 于 2007-3-11 00:32 发表
谢谢分享。

"测试123\nxxxxxx"
中怎么能象(\w+)一样把
"测试123"
分出来?
就是
"test123\nxxxxxx" /\w+/
得到 "test123" 一样。


这个我觉得单个正则的关键字够呛能实现。
应该会用到中文匹配以及[a-zA-Z0-9]这类组合,而且还得根据实际的情况来匹配。
上面是我能想到的。

论坛徽章:
0
14 [报告]
发表于 2007-03-12 10:36 |只看该作者
比麻辣的那个更多些了

论坛徽章:
0
15 [报告]
发表于 2007-03-12 15:01 |只看该作者
感谢大家的关注,

EUC_JP全角片假名 编码范围有更新.

论坛徽章:
0
16 [报告]
发表于 2007-03-12 15:11 |只看该作者
EUC_JP全角汉字有更新

说明:由于单纯从EUC的编码表中无法显示全部的日文汉字,因此EUC编码使用多个字节的编码组合来代表其他无法显示的汉字.
本次更新的编码部分是从我们的日本本社的代码中找到的产品代码.
相信日本人自己不会把自己语言的编码范围搞错的,呵呵.

[ 本帖最后由 gsging 于 2007-3-12 15:13 编辑 ]

论坛徽章:
0
17 [报告]
发表于 2007-03-12 21:38 |只看该作者
2007-03-12 21:35 补充以下内容

日文半角空格
SJIS全角空格
SJIS全角数字
SJIS全角大写英文
SJIS全角小写英文
SJIS全角平假名
SJIS全角平假名扩展
SJIS全角片假名
SJIS全角片假名扩展
EUC_JP全角空格
EUC半角片假名

论坛徽章:
0
18 [报告]
发表于 2007-03-15 20:50 |只看该作者
不知道楼主的东东怎么使用?

论坛徽章:
0
19 [报告]
发表于 2007-03-15 20:58 |只看该作者
不错的整理,收下备查

论坛徽章:
0
20 [报告]
发表于 2007-03-16 08:17 |只看该作者
原帖由 damofeixue 于 2007-3-15 20:50 发表
不知道楼主的东东怎么使用?


这个我主要应该用在正则匹配/替换中.
比如判断一个字符串里面是否包含中文/日文或者特殊符号.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP