123 4 / 4 页下一页

[分享]对各字符集编码范围的总结[更新日期2007-03-12] [复制链接]

gsging

家境小康

论坛徽章:: 0

11楼 [报告]

发表于 2007-03-11 00:02 |只看该作者

原帖由 perlpg 于 2007-3-9 21:10 发表
GB18030的有吗？现在操作系统都必需支持这个。

感謝提醒,參考了GB18030的編碼標準,將結果補充至原帖結尾.

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

perlpg

白手起家

论坛徽章:: 0

12楼 [报告]

发表于 2007-03-11 00:32 |只看该作者

谢谢分享。

"测试123\nxxxxxx"
中怎么能象（\w+）一样把
"测试123"
分出来？
就是
"test123\nxxxxxx" /\w+/
得到 "test123" 一样。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

gsging

家境小康

论坛徽章:: 0

13楼 [报告]

发表于 2007-03-11 00:39 |只看该作者

原帖由 perlpg 于 2007-3-11 00:32 发表
谢谢分享。

"测试123\nxxxxxx"
中怎么能象（\w+）一样把
"测试123"
分出来？
就是
"test123\nxxxxxx" /\w+/
得到 "test123" 一样。

这个我觉得单个正则的关键字够呛能实现。
应该会用到中文匹配以及[a-zA-Z0-9]这类组合，而且还得根据实际的情况来匹配。
上面是我能想到的。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

nsnake

稍有积蓄

论坛徽章:: 0

14楼 [报告]

发表于 2007-03-12 10:36 |只看该作者

gsging

家境小康

论坛徽章:: 0

15楼 [报告]

发表于 2007-03-12 15:01 |只看该作者

感谢大家的关注,

EUC_JP全角片假名编码范围有更新.

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

gsging

家境小康

论坛徽章:: 0

16楼 [报告]

发表于 2007-03-12 15:11 |只看该作者

EUC_JP全角汉字有更新

说明：由于单纯从EUC的编码表中无法显示全部的日文汉字,因此EUC编码使用多个字节的编码组合来代表其他无法显示的汉字.
本次更新的编码部分是从我们的日本本社的代码中找到的产品代码.
相信日本人自己不会把自己语言的编码范围搞错的,呵呵.

[ 本帖最后由 gsging 于 2007-3-12 15:13 编辑 ]