免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2119 | 回复: 4
打印 上一主题 下一主题

汉字编码匹配 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2004-11-22 22:34 |只看该作者 |倒序浏览
你们写汉字编码匹配时一般用哪个范围?
[\x8140-\xFEFE]
[\x80-\xff]
[\xA1A1-\xFEFE]
或者其他的?

还有过滤空格除了过滤
s/[\xA1\xAB]//g;
还过滤那个字符?

我记得有个范围是属于自定义的,那个范围的字在网页上显示都是空白的。

谢谢帮忙。

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
2 [报告]
发表于 2004-11-23 11:35 |只看该作者

汉字编码匹配

http://www.douzi.org/weblog/archives/2004_03.html
可能有幫助..看看吧...

论坛徽章:
0
3 [报告]
发表于 2004-11-23 11:54 |只看该作者

汉字编码匹配

我看过那了呢,看过了才写
[\x8140-\xFEFE]
这个好像不能匹配所有中文
[\xA1A1-\xFEFE]
这个不知道是不是

想问问用过这东西的都怎么写的?

那里空白的也没指出范围。

论坛徽章:
0
4 [报告]
发表于 2004-11-23 15:23 |只看该作者

汉字编码匹配

BIG5  
/([\xa4-\xfe][\x40-\x7e\xa1-\xfe])/

GB
/[\xa1-\xfe]{2,2}/

论坛徽章:
0
5 [报告]
发表于 2004-11-23 16:38 |只看该作者

汉字编码匹配

多谢,那空白的范围呢。
比如说
\xa1a1就是空白的字。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP