免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2429 | 回复: 3
打印 上一主题 下一主题

汉字“太阳”,“天空”的问题,pg(Unicode)里居然相等? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-05-27 17:46 |只看该作者 |倒序浏览
我在数据库插入数据的过程中偶然发现,汉字“太阳”和“天队”在pg里居然作为关键字是相同的...
我的客户端是GBK,服务端是Unicode.

$ pg_config --version
PostgreSQL 7.4.8
$ echo "太阳" >; /tmp/tmp1
$ echo "天队" >; /tmp/tmp2
$ iconv -f GBK -t UTF-8 /tmp/tmp1 | hexdump
0000000 a4e5 e9aa b398 000a                    
0000007
$ iconv -f GBK -t UTF-8 /tmp/tmp2 | hexdump
0000000 a4e5 e9a9 9f98 000a                    
0000007
$ psql html
html=>; set client_encoding='GBK';
SET
html=>; show server_encoding;
server_encoding
-----------------
  UNICODE
  (1 行)

html=>; show client_encoding;
client_encoding
-----------------
  GBK
  (1 行)

html=>; create table gbk (key varchar(64), value integer);
CREATE TABLE
html=>; insert into gbk values ('太阳', 1);
INSERT 2836917 1
html=>; insert into gbk values ('月亮', 2);
INSERT 2836918 1
html=>; insert into gbk values ('草原', 3);
INSERT 2836919 1
html=>; insert into gbk values ('天队', 4);
INSERT 2836920 1
html=>; select * from gbk;
  key  | value
------+-------
  太阳 |     1
  月亮 |     2
  草原 |     3
  天队 |     4
(4 行)

html=>; select * from gbk where key='草原';
  key  | value
------+-------
  草原 |     3
(1 行)

html=>; select * from gbk where key='太阳';
key  | value
------+-------
  太阳 |     1
  天队 |     4
(2 行)

html=>; \q

-------------------------------------------------------------
为什么会这样?

论坛徽章:
0
2 [报告]
发表于 2005-05-29 17:24 |只看该作者

汉字“太阳”,“天空”的问题,pg(Unicode)里居然相等?

还有这几个词组:只可,口可,可可,可取,口发,可变,叮叮;

html=>; create table test (name varchar(64));
CREATE TABLE
html=>; insert into test values ('只可');
INSERT 2853321 1
html=>; insert into test values ('口可');
INSERT 2853322 1
html=>; insert into test values ('口发');
INSERT 2853323 1
html=>; insert into test values ('可取');
INSERT 2853324 1
html=>; insert into test values ('可口');
INSERT 2853325 1
html=>; insert into test values ('可变');
INSERT 2853326 1
html=>; insert into test values ('叮叮');
INSERT 2853327 1
html=>; select * from test where name='可可';
name
------
只可
口可
口发
可取
可口
可变
叮叮
(7 行)

论坛徽章:
0
3 [报告]
发表于 2005-05-30 23:31 |只看该作者

汉字“太阳”,“天空”的问题,pg(Unicode)里居然相等?

刚才按你的方法验证了一下,Pg8.03根本没出错。是你的数据库损坏了,或者是操作系统里负责处理Encoding 的库文件被改写了。换Pg8.03试试?

mydb=>; select * from gbk;
key  | value
------+-------
太阳 |     1
月亮 |     2
草原 |     3
天空 |     4
天队 |     5
(5 行)

mydb=>; select * from gbk where key='太阳';
key  | value
------+-------
太阳 |     1
(1 行)

mydb=>; select * from gbk where key='天队';
key  | value
------+-------
天队 |     5
(1 行)

论坛徽章:
0
4 [报告]
发表于 2005-05-31 22:14 |只看该作者

汉字“太阳”,“天空”的问题,pg(Unicode)里居然相等?

谢谢楼上的提醒,确实是我自己的数据库出了问题,重新编译了一次数据库,上面说的问题消失。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP