为什么有了utf8还要unicode?
今天搞个unicode转utf8搞了好久,烦死了,结果linux下库不一样。这个编码问题真是烦人啊,什么iso系列,cpa* 系,latin系。要说每个国家有一套自己的编码还说得过去,这unicode跟utf8,干吗要两个,直接一个utf8不就完了吗?
有哪位计算机专家给解惑一下? 好像unicode还有个大头小头之分,oh my god.
是不是一帮子人,各做各的,谁也不服谁? unicode好像是utf8的前身!你用mb_convert_encoding试试 我试过,\u00fc根本就不能转。 这个不是很懂,帮顶了 Unicode 定义了大多数语言中字符的编码是多少,但 Unicode 用两个字节或更多表示一个字符,为了与广为使用的ASCII兼容,同时也节省存储空间,就发明了 UTF-8 把 Unicode 转换一下。
也就是 UTF-8 并不定义一个字符的 code point 是多少,那是Unicode的事,UTF-8只是为了兼容ASCII,对Unicode再做的一次编码转换而已。
那为啥不直接用UTF-8代替Unicode呢?因为还有UTF-7,UTF-9,UTF-16等等其它UTF格式。
参考这篇FAQ:
http://www.cl.cam.ac.uk/~mgk25/unicode.html 回复 6# sorrento
谢了,虽然还是不懂。
页:
[1]