12 3 4 / 4 页下一页

论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2010-04-02 09:35 |只看该作者 |倒序浏览

本帖最后由 yihucha 于 2010-04-02 09:37 编辑

& #x6770;& #x514b;

复制代码

网页上面类似这种的转义 python有函数可以支持吗？

文库|博客

luffy.deng

腰缠万贯

论坛徽章:: 0

2楼 [报告]

发表于 2010-04-02 12:19 |只看该作者

什么意思?

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

pywugw

家境小康

论坛徽章:: 0

3楼 [报告]

发表于 2010-04-02 12:58 |只看该作者

http://blog.chinaunix.net/u3/109054/showart_2180389.html

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

luffy.deng

腰缠万贯

论坛徽章:: 0

4楼 [报告]

发表于 2010-04-02 17:55 |只看该作者

print unichr(0x6709)
s=u'有'
print ord(s)
print hex(ord(s))

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

wqjwftcaqr

小富即安

论坛徽章:: 0

5楼 [报告]

发表于 2010-04-03 09:14 |只看该作者

print unichr(0x6709)
s=u'有'
print ord(s)
print hex(ord(s))
luffy.deng 发表于 2010-04-02 17:55

好啊，请问用什么语问把他这字符串变成中文的字符串？& #x6770;& #x514b;

>>> s=u'有'
>>> print ord(s)
Traceback (most recent call last):
File "<pyshell#10>", line 1, in <module>
print ord(s)
TypeError: ord() expected a character, but string of length 2 found
>>> print hex(ord(s))
Traceback (most recent call last):
File "<pyshell#11>", line 1, in <module>
print hex(ord(s))
TypeError: ord() expected a character, but string of length 2 found
>>>

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

luffy.deng

腰缠万贯

论坛徽章:: 0

6楼 [报告]

发表于 2010-04-03 10:35 |只看该作者

>>> s=u'他'
>>> print hex(ord(s))
0x4ed6
>>>

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

wqjwftcaqr

小富即安

论坛徽章:: 0

7楼 [报告]

发表于 2010-04-03 11:21 |只看该作者

本帖最后由 wqjwftcaqr 于 2010-04-03 11:22 编辑

luffy.deng 发表于 2010-04-03 10:35

>>> s=u'爱'
>>> print hex(ord(s))
Traceback (most recent call last):
File "<pyshell#15>", line 1, in <module>
print hex(ord(s))
TypeError: ord() expected a character, but string of length 2 found

复制代码

我是不是缺少什么模块什么的

还有就是能不能将他的 & #x6770;& #x514b;（二个字）一口气转换成可以直接写入文本的字符串？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

3227049

家境小康

论坛徽章:: 0

8楼 [报告]

发表于 2010-04-03 11:39 |只看该作者

本帖最后由 3227049 于 2010-04-03 11:59 编辑

ipython或者code.interact打开的pyshell直接用u'汉字'都会出错,产生的都是多字节编码，你要试这个直接用python的原生shell

楼主要转换html实体的话

s="&# 24038;&# 36793;".replace(" ",'') #这边直写会被cu自动替换掉................................
import re
_=re.compile('&#(x)?([0-9a-fA-F]+);')
to_str=lambda s,charset='utf-8':_.sub(lambda result:unichr(int(result.group(2),result.group(1)=='x' and 16 or 10)).encode(charset) ,s)
print to_str(s)

复制代码