- 论坛徽章:
- 0
|
原帖由 wolfg 于 2006-3-6 14:00 发表
你自己的是如何尝试解决这个问题的?讨论问题,不能只要求别人想办法啊,也说说你的思路。
我的思路是:
1.利用正则表达式:写一个匹配所有汉语拼音的re,我找出其对应的字符如下:
252 A3E0 ` a b c d e f g h i j k l m n o
268 A3F0 p q r s t u v w x y z { | }
658 A8A0 ā á ǎ à ē é ě è ī í ǐ ì ō ó ǒ
674 A8B0 ò ū ú ǔ ù ǖ ǘ ǚ ǜ ü ê ɑ ń ň
将匹配的字符re.match(...).group()修改成<p>re.match(...).group()</p>
目前的困难在于 :a.这个re怎么写;b.字符串的修改,没有类似list的insert()函数,也没有replace()
2.利用字符操作:根据limodou兄的建议,将所有汉语拼音存成一个list,然后遍历查找文件,得出每行出现汉语拼音的首位置和尾位置,在首位置处插入‘<p>’,在尾位置插入'</p>'。位置查找如例:
-
- >>>s='【牴牾】 dǐwǔ 抵牾 contradiction;; conflict'
- >>>m='d'
- >>>s.find(m,0,len(s))
- 9
复制代码
关键难点在如何在9这个位置插入<p>这个标签?如何判断首位位置?然后就是速度可能有点问题。
还请大家指教! |
|