免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
1234下一页
最近访问板块 发新帖
查看: 21483 | 回复: 33
打印 上一主题 下一主题

将全部GBK编码汉字转换为拼音. (原创) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-04-03 19:44 |只看该作者 |倒序浏览
如题所说, 有时会需要用到这个功能, 网上也已经出现过类似程序, 不过支持的范围比较小

我作了一个基本上支持全部GBK编码的汉字转拼音程序, 欢迎使用.  目前不支持多音字

源码打包下载见附件   测试地址 (一次一字)

[ 本帖最后由 hightman 于 2008-12-16 16:34 编辑 ]

getpy.tar.gz

41.74 KB, 下载次数: 1104

论坛徽章:
0
2 [报告]
发表于 2006-04-03 19:57 |只看该作者

贴个图吧

如题, 现场贴图

xx.JPG (17.94 KB, 下载次数: 164)

xx.JPG

论坛徽章:
0
3 [报告]
发表于 2006-04-04 00:06 |只看该作者
不错。 帮顶

论坛徽章:
0
4 [报告]
发表于 2006-04-04 09:32 |只看该作者
neoeime.sf.net
一个java输入法。
里面附带GBK拼音表,基本词汇表,日语词汇读法表。 (都是网上收集的)。

论坛徽章:
0
5 [报告]
发表于 2006-04-04 11:02 |只看该作者
研究研究

论坛徽章:
0
6 [报告]
发表于 2006-04-04 11:12 |只看该作者
老兄,把怎么分析的py.dat说说吧

论坛徽章:
0
7 [报告]
发表于 2006-04-04 11:26 |只看该作者
代码风格不错,但是只有gb2312编码,gbk编码范围更广,而且有几个区域是不连续的,你需要一张更大的表

论坛徽章:
0
8 [报告]
发表于 2006-04-04 13:01 |只看该作者

回复 1楼 hightman 的帖子

不错,连“妺”这种冷僻字都有。

论坛徽章:
0
9 [报告]
发表于 2006-04-04 13:05 |只看该作者
原帖由 dulao5 于 2006-4-4 11:26 发表
代码风格不错,但是只有gb2312编码,gbk编码范围更广,而且有几个区域是不连续的,你需要一张更大的表


我发的这个就是 GBK 编码的, 基本上很齐全了. 大概2.5万字不到一点

论坛徽章:
0
10 [报告]
发表于 2006-04-04 13:07 |只看该作者
原帖由 艾斯尼勒 于 2006-4-4 11:12 发表
老兄,把怎么分析的py.dat说说吧


py.dat 很简单啦, 看下程序就知道了

基本上是 char( ......... 连续下去
将汉字的编码进行计算得出一个序号, 序号就是在 py.dat 中对应的拼音位置, 所以速度很快

因为汉字编码基本上是连续的, 但也有部分不连续, 已被我优化忽略了, 所以py.dat 大概膨胀了几KB
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP