免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1830 | 回复: 0
打印 上一主题 下一主题

[FreeBSD] [demo]自己写的文本翻译软件,还不成熟,库也小目前只能翻译man(1) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-06-21 12:47 |只看该作者 |倒序浏览
程序demo在附件里
用法:

#!/bin/csh
man man | col -b >> orig.text#先把 man 的手册页保存成文本
./cb orig.text >> trans.text#让程序读取文本(不会通道本人超菜)
#请使用支持utf-8编码的文本浏览器查看译文


       小软采用分段式翻译,与传统分词式翻译不同。例如:英语"Welcome to FreeBSD. "这样的句子进行整段翻译,而不是将"Welcome"与"to"及"FreeBSD"分别翻译.句子(段落)将只译为库中某个语言的对应

格式问题
       例如原文句子"Добро пожаловать в FreeBSD"被译为"欢迎使用 FreeBSD",但两个句子的长度明显不同.怎样才能让译文与原文的格式统一且漂亮就是个严重问题.让用户阅读一堆无格式或格式混乱的译文不能体现软件价值,而且事后手动排版又令人厌烦(至少我不喜欢).目前程序机械的套用原文格式,算法简陋挺难看的.

嵌套的配对符号问题
       你会发现有个"(See the -o option above.)"没翻译就是这个原因.其实库中已经有"See the -o option above=看上面的 -o 选项"的条目了.
       例如"aaa aaa (ccc ccc.) bbb bbbb"这样含有嵌套配对符号的情况没作处理,例子比较简单麻烦的是多重嵌套的情况,例如"aaa "eee" aaa (ccc "ddd ddd" ccc.) bbb bbbb"这样的一段文字中有多个嵌套与多重嵌套并且深度不同的情况我还没处理.

命令行处理问题
       没想到可能要用的参数如此之多,不好处理啊,我很菜的啊~还没想好以后是不是靠这卖钱过活,所以仅使用了 boost 没有用其他有版权问题可能的代码或库.本人庄重承诺写好后永远对开源社区免费提供,若条件成熟我就开源.

[ 本帖最后由 乌克兰白鼠 于 2009-6-21 12:48 编辑 ]

cb.zip

135.53 KB, 下载次数: 29

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP