免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3205 | 回复: 7
打印 上一主题 下一主题

【求助】Perl能直接提取word里的文字吗? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-04-27 15:44 |只看该作者 |倒序浏览
本帖最后由 tonyliuy 于 2016-04-27 15:44 编辑

工作中遇到了一堆word的情况,想写个脚本批量把我需要的信息提取出来,Perl能做到吗?或者什么语言可以搞定?VBA?
注明:Windows操作环境

论坛徽章:
0
2 [报告]
发表于 2016-04-27 16:59 |只看该作者
本帖最后由 david_95 于 2016-04-27 17:08 编辑

vba 宏肯定能搞这个。之前搞过一个vba 宏, 把目录下的excel 文件,汇总,excel 各列内容更新到 word 里。 perl 估计也行,但是vba 的好处就是不用到处找perl module。
当年客户要看word 的测试用例,且要按照一定表格样式展现, 而我们只有excel 的。
我们的测试经理头大的不行,让team 一个一个粘贴拷贝。我刚到那个公司,看他们苦哈哈的,就一遍看文档,一边摸索,写了一个宏。之前没学过宏。 本来一个月的工作,半天搞定,想想也是有些成就感。

论坛徽章:
0
3 [报告]
发表于 2016-04-28 02:58 |只看该作者
回复 1# tonyliuy


  OLE接口可以

论坛徽章:
6
15-16赛季CBA联赛之新疆
日期:2016-03-22 22:34:5915-16赛季CBA联赛之山东
日期:2016-04-11 09:08:41程序设计版块每日发帖之星
日期:2016-06-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-19 06:20:00每日论坛发贴之星
日期:2016-07-19 06:20:0015-16赛季CBA联赛之青岛
日期:2016-07-20 22:44:17
4 [报告]
发表于 2016-04-28 04:52 |只看该作者
Word有不同版本。2003 以前的doc是2进制的。之后的docx是压缩的xml,读法不同。CPAN找找。

论坛徽章:
0
5 [报告]
发表于 2016-04-28 07:50 |只看该作者
OLE接口是什么?一个模块吗?回复 3# L_WC


   

论坛徽章:
0
6 [报告]
发表于 2016-04-28 10:47 |只看该作者
楼主可以试试这个模块Win32::Word:eclarative,但如果能VBA搞定,还是建议VBA。Excel倒是比较容易,有好几个模块可用。

论坛徽章:
42
19周年集字徽章-周
日期:2019-10-14 14:35:31平安夜徽章
日期:2015-12-26 00:06:30数据库技术版块每日发帖之星
日期:2015-12-01 06:20:002015亚冠之首尔
日期:2015-11-04 22:25:43IT运维版块每日发帖之星
日期:2015-08-17 06:20:00寅虎
日期:2014-06-04 16:25:27狮子座
日期:2014-05-12 11:00:00辰龙
日期:2013-12-20 17:07:19射手座
日期:2013-10-24 21:01:23CU十二周年纪念徽章
日期:2013-10-24 15:41:34IT运维版块每日发帖之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之新疆
日期:2016-06-07 14:10:01
7 [报告]
发表于 2016-05-02 11:31 |只看该作者
用vbs轻松搞定

求职 : 软件工程师
论坛徽章:
3
程序设计版块每日发帖之星
日期:2015-10-07 06:20:00程序设计版块每日发帖之星
日期:2015-12-13 06:20:00程序设计版块每日发帖之星
日期:2016-05-05 06:20:00
8 [报告]
发表于 2016-05-02 21:25 |只看该作者
先到 CPAN 找找,看能不能找到直接将 Word 文档当成文本读写的模块,如果没有,可以找一个批量处理转换 Word 到 txt 文档的第三方工具,然后用 Perl 解决,就方便了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP