免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2790 | 回复: 9
打印 上一主题 下一主题

已解决:关于如何提取man的内容为纯文本? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-01-24 22:10 |只看该作者 |倒序浏览
man bash > bash.man
vi bash.man的时候会出现很多像_^H这样的乱码,不知道有没有好的办法可以解决,谢谢!
在HP和Solaris下面都试过。

问题原因解释在4楼,大家自己看。

[ 本帖最后由 cliffordbear 于 2008-1-26 22:47 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2008-01-24 22:23 |只看该作者
man ls|col -b > ls.txt

论坛徽章:
0
3 [报告]
发表于 2008-01-25 20:59 |只看该作者
原帖由 davistar 于 2008-1-24 22:23 发表
man ls|col -b > ls.txt

谢谢了,这个方法可以解决。可以生成一个文件类型为English TEXT的ls.txt
但是看man col的时候不是太明白,能不能讲一下
col -b 是起的什么作用,谢谢!

论坛徽章:
0
4 [报告]
发表于 2008-01-25 21:48 |只看该作者
^H其实就是退格。
在一般的打印格式里面,比如行式打印。
打印到 A^HA,会做什么动作呢? 先打印A,打印头挪到下一个位置。遇到了^H(退格),又回到了A的位置,再打印一遍A,在打印纸上就能看到这个A明显得比其他字符黑粗。实现了黑体打印的效果。
实际上你仔细观察一下文件,很有规律的,每个出现^H的地方,对应的就是直接man的高亮部分。
而且,^H两边的字符肯定是一样的。
根据这个,你可以制作自己的高亮效果。
选择要高亮的文本部分。然后vi/sed   s/./&^H&/g 保存后,再more这个文件,看看什么效果?
col -b就是用来把X^HX部分,合并成X的过程。如果用C来写,将是非常简单的事情。

论坛徽章:
0
5 [报告]
发表于 2008-01-26 16:57 |只看该作者
又学到了
谢谢

论坛徽章:
0
6 [报告]
发表于 2008-01-26 22:46 |只看该作者
原帖由 ivhb 于 2008-1-25 21:48 发表
^H其实就是退格。
在一般的打印格式里面,比如行式打印。
打印到 A^HA,会做什么动作呢? 先打印A,打印头挪到下一个位置。遇到了^H(退格),又回到了A的位置,再打印一遍A,在打印纸上就能看到这个A明显得比 ...

哦,懂了。非常感谢你的热心帮助!

论坛徽章:
0
7 [报告]
发表于 2008-01-27 12:18 |只看该作者
为什么用vi新建一个文件输入A^HA为什么就没有高亮的效果呢?
在man导出的文件里的某个字符后^H就可以

论坛徽章:
0
8 [报告]
发表于 2008-01-27 12:31 |只看该作者
vi本身没有格式化的效果。
需要用more来看。对于more来说,他会解释^H

论坛徽章:
0
9 [报告]
发表于 2008-01-27 15:34 |只看该作者
具体是这样的:
我man col>col.man   vi col.man  显示很多^H,比如^HN,^H前面的字符不可见,后面的N是高亮的,删除这个高亮N,前面的"隐形"N出现
在这个文件中我在任意一个字符后面输入ctrl+V+H然后再输入相同字符,可以使这个字符高亮.我用less col.man也可以正确显示高亮字符
但我vi test  手动输入A^HA则没有这种效果,less test也确实没有高亮
不解

论坛徽章:
0
10 [报告]
发表于 2008-02-01 15:12 |只看该作者
原帖由 ivhb 于 2008-1-27 12:31 发表
vi本身没有格式化的效果。
需要用more来看。对于more来说,他会解释^H



说出了本质阿。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP