免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 5371 | 回复: 11
打印 上一主题 下一主题

如何替换html文件中的大写标签为小写? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-01-22 09:43 |只看该作者 |倒序浏览
如:
<HTML>
<TABLE border="0">

</TABLE>
</HTML>

<html>
<table border="0">
</table>
</html>

我在网上搜了半天也没有什么有用的信息

论坛徽章:
0
2 [报告]
发表于 2010-01-22 09:53 |只看该作者
sed 's/<[^>]*>/\L&/g' file

论坛徽章:
0
3 [报告]
发表于 2010-01-22 10:03 |只看该作者

回复 #2 ywlscpl 的帖子

sed 中的 \L 是转换小写, \U 是大写,还有其他的类似的 \X 吗?在哪里能查到呢?

[ 本帖最后由 LonnyHe 于 2010-1-22 10:06 编辑 ]

论坛徽章:
0
4 [报告]
发表于 2010-01-22 10:08 |只看该作者

回复 #3 LonnyHe 的帖子

info sed

   The `s' command is probably the most important in `sed' and has a
lot of different options.  Its basic concept is simple: the `s' command
attempts to match the pattern space against the supplied REGEXP; if the
match is successful, then that portion of the pattern space which was
matched is replaced with REPLACEMENT.

   The REPLACEMENT can contain `\N' (N being a number from 1 to 9,
inclusive) references, which refer to the portion of the match which is
contained between the Nth `\(' and its matching `\)'.  Also, the
REPLACEMENT can contain unescaped `&' characters which reference the
whole matched portion of the pattern space.  Finally, as a GNU `sed'
extension, you can include a special sequence made of a backslash and
one of the letters `L', `l', `U', `u', or `E'.  The meaning is as
follows:

`\L'
     Turn the replacement to lowercase until a `\U' or `\E' is found,

`\l'
     Turn the next character to lowercase,

`\U'
     Turn the replacement to uppercase until a `\L' or `\E' is found,

`\u'
     Turn the next character to uppercase,

`\E'
     Stop case conversion started by `\L' or `\U'.

[ 本帖最后由 ywlscpl 于 2010-1-22 10:10 编辑 ]

论坛徽章:
0
5 [报告]
发表于 2010-01-22 10:18 |只看该作者
原帖由 ywlscpl 于 2010-1-22 09:53 发表
sed 's/]*>/\L&/g' file



这个表达式有问题,它把不是标签的也给替换了

论坛徽章:
0
6 [报告]
发表于 2010-01-22 10:28 |只看该作者
sed 'y/ABCDEFGHIJKLMNOPQRSTUVWXYZ/abcdefghijklmnopqrstuvwxyz/g' URFILE

论坛徽章:
0
7 [报告]
发表于 2010-01-22 10:28 |只看该作者
多谢了

论坛徽章:
0
8 [报告]
发表于 2010-01-22 10:32 |只看该作者

回复 #5 peixubin 的帖子

是没考虑周全
  1. sed 's/<[^> ]*[ >]/\L&/g' file
复制代码

论坛徽章:
0
9 [报告]
发表于 2010-01-22 10:38 |只看该作者
sed -n '/<[^> ]*[ \>]/p' a | tr "[A-Z]" "[a-z]"

论坛徽章:
0
10 [报告]
发表于 2010-01-22 10:42 |只看该作者

回复 #1 peixubin 的帖子

[root@CMCC-BOSS root]# echo "assdca">1.txt
[root@CMCC-BOSS root]# tr "[a-z]" "[A-Z]" <1.txt> 2.txt
[root@CMCC-BOSS root]# more 2.txt
ASSDCA
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP