12 3 4 5 / 5 页下一页

论坛徽章:: 1

发表于 2003-10-28 21:36 |显示全部楼层

匹配html的嵌入代码

<[^>]*>

复制代码

匹配[....]的嵌入码

\[[^]]\{1,\}\]

复制代码

删除仅由空字符组成的行

sed '/^[[:space:]]*$/d' filename

复制代码

匹配html标签

/$<[^>]*>$/

复制代码

例如：从html文件中剔除html标签

sed 's/$<[^>]*>$//g;/^[[:space:]]*$/d' file.html

复制代码

例如：要从下列代码中去除"[]"及其中包括的代码

[b:4c6c2a6554][color=red:4c6c2a6554]一. 替换[/color:4c6c2a6554][/b:4c6c2a6554]
sed 's/\[[^]]\{1,\}\]//g' filename

复制代码

匹配日期：

Month, Day, Year [A-Z][a-z]\{3,9\}, [0-9]\{1,2\}, [0-9]\{4\}
2003-01-28 或 2003.10.18 或 2003/10/10 或 2003 10 10
$[0-9]\{4\}[ /-.][0-2][0-9][ /-.][0-3][0-9]$

复制代码

匹配IP地址

$[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}$
$\([0-9]\{1,3\}\.$\{3\}[0-9]\{1,3\}\)

复制代码

匹配数字串

[-+]*[0-9]\{1,\} 整数
[-+]*[0-9]\{1,\}\.[0-9]\{1,\} 浮点数

复制代码

从字串中解析出两个子串(前2各字符和后9个字符)

echo "WeLoveChinaUnix"|sed -e 'H;s/$..$.*/\1/;x;s/.*$.\{9\}$$/\1/;x;G;s/\n/ /'
We ChinaUnix

复制代码

分解日期串

echo 20030922|sed 's/$....$$..$$..$/\1 \2 \3/'|read year month day
echo $year $month $day

复制代码

文件内容倒序输出

sed '1!G;h;$!d' oldfile >newfile

复制代码

文库|博客

光明晓仙

丰衣足食

论坛徽章:: 0

发表于 2003-10-28 21:57 |显示全部楼层

我常用的正则表达式

收藏..............

俺就是对表达式有点晕,总是搞不清楚.........

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

bjgirl

家境小康

论坛徽章:: 0

发表于 2003-10-28 22:08 |显示全部楼层

我常用的正则表达式

学习~~~

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

飞灰橙

小富即安

论坛徽章:: 0

发表于 2003-10-29 07:45 |显示全部楼层

我常用的正则表达式

有用，斑竹不介意的话俺抄走了

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

BabyBlue

稍有积蓄

论坛徽章:: 0

发表于 2003-10-29 08:10 |显示全部楼层

我常用的正则表达式

ha !一大早就被这么好的东东撞了个大跟头，高兴呀。
正则表达式，有时说不清楚，但确实挺有意思的。谢谢斑竹了。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

binary

丰衣足食

论坛徽章:: 0

发表于 2003-10-29 08:45 |显示全部楼层

我常用的正则表达式

最喜欢有人做总结归纳了

谢谢！

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

sunkey

稍有积蓄

论坛徽章:: 0

发表于 2003-10-29 09:53 |显示全部楼层

我常用的正则表达式

太好了～～ admirer就是活雷锋～～哈～：）

   既然提出来了，大家都把自己经常用的或者需要用的正则表达式
   列出来啊～！！

   偶狗尾续貂来一个：

   科学表达式：  [+-]?([0-9]+[.]?[0-9]*|[.][0-9]+)([eE][+-]?[0-9]+)? $

   2.9e-15
   100e+3
   0.23E19

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

sunkey

稍有积蓄

论坛徽章:: 0

发表于 2003-10-29 10:06 |显示全部楼层

我常用的正则表达式

还有啊，怎么匹配字节数？
  比如  234,000
      12,323K
         200M
         ..........

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

sunkey

稍有积蓄

论坛徽章:: 0

发表于 2003-10-29 10:56 |显示全部楼层

我常用的正则表达式

例如：要从下列代码中去除"[]"及其中包括的代码
代码:
一. 替换
sed 's/\[[^]]\{1,\}\]//g' filename

  如果出现[] 的匹配，将[]换成{}，如果不是[]的匹配，不改变[符号，但保留其中的内容怎么做？

  例如 :

         hello world ]
   变成：
         {b:4c6c2a6554}{color=red:4c6c2a6554}
         hello world ]