免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 3762 | 回复: 20
打印 上一主题 下一主题

[文本处理] 这样的文本如何提取?? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-07-27 14:05 |只看该作者 |倒序浏览
本帖最后由 oneouts 于 2012-07-27 14:19 编辑

   <td align="left"><span class="row_proxy_ip">110.139.99.207</span
   </td>
         
         
          <td align="left"><span class="row_proxy_port">proxy list - port 8080">8080</a>       </span>   </td>
         
         
         
         <td align="left"><div class="last_check" data-time="114"></div></td>     
         

          <td align="left">
         
                    
            <a title="Indonesian proxy list elite">china<span style="color:#666666; font-size:10px;"> - Pontianak</span></a>          </td>

。。。。。。。。

在这个文本中提取ip ,port,国家
就像
110.139.99.207   8080    china
.......


请问awk 的脚本如何实现啊
谢谢

论坛徽章:
0
2 [报告]
发表于 2012-07-27 14:09 |只看该作者
awk 的甲苯。。这是什么。。。

论坛徽章:
0
3 [报告]
发表于 2012-07-27 14:12 |只看该作者
提取ip
  1. grep -oP '\d+.\d+.\d+.\d+'
复制代码

论坛徽章:
0
4 [报告]
发表于 2012-07-27 14:20 |只看该作者
这个ip 是取出来了但是端口和国家呢》?
如何把这3个选项放在一行

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
5 [报告]
发表于 2012-07-27 14:25 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
6 [报告]
发表于 2012-07-27 14:26 |只看该作者
端口
  1. grep -oP "(?<=port )\d+"
复制代码
国家感觉没啥特殊标记


论坛徽章:
0
7 [报告]
发表于 2012-07-27 14:27 |只看该作者
title="Indonesian proxy list elite"
这个title会变化么?如果后面的china变了的话。。

论坛徽章:
0
8 [报告]
发表于 2012-07-27 14:28 |只看该作者
这只是一部分而已啊。
还有好多个与上面一样的文本,手动会死人 的啊
求指教。。
把这些文本能成这样
110.139.99.207   8080    china
110.139.99.207   8080    usa
。。。。
。。

谢谢了

论坛徽章:
0
9 [报告]
发表于 2012-07-27 14:33 |只看该作者
不会的
你想用RS 这选项吗

论坛徽章:
0
10 [报告]
发表于 2012-07-27 14:34 |只看该作者
回复 8# oneouts


    先回答7L问题
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP