- 论坛徽章:
- 0
|
本帖最后由 batty123292 于 2013-12-06 10:35 编辑
aa.word
(990 Bytes, 下载次数: 19)
bb.word
(1.08 KB, 下载次数: 19)
现在有很多个文件,暂且提供两个,aa.word,bb.word。后续还会有cc.word,dd.word等等。
我想把其中标签为data-src的属性值抽出来,并且我只希望抽每个文件其中的前3个。
期望输出为一行,一共4个字段。第一个字段为文件的名字aa/bb/cc,第二个字段为第一个data-src对应的值,
第三个字段为第二个data-src对应的值,第四个字段为第三个data-src对应的值。
输出到一个文件里面,样例为:
aa http://t1.gstatic.com/sh/sh/a http://t0.gstatic.com http://t3.gstatic.com/images?q
bb httphsh.gstatic.com/sh/sj httpnsklal://hs http://t3mss/aj
aa.word为:- aaaaaaaaaaaaaaaaaaaa
- aaaaaaaaaaaasasas
- target=_blank class=_l<img class=rg_i name=Veu1j2oKuKYzyM: data-src="http://t1.gstatic.com/sh/sh/a" data-sz=f onload="google.stb.csi.onTbn(1, this)"></a>gshjksk djlkl ksl oom=1" target=_blank class=rg_l<img class=rg_i name=4rq0eMtoD0OT6M: data-src="http://t0.gstatic.com" data-sz=f onload="google.stb.csi.onTbn(1, this)"></a>
- hskjaj dklasj dkla dkl
- target=_blank class=rg_l<img class=rg_i name=pM0PJS7WOnG-TM: data-src="http://t3.gstatic.com/images?q" data-sz=f onload="google.stb.csi.onTbn(1, this)"></a>
- sjk djlks dkls
- djkas djka
- gfwv4DoDA&zoom=1" target=_blank class=rg_l<img class=rg_i name=fk2DM_qEo4qlcM: data-src="http://t3.gstatic.com/itbn:AN" data-sz=f onload="google.stb.csi.onTbn(1, this)"></a>
- sjk djkd kld kld
- =1" target=_blank class=rg_l<img class=rg_i name=FAisdPNr43SpYM: data-src="http://t0.gstatic.com/images?q" data-sz=f onload="google.stb.csi.onTbn(1, this)"></a>
- hsj dj dkl djks djk
- sjk djk djkl
- the end
复制代码 bb.word为:- zh jsj dkl dkjld jk fkld
- target=_blank class=rg_l<img class=rg_i name=Veu1j2oKuKYzyM: data-src="httphsh.gstatic.com/sh/sj" data-sz=f onload="google.stb.csi.onTbn(1, this)"></a>
- gshjksk djlkl ksl
- oom=1" target=_blank class=rg_l<img class=rg_i name=4rq0eMtoD0OT6M: data-src="httpnsklal://hs" data-sz=f onload="google.stb.csi.onTbn(1, this)"></a>
- hskjaj dklasj dkla dkl
- target=_blank class=rg_l<img class=rg_i name=pM0PJS7WOnG-TM: data-src="http://t3mss/aj" data-sz=f onload="google.stb.csi.onTbn(1, this)"></a>
- sjk djlks dkls
- djkas djka
- gfwv4DoDA&zoom=1" target=_blank class=rg_l<img class=rg_i name=fk2DM_qEo4qlcM: data-src="http://t3jsjka:AN" data-sz=f onload="google.stb.csi.onTbn(1, this)"></a>
- sjk djkd kld kld
- =1" target=_blank class=rg_l<img class=rg_i name=FAisdPNr43SpYM: data-src="http://t0.gstaticskaklsam/images?q" data-sz=f onload="google.stb.csi.onTbn(1, this)"></a>
- hsj dj dkl djks djk
- target=_blank class=rg_l<img class=rg_i name=FAisdPNr43SpYM: data-src="http://kslataticskaklsam/images?q" data-sz=f onload="google.stb.csi.onTbn(1, this)"></a>
- hsj dj dkl djks djk
复制代码 |
|