免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 6107 | 回复: 10
打印 上一主题 下一主题

[文本处理] 如何提取标签中的数字,修改后再替换掉数字 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-01-25 18:54 |显示全部楼层 |倒序浏览
  1. <CreateTime>1390136672987</CreateTime>
复制代码
如何把一个标签中的数字1390136672987截取前十位(1390136672),经过计算(如下),得出2014-1-19再替换掉那串数字,最后格式是<CreateTime>2014-1-19</CreateTime>
对了,标签是在一行的,并且文中有多处需要替换
  1. date -d "$((1298995200 - `date '+%s'` )) sec" +%Y-%-m-%-d
复制代码
处女帖,求呵护

先谢谢大家拉^_^

论坛徽章:
0
2 [报告]
发表于 2014-01-26 11:09 |显示全部楼层
大侠,都怪我少说了点东西,真不好意思。{:3_196:}
我要处理的文档是一个XML。里面的标签都是<>这样的。所以这个好像不行。而且要处理的地方有多处。还望大侠再帮帮忙
给个测试例子

  1. <dc:creator>admin</dc:creator>
  2. <CreateTime>1390136672987</CreateTime>
  3. <wp:post_id>40060814513</wp:post_id>
  4. <wp:post_type>post</wp:post_type>
  5. <wp:status>publish</wp:status>
  6. <category domain="post_tag">Something</category>

  7. <dc:creator>admin</dc:creator>
  8. <CreateTime>1390052327865</CreateTime>
  9. <wp:post_id>40060794903</wp:post_id>
  10. <wp:post_type>post</wp:post_type>
  11. <wp:status>publish</wp:status>
  12. <category domain="post_tag">Something</category>

  13. <dc:creator>admin</dc:creator>
  14. <CreateTime>1389533317291</CreateTime>
  15. <wp:post_id>40060756519</wp:post_id>
  16. <wp:post_type>post</wp:post_type>
  17. <wp:status>publish</wp:status>
  18. <category domain="post_tag">Something</category>

复制代码
而且文档中还保存有文章。不排除有什么干扰的符号。
回复 2# yestreenstars


   

论坛徽章:
0
3 [报告]
发表于 2014-01-26 11:11 |显示全部楼层
好像不能处理多处呀,我在9楼给出个测试例子,麻烦再帮帮忙,谢谢

回复 4# nathanielwen


   

论坛徽章:
0
4 [报告]
发表于 2014-01-26 11:14 |显示全部楼层
大侠,感谢你的帮助,怪我没说明白。不能用<>来进行判断,因为文本好多标签,测试例子在9L,麻烦再帮忙看看

回复 7# runintostar


   

论坛徽章:
0
5 [报告]
发表于 2014-01-26 11:29 |显示全部楼层
太感谢啦,谢谢

回复 12# yestreenstars


   

论坛徽章:
0
6 [报告]
发表于 2014-01-26 11:37 |显示全部楼层
恩恩,是的,可以使用,谢谢

回复 13# runintostar


   

论坛徽章:
0
7 [报告]
发表于 2014-01-26 16:12 |显示全部楼层
谢谢啦,是正确的~~

回复 16# blackold


   

论坛徽章:
0
8 [报告]
发表于 2014-01-26 16:49 |显示全部楼层
回复 12# yestreenstars


    大神,你给的代码很简洁好用,有一个相似的问题,我根据你给的代码改了改,不过报错了,还请指教

为了实现从
  1. <Tag>杂<Tag>
复制代码
  1. <category domain="post_tag" nicename="%e6%9d%82"><![CDATA[杂]]></category>
复制代码
的转化

那个nicename的值是“杂”转化的urlencod,转化方法是
  1. echo -n "杂"|od -An -tx1 -w30|tr ' ' %
复制代码
应该是我嵌套出了问题。求大神举例。

论坛徽章:
0
9 [报告]
发表于 2014-01-27 20:29 |显示全部楼层
回复 20# jason680


    十分感谢。^_^

论坛徽章:
0
10 [报告]
发表于 2014-01-27 20:32 |显示全部楼层
回复 22# LikeLx


    十分感谢{:2_172:}
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP