免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2104 | 回复: 5

[文本处理] 转换文本里的日期格式 [复制链接]

论坛徽章:
2
技术图书徽章
日期:2013-12-20 07:35:03技术图书徽章
日期:2014-12-16 12:59:42
发表于 2014-10-14 20:12 |显示全部楼层
本帖最后由 General_715 于 2014-10-14 21:55 编辑

比如文本里的日期格式是
Aug 10  2014 9:01:00    xxxxxxxxxx等其他内容
Oct  11  2014 10:20:02  xxxxxxxxxx

想转换成  
2014/08/10 9:01:00        xxxxxxxxxxxxxx
2014/10/11 10:20:02      xxxxxxxxxxxxxx

该怎么写呢

论坛徽章:
8
戌狗
日期:2014-09-26 16:39:44水瓶座
日期:2014-10-10 02:06:57金牛座
日期:2014-10-11 23:04:042015亚冠之首尔
日期:2015-06-23 15:37:0015-16赛季CBA联赛之天津
日期:2016-01-22 18:58:2915-16赛季CBA联赛之佛山
日期:2016-05-31 19:18:0815-16赛季CBA联赛之同曦
日期:2016-08-10 16:26:3315-16赛季CBA联赛之辽宁
日期:2018-01-10 11:47:40
发表于 2014-10-14 20:44 |显示全部楼层
本帖最后由 wiliiwin 于 2014-10-14 20:46 编辑
  1. awk 'BEGIN{split("Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec",k," ");for(i=1;i<13;i++){m[k[i]]=i}}{$1=m[$1];print $3"/"$1"/"$2" "$4}'   19.txt
  2. 2014/8/10 9:01:00
  3. 2014/10/11 10:20:02
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
发表于 2014-10-14 21:07 |显示全部楼层
  1. $ cat i
  2. Aug 10  2014 9:01:00
  3. Oct  11  2014 10:20:02
  4. $ while read line;do date -d "$line" "+%Y/%m/%d %T";done < i
  5. 2014/08/10 09:01:00
  6. 2014/10/11 10:20:02
复制代码

论坛徽章:
3
丑牛
日期:2014-09-13 18:19:22摩羯座
日期:2014-10-10 17:43:02水瓶座
日期:2014-10-16 01:00:22
发表于 2014-10-14 23:33 |显示全部楼层
学生党:无聊~飘过~

  1. $ cat yhsafe.py
  2. #!/usr/bin/env python
  3. # -*- coding:gbk -*-

  4. import sys,re
  5. import datetime

  6. with open(sys.argv[1],'r+') as fd:
  7.         for x in fd:
  8.                 print re.sub(r'\w+\s+\d+\s+\d+',datetime.datetime.strptime(' '.join(x.split()[:3]),'%b %d %Y').strftime('%Y/%m/%d'),x),
复制代码
测试:
$ ./yhsafe.py yhsafe.txt
2014/08/10 9:01:00   xxxxxxxxxx
2014/10/11 10:20:02  xxxxxxxxxx

论坛徽章:
13
双鱼座
日期:2013-10-23 09:30:05数据库技术版块每日发帖之星
日期:2016-04-20 06:20:00程序设计版块每日发帖之星
日期:2016-03-09 06:20:002015亚冠之塔什干火车头
日期:2015-11-02 10:07:452015亚冠之德黑兰石油
日期:2015-08-30 10:07:07数据库技术版块每日发帖之星
日期:2015-08-28 06:20:00数据库技术版块每日发帖之星
日期:2015-08-05 06:20:002015年迎新春徽章
日期:2015-03-04 09:57:09辰龙
日期:2014-12-03 14:45:52酉鸡
日期:2014-07-23 09:46:23亥猪
日期:2014-03-13 08:46:22金牛座
日期:2014-02-11 09:36:21
发表于 2014-10-15 09:42 |显示全部楼层
学生党。。。飘个蛋啊

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:58:11
发表于 2014-10-15 09:50 |显示全部楼层
回复 2# wiliiwin


    大赞啊,,,学习了,这种方法 较好
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

DTCC2020中国数据库技术大会 限时8.5折

【架构革新 高效可控】2020年6月4日~6日第十一届中国数据库技术大会将在北京隆重召开。

大会设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕数据架构、AI与大数据、传统企业数据库实践和国产开源数据库等内容展开分享和探讨,为广大数据领域从业人士提供一场年度盛会和交流平台。

http://dtcc.it168.com


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP