免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2614 | 回复: 14
打印 上一主题 下一主题

[文本处理] 文本处理的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-10-10 16:31 |只看该作者 |倒序浏览
输入文件:
1
2
3
4
5
输入文件2:
5     4
4     1
2     12
3     15
1      17
输出文件:
1  17
2  12
3  15
4  1
5   4
规则:按照输入文件1的顺序将输入文件2的第二列补齐。
谢谢,比较急。。所以前面的没来得及消化

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
2 [报告]
发表于 2014-10-10 16:36 |只看该作者
回复 1# kellyseeme123

帮忙关于文本处理的shell
http://bbs.chinaunix.net/forum.p ... mp;fromuid=24785593

   

论坛徽章:
8
戌狗
日期:2014-09-26 16:39:44水瓶座
日期:2014-10-10 02:06:57金牛座
日期:2014-10-11 23:04:042015亚冠之首尔
日期:2015-06-23 15:37:0015-16赛季CBA联赛之天津
日期:2016-01-22 18:58:2915-16赛季CBA联赛之佛山
日期:2016-05-31 19:18:0815-16赛季CBA联赛之同曦
日期:2016-08-10 16:26:3315-16赛季CBA联赛之辽宁
日期:2018-01-10 11:47:40
3 [报告]
发表于 2014-10-10 16:52 |只看该作者
  这不是之前做过了吗 怎么又提这样的问题  我晕倒

论坛徽章:
7
亥猪
日期:2013-10-10 17:00:29辰龙
日期:2013-10-12 16:23:19卯兔
日期:2013-11-18 17:01:27金牛座
日期:2014-09-09 10:17:052015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之柏太阳神
日期:2015-09-25 13:56:42数据库技术版块每日发帖之星
日期:2016-08-06 06:20:00
4 [报告]
发表于 2014-10-10 17:05 |只看该作者
  1. awk 'NR==FNR{a[$1]=$2;next}{print $0,a[$0]}' 2 1
复制代码

论坛徽章:
3
丑牛
日期:2014-09-13 18:19:22摩羯座
日期:2014-10-10 17:43:02水瓶座
日期:2014-10-16 01:00:22
5 [报告]
发表于 2014-10-10 17:09 |只看该作者
学生党:飘过~python来一发~

  1. $ cat yhsafe.py
  2. #!/usr/bin/env python
  3. # -*- coding:utf-8 -*-
  4. "just for fun"

  5. import sys
  6. import fileinput
  7. import linecache

  8. list={}
  9. for x in fileinput.input(sys.argv[1:]):
  10.         if fileinput.filename()=="file2.txt":
  11.                 list[x.split()[0]]=x
  12.         else:
  13.                 print x.strip('\n'), list[x.strip('\n')].split()[1]
复制代码
测试:
$ ./yhsafe.py file2.txt file1.txt
1 17
2 12
3 15
4 1
5 4

论坛徽章:
14
15-16赛季CBA联赛之辽宁
日期:2019-06-16 15:47:3515-16赛季CBA联赛之广夏
日期:2016-08-13 21:24:352015亚冠之武里南联
日期:2015-07-07 17:37:372015亚冠之萨济拖拉机
日期:2015-07-06 17:07:482015亚冠之全北现代
日期:2015-06-04 13:54:272015亚冠之城南
日期:2015-05-21 15:43:212015年亚洲杯之伊朗
日期:2015-04-25 18:20:362015年亚洲杯之伊朗
日期:2015-04-20 16:06:052015年亚洲杯之科威特
日期:2015-03-07 12:51:26丑牛
日期:2014-12-30 10:26:38申猴
日期:2014-09-28 22:40:18金牛座
日期:2014-09-13 21:12:22
6 [报告]
发表于 2014-10-10 19:12 |只看该作者
  1. awk 'NR==FNR{a[$1]=$0;next}{print a[$1]}' 2 1
  2. 1      17
  3. 2     12
  4. 3     15
  5. 4     1
  6. 5     4
复制代码

论坛徽章:
0
7 [报告]
发表于 2014-10-10 22:35 |只看该作者
搞定了。。。
用了一个比较麻烦的方法。。
对shell不是很熟悉。。

我导入到数据库,然后用SQL进行处理掉了,谢谢各位

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
8 [报告]
发表于 2014-10-11 09:06 |只看该作者
  1. [root@localhost ~]# awk 'NR==FNR{a[$1]=$0;next}{print a[$1]}' b a
  2. 1      17
  3. 2     12
  4. 3     15
  5. 4     1
  6. 5     4
  7. [root@localhost ~]# head a b
  8. ==> a <==
  9. 1
  10. 2
  11. 3
  12. 4
  13. 5

  14. ==> b <==
  15. 5     4
  16. 4     1
  17. 2     12
  18. 3     15
  19. 1      17
  20. [root@localhost ~]#
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
9 [报告]
发表于 2014-10-11 09:07 |只看该作者
回复 7# kellyseeme123

你每次问完后,自己又用SQL搞定,这不是瞎折腾么?{:3_183:}
   

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
10 [报告]
发表于 2014-10-11 09:12 |只看该作者
回复 1# kellyseeme123


这个一看就是join的菜:
  1. join <(sort 1) <(sort 2)
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP