免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: zimuyunren
打印 上一主题 下一主题

[文本处理] 求助 ,文本处理 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2013-12-18 16:28 |只看该作者
我刚试了下  如果文件两个文件都是这几行就可以  但实际文件的 3000多行 和1800行 就不行了 ,什么问题?

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
12 [报告]
发表于 2013-12-18 16:29 |只看该作者
回复 11# zimuyunren
估计是数组不够用了~

   

论坛徽章:
0
13 [报告]
发表于 2013-12-18 16:31 |只看该作者
我把文件传上来

论坛徽章:
0
14 [报告]
发表于 2013-12-18 16:33 |只看该作者
本帖最后由 zimuyunren 于 2013-12-18 22:37 编辑

我吧文件打包了 这是实际文件



回复 10# WilliBhamlll


   

论坛徽章:
0
15 [报告]
发表于 2013-12-18 16:34 |只看该作者
那有解决办法吗 ?回复 12# yestreenstars


   

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
16 [报告]
发表于 2013-12-18 16:36 |只看该作者
回复 15# zimuyunren
试一下用perl~
  1. #!/usr/bin/perl

  2. open(FILE1, "a") or die;
  3. open(FILE2, "b") or die;

  4. my %hash;

  5. while (<FILE2>) {
  6.         @_ = split;
  7.         $hash{$_[0]} = $_[1];
  8. }

  9. while (<FILE1>) {
  10.         @_ = split /,/;
  11.         $_[0] = $hash{$_[0]} if $hash{$_[0]};
  12.         print join ',', @_;
  13. }
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
17 [报告]
发表于 2013-12-18 16:42 |只看该作者
回复 15# zimuyunren
用你打包的那两个文件测试也是能得到结果的啊,而且也很快~
  1. [root@localhost ~]# awk -F '[, ]+' -vOFS=',' 'NR==FNR{a[$1]=$2;next}{if(a[$1])$1=a[$1]}1' bieming.list.bak user.list.bak | wc -l
  2. 3567
  3. [root@localhost ~]# wc -l user.list.bak
  4. 3567 user.list.bak
  5. [root@localhost ~]#
复制代码

论坛徽章:
0
18 [报告]
发表于 2013-12-18 16:43 |只看该作者
谢谢 好使回复 16# yestreenstars


   

论坛徽章:
0
19 [报告]
发表于 2013-12-18 16:44 |只看该作者
我试了,内容没有替换回复 17# yestreenstars


   

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
20 [报告]
发表于 2013-12-18 16:46 |只看该作者
回复 19# zimuyunren
确实如此~

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP