免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: filwydb2
打印 上一主题 下一主题

遇到很难的数据提取问题 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2009-11-11 23:03 |只看该作者
说明一下,awk -F "|" 'NR==FNR{a[$1"#"$2]}NR>FNR&&!($1"#"$2 in a)' b1 a1
是按你2楼的思路来的,也就是$1 $2相同,就认为整行内容肯定是相同了

如果不是这样,改成awk -F "|" 'NR==FNR{a[$0]}NR>FNR&&!($0 in a)' b1 a1

论坛徽章:
0
12 [报告]
发表于 2009-11-11 23:07 |只看该作者
原帖由 ywlscpl 于 2009-11-11 23:00 发表
字段数是定的吧,7个
[root@Mylinux tmp]# awk -F "|"  'NF+NF1!=7{printf $0;NF1=NF1+NF-1;next}{print;NF1=0}' a>a1
[root@Mylinux tmp]# awk -F "|"  'NF+NF1!=7{printf $0;NF1=NF1+NF-1;next}{print;NF1= ...


兄弟,感谢啊!

论坛徽章:
0
13 [报告]
发表于 2009-11-11 23:11 |只看该作者
如果需要保留这些换行的话

  1. [root@Mylinux tmp]# awk -F "|"  'NF+NF1!=7{printf $0"@@##";NF1=NF1+NF-1;next}{print;NF1=0}' a>a1
  2. [root@Mylinux tmp]# awk -F "|"  'NF+NF1!=7{printf $0"@@##";NF1=NF1+NF-1;next}{print;NF1=0}' b>b1
  3. [root@Mylinux tmp]# awk -F "|" 'NR==FNR{a[$1"#"$2]}NR>FNR&&!($1"#"$2 in a)' b1 a1 | awk -v RS="@@##" '1'
  4. 100172|1|尊敬的客户:对不起,我们的系统繁忙,请稍后再试。|FF|||
  5. 190048|3|我公司推出每月获赠积分活动2,请留意哦;预定我们的航线将会获得更多的优惠;或者可以到我们的客服了解相关情况。,如有问题也请拔大我们的电话,谢谢。
  6. 1、你可以在当地找营业厅。
  7. 2、你可以拔打我们的热线。|FF|||
复制代码

论坛徽章:
0
14 [报告]
发表于 2009-11-12 11:41 |只看该作者
留名,以后估计能用得着

论坛徽章:
11
金牛座
日期:2015-03-19 16:56:22数据库技术版块每日发帖之星
日期:2016-08-02 06:20:00数据库技术版块每日发帖之星
日期:2016-04-24 06:20:00数据库技术版块每日发帖之星
日期:2016-04-13 06:20:00IT运维版块每日发帖之星
日期:2016-04-13 06:20:00数据库技术版块每日发帖之星
日期:2016-02-03 06:20:00数据库技术版块每日发帖之星
日期:2015-08-06 06:20:00季节之章:春
日期:2015-03-27 15:54:57羊年新春福章
日期:2015-03-27 15:54:37戌狗
日期:2015-03-19 16:56:41数据库技术版块每日发帖之星
日期:2016-08-18 06:20:00
15 [报告]
发表于 2009-11-12 12:10 |只看该作者
这个直接用数据库操作吧...比较容易~

论坛徽章:
0
16 [报告]
发表于 2009-11-12 21:09 |只看该作者
l留步。呵呵
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP