免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 1365 | 回复: 16
打印 上一主题 下一主题

[文本处理] 只提取指定开头的行,给看看错在哪? [复制链接]

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-10-26 07:53 |只看该作者 |倒序浏览



源:

海_-_海_-_84_-_ion._-__-__-__-_12_-_5
海_-_海_-_7432_-_344_-__-__-__-_12_-_116
yau*_-_海_-__-_68_-_ _-_区_-_00-24-
7161_-_上_-__-_14_-_ _-_区_-_00-
Q72_-_区_-__-_49_-_ _-_上_-_50
海_-__-_181_-__-_qq_-__-__-__-_0_-__-_C:p:_-__-_59
海_-__-_43_-__-_321123._-__-__-__-_26_-__-_D2_-__-_6
海_-__-_8335_-__-_l21_-__-__-__-_58_-__-_B1_-__-_2



要求:只提取首位是数字或大小写字母的一个或多个的行


结果:

yau*_-_海_-__-_68_-_ _-_区_-_00-24-
7161_-_上_-__-_14_-_ _-_区_-_00-
Q72_-_区_-__-_49_-_ _-_上_-_50


用这个为什么不可以? grep -P '^\w+' 或 LANG=C grep -P '^\w+'



谢谢!给指导一下吧




论坛徽章:
6
羊年新春福章
日期:2015-03-03 17:16:28双子座
日期:2015-03-03 17:16:56巳蛇
日期:2015-03-03 17:17:2415-16赛季CBA联赛之福建
日期:2016-03-11 09:05:00黑曼巴
日期:2016-07-07 16:58:1215-16赛季CBA联赛之吉林
日期:2016-11-14 09:23:07
2 [报告]
发表于 2016-10-26 09:07 |只看该作者
  1. grep -E '^[a-zA-Z0-9]' file
复制代码

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
3 [报告]
发表于 2016-10-26 09:20 |只看该作者
回复 2# jcdiy0601



谢谢大神,等了这么多天。终于有有时间的大神来了

感谢、感谢。

学习了3个多小时了,没学会。

看到了大神的代码后,再学学去



论坛徽章:
39
双子座
日期:2014-08-06 17:37:19极客徽章
日期:2016-12-07 14:03:402017金鸡报晓
日期:2017-01-10 15:13:292017金鸡报晓
日期:2017-02-08 10:39:4215-16赛季CBA联赛之新疆
日期:2017-03-24 16:36:1915-16赛季CBA联赛之江苏
日期:2017-04-26 17:19:08黑曼巴
日期:2018-03-07 18:56:5615-16赛季CBA联赛之八一
日期:2018-03-09 10:44:1015-16赛季CBA联赛之江苏
日期:2018-03-12 15:12:1915-16赛季CBA联赛之青岛
日期:2018-03-16 09:13:0515-16赛季CBA联赛之山东
日期:2018-04-27 18:23:0515-16赛季CBA联赛之新疆
日期:2018-05-04 11:29:30
4 [报告]
发表于 2016-10-26 10:01 |只看该作者
本帖最后由 o枫叶o飘零 于 2016-10-26 10:02 编辑

你的并没有错啊。。。



可能是你的grep版本不一样。。

论坛徽章:
1
15-16赛季CBA联赛之江苏
日期:2016-10-26 16:19:04
5 [报告]
发表于 2016-10-26 10:15 |只看该作者
awk '$1~/^[0-9a-zA-Z]/' file

论坛徽章:
1
15-16赛季CBA联赛之江苏
日期:2016-10-26 16:19:04
6 [报告]
发表于 2016-10-26 10:16 |只看该作者
awk '$1~/^[0-9a-zA-Z]+/' file

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
7 [报告]
发表于 2016-10-26 12:16 |只看该作者
回复 4# o枫叶o飘零



我最近请求帮助的几个问题,基本都是围绕有汉字

谢谢测试


论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
8 [报告]
发表于 2016-10-26 12:17 |只看该作者
本帖最后由 bmne 于 2016-10-26 13:18 编辑

回复 6# fh21_xuejinlian



谢谢了。辛苦

我这里处理有汉字的,awk好于grep




论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
9 [报告]
发表于 2016-10-26 12:32 |只看该作者
回复 6# fh21_xuejinlian

看到你玩awk易于反掌

张张口试试,麻烦帮助下


源:

中国  中国  123  ---   ...  华
人们  人们  6890  '''  ,,,   人
就  9743   3684   ----   的


要求:  遇到最前面是两组汉字的,就删除一组。保留其后所有

结果:

中国  123  ---   ...  华
人们  6890  '''  ,,,   人
就  9743   3684   ----   的


辛苦,麻烦你给个awk代码。感谢、感谢








论坛徽章:
1
15-16赛季CBA联赛之江苏
日期:2016-10-26 16:19:04
10 [报告]
发表于 2016-10-26 13:41 |只看该作者
回复 9# bmne

awk '$1~/[^0-9a-zA-Z_]/&&$2~/[^0-9a-zA-Z_]/{$2=""}1' file
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP