免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 8030 | 回复: 6

[文本处理] 如何在一个文件里抽取特定字符串的行,并打印所在行数 [复制链接]

论坛徽章:
0
发表于 2016-11-10 16:55 |显示全部楼层
山外有山,人外有人,入行四月有余,一直处在调代码状态,,,给自己的感觉就是还是什么都不会的菜鸟,废话不多说
今天想请教大神的是两个问题:
1. 如何在每一个子文件夹(最底下的文件夹)下面创立一个新的文件夹???

我曾经试过,但是发现创建了一个无限循环的文件夹,和俄罗斯套娃似得,,,想请大神帮忙

2. 如何在一个文件里面搜寻出一行,并打印其所在的行数???

比如a.txt有1000000行,但是我想知道含有 '>chr1'这行是第几行,并且打印出来,打印某一行不难,但是知道是第几行原谅我不会,,,


感谢相助


论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
发表于 2016-11-10 17:10 |显示全部楼层
1:
  1. find -type d  | awk -F'/' '$0!~"^"a{system("mkdir "a"/xxx")}{a=$0}END{system("mkdir "a"/xxx")}'
复制代码

2:
  1. grep -n "xxx"
  2. sed -n "/xxx/="
复制代码

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
发表于 2016-11-10 17:10 |显示全部楼层
本帖最后由 sunzhiguolu 于 2016-11-10 17:20 编辑

perl 的话,  
mkdir 函数建立文件夹
内置变量 $. 代表的就是行号

论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
发表于 2016-11-10 17:28 |显示全部楼层
1.
  1. find . -type d -links 2|xargs -i mkdir -p {}/e #创建文件夹e
复制代码

2.
  1. grep -n '>chr1' file
复制代码

论坛徽章:
1
15-16赛季CBA联赛之江苏
日期:2016-10-26 16:19:04
发表于 2016-11-11 10:30 |显示全部楼层
回复 4# moperyblue

大神,请教下,find -links 2,这个参数的具体的作用是什么,加上这个参数就实现了最底层的目录的创建,man find  只有 file  has  n links这一句解释。

论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
发表于 2016-11-11 10:52 |显示全部楼层
本帖最后由 moperyblue 于 2016-11-11 11:05 编辑

回复 5# fh21_xuejinlian


http://stackoverflow.com/questio ... irectories-in-linux

info find
=>
   You can also search for files that have a certain number of links,
with `-links'.  Directories normally have at least two hard links;
their `.' entry is the second one.  If they have subdirectories, each
of those also has a hard link called `..' to its parent directory.  The
`.' and `..' directory entries are not normally searched unless they
are mentioned on the `find' command line.

-- Test: -links n
     File has N hard links.

-- Test: -links +n
     File has more than N hard links.

-- Test: -links -n
     File has fewer than N hard links.

论坛徽章:
1
15-16赛季CBA联赛之江苏
日期:2016-10-26 16:19:04
发表于 2016-11-11 11:09 |显示全部楼层
回复 6# moperyblue

thx
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP