免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 20464 | 回复: 14
打印 上一主题 下一主题

需要把这些关键字行取出来 [复制链接]

论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2017-06-29 14:07 |只看该作者 |倒序浏览
本帖最后由 Windows19 于 2017-06-29 14:23 编辑

100g  log  效率  性能

a.txt
4gfgdg\[8654
45345btgtfdfddgggd
/[][ry4353453466434534rtyt/yr'
234235346465'/\.h\'rt;'uy6r\'y7;
gfgdg9687110575448
btgtfdfddgggd\';btgtfdfddgggd
4353453466434534.,/'4353453466434534/'ryrtytryrtlyphft''/
btgtfdfddgggd\';btgtfdfddgggd8654

'\kji']\;\lknokjp8
8u90ulknouh07kno078onk
/[][ry4353453466434534789rtyt/yr'
4gfgdgab\[8654243
我已经有1个B文本  需要把这些有关键字行取出来  而b文件大小仅5m左右  没有关键字的可以不输出

精确匹配b文本中关键字  数字串   子母串   后输出  区分大小写

b.txt
gfgdg
btgtfdfddgggd
4353453466434534
234235346465
8654
9687110575448
6789679869797897897879
uuighkhgihugouhjoihiohijoiioio

示例中颜色匹配关键子
大概应得结果,  log.txt

4gfgdg\[8654
45345btgtfdfddgggd
/[][ry4353453466434534rtyt/yr'
234235346465'/\.h\'rt;'uy6r\'y7;
gfgdg9687110575448
btgtfdfddgggd\';btgtfdfddgggd
4353453466434534.,/'4353453466434534/'ryrtytryrtlyphft''/
btgtfdfddgggd\';btgtfdfddgggd8654

谢谢了,,,







论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
2 [报告]
发表于 2017-06-29 23:58 来自手机 |只看该作者
高手在那?

论坛徽章:
0
3 [报告]
发表于 2017-06-30 09:52 |只看该作者
读A文件,然后一行一行去查,不行吗

论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
4 [报告]
发表于 2017-06-30 10:41 来自手机 |只看该作者
quanpai 发表于 2017-06-30 09:52
读A文件,然后一行一行去查,不行吗

也许按老师你思路可以吧,不妨试试

论坛徽章:
6
丑牛
日期:2014-03-21 15:42:04子鼠
日期:2014-04-12 11:50:17处女座
日期:2014-09-01 09:25:1115-16赛季CBA联赛之吉林
日期:2015-12-22 14:01:5215-16赛季CBA联赛之广东
日期:2016-03-08 18:49:422016科比退役纪念章
日期:2016-07-06 12:19:55
5 [报告]
发表于 2017-06-30 21:25 |只看该作者
egrep -f b.txt a.txt

论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
6 [报告]
发表于 2017-06-30 22:06 来自手机 |只看该作者
本帖最后由 Windows19 于 2017-07-01 05:42 编辑
stanley_tam 发表于 2017-06-30 21:25
egrep -f b.txt a.txt

         
,,

论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
7 [报告]
发表于 2017-06-30 22:08 来自手机 |只看该作者

没看到精确匹配?

论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
8 [报告]
发表于 2017-07-01 15:01 来自手机 |只看该作者
想不到要实现起来这么难

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
9 [报告]
发表于 2017-07-03 01:55 |只看该作者
本帖最后由 rubyish 于 2017-07-02 21:57 编辑

if linux? shishi biru.c


compile:
gcc -Wall -O3 -march=native -o biru biru.c `pkg-config --cflags --libs glib-2.0`

run:
./biru b  a  >  c


LINE: max line length
KEY: max key length
  1. # define LINE     512
  2. # define KEY      256
复制代码


biru.c

  1. // gcc -Wall -O3 -march=native -o biru biru.c `pkg-config --cflags --libs glib-2.0`
  2. // ./biru b a > c

  3. # include <stdio.h>
  4. # include <ctype.h>
  5. # include <string.h>
  6. # include <stdlib.h>
  7. # include <glib.h>

  8. # define LINE     512
  9. # define KEY      256

  10. # define insert   g_hash_table_insert
  11. # define contains g_hash_table_contains
  12. # define Table    g_hash_table_new_full
  13. # define destroy  g_hash_table_destroy
  14. # define STR      g_str_hash, g_str_equal
  15. # define FREE     F_, F_
  16. # define print(s) fputs (s, stdout)

  17. typedef char *str;
  18. typedef char kar;
  19. typedef unsigned Int;

  20. void alkaa (str);
  21. void fari (str);
  22. GHashTable *hash = NULL;

  23. int main (int para, str *vec){
  24.     fari (vec[1]);
  25.     alkaa (vec[2]);
  26.     destroy (hash);
  27.     return 0;
  28. } /* main */

  29. /* ______________________ SUB ______________________ */

  30. void F_ (gpointer data) {
  31.     free (data);
  32. }

  33. void fari (str fil){
  34.     FILE *lima = fopen (fil, "r");

  35.     hash = Table (STR, FREE);
  36.     kar garis[LINE] = { 0 };

  37.     while (fgets (garis, LINE, lima)) {
  38.         garis[strlen (garis) - 1] = 0;
  39.         insert (hash, strdup (garis), NULL);
  40.     }
  41. }


  42. void alkaa (str fil){
  43.     FILE *lima      = fopen (fil, "r");
  44.     kar garis[LINE] = { 0 };
  45.     kar kunci[KEY]  = { 0 };

  46.     while (fgets (garis, LINE, lima)) {
  47.         kar *dat   = garis;
  48.         Int aantal = 0;

  49.         while (*dat) {
  50.             if (!isalnum (*dat)) {
  51.                 dat++;
  52.                 continue;
  53.             }

  54.             str formaat = isdigit (*dat) ? "%[0-9]%n" : "%[a-zA-Z]%n";
  55.             sscanf (dat, formaat, kunci, &aantal);
  56.             
  57.             if (contains (hash, kunci)) {
  58.                 print (garis);
  59.                 break;
  60.             }
  61.             
  62.             dat += aantal;
  63.         }
  64.     }
  65. } /* dos */

复制代码

评分

参与人数 1信誉积分 +10 收起 理由
Windows19 + 10 谢谢 装好环境再来试

查看全部评分

论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
10 [报告]
发表于 2017-07-03 07:54 |只看该作者
回复 9# rubyish
我将你的代码放入脚本后执行后
返回信息了
  1. // gcc -Wall -O3 -march=native -o biru biru.c `pkg-config --cflags --libs glib-2.0`
  2. // ./biru b a > c

  3. # include <stdio.h>
  4. # include <ctype.h>
  5. # include <string.h>
  6. # include <stdlib.h>
  7. # include <glib.h>

  8. # define LINE     512
  9. # define KEY      256

  10. # define insert   g_hash_table_insert
  11. # define contains g_hash_table_contains
  12. # define Table    g_hash_table_new_full
  13. # define destroy  g_hash_table_destroy
  14. # define STR      g_str_hash, g_str_equal
  15. # define FREE     F_, F_
  16. # define print(s) fputs (s, stdout)

  17. typedef char *str;
  18. typedef char kar;
  19. typedef unsigned Int;

  20. void alkaa (str);
  21. void fari (str);
  22. GHashTable *hash = NULL;

  23. int main (int para, str *vec){
  24.     fari (vec[1]);
  25.     alkaa (vec[2]);
  26.     destroy (hash);
  27.     return 0;
  28. } /* main */

  29. /* ______________________ SUB ______________________ */

  30. void F_ (gpointer data) {
  31.     free (data);
  32. }

  33. void fari (str fil){
  34.     FILE *lima = fopen (fil, "r");

  35.     hash = Table (STR, FREE);
  36.     kar garis[LINE] = { 0 };

  37.     while (fgets (garis, LINE, lima)) {
  38.         garis[strlen (garis) - 1] = 0;
  39.         insert (hash, strdup (garis), NULL);
  40.     }
  41. }


  42. void alkaa (str fil){
  43.     FILE *lima      = fopen (fil, "r");
  44.     kar garis[LINE] = { 0 };
  45.     kar kunci[KEY]  = { 0 };

  46.     while (fgets (garis, LINE, lima)) {
  47.         kar *dat   = garis;
  48.         Int aantal = 0;

  49.         while (*dat) {
  50.             if (!isalnum (*dat)) {
  51.                 dat++;
  52.                 continue;
  53.             }

  54.             str formaat = isdigit (*dat) ? "%[0-9]%n" : "%[a-zA-Z]%n";
  55.             sscanf (dat, formaat, kunci, &aantal);
  56.             
  57.             if (contains (hash, kunci)) {
  58.                 print (garis);
  59.                 break;
  60.             }
  61.             
  62.             dat += aantal;
  63.         }
  64.     }
  65. } /* dos */

复制代码

$ ./biru b.txt  a.txt  >  c
./biru: line 1: pkg-config: command not found
./biru: line 1: //: Is a directory
./biru: line 2: //: Is a directory
./biru: line 21: typedef: command not found
./biru: line 22: typedef: command not found
./biru: line 23: typedef: command not found
./biru: line 25: syntax error near unexpected token `('
./biru: line 25: `void alkaa (str);'




您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP