免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2736 | 回复: 5
打印 上一主题 下一主题

POSIX正则无法匹配中括号的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-07-01 15:18 |只看该作者 |倒序浏览
本帖最后由 wrongway88_cu 于 2010-07-01 16:06 编辑

有一个字符串是"[大家好]",想提取出其中的"大家好",用regcomp和regexec两个函数做的,pattern是这样写的
char pattern[] = "\[([^\]]+)\]";
char pattern[] = "\[([^\\]]+)\]";
char pattern[] = "\[([^\\\]]+)\]";
char pattern[] = "[([^]]+)]";
char pattern[] = "[([^\\\]]+)]";
以上均无法匹配,我该如何写呢?

程序代码如下:
#include <stdio.h>
#include <regex.h>
#include <string.h>

int main(int argc, char **argv) {
    regex_t re;
    regmatch_t subs[10];
    char errbuf[256];
    char matched[256];
    char pattern[] = "[([^]]+)]";
    char string[] = "[大家好]";
    int err, i;
    const size_t nmatch = 10;
    size_t len;

    err = regcomp (&re, pattern, REG_EXTENDED);
    if (err)
    {
        len = regerror (err, &re, errbuf, sizeof (errbuf));
        fprintf (stderr, "error: regcomp: %s\n", errbuf);
        exit (1);
    }

    printf ("Total has subexpression: %d\n", re.re_nsub);
    /* execute pattern match */
    err = regexec (&re, string, nmatch, subs, 0);
    if (err == REG_NOMATCH)
    {
        fprintf (stderr, "Sorry, no match ...\n");
        regfree (&re);
        exit (0);
    }
    else if (err)
    {
        len = regerror (err, &re, errbuf, sizeof (errbuf));
        fprintf (stderr, "error: regexec: %s\n", errbuf);
        exit (1);
    }


    /* if no REG_NOMATCH and no error, then pattern matched */
    printf ("\nOK, has matched ...\n\n");
    for (i = 0; i <= re.re_nsub; i++)
    {
        if (i == 0)
        {
        printf ("begin: %d, end: %d, ",subs.rm_so, subs.rm_eo);
        }
        else
        {
        printf ("subexpression %d begin: %d, end: %d, ", i, subs.rm_so, subs.rm_eo);
        }
        len = subs.rm_eo - subs.rm_so;
        memcpy(matched, string + subs.rm_so, len);
        matched[len] = '\0';
        printf("match: %s\n", matched);
    }

    regfree(&re);
    exit(0);


}

论坛徽章:
0
2 [报告]
发表于 2010-07-01 15:49 |只看该作者
自己顶一下

论坛徽章:
0
3 [报告]
发表于 2010-07-01 16:41 |只看该作者


  1. $ cat reg.c
  2. #include <stdio.h>
  3. #include <regex.h>
  4. #include <string.h>

  5. int main(int argc, char **argv) {
  6.     regex_t re;
  7.     regmatch_t subs[10];
  8.     char errbuf[256];
  9.     char matched[256];
  10.     char pattern[] = "\\[(.*)]";
  11.     char string[] = "[大家好]";
  12.     int err, i;
  13.     const size_t nmatch = 10;
  14.     size_t len;

  15.     err = regcomp (&re, pattern, REG_EXTENDED);
  16.     if (err)
  17.     {
  18.         len = regerror (err, &re, errbuf, sizeof (errbuf));
  19.         fprintf (stderr, "error: regcomp: %s\n", errbuf);
  20.         exit (1);
  21.     }

  22.     printf ("Total has subexpression: %d\n", re.re_nsub);
  23.     /* execute pattern match */
  24.     err = regexec (&re, string, nmatch, subs, 0);
  25.     if (err == REG_NOMATCH)
  26.     {
  27.         fprintf (stderr, "Sorry, no match ...\n");
  28.         regfree (&re);
  29.         exit (0);
  30.     }
  31.     else if (err)
  32.     {
  33.         len = regerror (err, &re, errbuf, sizeof (errbuf));
  34.         fprintf (stderr, "error: regexec: %s\n", errbuf);
  35.         exit (1);
  36.     }


  37.     /* if no REG_NOMATCH and no error, then pattern matched */
  38.     printf ("\nOK, has matched ...\n\n");
  39.     for (i = 0; i <= re.re_nsub; i++)
  40.     {
  41.         if (i == 0)
  42.         {
  43.         printf ("begin: %d, end: %d, ",subs[i].rm_so, subs[i].rm_eo);
  44.         }
  45.         else
  46.         {
  47.         printf ("subexpression %d begin: %d, end: %d, ", i, subs[i].rm_so, subs[i].rm_eo);
  48.         }
  49.         len = subs[i].rm_eo - subs[i].rm_so;
  50.         memcpy(matched, string + subs[i].rm_so, len);
  51.         matched[len] = '\0';
  52.         printf("match: %s\n", matched);
  53.     }

  54.     regfree(&re);
  55.     exit(0);


  56. }

  57. $ gcc -o reg reg.c
  58. reg.c: In function ‘main’:
  59. reg.c:21:9: warning: incompatible implicit declaration of built-in function ‘exit’
  60. reg.c:24:5: warning: format ‘%d’ expects type ‘int’, but argument 2 has type ‘size_t’
  61. reg.c:31:9: warning: incompatible implicit declaration of built-in function ‘exit’
  62. reg.c:37:9: warning: incompatible implicit declaration of built-in function ‘exit’
  63. reg.c:60:5: warning: incompatible implicit declaration of built-in function ‘exit’
  64. $ ./reg
  65. Total has subexpression: 1

  66. OK, has matched ...

  67. begin: 0, end: 11, match: [大家好]
  68. subexpression 1 begin: 1, end: 10, match: 大家好
  69. $
复制代码

论坛徽章:
0
4 [报告]
发表于 2010-07-01 17:08 |只看该作者
为什么是 \\[ 呢?

论坛徽章:
0
5 [报告]
发表于 2010-07-01 17:15 |只看该作者
我用PHP写的规则是 \[([^]]+)] ,为什么到了C就不好使了呢?

论坛徽章:
0
6 [报告]
发表于 2010-07-02 08:17 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP