论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2007-07-18 18:42 |只看该作者 |倒序浏览

以"开始，以"结束，中间任何字符都合法，包括""、" "、"\n"、"\t"......
我不知道，试了几个都不行。
比如：\"[^"]\"，就匹配不了，向大家请教一下。

文库|博客

prolj

荣誉版主

论坛徽章:: 0

2楼 [报告]

发表于 2007-07-19 08:41 |只看该作者

没办法，用了个最苯的办法：

\" {count(); is_str(); return STRING;}
is_str()
{
char ch, c[255];
bzero(&c, strlen(c));
int i;
for (i=0; (ch=input()) != '"'; i++)
c[i]=ch;
yytokval.strval=c;
}

复制代码

俺比较愚笨，望大家拿出更好的方法。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

prolj

荣誉版主

论坛徽章:: 0

3楼 [报告]

发表于 2007-07-19 10:05 |只看该作者

不好意思，昨天太晕了。

更好一点点的方法：

\"[^"]*\" {count(); is_str(); return STRING;}
is_str()
{
int nu;
char c[nu-2];
nu=strlen(yytext);
int i;
for (i=1; i<nu-1; i++)
c[i-1]=yytext[i];
yyltok.strval=c;
}

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

bilbo0214

丰衣足食

论坛徽章:: 0

4楼 [报告]

发表于 2007-07-19 12:50 |只看该作者

下面这个如何：
%x string

\" { BEGIN(string); }
<string>[^\n]\"\n { BEGIN(INITIAL); }

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

prolj

荣誉版主

论坛徽章:: 0

5楼 [报告]

发表于 2007-07-19 15:28 |只看该作者

原帖由 bilbo0214 于 2007-7-19 12:50 发表
下面这个如何：
%x string

\" { BEGIN(string); }
[^\n]\"\n { BEGIN(INITIAL); }

不太明白，请问{ BEGIN(string); }和{ BEGIN(INITIAL); }是Lex提供的函数吗？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

bilbo0214

丰衣足食

论坛徽章:: 0

6楼 [报告]

发表于 2007-07-19 18:51 |只看该作者

可以看一下Lex&Yacc这本书。
BGIN相当于LEX提供的函数，这个与处理注释的方法是一致的。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

cjaizss

版主

论坛徽章:: 3

7楼 [报告]

发表于 2007-07-20 13:38 |只看该作者

原帖由 prolj 于 2007-7-19 15:28 发表

不太明白，请问{ BEGIN(string); }和{ BEGIN(INITIAL); }是Lex提供的函数吗？

lex提供，表示状态转移,INITIAL表示默认状态。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

zszyj

丰衣足食

论坛徽章:: 0

8楼 [报告]

发表于 2007-08-01 11:21 |只看该作者

原帖由 prolj 于 2007-7-18 18:42 发表
以"开始，以"结束，中间任何字符都合法，包括""、" "、"\n"、"\t"......
我不知道，试了几个都不行。
比如：\"[^"]\"，就匹配不了，向大家请教一下。

我用的是: \"[^"]*\"
用了很多年了,没有问题啊.

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

bilbo0214

丰衣足食

论坛徽章:: 0

9楼 [报告]

发表于 2007-08-01 12:32 |只看该作者

\"[^"]*\"
有可能会导致lex缓冲区溢出，对于小应用很少出现这种情况，可以如果字符串很长很长的话就会出现问题。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

zszyj

丰衣足食

论坛徽章:: 0

10楼 [报告]

发表于 2007-08-02 03:18 |只看该作者

原帖由 bilbo0214 于 2007-8-1 12:32 发表
\"[^"]*\"
有可能会导致lex缓冲区溢出，对于小应用很少出现这种情况，可以如果字符串很长很长的话就会出现问题。

晕，你说的是两个不同的问题啊．　ＬＺ问的是STRING的正则表达式如何定义的问题．　而你说的是扫描出来的词很大时如何缓存和传出的问题，这根本是两码事啊．
对于你说的问题，如果字符串很长的情况，你完全可以定义自已的YYSTYPE类型，预先从堆分配足够的针对单个NODE的值保存对象的方式来解决啊．例如我就是这样定义的：
struct NodeVal {
NodeVal() { val = new char[OUTBUFMAX]; val[0]=0; type=0; len=0;}
~NodeVal() { if (val != NULL) delete[] val; }

NodeVal& operator=(const NodeVal& rhs)
{
if ( this != &rhs )
{
memcpy(this->val, rhs.val, rhs.len); this->val[rhs.len] = 0;
this->len = rhs.len;
this->type = rhs.type;
}
return *this;
}

char* val;
}

#define YYSTYPE NodeVal
解释时，保存值的内存就是你自已分配的了，不会占用lex的缓冲，　其中OUTBUFMAX是你要预计的最大的字符串大小，需要你提前定义．

使用时，我是这样使用的
\"[^"]*\" {
memcpy(yylval->val, yytext+1, yyleng-2);
yylval->len = yyleng-2;
yylval->val[yylval->len] = 0;
yylval->type = T_STRING;
return STRING;
}

当然，你完全可以加上判断，如果yyleng大于outbufmax时，报错终止解析．

[ 本帖最后由 zszyj 于 2007-8-2 03:20 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

返回列表

Chinaunix › 论坛 › 程序设计 › CPU与编译器 › 请教大家一下用Lex怎么识别字符串？

请教大家一下用Lex怎么识别字符串？ [复制链接]

浏览过的版块