- 论坛徽章:
- 0
|
原帖由 bilbo0214 于 2007-8-1 12:32 发表 ![]()
\"[^"]*\"
有可能会导致lex缓冲区溢出,对于小应用很少出现这种情况,可以如果字符串很长很长的话就会出现问题。
晕,你说的是两个不同的问题啊. LZ问的是STRING的正则表达式如何定义的问题. 而你说的是扫描出来的词很大时如何缓存和传出的问题,这根本是两码事啊.
对于你说的问题,如果字符串很长的情况,你完全可以定义自已的YYSTYPE类型,预先从堆分配足够的针对单个NODE的值保存对象的方式来解决啊.例如我就是这样定义的:
struct NodeVal {
NodeVal() { val = new char[OUTBUFMAX]; val[0]=0; type=0; len=0;}
~NodeVal() { if (val != NULL) delete[] val; }
NodeVal& operator=(const NodeVal& rhs)
{
if ( this != &rhs )
{
memcpy(this->val, rhs.val, rhs.len); this->val[rhs.len] = 0;
this->len = rhs.len;
this->type = rhs.type;
}
return *this;
}
char* val;
}
#define YYSTYPE NodeVal
解释时,保存值的内存就是你自已分配的了,不会占用lex的缓冲, 其中OUTBUFMAX是你要预计的最大的字符串大小,需要你提前定义.
使用时,我是这样使用的
\"[^"]*\" {
memcpy(yylval->val, yytext+1, yyleng-2);
yylval->len = yyleng-2;
yylval->val[yylval->len] = 0;
yylval->type = T_STRING;
return STRING;
}
当然,你完全可以加上判断,如果yyleng大于outbufmax时,报错终止解析.
[ 本帖最后由 zszyj 于 2007-8-2 03:20 编辑 ] |
|