cdsfiui 发表于 2016-09-18 18:40

能否用lex来分析已知格式的二进制的数据流?

学lex的时候,都是用lex来写一个正则式,来分析文本格式的输入源。
我的想法是,能否用lex来分析二进制流,例如很多已知的图像格式和视频格式,也都是某种固定的格式,只不过不是文本的。它们能否通过lex来建立一个自动化的流解析工具?

lex/flex/yacc/bison支持二进制数据定义和分析吗? 如果不能的话,有没有相应的工具能做到?

MMMIX 发表于 2016-09-18 21:48

回复 1# cdsfiui

http://cs.stackexchange.com/questions/899/why-is-using-a-lexer-parser-on-binary-data-so-wrong

cdsfiui 发表于 2016-09-19 13:56

MMMIX 发表于 2016-09-18 21:48
回复 1# cdsfiui

http://cs.stackexchange.com/questions/899/why-is-using-a-lexer-parser-on-binary- ...

你是说,可以用于2进制?问题是,2进制格式的话,正则式怎么写呢?

举个例子,例如我们的文本格式可以区分字母和数字。
数字12开头的称为Head,34开头的称为Tail,文本格式的lex可以写成

Head:12
Content:*
Tail:34

那么12abc34xyz12可以解释为

Head Content Tail Content Head Content
--------------------------------------------------
而我的需求是,把输入当成字节流:
遇0x01 0x02就判定为Head, 遇到0x03 0x04就判定为Tail,其余的和上面的例子相同。

问题: 这个lex的正则表达式规则应该怎么写?

其实我的问题就在于lex的规则如何处理2进制值的情况,而不是文本的情况。
希望我表述清楚了。谢谢。
页: [1]
查看完整版本: 能否用lex来分析已知格式的二进制的数据流?