免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2034 | 回复: 0
打印 上一主题 下一主题

在GDB中查看 C/C++ Unicode文本变量内容(wchar_t*) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-07-19 12:22 |只看该作者 |倒序浏览
GDB(The GNU Project Debugger)中的 print 命令不支持查看 C/C++ Unicode文本变量的内容(wchar_t*)。
假设我们要调试以下 C/C++ 代码:
#include
int main()
{
    const char* szAnsi = "The EF programming language is a general-purpose, simple, easy to use, "
                         "efficient, practical, object-oriented and cross-platform language. ";
    const wchar_t* szUnicode = L"“易语言.飞扬”是一门简单易学、高效实用、面向对象、跨平台的计算机通用编程语言。";
    return 0;
}
在第 8 行(return 0;)中断后,可以用 print 命令显示出 const char* 变量 szAnsi 中的文本内容,但却无法显示 const wchar_t* 变量 szUnicode 中的文本内容:
(gdb) b 8
Breakpoint 1 at 0x80880e3: file test.cpp, line 8.
(gdb) r
Starting program: /home/dywt/test
Breakpoint 1, main () at test.cpp:8
8               return 0;
(gdb) print szAnsi
$1 = 0x80881cc "The EF programming language is a general-purpose, simple, easy to use, efficient, practical, object-oriented and cross-platform language. "
(gdb) print szUnicode
$2 = (const wchar_t *) 0x8088258
(gdb) print szUnicode[0]
$3 = 8220

从上面的执行结果可以看到,print 只能显示出 wchar_t* 文本变量的地址,并不直接显示出其中的文本内容,甚至连单个Unicode字符也显示不出来(只显示Unicode代码)。这个就比较讨厌了。
在实际调试工作中,迫切需要直接查看Unicode文本变量的内容。我们给出的解决方案是,通过 .gdbinit 文件给 GDB 增加一个 wprint 命令,用于显示 wchar_t* 变量值。
主要实现原理是,先将Unicode文本内容存储到一个临时文件中,然后调用另外一个程序读取文件内容并显示出来。
具体操作方法如下:
首先,请将以下内容存储为 ~/.gdbinit 文件,或添加到原有文件中:
define wprint
        set $fd = open("/tmp/dywt.gdb.wprint", 577)
        set $x = write($fd, $arg0, wcslen($arg0) * sizeof(wchar_t))
        set $y = close($fd)
        shell dywt.gdb.wprint
end
document wprint
        print the content of unicode text variable (wchar_t*)
        for example: wprint unicode_text_var_name
end
其中,我们调用了一个外部可执行程序,dywt.gdb.wprint,其 C/C++ 源代码如下:
#include
#include
#include
#include
int main()
{
        setlocale(LC_ALL, "");
        const char* file_name = "/tmp/dywt.gdb.wprint";
        FILE* f = fopen(file_name, "rb");
        if(f == 0)
        {
                printf("Open '%s' error! ", file_name);
                return -1;
        }
        fseek(f, 0, SEEK_END);
        long file_size = ftell(f) + 1;
        fseek(f, 0, SEEK_SET);
        wchar_t* buf = (wchar_t*)malloc(file_size + sizeof(wchar_t));
        int r = fread(buf, 1, file_size, f);
        buf[file_size / sizeof(wchar_t)] = 0;
        printf("%s\n", buf); //较原文稍作修改
        free(buf);
}
将以上代码编译为可执行程序 dywt.gdb.wprint,复制到 /usr/bin 目录下即可。
(注:以上实现中,好象不能省略临时文件 /tmp/dywt.gdb.wprint。GDB中的 $var 采用文本替换机制,即,如果把 $arg0 当作参数传递给 dywt.gdb.wprint,实际接收到的是文本 "$arg0" 。)
实际使用中,wprint 用法与 print 完全相同:
(gdb) print szAnsi
$1 = 0x80881cc "The EF programming language is a general-purpose, simple, easy to use, efficient, practical, object-oriented and cross-platform language. "
(gdb) wprint szUnicode
“易语言.飞扬”是一门简单易学、高效实用、面向对象、跨平台的计算机通用编程语言。

以上是在实践中摸索出来的方法,不敢私藏,特拿出来与大家分享。应该还有更好的解决方案,我们暂时没有发现而已,期待高人指点。

本文来自CSDN博客,转载请标明出处:
http://blog.csdn.net/efdev/archive/2007/12/19/1953396.aspx


本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/86948/showart_2000412.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP