免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 7638 | 回复: 5
打印 上一主题 下一主题

[其他] 字符集问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-10-13 08:59 |只看该作者 |倒序浏览
各位大虾:
    下面两行应该是浏览器将中文转换成别的字符集了,我如果在C程序中读到这些串后将其还原成原中文?
$%7BPRODUCT_NAME%7D
%E4%B9%A6%E6%97%97%E5%85%8D%E8%B4%B9%E5%B0%8F%E8%AF%B4
%E5%BC%80%E5%BF%83%E6%B0%B4%E6%97%8F%E7%AE%B1

      求各位指教,小弟在线等!

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
2 [报告]
发表于 2012-10-13 10:04 |只看该作者
本帖最后由 linux_c_py_php 于 2012-10-13 11:43 编辑
  1. [root@vps616 php]# php main.php
  2. ${PRODUCT_NAME}
  3. 书旗免费小说
  4. 开心水族箱[root@vps616 php]# cat main.php
  5. <?php
  6. $content = <<<EOF
  7. $%7BPRODUCT_NAME%7D
  8. %E4%B9%A6%E6%97%97%E5%85%8D%E8%B4%B9%E5%B0%8F%E8%AF%B4
  9. %E5%BC%80%E5%BF%83%E6%B0%B4%E6%97%8F%E7%AE%B1
  10. EOF;

  11. echo urldecode($content);
  12. ?>
复制代码
额, 是C代码, 写了个, 感觉有点糟烂.
  1. urldecode=0 out=${PRODUCT_NAME}书旗免费小说开心水族箱
  2. [root@vps616 c]# cat main.c
  3. #include <stdio.h>
  4. #include <stdlib.h>
  5. #include <string.h>

  6. int urldecode(const char *in, int *in_size, char *out, int *out_size) {
  7.    if (!in || !out || !in_size || !out_size)
  8.        return -1;

  9.    int indx, ondx;

  10.    for (indx = ondx = 0; *in_size > 0 && *out_size > 0; -- *out_size, ++ ondx) {
  11.         int drain = 0;

  12.         if (in[indx] == '+') {
  13.             out[ondx] = ' ';
  14.             drain = 1;
  15.         } else if (in[indx] == '%') {
  16.             if (*in_size < 3)
  17.                 return 0;

  18.             int  i;
  19.             char base_chr;
  20.             char out_byte = 0;
  21.             
  22.             for (i = 1; i < 3; ++ i) {
  23.                 int index = indx + i;
  24.                
  25.                 if (in[index] >= '0' && in[index] <= '9')
  26.                     base_chr = '0';
  27.                 else if (in[index] >= 'a' && in[index] <= 'z')
  28.                     base_chr = 'a' - 10;
  29.                 else if (in[index] >= 'A' && in[index] <= 'Z')
  30.                     base_chr = 'A' - 10;
  31.                 else
  32.                     return -1;
  33.                 out_byte = (out_byte << 4) | (in[index] - base_chr);
  34.             }

  35.             out[ondx] = out_byte;
  36.             drain = 3;
  37.         } else {
  38.             out[ondx] = in[indx];
  39.             drain = 1;
  40.         }
  41.         
  42.         indx += drain;
  43.         *in_size -= drain;
  44.    }

  45.    return 0;
  46. }

  47. int main(int argc, char* const argv[]) {
  48.     const char *in = "$%7BPRODUCT_NAME%7D"
  49.                      "%E4%B9%A6%E6%97%97%E5%85%8D%E8%B4%B9%E5%B0%8F%E8%AF%B4"
  50.                      "%E5%BC%80%E5%BF%83%E6%B0%B4%E6%97%8F%E7%AE%B1";
  51.    
  52.     int in_size = strlen(in);
  53.     int out_size = in_size;
  54.     char *out = calloc(1, out_size + 1);
  55.     int ret = urldecode(in, &in_size, out, &out_size);
  56.     printf("urldecode=%d out=%s\n", ret, out);
  57.     free(out);
  58.     return 0;
  59. }
复制代码

论坛徽章:
59
2015年亚洲杯之约旦
日期:2015-01-27 21:27:392015年亚洲杯之日本
日期:2015-02-06 22:09:41拜羊年徽章
日期:2015-03-03 16:15:432015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015元宵节徽章
日期:2015-03-06 15:50:392015年亚洲杯之阿联酋
日期:2015-03-19 17:39:302015年亚洲杯之中国
日期:2015-03-23 18:52:23巳蛇
日期:2014-12-14 22:44:03双子座
日期:2014-12-10 21:39:16处女座
日期:2014-12-02 08:03:17天蝎座
日期:2014-07-21 19:08:47
3 [报告]
发表于 2012-10-13 13:34 |只看该作者
lsv5,8741

if it is utf-8, is easy to decode...

论坛徽章:
0
4 [报告]
发表于 2012-10-16 14:02 |只看该作者
回复 2# linux_c_py_php


    谢谢大侠,您的操作系统用的是什么字符集?

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:50:28
5 [报告]
发表于 2012-10-16 17:38 |只看该作者
一看就是utf-8。
直接转成对应的16进制,然后decode。

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
6 [报告]
发表于 2012-10-16 21:59 |只看该作者
utf-8呀

together007 发表于 2012-10-16 14:02
回复 2# linux_c_py_php
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP