免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4873 | 回复: 8
打印 上一主题 下一主题

将url中的编码转换成汉字的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-01-22 10:18 |只看该作者 |倒序浏览
val="submitbtn=%CC%E1%BD%BB%C1%D0%B1%EDpara_area1=%C4%CF%BE%A9para_ip1=10.121.1.97"

printf -v val "%b" "${val//\%/\\x}."

上面的语句可以将ASCII码转化成汉字, val 是一个变量,还有没有其它的方法实现上面的语句呢?

主要是我板子上的busybox的printf没有 -v 参数,不知道该怎么解决,所以想换一种方法。

[ 本帖最后由 daniel_kohler 于 2010-1-22 12:34 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2010-01-22 10:36 |只看该作者
${val/#\%/\\x}

论坛徽章:
0
3 [报告]
发表于 2010-01-22 10:59 |只看该作者
原帖由 nigelrax 于 2010-1-22 10:36 发表
${val/#\%/\\x}


-sh-2.05b#
-sh-2.05b# val="submitbtn=%CC%E1%BD%BB%C1%D0%B1%ED&para_area1=%C4%CF%BE%A9&para_ip1=10.121.1.97"
-sh-2.05b# echo $val
submitbtn=%CC%E1%BD%BB%C1%D0%B1%ED&para_area1=%C4%CF%BE%A9&para_ip1=10.121.1.97
-sh-2.05b# val=${val/#\%/\\x}
-sh-2.05b# echo $val         
submitbtn=%CC%E1%BD%BB%C1%D0%B1%ED&para_area1=%C4%CF%BE%A9&para_ip1=10.121.1.97
-sh-2.05b#

论坛徽章:
0
4 [报告]
发表于 2010-01-22 12:16 |只看该作者

回复 #1 daniel_kohler 的帖子

其实就是将html通过boa传递给cgi的url转换为汉字,这个大家明白不?

论坛徽章:
0
5 [报告]
发表于 2010-01-22 13:10 |只看该作者

回复 #1 daniel_kohler 的帖子

自问自答:
本来是很简单的一句,没想到要用这么长的语句替换。


  1. echo "adsfkjladsjf%E0%E0" | awk '
  2. BEGIN {
  3.         hextab="0123456789ABCDEF"
  4.         for ( i=1; i<=255; ++i ) ord [i] = sprintf("%c",i);
  5. }
  6. {
  7.         decoded = ""
  8.         for ( i=1; i<=length ($0); ++i ) {
  9.                 c = substr ($0, i, 1)
  10.                 if ( c ~ /[a-zA-Z0-9.-]/ ) {
  11.                         decoded = decoded c # safe character
  12.                 }
  13.                 else if ( c == " " ) {
  14.                         decoded = decoded "+" # special handling
  15.                 } else if ( c == "%" ) {
  16.                         hi= substr($0,i+1,1);
  17.                         low=substr($0,i+2,1);
  18.                         i++;i++
  19.                         decoded = decoded ord[(index(hextab,hi)-1)*16+index(hextab,low)-1]
  20.                 }
  21.         }
  22. }
  23. END{print decoded}
复制代码

[ 本帖最后由 daniel_kohler 于 2010-1-22 13:13 编辑 ]

论坛徽章:
0
6 [报告]
发表于 2010-01-22 14:55 |只看该作者

  1. 1#!/usr/bin/perl                                                                                                                                                
  2. 2use utf8;                                                                                                                                                      
  3. 3use Encode qw(decode);                                                                                                                                         
  4. 4binmode STDOUT, ":encoding(encoding_of_your_environment)";                                                                                                                             
  5. 5$str = "%CC%E1%BD%BB%C1%D0%B1%ED";                                                                                                                             
  6. 6                                                                                                                                                               
  7. 7push @octets, hex for $str =~ /%(..)/g;                                                                                                                        
  8. 8$octets = pack "c*", @octets;                                                                                                                                 
  9. 9print decode "gbk", $octets;
复制代码

论坛徽章:
0
7 [报告]
发表于 2010-01-22 15:02 |只看该作者

回复 #6 lululau 的帖子

谢谢你提供的方法,但我对perl不熟,最初只是想替换一个语句而已。

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
8 [报告]
发表于 2010-01-25 11:56 |只看该作者
waker斑竹的方案如何?
http://bbs.chinaunix.net/thread-982743-1-1.html

论坛徽章:
0
9 [报告]
发表于 2010-01-25 12:30 |只看该作者
原帖由 Shell_HAT 于 2010-1-25 11:56 发表
waker斑竹的方案如何?
http://bbs.chinaunix.net/thread-982743-1-1.html


谢了

看了一下,有些情况解析的不正确,要自己自己修改一下。

例如 %5A
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP