免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5168 | 回复: 1
打印 上一主题 下一主题

[文本处理] 求助对字符串进行编码UrlEncode [复制链接]

论坛徽章:
0
1 [报告]
发表于 2015-11-26 23:16 |显示全部楼层
a='%e6%88%91%e7%9a%84%e5%ae%b6%e5%9c%a8_19%e5%8f%b74%e6%a5%bc'
echo ${a//%/\\x}
    \xe6\x88\x91\xe7\x9a\x84\xe5\xae\xb6\xe5\x9c\xa8_19\xe5\x8f\xb74\xe6\xa5\xbc
eval echo $\'${a//%/\\x}\'
     我的家在_19号4楼
b=$(eval echo $\'${a//%/\\x}\')
echo $b
     我的家在_19号4楼


论坛徽章:
0
2 [报告]
发表于 2015-11-26 23:51 |显示全部楼层
送给楼主一个我自己写的  awk 转换 WEB编码的处理,使用比其他工具灵活。

echo "我的家在_19号4楼" |awk -F "" 'BEGIN{split("35,36,37,38,43,63,64",ExcStr,",");for(i in ExcStr)ExcString[sprintf("%c",ExcStr[i])]=1; for (i=0;i<=255;i++) a[sprintf("%c",i)]=i ;}{for(ii=1;ii<=NF;ii++){if(a[$ii]>=33 && a[$ii]<=126 && ExcString[$ii]!=1){printf "%c",a[$ii]}else{printf "%%%X",a[$ii]};}}'

结果:  %E6%88%91%E7%9A%84%E5%AE%B6%E5%9C%A8_19%E5%8F%B74%E6%A5%BC

注意:如果你的环境语言是 UTF-8 ,那么你要在开始之前加

export LANG=""

一个UTF8中等于3个字符,如果你的环境是 LANG="en_HK.UTF-8" ,那么一个中文当成一个字符处理。
split("35,36,37,38,43,63,64",ExcStr,",")  这个是排除编码,我随便写几个进去,比如说  反斜杠 \ ,他的 编码是 5c ,十进制就是 92,那么要 把\ 转成  %5C ,就把 92 写到排除列表中 就会自动转换。

当然你也改编我的思维,把排除效果做成   直接填写明文字符

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP