免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3855 | 回复: 6
打印 上一主题 下一主题

请教前辈——linux下的中英文混合的url编码程序 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-08-28 11:01 |只看该作者 |倒序浏览
我最近做一个linux下自动顶帖子的工具,用wget自动登录。

可是post的时候中文要用url编码,不知道有没有linux的程序,可以直接调用的

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
2 [报告]
发表于 2007-08-28 11:44 |只看该作者
LANG=C awk 'BEGIN{for(i=1;i<256;i++)char[sprintf("%c",i)]=i+0}
{for(i=1;i<=length($0);i++){
c = substr ($0, i, 1)
if ( c ~ /[a-zA-Z0-9.-]/ ) printf c
else if (c==" ") printf "+"
else printf "%%%02X",char[substr($0,i,1)]}}'

没测试,大概就这个意思

论坛徽章:
0
3 [报告]
发表于 2007-08-28 11:57 |只看该作者

回复 #2 waker 的帖子

大法师前辈

为什么要在最前面设置环境变量lang=c, c是什么编码?

论坛徽章:
0
4 [报告]
发表于 2007-08-28 14:29 |只看该作者

大法师,有个问题没想明白

我用了你的那个url encode的脚本。

如果我的字符串是通过echo 管道传进去,显示的和firefox的编码结果一致;

如果把字符串写在一个文件里,通过cat 管道传进去,显示的就不同。用wc查看那个文件,也比字符串本身多出来几个字符,到底多出来了什么嗫,怎么把它们去掉?

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
5 [报告]
发表于 2007-08-28 14:33 |只看该作者
1.你的文件与终端的字符集一致么?
2.\n有没有计算在内?

论坛徽章:
0
6 [报告]
发表于 2007-08-28 14:36 |只看该作者

回复 #5 waker 的帖子

大法师,我该用什么命令去查看或者改变 终端与文件的字符集

我在终端输出的编码是%C7%E9%D6%D6%D2%D1%B7%A2%D1%BF ,这与firefox的相同

我在文件里输出的编码是%E6%83%85%E7%A7%8D%E5%B7%B2%E5%8F%91%E8%8A%BD , 最后一个不是换行呀。而且我用wc 看了,只有1行文件

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
7 [报告]
发表于 2007-08-28 15:16 |只看该作者
你的文件是UTF-8的,终端显示是GBK的
用iconv -f UTF-8 -t GBK转换一下文件或者直接

echo 情种已发芽 >urfile
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP