免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2527 | 回复: 5
打印 上一主题 下一主题

求格式化文本的代码 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-10-07 16:54 |只看该作者 |倒序浏览
  1. <OPTION
  2.         value=119999>北京市</OPTION><OPTION value=110101>北京市东城区</OPTION><OPTION
  3.         value=119192>北京市西城区</OPTION><OPTION value=110103>北京市崇文区</OPTION><OPTION
  4.         value=119194>北京市宣武区</OPTION><OPTION value=110105>北京市朝阳区</OPTION><OPTION
  5.         value=119196>北京市丰台区</OPTION><OPTION value=110107>北京市石景山区</OPTION><OPTION
  6.         value=119198>北京市海淀区</OPTION><OPTION value=110109>北京市门头沟区</OPTION><OPTION
  7.         value=119111>北京市房山区</OPTION><OPTION value=110112>北京市通州区</OPTION><OPTION
  8.         value=119113>北京市顺义区</OPTION><OPTION value=110114>北京市昌平区</OPTION><OPTION
  9.         value=119115>北京市大兴区</OPTION><OPTION value=110116>北京市怀柔区</OPTION><OPTION
  10.         value=119117>北京市平谷区</OPTION><OPTION value=110228>北京市密云县</OPTION><OPTION
  11.         value=119229>北京市延庆县</OPTION>
复制代码
需要把上面html里选择标签的代码,格式化成python用到字典数组(有几百条),字典格式如下
  1. {'北京市':'119999','北京市宣武区':'119194'}
复制代码
不知道能发在这里求吗?先谢了

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
2 [报告]
发表于 2011-10-07 17:06 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
3 [报告]
发表于 2011-10-07 17:14 |只看该作者
把option标签<OPTION >  </OPTION >之间的文本,比如北京市作为key,value=11999的数字作为value,{'key1':'value1','key2':'value2'},比如 {'北京市':'119999'}

另外,文本换行没有规律,最好能组成这样
  1. {'key1':'value1',\
  2. 'key2':'value2'}
复制代码

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
4 [报告]
发表于 2011-10-07 18:09 |只看该作者
  1. awk 'ORS=" "' urfile | awk '{n=split($0,a,"=");for(i=2;i<=n;i++)print a[i]}' | awk -F "[<>]+" "NR==1{printf \"{'%s':'%s'\",\$2,\$1}{printf \",'%s':'%s'\",\$2,\$1}END{printf \"}\"}"
复制代码

论坛徽章:
0
5 [报告]
发表于 2011-10-07 18:55 |只看该作者
多谢版主了

论坛徽章:
0
6 [报告]
发表于 2011-10-07 23:04 |只看该作者
  1. awk -v RS="" -v FS='[=><]' 'BEGIN{printf "{"}{for(i=3;i<=NF;i+=5){if(j==1)printf ",";printf "\x027" $(i+1) "\x027:\x027" $i "\x27";j=1}}END{print "}"}'
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP