Chinaunix

标题: 页面里的"&S226;"是怎么产生的? [打印本页]

作者: netentsec    时间: 2008-03-18 10:20
标题: 页面里的"&S226;"是怎么产生的?
发现很多页面里有“&S226;”,这应该不是什么html的转义符号吧?

在baidu知道里搜一下,发现大量的页面里存在这个字符串
http://zhidao.baidu.com/q?word=% ... =ikaslist&rn=10

根据上下文判断,应该是“·”,用在
1)外国人姓名之间(罗伯特·巴乔)
2)书名章节名之间 (史记·高祖本纪)
3)类似于html中的<li>(列表)

为什么“&S226;”会在这么多页面里(错误的)存在?
问题出在哪里?
1)页面编辑工具的问题(或者输入法的问题)
2)编辑工具所在的中文OS的问题
3)存放页面的web服务器的问题(或者页面上传的问题)
4)搜索引擎抓取、分析页面的问题
5)我的浏览器的问题
作者: netentsec    时间: 2008-03-18 14:45
从下面的页面得到些启发
http://bbs.duzhe.com/viewthread.php?tid=8305

估计“&S226;”的本意是“•” [& #8226;](参见页面文章标题)
“•”(0x2022)在IE中显示为间隔号——貌似GBK中的“·”(0xA1A4)
http://www.fileformat.info/info/unicode/char/2022/index.htm

但问题是,“•”是怎么变成“&S226;”的?
特别的,“S”是怎么出来的?




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2