Chinaunix

标题: hpricot解析utf8页面出错in `gsub': invalid byte sequence in GBK (ArgumentError) [打印本页]

作者: yakczh_cu    时间: 2014-06-20 07:46
标题: hpricot解析utf8页面出错in `gsub': invalid byte sequence in GBK (ArgumentError)
  1. # encoding: utf-8
  2. require 'hpricot'
  3. content='<font color="#6466b3">AVIASLIDER – jQuery Slideshow</font>'

  4. doc = Hpricot(content)
  5.    
  6. font=doc.search("font")
  7. puts font.text
复制代码
排除掉页面其他部分,发现问题是出在这个连字符上 ,但是文件是utf8编码的, 为什么报错说invalid byte sequence in GBK
作者: Sevk    时间: 2014-07-09 15:00
提示: 作者被禁止或删除 内容自动屏蔽




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2