yakczh_cu 发表于 2017-04-20 22:25

`gsub': invalid byte sequence in GBK (ArgumentError)

本帖最后由 yakczh_cu 于 2017-04-20 22:51 编辑


# encoding: UTF-8
require 'hpricot'

content='''
<div class="bdsharebuttonbox">
      <a href="#"   title="分享到新浪微博">新浪微博</a>
</div>

'''

doc = Hpricot(content)

(doc/"a").each do |x|
puts x
end

报错    `gsub': invalid byte sequence in GBK (ArgumentError)
根据提示找到 /lib/hpricot/tag.rb:32行
"\"" + str.gsub('"', '\\"') + "\"" 好象是gsub的问题

arr = content.split("\n")

puts arr.length
arr.each do |x|
puts   "\"" + x.gsub('"', '\\"') + "\""
   
end


但是单独用gsub又没问题




Sevk 发表于 2018-09-14 16:48

页: [1]
查看完整版本: `gsub': invalid byte sequence in GBK (ArgumentError)