×
Apr 1, 2012 · ... Mechanize.new agent.get(url) text = agent ... 文字列の中身としてはShift-JISの ... しばらく前から、Sleipnir(というかIE)がやたら文字化けする…
Jul 31, 2011 · Mechanizeを使ってスクレイプしてるとUTF-8以外のページでうまくいかないことがあるので、その対策です。 http://blog.cles.jp/item/3416 から ...
mechanizeのバージョンは1.0.0です。 ○問題 mechanizeでhtmlをparseすると文字化けすることがあります。 ○原因 ・mechanizeは内部的にnokogiriを使っている ...
Mar 27, 2011 · 一番の原因は、日本語マルチバイトの壁。 使っていても「Wide Characterうんたら」というエラーが出たり、文字コードの扱いがうまくいってい ...
Feb 11, 2010 · RubyのMechanizeはスクレイピングをするときにとても便利なライブラリですが、UTF-8以外のページだとどうしてもうまく取得出来ないページがあって困っ ...
最近、LWPやWWW::Mechanizeを2007年頃のバージョンから最新のバージョンにしたら、文字コードで色々ハマったのでメモっておきます。
Sep 14, 2013 · 引き続きkoboをクローリングする文脈で、です。 irb(main):001:0> require 'mechanize' => true irb(main):002:0> agent = Mechanize.new => # ...
rubyのmechanizeを使うとwebページの文字コードを強制的にasciiにされる。それを正しい文字コードに変換する方法メモ。 文字コードをasciiからutf8(またはeuc)に変換 ...
Dec 29, 2014 · Ruby Mechanize の文字コードエンコーディング変換 ... 最近はやり方が大部スマートになってるんですね。 encoding変換部分がフックできるようになっている ...