【R】Shift-JISエンコードのcsvファイルを文字化けせずに読み込む
以前苦戦していたRでのデータ読み込み問題に終止符が打たれました!
政府統計などのオープンデータをダウンロードしてそのままRで読み込みたいと思ってやってみると、「不正なマルチバイト文字があって読み込めないよー!」みたいなエラーが出る問題です。
これが出るとやる気が半減。。。
demacassette2.hateblo.jp
当時の解決策は、読み込むデータファイルのエンコードを「 UTF-8」に変換して保存し直すと、Rでは普通に読み込める、というものでした。ですが、これだと読み込まれた内容は文字化けしてしまいますし、ダウンロードしたデータを一個一個エンコード変換し保存しないといけません。これでは意味がない。そこで、再度手間のかからない方法を探してみました。すると。。。
出た!
qiita.com
結論的にはこれです。
data1<-read.csv(file("csvデータ/001-2.csv",encoding='cp932'))
あとは、好きに料理しちゃってくださいー。簡単だけど、なかなかたどり着けなかったコードですね。
やっぱり書籍でも勉強すべきかな。以下参考。
- 作者: 金明哲
- 出版社/メーカー: 森北出版
- 発売日: 2007/10/01
- メディア: 単行本(ソフトカバー)
- 購入: 36人 クリック: 694回
- この商品を含むブログ (64件) を見る
- 作者: P.スペクター
- 出版社/メーカー: 丸善出版
- 発売日: 2012/04/05
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~
- 作者: 横内大介,青木義充
- 出版社/メーカー: 技術評論社
- 発売日: 2014/02/18
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (6件) を見る
データサイエンティスト養成読本 R活用編 【ビジネスデータ分析の現場で役立つ知識が満載! 】 (Software Design plus)
- 作者: 酒巻隆治,里洋平,市川太祐,福島真太朗,安部晃生,和田計也,久本空海,西薗良太
- 出版社/メーカー: 技術評論社
- 発売日: 2014/12/12
- メディア: 大型本
- この商品を含むブログ (7件) を見る