Tips-R

【R】Rでテキストマイニング(第2回 ワードクラウドを作ってみる)

最強統計処理ツールRを用いて、テキストマイニングするシリーズの第2回目です。 (※編集中だけど、一旦公開します。なぜ??) 今回は、ちょっと前に流行ったこんな図を作ってみます。 準備すること パッケージのインストール パッケージのインストール方法…

【R】Rでテキストマイニング(第1回 イントロダクション)

フリーの統計処理プログラミングツール「R」を使って、テキストマイニング(文字列の分析等)を行う一連の流れを記録しておきたいと思います。急に、Rネタが出てきたのはなぜか?やっぱRは最強ツールだから、周囲から需要が出てきた!ま、多かれ少なかれ、そ…

【R】続・csvデータを読み込むときに出てくるエラーを解消したい。

最強の統計処理系オープンソースのプログラミング言語「R」において、初歩の初歩である、データの読み込みで苦戦しています。 以前、こんなエントリーを書きました。 demacassette2.hateblo.jp実は、これでは完全にエラーが解消したわけではございませんでし…

【R】Shift-JISエンコードのcsvファイルを文字化けせずに読み込む

以前苦戦していたRでのデータ読み込み問題に終止符が打たれました! 政府統計などのオープンデータをダウンロードしてそのままRで読み込みたいと思ってやってみると、「不正なマルチバイト文字があって読み込めないよー!」みたいなエラーが出る問題です。 …

【R】csvデータを読み込む時にいろいろエラーが出ることを解消したい

お手軽フリー統計ソフトRでのcsvデータの読み込み時のエラー対応について。 ざっくり言うと 読み込みたいcsvデータのエンコードを「UTF-8」に変換しておく 文字列や数値が混在しても混乱しないおまじない"as.is=T"を入れる それでも数値が文字列化しているな…

Rでパイチャート(円グラフ)応用編1

さて、久しぶりです。最強統計フリーソフト"R"の使い方記録シリーズです。このシリーズに流れなど存在しません。私がやりたいこと、必要になったことを思いついたときに記録するというスタイルです。ま、ほかのシリーズもそうなのですが。 今回は、Rでパイチ…

Rで散布図行列2

前回の「Rで散布図行列1」では、とりあえずエクセルではすぐにできないであろうグラフィック表現をすることで、Rのありがたさを実感しました。ここでは、さらにアドバンスっぽいことをトライします。と言っても、世の中に提供されている情報サイトを参考にし…

Rで散布図行列1

「Rでプロット」と「Rでデータ書き出し1」を受けて、今回はちょいと見た目にぐっとくるグラフィックを表現したいと思います。その名も散布図行列。散布図をたくさん行列の形で表現するというそのままの意味です。データは前回のものを用います。 例によって…

Rでデータ書き出し2(グラフィックの保存)

「Rでデータ書き出し1」では、R内で計算や処理されたデータをファイルで保存することを確認しました。今回は、プロットデバイスに表示されたグラフィック(一応インフォグラフィックス)をデータ保存することを確認します。 グラフィックの保存方法は大きく…

Rでデータ書き出し1(データ値の書き出し)

「データ読み込み2」では、単純なデータセットをRに読み込んでプロットしてみました。今回は、ちょっとデータを増やしてみます。この辺からエクセルよりもパワフルだということが実感できるかもしれません。 前回の流れから、GDPデータを拾ってきます。今度…

Rでデータ読み込み2(データの読み込みと処理)

「Rでデータ読み込み1」の回では、まず作業ディレクトリの変更を確認しました。 こんなの当たり前だろ!という声もあるかと思いますが、以外と忘れがちですし、これがないと全く先に進めません。(うっかり完全に忘れていて、イライラし続けることも多々あり…

Rでデータ読み込み1(ディレクトリの変更)

さて、Rネタが続きますが、あくまで自分のためです。 複数データをプロットの回では、matplotというコマンドを用いて複数データをまとめてプロットできました。こうゆうことが簡単にできるということがわかれば、なんだか世の中のデータをプロットしたいなぁ…

R言語向けテキストエディタ

前回のエントリでは、複数データ(簡単なベクトル)を同じグラフ内に描くことを確認しました。しかし、Rに限らない話ですがプログラミング言語を使う際、いちいち直接入力してられません。(Rではコードを入力する画面をコンソールと言います。) そうゆう悩…

Rでプロット(複数のデータを散布図で描く)

前回のエントリで、Rの超基礎的プロットを記録しました。 今日は、その基礎的プロットからちょっとだけ進歩。複数のデータ(時系列データなど)を同じ図の中に描くことをやってみます。 例によって、いきなりコードの紹介 x <- 1:10 y1 <- 0.8*x y2 <- 1.0*x…

Rでプロット(基礎)

Rでできることを基本から確認していきます。 できることなんて、ユーザーのアイデア次第で無限にあるので、私が主に使用している数値解析用の使い方を記録しておきます。 まずRをインストールして、コンソール立ち上げたら、白い画面に以下をコピぺしてエン…

Rの基礎

R これは、右という意味ではない。スペシャル統計解析用プログラミング言語「R」のことである。このRというソフトは、一般的にはほぼ知られていないのではないだろうか。しかしながら、自然科学系の学者、統計学者、経済学者など、大量のデータを扱い、統計…