はじめてのR

Rを学ぶ最初の一歩、まずRの基本を知ろう

スライド資料(PDF形式)と演習用データ(Excel形式)のダウンロードはコチラ

はじめに [▶]

     説明を表示する


このセミナーは統計解析ソフトRの初学者向けのセミナーとなっており、Rの初期設定や基本操作について学習します。
まず「統計解析ソフトR」とはそもそも何なのか、よく使われているエクセルのデータ分析と何が違うのか、そして基本的な画面構成について説明します。
まずダウンロードからインストールまで、そしてコンソール画面の操作やエディタ画面の操作にいて学習します。またRにはいろんなパッケージがありますので、そのインストールや利用の仕方について説明します。メニュー構成やウィンドーの設定などについても触れていきます。

説明をたたむ

1.統計解析ソフト「R」の概要 [▶]

     説明を表示する


統計解析ソフトRの概要について説明します。
このRというのは統計解析とグラフを書くためのソフトウェアということです。元々はアメリカのAT&Tが開発したS言語がベースになっていますが、それをロス・イハカとロバート・ジェントルマンがR言語として開発しました。
無償のオープンソースですので誰でもフリーで使用することができ、またライブラリやパッケージが充実しているので大変便利、大規模なデータ処理にも対応可能であるというところも魅力です。
Rには3つの画面があります。一つ目はコマンドラインで1行ずつ実行するコンソール画面、二つ目はスクリプトを一括で実行させるエディタ画面、三つ目はグラフを表示するグラフィックス画面です。
実際のところ、R言語をそのまま使うということは殆どなく、R-StudioやR-Commanderといったパッケージを介して利用される場合が多いと思います。
したがってRを単独で使用するケースは少ないかもしれませんが、本セミナーはRの基礎知識を習得することを目的としているので、コンソール画面でコマンドを打ったり、スクリプトを実行する演習を行います。

説明をたたむ

2.エクセルではできない高度な分析 [▶]

     説明を表示する


エクセルではできない高度な分析について説明します
私もデータ分析ではエクセルをよく使うのですが、やはりどうしてもエクセルではできないケースが出てきます。
先ず、エクセルの分析というのは集計しっぱなしで結果の検証についてはできないといっても過言ではありません。(正確には実務上面倒であったり、マクロを組まないとできないものもある)例えば、エクセルでも相関係数を求めることができますが、その値が有意であるかの判定はできないのです。その点、このRは多種多様な検定ツールが揃っており、簡単に実行することができます。
2つ目の特徴は、統計解析には多変量解析という高度な分析手法があります。予測したり分類したり重要度を出したりするのですが、それらはビジネスにおける意思決定上大変有効なものとなっていますし、昨今の機械学習のベースにもなっています。
3つ目の特徴は、ビッグデータ解析にも対応している点です。エクセルでは100万行のデータしか扱えませんが、Rにはデータレコードの制限がありません。また、数量やカテゴリの集計だけではなく、文章データを解析して統計的に処理を行うテキストマイニングなどにも対応しています。
4つ目の特徴はこの高度なプログラミングができるというものです。例えば昨今のAIはPythonで動いていますが、統計解析のところだけRのモジュールを使うということもできます
5つ目の特徴は多彩なグラフ機能です。例えば統計でよく使う「箱ひげ図」や「散布図」や「ヒストグラム」などを描くことができます。

説明をたたむ

3.ダウンロードとインストール [▶]

     説明を表示する


Rのインストールのやり方について説明いたします
まずインストールプログラムをダウンロードします。「CRAN」で検索して統計数理研究所のサイトを選択します。次にOS(この演習ではWindows)を選択して、 baseを選んでダウンロードを実行します。インストールプログラムをダブルクリックして、インストールを開始します。

説明をたたむ

4.Rの基本操作 [▶]

     説明を表示する


基本操作について説明します
R言語では、演算子や関数を使って数値計算をしたり、その結果をオブジェクトに格納したり、あるいはデータファイルを読み込んだり、グラフを作成することができます。またパッケージを利用する場合はlibrary(パッケージ名)でロードして使用することができます。
演習ではコンソール画面でいくつかのコマンドを打ちこみますが、詳細については動画をご覧ください。

説明をたたむ

  コンソール画面の操作 [▶]

5.エディタ画面での操作 [▶]

     説明を表示する


Rのエディタ機能について説明いたします。
コンソール画面で1行ずつコマンドを打って実行しましたが、スクリプト画面ではコマンドの塊を一連のプログラムとして登録し、それを実行したり編集したりすることができます。
実行する場合は、1行ずつ実行することもできますし、範囲選択して実行することもできます。メニューから実行することもできますし、ショートカットキー(Ctrl+r)でも実行できます。
実行したスクリプトと出力結果はコンソール画面やグラフィック画面に表示されます。
詳細については動画をご覧ください。

説明をたたむ

6.パッケージの利用 [▶]

     説明を表示する


Rには目的に応じた様々なパッケージがあります。
デフォルトの状態ではインストールされていませんので、任意のミラーサイトから
ダウンロードしてインストールする必要があります。
ここでは「ggplot2」というパッケージのインストールと使い方について説明します。
パッケージを読み込むにはlibraryというコマンドを使います。実行結果は、グラフィックス画面に表示されます。
詳細については動画をご覧ください。

説明をたたむ

7.ファイルメニュー [▶]

     説明を表示する


Rコンソールのファイルメニューについて説明します。
Rコンソール画面の左上に「ファイル」というボタンがあります。
この中に、新しいスクリプトを作成したり編集する機能や、一連の作業環境を登録しておく作業スペースという機能、打ち込んだコマンドを記憶する履歴機能、などがあります。
作業スペースというは「タスク」と捉えることができます。例えばある期間の売上データや商品マスタなどのデータソースとそれを分析するスクリプトを一つのタスクとして登録しておくと、次からそのタスクを呼び出すことで作業の続きが行えます。
作業スペースと混同しやすいのが、作業ディレクトリという概念です。これはWindowsで言えばフォルダに該当しますが、データやスクリプトを読み書きする場所のことをそのように呼びます。

説明をたたむ

8.ウィンドーの設定 [▶]

     説明を表示する


3つの画面を独立して表示させる方法について説明します。
Rの3つの画面は、デフォルトでは1つのウィンドー内に表示(MDIモード)されます。しかし、先程のggplot2などのパッケージを利用する場合は、グラフィックス画面だけ呼び出せばいいわけで、その都度コンソール画面も一緒に出てくると鬱陶しいですよね。Rではこの3つの画面を分割し単独で表示させる(SDIモード)ことができます。
その設定方法については動画をご覧ください。

説明をたたむ

RをGUIで操作できるRコマンダーで統計解析をしよう