14 R Studio で R
いよいよ、プログラミング言語 R を使って、データサイエンスを始めます。RStudioで R をすでに、使い始めておられる方も、ざっと読んでおかれることをお勧めします。R Markdown についてと、Posit Cloud というクラウドサービスの利用方法についても、述べてあります。
14.1 はじめに
この章では、R と R Studio をインストールし、正常に動作しているかを、確認することを目標とします。実際の、使い方は、次の章以下で、述べます。
また、Posit Cloud など、R Studio 以外で、R を使う方法も、最後に述べます。特に、Posit Cloud は、一定の制限はあるものの、基本的には、R Studio で R を使うのと、同様のことが可能な、Cloud 環境ですので、R と R Studio のインストールに成功した場合も、利用方法を確認してください。
確認の段階で、エラーが出てしまった場合の解決方法も、下に書きますが、まずは、Posit Cloud など、他の方法でR を使えるようにして、時間のあるときに、解決を試みてください。
注:この部分を書いている、2023年では、ほとんど、インストールについては、ほとんど問題がないようですが、Windows ユーザの、OneDrive 問題は、まだ、一部残っているようですので、確認していただくことをお勧めします。
14.2 R と R Studio
R is a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS. https://www.r-project.org
R は、無償で提供されている、統計解析ともに、データサイエンスにおいてたいせつな可視化のためのグラフを描写する環境でもあります。Windows、MacOS や、Linux で利用することが可能です。
RStudio is an integrated development environment (IDE) for R and Python. It includes a console, syntax-highlighting editor that supports direct code execution, and tools for plotting, history, debugging, and workspace management. RStudio is available in open source and commercial editions and runs on the desktop (Windows, Mac, and Linux). https://posit.co/products/open-source/rstudio/
RStudio は、R と Python のための、総合開発環境(IDE)です。RStudio には、プログラムを実行したり、制御やジョブ管理のための、コンソール(console)、コードを書いたり、実行したりする、文書の編集をする、エディター(Editor)とともに、グラフを表示したり、履歴や、プログラムを修正するなどのための、さまざまなツールが付属しています。RStudio はオープンソースで提供され、Windows、Mac および、Linux で利用可能で、有償版のサービスと無償版を提供しています。
R は、統計解析のためのシステムで、R Studio は、R(および Python)を利用するための、総合開発環境です。そこで、「R Studio で R を利用する」という表現をします。
14.3 R と R Studio のインストール
R と R Studio をインストールします。
両方とも、インストールすることが必要です。
今後のために、動作確認を、RNotebook を使って行います。
注意
以下は、自分のコンピュータ、すなわち、管理者権限があるコンピュータにインストールすることを前提に書きます。
家族で、コンピュータを共有していて、管理者権限がない場合は、管理者権限のあるかたに、R と RStudio をインストールしてもらってください。そうすれば、そのコンピュータの他のアカウントでも利用することができます。
ある制約がかかるとメッセージが出ますが、管理者権限なしで、インストールすることも可能です。特別の事情があり、管理者権限なしで、インストールする場合は、こちらを参照してください。
14.3.1 R のインストール
上のリンクから、Windows、macOS または、Linux を選択して、インストールしてください。
Windows の場合は、base - install R for the first time を選択してください。
macOS の場合は、M1, M2 など、最近の Apple Silicon の CPU で動くコンピュータか、以前の、Intel の CPU で動くものか、選択してください。Mac の左上の、りんごマークの、このコンピュータについてから、確認できます。
不明の場合は、「R のインストール」と検索してみてください。
14.3.2 R Studio の インストール
http://www.rstudio.com/download
上のリンクから、Windows 10/11 または、macOS 11+ を 選択してください。これら以外の、古いシステムのコンピュータの場合は、 下のサイトから、探してください。
https://docs.posit.co/previous-versions/
不明の場合は、「RStudio のインストール」と検索してみてください。
14.3.3 動作確認
動作確認のための、一連の流れを書き、その下に、問題が起こった場合の対処を書きます。
R Studio はこれまでも使っていたが、R Notebook は使ったことがないという方も、同様の確認をしてください。
- RStudio を立ち上げます。
- 上のメニューの File から、New Project を選択します。
- Project の名前を(test とか、firstproject など)つけて、Create ボタンを押します。
- 上のメニューの File から、New File の R Notebook を選択します。
- Package が必要なので、Install するかと聞かれますから、インストールを選んでください7。
- File から、Save as を選んで、名前を(test0, rnotebook など)とつけ、Preview ボタンを押すと、内容が現れます。
- Preview ボタンの右の、三角印を押すと、Knit PDF と現れますから、それを選択
- すでに、TeX というシステムを使っておられる方は、PDF が作成されますが、それ以外の方は、なにやらメッセージが出て、TeX システムが無いと出ると思います。
- 左下の、Console タブに、
tinytex::install_tinytex()
をコピーして、入力し、Enter または、Return キーを押し実行します。 - もう一度、Kit PDF を(今度は、Preview ボタンが、Knit となっていると思います。その右の三角から Knit PDF を選択し)押し実行します。
この一連の作業で、最後に、PDF が現れれば、動作確認終了です。クラウド Posit Cloud の項目に進んでください。
ステップ5まで終了すれば、PDF を作成しない限り、問題はありませんので、あとは、時間のあるときに、対応することも可能です。
14.3.4 トラブル・シューティング(1)
動作確認のステップ 4 (またはステップ5で要求されるパッケージのインストール時点)または、6 でエラーが出る場合があります。
-
動作確認の ステップ 4で、パッケージをたくさんインストールしますが、この段階で、エラーが出る場合があります。そのときは、まず、RStudio の上のメニューの、Tools の一番下の、Global Options を開き、左のメニューから、Packages を選び、Primary CRAN Repository を Change として、CRAN mirror から、Japan: The Institute of Statistical Mathematics, Tokyo を選択してください8。
- 解決しない場合は、下の、解決しない場合はに進んでください。
-
動作確認のステップ 4では、問題なく、パッケージのインストールが完了したが、6で、エラーが出た場合には、Windows の日本語アカウント名の問題の可能性が高いと思います。OneDrive の問題の可能性もないとは言えませんが、次を試してみてください。
- TinyTeX のアンインストール:
tinytex::unstall_tinytex()
を コンソールで実行 - Windowsの自分のアカウントからサインアウトし、サインインしなおす
- TinyTeX をディレクトリを指定してインストール:
tinytex::install_tinytex(dir = "C:/myTinyTeX")
を コンソールで実行 - サインアウトし、サインインしなおす
- 上の動作確認のステップ6、R Notebook から knit PDF を利用して、PDF を作成する。
- 解決しない場合は、下の、解決しない場合はに進んでください。
- TinyTeX のアンインストール:
-
解決しない場合は、下の囲みの中を読んでください。Windows の、OneDrive 関連の問題の可能性が高いかと思います。
- その後に書いてあるように、R と RStudio を一度、アンインストールします。(この作業はしなくても、おそらく問題ないと思いますが、安全のためにアンインストールします。)
- もう一つ別の管理者権限のあるアカウントを(半角ローマ字名で)下の指示に従って作成して、そのアカウントにサインインして、上の、1から6を試してください。
- 問題なく、1から6が完了したら、しばらく、そちらのアカウントを利用してください。それ以降については、また下に書きます。
-
別のアカウントでも、問題が解決しない場合は、コンピュータに詳しい方に相談してください。わたしのホームページにある、メールアドレスから、わたしに相談するときは、次の三つの情報をコピー・ペーストして、教えてください。
- 上の手順のどこでどのような問題が生じたか、そのときの、エラーメッセージ
-
Sys.getenv()
の出力 - Windows の場合、コマンド・プロンプトから、
systeminfo
と入力したときの出力
注意:Windows における既知の不具合について
Sys.getenv('HOME')
と、Sys.getenv('R_LIBS_USER')
をそれぞれ、コピーして、RStudio 左下の窓枠の Console タブに、ペーストして、エンターして、???? や、カタカナ、漢字や、OneDrive という文字列が現れるか確認してください。Sys.getenv()
とすれば、すべての環境変数を確認することもできます9。
Windows の日本語システムで、アカウント名に日本語を使っておられる方、または、OneDrive を使っていて、Documents(書類)ディレクトリーのすべてをバックアップしておられる方は、ファイルを作成したり、パッケージをインストールするときに、問題が発生する可能性があります。
カタカナや漢字のユーザネームを使っている場合は、RMarkdown で、文書を作成し、PDF で出力するときには、問題が起こります10。解決方法は上に書いたように、一つの解決方法として、TinyTeX を、Home とは異なるところにインストールしています11。
OneDrive で、ドキュメントフォルダ全体のバックアップをとっている場合も、問題が起こる可能性がありますが、一般的には書けませんので、困ったときは、下に書く方法を参照してください12。
14.3.4.1 トラブル・シューティング(2)
トラブル・シューティング(1)では解決できない場合の対処法を書きます。わたしは、MacOS では、動作確認の1から6で、問題が起こったと聞いたことがないので、以下では主として、Windows に限って書きます。
実際には、さまざまな理由がありますから、以下の方法では対処できないかもしれません。まず、エラーメッセージを丁寧に見ることが大切ですが、簡単には理解できない場合が多いかと思います。そこで、まず、試してみる方法を以下に書きます。
14.3.4.1.1 R および RStudio のアンインストール
どのようなアプリも、本来はインストールと同時に、アンインストール(アプリを削除)する方法を知っておくことは大切です。
- Windows: 設定から、アプリを選び、アンインストール(削除)したいものを選択して、実行。
- Mac: アプリケーションフォルダーから、アプリをみつけ、ゴミ箱へ。
備考:環境変数のPath について
上記の方法で、残ってしまうものがあります。それは、環境変数 Path の設定です。 アンインストールなどをしたときは、一旦、サインアウトをして、もう一度、サインインしてから確認してください。
Mac は、システムのベースにあるのは、Linux などと同じ、Unix なので、アプリケーションの、ユーティリティ(Utilities)から、Terminal を立ち上げ、 echo $PATH
とすると、確認できます。RStudio の左下の窓枠にも Terminal があり、そこからでも、同じように確認できます。
Windows の場合は、対応するものには、コマンド・プロンプト(Command Prompt)と、パワーシェル(PowerShell)があります。初期設定13では、RStudio の左下の窓枠には、コマンド・プロンプトが出ていると思います。そこで、echo %PATH%
とします。PowerShell の場合は echo $Env:Path
とすれば、表示できます。
Windows の場合、「設定」から、「環境変数の編集」を検索して、選択すると、Path を見ることができます。上の枠が、ユーザの環境変数、下の枠が、システム環境変数です。ユーザの環境変数の中の、Path(他には、TEMP, TMP もあるかと思います。)をコピーしておくと良いでしょう。Path をダブルクリックして、編集することも可能です。ただし、十分理解しないで、Path を変更すると、問題が起こる可能性がありますので、注意してください。
14.3.4.1.2 別のアカウントを作成してインストール
Windows に、もう一つ、アカウントを作成します。
[スタート] \(>\) [設定] \(>\) [アカウント] の順に選択し、[ファミリとその他のユーザー] を選択し、[アカウントの追加] から作成します。
どのようにサインインしますかと出ますから、下にある、「このユーザーのサインイン 情報がありません」を選択します。[次へ]
つぎに、アカウントを作成しましょうとでますから、特に、なにも入力せず、「Microsoft ア カウントを持たないユーザーを追加する」を選択します。[次へ]
アカウント設定、名前とパスワード、名前は、ローマ字と数字の半角で作成。パスワードは2回入れる。アカウントの名前と、パスワードは記録しておくこと。
その下の三つの質問とその答えを記入します。これも、おぼられるものにするか、記録すること。[次へ]
アカウントが作成されるが、そのアカウントを選択すると、「アカウントの種類の変更」が選択できるので、「管理者」に変更。[OK] をクリックして終了。
アカウント名をローマ字にします。このアカウントから、インストールしてください。元の日本語アカウントとファイルを共有したいときは、C ドライブのユーザーにあるパブリック(共有)ディレクトリーにコピーしてください。
14.3.4.1.3 このあとの使い方について
他のアカウントに、R と RStudio をインストールしても、自分のアカウントでも、R と RStudio を利用することが可能です。しかし、漢字やカタカナのアカウント名や、OneDrive の問題は、解決しません。アカウント名を修正することは可能ですが、間違えると、コンピュータ自体が動かなくなりますから、ここでは、説明しませんが、興味のあるかたは、矢内勇生さんのスライド を参照してください。
OneDrive は、どのように使われているかによって、対応が変わりますので、一般的な対応方法は書けません。OneDrive は、Microsoft が提供するクラウドサービスで、5GB までは、無料で使えることもあり、コンピュータを使い始めるときに14、利用を促されます。5GB を超える場合は、課金されます。十分な容量を有料で確保していると、すべて、OneDrive にバックアップすることになり、Home も、OneDrive の管理下に置かれて、上に述べたような、ファイルを書いたり消去したりを頻繁に行うプログラムの場合には、問題が起こるようです。
ただし、バックアップを取ること自体は、とても有効なことですので、設定を変える場合は、十分検討してから行ってください。
個人的には、簡単設定で設定される、デスクトップと、ドキュメントと、フォトのうち、ドキュメントについては、OneDrive バックアップを停止し、ドキュメントの中に、バックアップ用のフォリダーを作成し、その中のもののみ、バックアップするのが良いのではないかと思います。それには、ドキュメントのバックアップを外し、OneDrive の中に、フォルダーを作成して、そこに、バックアップするファイルを移動させます。しかし、使い方などによって、状況が異なりますので、コンピュータに詳しいかたに相談することをお勧めします。
その上で、RStudio のプロジェクトを作成するときは、OneDrive でバックアップをとっていないフォルダーに作成します。
詳細は、下のリンクなどを参照してください。
14.4 クラウド - Posit Cloud
Posit(RStudio)Cloudは、誰でもオンラインでデータサイエンスを行い、共有し、教え、学ぶことができる、軽量でクラウドベースのソリューションです。2022年11月に、会社名が、RStuio から Posit に変更になったので、Posit Cloud となっていますが、まだ、RStudio Cloud と表示されている箇所もあります。
14.4.1 クラウドサービス How to Start Posit Cloud
まず、サインアップして、使ってください。一ヶ月の利用時間の限度など、設定されていますが、どこからでも、インターネットにつながっていれば使えるので、わたしは、いつくかアカウントを持って、活用しています。
- Posit Cloud にアクセスします。Go to https://posit.cloud/
- Get Started または、右上から、Sign UP を選択します。Sign Up: top right
- Email address or Google account
- New Project: Project Name
特徴:制限など(Key Features)
- プロジェクト数の上限は50。Up to 50 projects total
- 共有スペースは一つのみ(5人までのメンバーが10個のプロジェクトまで共有できます) 1 shared space (5 members and 10 projects max)
- コンピュータ時間としては月間最大25時間15。25 compute hours per month
- 各プロジェクトについて最大 1GB のRAM(Read Access Memory)。Up to 1 GB RAM per project
- 各プロジェクトについて 1 CPU。Up to 1 CPU per project
- 背後で実行する作業は1時間が上限。Up to 1 hour background execution time
大学で課題などに取り組むと、まず、月間25時間の制限に引っかかり、次のようなメッセージが表示されます。
Your account exceeded its compute hour limit. You can continue to open projects in your account until such and such time, or until you have used at total of 40 compute hours. After that you will be unable to open projects in space owned by your account until your next usage period begins on such and such day.
わたしは、このようなメッセージが出たら、重要度にもよりますが、まずは、プロジェクトをダウンロードし、いつでも、自分のコンピュータで使えるようにしてから、他の、アカウントに引っ越して、作業を続けています。その方法を追記しておきます。
TIPs:
プロジェクトをダウンロード:
プロジェクトのダウンロード:自分のコンピュータに R と R Studio が使える場合は、必要なプロジェクトをダンロードします。ダウンロードするには、左上の3本線から、自分の Workspace にもどり、プロジェクトの右についている、ダウンロードボタンを押します。これは、プロジェクトとして、RStudio から開くことができます。
If you have installed R Studio and R on your computer, From the three lines on the top left, go back to your workspace. Then there is a download button on the right of your project. You can open it on your computer.
他のアカウントとの共有:
- 異なる電子メールアドレスで別の Posit Cloud アカウントを作成します。(create another Posit Cloud account with another email address.)
- 使っていたプロジェクトを開き、右上のギアマークから、Change Access を、
You
から、everyone
に変更します。(In your current project, open the gear mark on the top right, and change access fromYou
toeveryone
.) - 使っていたプロジェクトのアカウント名の隣にある、三つの点が丸で囲まれているものを選び、
Share Link
を、別のアカウントを作成したアドレスに送ります。(In your currentproject, next to your account name, there is a circle with three dots. Share the link and send the email to another account.) - 使っていた、元のアカウントからログアウトし、新しいアカウントを開き、送られてきたアドレスクリック、またはコードを入れると、使っていたプロジェクトが開き、Temporary Copy と出ます。編集して使いたい時は、それを Permanent Copy にすると、新しいアカウントで編集し、使うことができます。(Then, you can get an access code to your current project. Log out from the existing account, log in to your new account, and then use the link. Then you can see the temporary file containing everything in your old account and use it for a permanent project.)
14.5 R のその他の利用方法
R Studio または、RStudio Cloud(Posit Cloud) 以外で、R を使われる方のために、少しだけ書いておきます。個人的には、Google colab と、Cocalc を利用しています。
Google colab は、Google アカウントの作成、Cocalc は、Cocalc アカウントの作成、または、Google アカウントか、GitHub アカウントのリンクが必要です。
Google アカウントをお持ちの方は多いと思うので、Google colab について、最低限のことのみ、書いておきます。
14.5.1 Google colab で R
基本的に、python
開発環境として構築されているものですが、R でも使うことができます。
- Google アカウントにログインします。
- ここ をクリックして起動します。
- 一番上に、ノートブック名が
Untitled0.ipynb
などと表示されますから、適当に変更します。 - +コード、+テキスト とあり、最初のコードの1行が表示されていますから、たとえば、
head(cars)
と入れて、左の三角を押します。すると、最初だけ少し時間がかかりますが、その下に結果がでます。 - 次に、上や、最後の行の直下に、表示される、+コード、+テキスト をクリックして、あたらしい、コード・チャンクか、テキスト・チャンクを書き入れていきます。
-
tidyverse
などは、すでにインストールされていますが、使いたいときは、library(tidyverse)
とし、インストールされていないときは、install.packages("WDI")
などとします。
ノートを、保存、印刷、ダウンロードなど可能です。
フォルダーを作成して、外部ファイルを読み込んだり、書き出したりすることも可能です。
14.5.2 CoCalc で R と RMarkdown
無償版は、スピードが遅いですが、個人的には、有用なクラウドサービスとして、活用しています。グループでプロジェクトを共有することも簡単にできます。
- 最初は、上のリンクの下にある、SignUp から、アカウントを作成します。
- Email アドレス、または、Google などのアカウントにリンクさせて、アカウントを作成することが可能です。
- Create a New Project から、プロジェクトを作成します。
- 使い方
- New から、Sage Worksheet を選択して、
%default_mode r
と最初に書けば、そのあと、R のコマンドを実行できます。 - New から、RMarkdown を選択すると、RMarkdown 文書を作成することができます。
- 他にも、TeX や、Python Notebook (Jupyter Notebook) など、さまざまな道具が提供されています。
- Maxima と呼ばれる、Maathematica の Free のバージョンから改良した、SageMath からスタートしたサイトです。