広告 R基礎

R言語ではじめるデータ解析

2023年9月9日

R言語とは?

そもそもR言語ってなんなの?

R言語とは、統計計算やグラフの作成を行うためのプログラミング言語です。
プログラミング言語と言うと難しそうに聞こえるかもしれませんが、実はとても便利なツールです。

例えば、学校のテストの点数を使ってクラス全体の平均点を計算したり、最高点や最低点を見つけることは、R言語なら簡単にできます。

テストの点数をグラフにしてみたい、と思ったら、R言語を使えばカラフルなグラフも手軽に作れます。

また、3次元のグラフを動かして、いろいろな方向から見たりするなど、エクセルのグラフではできないようなこともできたりします。

市販統計解析ソフトではなくR言語を使うメリット

R言語は、研究者やデータ分析の専門家たちがよく使っているツールですが、高校生でも使い始めることができます。R言語でプログラミングを学ぶことで、数学や統計の知識を実際に活用して、面白い発見をすることができます。

マーケティングの業界などで主成分分析など多変量解析をしたいと思っても、市販のソフトだと数万円かかってしまうのですが、R言語は無料で使えるので、コンピュータがあれば誰でも始めることができます。OSはLinux、windows、Mac、のどれでも大丈夫です。

また、市販の統計解析ソフトのようにボタン一つで結果が出ることは便利である反面、統計処理の中身を理解しにくい面があるように思います。

市販の統計ソフトの場合、誤った使い方をしてもデータが出ることがあるので、統計処理の中身を理解しないままだと、その間違いに気付けない恐れがあります。

仕事の場で、以前に示したデータ解析結果がやっぱり間違ってましたと後から言ったりしたら、一瞬で信用を失いかねません。

R言語では途中の計算結果を確認しながら解析を進めることができるので統計解析に対する理解が深まります

R言語によるデータ解析のハードル

R言語では統計処理はほぼ何でもできるのですが、コードを書いて計算させるので、コードの書き方を身に着けるのに根気強く学んでいかなければいけません。これがまず一つ目のハードルです。

また、線形代数や統計学などの数学の基礎知識も土台として必要になります。
これが、二つ目のハードルではないでしょうか。
統計の専門書の最初の1ページ目から数式の羅列でほとんどの人がウンザリしてしまうと思います。

私自身は、今流行りの多くのデータサイエンティストの方たちのように、数学科や物理学科で学んできた訳ではないので、数学に対する理解力は弱いと思います。化学科卒なので基礎的な数学しか大学では勉強してなかったです。

専門書に出てくる細かい数式を全て理解できなくても、なんとなくこんなことを計算しているんだくらいの理解しかできていないのですが、それでもRを使うようになってからは、昔の自分に比べると大きく成長したと思います。

最後に

私自身は他のプログラミンングは全くできないのですが、R言語については、研究の仕事でどうしても多変量解析を試さなくてはいけない状況になり、必要に迫られる形で数年前から勉強を始めたところです。

まだまだ、初心者でかつ独学で勉強していることもあり、自分で勉強していったことを忘れないためにも忘備録として、その経過をブログに残そうと思っています。

私自身が初心者ですので、他の方のブログなどを参考にすることがあるのですが、理解が追い付かなくて、初歩的な所でつまづくことも多々あり、専門書も参考にしてちょっとずつ前に進んでいます。

このブログでは、私と同じようなR言語初心者の方でも理解できるよう分かりやすく説明していきたいと考えています。

私のこのブログが皆様のお役に立てたら幸いです。

-R基礎
-