教材の内容に関係のない質問や教材とは異なる環境・バージョンで進めている場合のエラーなど、教材に関係しない質問は推奨していないため回答できない場合がございます。
その場合、teratailなどの外部サイトを利用して質問することをおすすめします。教材の誤字脱字や追記・改善の要望は「文章の間違いや改善点の指摘」からお願いします。
今回、メンヘラ判定器を作成するにあたり利用するのが「機械学習」と呼ばれる技術です。機械学習についてしっかり理解しようとすると、道のりがとてつもなく長くなるので、本教材ではメンヘラ判定器を作成する上で理解しておくといい程度の機械学習の概要を簡単に説明していきます。
近年、いろいろなところで耳にする「AI」という言葉。「機械学習」と同じような場面で使われることも多く、何がどう違うのでしょうか。
「Artificial Intelligence(人工知能)」の略である「AI」は、人工知能学会では「知的な機械、特に、知的なコンピュータプログラムを作る科学と技術」と大まかに説明されています。しかし、未だにその定義は曖昧で下記のように専門家によっても意見が分かれる言葉です。
(出典)松尾豊「人工知能は人間を超えるか」(KADOKAWA)p.45
この「AI」を実現するための1つであり、明示的にプログラムで指示せずにコンピュータに学習をさせる技術が「機械学習」です。今回も具体的に【〇〇という単語が含まれるツイートをしている場合はメンヘラと判定する】というようなプログラムを作成せずに、コンピュータにメンヘラの特徴を学習させて、メンヘラを判定するためのモデルを作成します。そのモデルを元に、コンピュータは新たなツイートに対して、メンヘラか否かを判定します。
さらに、この「機械学習」には学習の方法として、教師あり学習と教師なし学習があります。今回、メンヘラ判定器を作成するのに用いるのは、教師あり学習です。
名前の通り、教師あり学習の場合は訓練データとして、入力データと正解データがセットになったものを使います。今回のようにモデルを作成し、未知のデータを分類したり、予測したりする際に用いられます。
教師なし学習は、正解データを与えずにコンピュータ自身がデータの中から共通項や特徴を見つけ出し、学習します。一見すると相関関係がなさそうなデータ同士の頻出パターンなどを見つけ出したいときに用いられます。