テクノロジーで遊ブログ

テクノロジーで遊びたい!!!と勝手に発信するブロブ

統計学で遊んでみた。

AIとか機械学習に興味が沸いてきて割とよくAI関係の本を読んだりしています。

 

AI・機械学習では統計学を使っているようですが何となくイメージが固まらなかったりしています。

 

調べているとこんなサイトを発見。

kogolab.chillout.jp

 

分かりやすい!

 

では実践してみよう!

 

と思い立ちました。

 

せっかく記事にするので作者に敬意を表し

 

以下の本を購入してレッツトライ!!

 

↓ウェブサイトを本にしたヤツ

 

まずハンバーガ屋さんでポテトを購入。

長さと本数を測定。

テリヤキバーガーを食べながらどんどん測定

エクセルに入力。

エクセルで解析。

 

の流れで実行。

 

 

Mサイズは何本入っているの?

 

今回数えてみたところ83本入っていました。

 

意外と多いことにびっくり!

 

長さの平均をもとめてみる

エクセルで関数

 

=AVERAGE(B2:B84)

 

と入力。

 

平均をだす。

 

今回の平均は50.8mm

 

でした。

 

度数分布(どすうぶんぷ)を調べる

まず

度数分布とは

収集したデータをいくつかの階級区間)に分けたときの、それぞれの階級に所属するデータの分布状況のこと。度数分布を表したグラフに、ヒストグラムがある。

 ASCII.jpデジタル用語辞より引用

 

??ちょっとだけわかりずらいので解説すると

 

今回のポテトでいうと階級(区間)を設定してグラフにしましょうということらしい。

 

階級とは

今回のポテトでいうと個別で長さが違いますよね?

 

それを長さごとのグループにしてわけましょうよ!

 

ということらしい。

 

こんな感じ

f:id:penguin_x:20190804143403p:plain

詳しくここを見てください。

 

統計学のことが紹介されている有名サイト。

 

統計検定受けてみたい人は必見かも。

 

bellcurve.jp

 

グラフにしてわかりやすくしよう。

グラフの種類にヒストグラフがあります。

さっそくグラフにしてみました。

 

f:id:penguin_x:20190804144310p:plain

マッ〇ポテトは40以上50未満(mm)が一番多いようです。

 

 

色々なハンバーガー屋さんのポテトを比べるともっと面白そうなのですが、

 

もうお腹いっぱいのため紹介はまた今度。

 

 

 

本当は分散と標準偏差を計算したのですがちょっと怪しい数値が出てしまい計算間違い(計算設定ミス)の可能性があるため紹介できませんでした。

どこがちがうの??

 

夏休みの自由研究にどうですか???