ブログ
2022年 6月 28日 期待値と分散ってなんのための数字なんですか???^^というあなたへ
こんにちは!東京理科大学理工学部森涼太です!
さて、今回はデータと分析の分野について書きます!
1Aの共通テストで出てくるデータと分析の問題。皆さん解けていますか??
学校ではさらっと終わってそんなに難しくもなさそう、けどやるとなると覚えるのが面倒、、、、と、扱いに困っている人をよく見ます。ということで、今回はデータと分析がなんで出てくるのかと、内容について軽く触れてみたいと思います。
・データと分析とは
データと分析って範囲は一体なんなんでしょうか?
高校生の頃の自分にとってデータと分析の範囲は、期待値が云々とか分散がどうのとかで計算しても、何に使うのか、どこが重要なのかとかがさっぱりわからず、とりあえず覚えれば何となくできてしまうという出題の傾向もあって、宙ぶらりんな存在でした。
が、、、、
大学に入ると割と大事な計算の勉強をしていたということに気づきました。
自分の大学でもっとも重視されている数学の範囲の一つに”統計”があります。また、“統計”の授業は理系の大学だけでなく文系学科の授業にも結構よく出てきているみたいで、担任助手の仲間が統計の勉強をしているのを何度も見たこともあります。
そんな大学でめっちゃやる”統計”ですが、やることは”データを分析する”ことです。
そう、”データと分析”という範囲は高校生版の”統計”です。
ということで、大学でやる”統計”について知っておくと”データと分析”が何を目指しているかを知れます。
大学生でやる統計ではデータの分析をするわけですが、
大体の場合したいことは”データの法則性の発見”≒”将来の予想”(に活かしたい)だと思います。
今までのデータの特徴を掴んで、出来れば将来起きることを予想しよう!みたいな感じです。
(さすがにもう少し複雑な時もあると思いますが、、)
・平均と期待値の違いとは
ということで、ここで期待値です。”期待”というのは将来について期待するわけですね。そうです、本当は分析というよりは予想したいんです。
さて、1, 2, 3 というデータの平均は2ですが、
1, 2, 3がそれぞれ 0%, 0%, 100%で出てくる箱があったら、でてくる数字として期待できるのは何ですか?
3です。 期待値の公式に入れてもわかります。
公式で考えると、1×0 + 2×0 + 3×1 = 3 になります。
ということで、出てくる確率の概念が入ってるのが期待値です。
ほかのパターンで考えると、
1は絶対出てこなくて、2と3が出てくる確率がそれぞれ50%であるとき、でてくる数字として期待できるのは、2と3が半々ずつなので、整数で答えられません。
ということで、期待値の概念が使えます。
1×0 + 2×0.5 + 3×0.5 = 2.5 ☚ 2.5が期待値になります。
ということで期待値は、データにそれが出てくる確率という概念を加えて考えたとき、次出てくる値で最も期待できそうなものの指標的な値です。(期待値がとり得る値でなくてもいい)。
・分散と標準偏差
分散は、データが期待値からどのくらいばらけそうかを示す値です。
例えば期待値が2と出ても、2しか出ないから期待値2なのか、-100と104という数値が50%ずつで出るから期待値2なのかで、予想すべき状況が大きく変わってきます。ということで、分散というデータが要ります!!
ということで、今回はデータと分析の話でした。すいません、本当は共分散とか相関係数についてもっと書かないとと思ってたんですが、大変長くなりそうだったので、簡潔にできるよう勉強してまた次回の機会にしたい思います!
次回!!お楽しみに!!
森