Pythonでデータ処理入門 テストデータをまとめよう!
今回はPythonで データ処理の入門や活用の仕方の例 として、テストのデータをまとめて平均点や偏差値を自動で求めてくれるプログラムをつくりましょう! 作るのは、このようなものです。 a , 95 b , 50 c , 30 d , 15 e , 70 f , 60 g , 65 h , 20 i,95 名前,テストの 点数 のデータを このように処理して偏差値などの データにまとめてくれるプログラム です。 では作っていきましょう! まずは 平均点を求める関数 を作りましょう。 def calculate_average ( scores ): return sum ( scores ) / len ( scores ) scores というのは、全員の点数のデータの入ったリストです。例えば[10,50,90] sum関数 は、引数の合計を返す関数です。 len関数 は、引数のデータの個数を返す関数です。 つまり、 データの合計/データの個数 なので 平均 を求められます。returnで値を返します。 次に、 標準偏差を求める関数 を作ります。 偏差値を求めるには標準偏差は不可欠です。 def calculate_std_deviation ( scores , mean ): variance = sum (( x - mean ) ** 2 for x in scores ) / len ( scores ) return variance ** 0.5 mean は、平均点のことです。 variance は、個々の点数と平均点の差の2乗の合計を、データの個数で割ったものです。 それの平方根を返します。 これで 標準偏差 が求められます。 では 偏差値を求める関数 を作りましょう。 def calculate_z_score ( score , mean , std_deviation ): return 50 + 10 * (( score - mean ) / std_deviation ) std_deviation が標準偏差です。 score は個々の点数のことなので、これで 偏差値 が返されます...