2026年5月2日
情報Ⅰのテストで「平均値と中央値の違いは?」「分散を求めよ」と出題されて、困った経験はありませんか?
データの活用分野は、計算の手順が多くて苦手に感じる人が多いです。でも、1つ1つのステップはシンプルです。手順を覚えれば、確実に解けるようになります。
この記事では、データの種類から代表値・分散の計算、グラフの読み方、表計算の関数まで、テストに出やすいポイントを具体的な数値例で解説します。
情報Ⅰの学習全体の進め方は「情報Ⅰの準備と勉強法」でまとめています。
データの種類と収集方法
データには大きく分けて2つの種類があります。
量的データと質的データ
量的データ(りょうてきデータ): 数値で表せるデータです。計算ができます。
- 例: 身長(170cm)、テストの点数(85点)、気温(25℃)
質的データ(しつてきデータ): 分類やカテゴリを表すデータです。数値で計算できません。
- 例: 血液型(A型)、好きな教科(数学)、性別
テストでは「次のデータは量的データか質的データか」と問われます。「数値で足し算や平均が計算できるか」を基準に判断しましょう。出席番号は数字ですが、足しても意味がないので質的データです。
一次データと二次データ
- 一次データ: 自分で直接集めたデータです。アンケートや実験で得られます。
- 二次データ: 他の人や機関が集めたデータです。政府の統計や論文のデータが該当します。
アンケート設計の基本
テストでは「良いアンケートの条件」が出ることがあります。
- 質問は1つの内容だけを聞く(ダブルバーレル質問を避ける)
- 誘導的な表現を使わない
- 選択肢はもれなく、重なりなく設定する
悪い例: 「あなたは健康的で美味しい学食が好きですか?」
→ 「健康的」と「美味しい」の2つを同時に聞いている
良い例: 「学食の味に満足していますか?」
→ 1つの内容だけを聞いている
代表値(平均値・中央値・最頻値)
代表値とは、データ全体の特徴を1つの数値で表したものです。3種類あります。
平均値(へいきんち)
すべてのデータを足して、データの個数で割った値です。
例: テストの点数が 60, 70, 75, 80, 90 の5人の場合
平均値 = (60 + 70 + 75 + 80 + 90) ÷ 5 = 375 ÷ 5 = 75
中央値(ちゅうおうち)
データを小さい順に並べたとき、真ん中に来る値です。
例: 同じデータ 60, 70, 75, 80, 90 の場合
→ 真ん中(3番目)の値は 75
データが偶数個の場合は、真ん中の2つの平均を取ります。
例: 60, 70, 80, 90 の4人の場合
→ 真ん中の2つは 70 と 80
→ 中央値 = (70 + 80) ÷ 2 = 75
最頻値(さいひんち)
データの中で最も多く出てくる値です。
例: 70, 80, 80, 80, 90, 95 の場合
→ 80が3回で最も多い → 最頻値は 80
使い分けのポイント
テストでは「どの代表値を使うべきか」が問われます。
- 平均値: 極端な値(外れ値)に影響されやすい
- 中央値: 外れ値の影響を受けにくい
- 最頻値: 質的データにも使える
例: 5人の月収が 20万, 25万, 30万, 30万, 500万 の場合
- 平均値: 121万(500万に引っ張られる)
- 中央値: 30万(実態に近い)
このように外れ値がある場合は、中央値のほうが実態を表します。
プログラミングで配列データを扱う方法は「JavaScriptの配列入門」で学べます。
データの散らばり(分散・標準偏差)
代表値だけではデータの特徴はわかりません。「散らばり具合」も重要です。
分散(ぶんさん)の計算手順
分散は「データが平均からどれくらい離れているか」を表す数値です。
- 平均値を求める
- 各データから平均値を引く(偏差)
- 偏差を2乗する
- 2乗した値の平均を求める
具体例: データが 2, 4, 6, 8, 10 の場合
手順1: 平均値 = (2+4+6+8+10) ÷ 5 = 30 ÷ 5 = 6
手順2・3: 各データの偏差と2乗
2 - 6 = -4 → (-4)² = 16
4 - 6 = -2 → (-2)² = 4
6 - 6 = 0 → 0² = 0
8 - 6 = 2 → 2² = 4
10 - 6 = 4 → 4² = 16
手順4: 分散 = (16+4+0+4+16) ÷ 5 = 40 ÷ 5 = 8
答え: 分散は 8
標準偏差(ひょうじゅんへんさ)
標準偏差は分散の正の平方根(ルート)です。単位が元のデータと同じになるので、解釈しやすくなります。
上の例の場合: 標準偏差 = √8 ≈ 2.83
偏差値との関係
テストの偏差値は標準偏差を使って計算されます。
偏差値 = 50 + 10 ×(自分の点数 − 平均点)÷ 標準偏差
偏差値50が平均、60なら平均より上、40なら平均より下です。
テストでのコツ: 分散の計算は手順が多いので、表を作って整理すると間違えにくくなります。「データ」「偏差」「偏差の2乗」の3列を書きましょう。
数値計算の基礎は「JavaScriptの数値と計算」でも学べます。
グラフの種類と読み方
データを視覚的に表すのがグラフです。テストでは「どのグラフを使うべきか」が問われます。
棒グラフ
用途: カテゴリごとの量を比較する
例: クラスごとの平均点、教科別の好き嫌いの人数
折れ線グラフ
用途: 時間の経過による変化を表す
例: 月ごとの気温の変化、年度ごとの生徒数の推移
円グラフ
用途: 全体に対する割合を表す
例: アンケートの回答割合、予算の内訳
注意: 項目が多すぎると見にくくなります。5〜6項目以内が目安です。
散布図(さんぷず)
用途: 2つの量的データの関係を表す
例: 勉強時間とテストの点数、気温とアイスの売上
特徴: 点の散らばり方から相関関係が読み取れます。
ヒストグラム
用途: データの分布(散らばり方)を表す
例: テストの点数分布(0〜10点が何人、11〜20点が何人…)
注意: 棒グラフと似ていますが、ヒストグラムは連続するデータの区間を表すため、棒の間に隙間がありません。
箱ひげ図
用途: データの散らばりと中央値を一目で比較する
構成要素:
- 箱の中の線: 中央値
- 箱の下端: 第1四分位数(下から25%の位置)
- 箱の上端: 第3四分位数(下から75%の位置)
- ひげの端: 最小値と最大値
テストでは「このデータに適切なグラフはどれか」という問題が出ます。「何を伝えたいか」で選びましょう。
表計算ソフトの基本操作
表計算ソフト(Excelやスプレッドシート)の操作もテストに出ます。
セル参照
セルとは、表の1つ1つのマスのことです。列(A, B, C…)と行(1, 2, 3…)で位置を表します。
相対参照: セルをコピーすると参照先が自動で変わる
例: A1のセルに「=B1+C1」と書いてA2にコピーすると「=B2+C2」になる
絶対参照: セルをコピーしても参照先が変わらない。「$」をつける
例: 「=$B$1+C1」→ B1は固定、C1はコピーで変わる
テストでは「次の数式をコピーしたとき、セルの値はいくつになるか」が頻出です。
基本関数
テストでよく出る関数を覚えましょう。
- SUM(範囲): 合計を求める → =SUM(A1:A5)
- AVERAGE(範囲): 平均を求める → =AVERAGE(A1:A5)
- MAX(範囲): 最大値を求める → =MAX(A1:A5)
- MIN(範囲): 最小値を求める → =MIN(A1:A5)
- COUNT(範囲): 数値が入ったセルの個数 → =COUNT(A1:A5)
- IF(条件, 真の値, 偽の値): 条件分岐 → =IF(A1>=60,"合格","不合格")
IF関数の考え方はプログラミングの条件分岐と同じです。「情報Ⅰの変数と条件分岐」で詳しく学べます。
相関と因果関係
相関関係とは
2つのデータの間に「一方が増えると他方も増える(または減る)」という関係があるとき、相関関係があると言います。
- 正の相関: 一方が増えると他方も増える(例: 勉強時間と点数)
- 負の相関: 一方が増えると他方は減る(例: 欠席日数と点数)
- 相関なし: 関係が見られない
相関係数
相関の強さを-1から1の数値で表したものが相関係数です。
- 1に近い: 強い正の相関
- -1に近い: 強い負の相関
- 0に近い: 相関なし
相関と因果の違い(超重要)
テストで最も出やすいポイントです。
- 相関関係: 2つのデータに関連がある
- 因果関係: 一方が原因で他方が結果である
相関があっても因果があるとは限りません。
例: 「アイスの売上」と「水難事故の件数」には正の相関があります。しかし「アイスを買うと水難事故が起きる」わけではありません。本当の原因は「気温が高い」ことです。これを疑似相関(ぎじそうかん)と言います。
テストでは「次の事例は相関関係か因果関係か」「疑似相関の例を挙げよ」という問題が出ます。「第三の要因がないか」を考える習慣をつけましょう。
テスト頻出問題パターン
パターン1: 代表値の計算
問題例: データ 3, 5, 7, 7, 8 の平均値、中央値、最頻値を求めよ。
平均値 = (3+5+7+7+8) ÷ 5 = 30 ÷ 5 = 6
中央値 = 7(3番目の値)
最頻値 = 7(2回出現)
コツ: まずデータを小さい順に並べてから計算を始めましょう。
パターン2: 分散の計算
問題例: データ 4, 6, 8 の分散を求めよ。
平均 = (4+6+8) ÷ 3 = 6
偏差の2乗: (4-6)²=4, (6-6)²=0, (8-6)²=4
分散 = (4+0+4) ÷ 3 = 8/3 ≈ 2.67
コツ: 偏差の合計は必ず0になります。計算の途中で確認すると、ミスに気づけます。
パターン3: セル参照の問題
問題例: セルA1に「=B1*$C$1」と入力し、A2にコピーした。A2の数式はどうなるか。
答え: =B2*$C$1
解説: B1は相対参照なのでB2に変わります。$C$1は絶対参照なので変わりません。
パターン4: グラフの選択
問題例: 「5年間の売上の推移を表すのに適切なグラフはどれか。」
答え: 折れ線グラフ(時間の経過による変化を表すため)
コツ: 「比較→棒グラフ」「変化→折れ線」「割合→円グラフ」「関係→散布図」「分布→ヒストグラム」と覚えましょう。
パターン5: 相関と因果の判別
問題例: 「靴のサイズが大きい子どもほど、テストの点数が高い傾向がある。これは因果関係と言えるか。」
答え: 因果関係とは言えない。靴のサイズとテストの点数の両方に影響する第三の要因(年齢・学年)が存在する疑似相関である。
コツ: 「AがBの直接の原因か?」「第三の要因はないか?」を考えましょう。
情報Ⅰの定期テスト対策全般は「情報Ⅰ中間テスト対策」でまとめています。
まとめ
- ✅ データは量的データと質的データに分けられる
- ✅ 代表値は平均値・中央値・最頻値の3種類
- ✅ 外れ値がある場合は中央値が実態に近い
- ✅ 分散 =「偏差の2乗の平均」、標準偏差 = √分散
- ✅ グラフは「何を伝えたいか」で種類を選ぶ
- ✅ 絶対参照は「$」をつけてコピーしても固定する
- ✅ 相関関係があっても因果関係があるとは限らない
- ✅ 疑似相関は「第三の要因」が原因
データの活用は計算手順を覚えれば確実に解ける分野です。この記事のパターンを繰り返し練習して、テスト本番に備えましょう。
🚀 情報Ⅰの学習をさらに進めよう!
データ分析の考え方は、プログラミングでデータを処理するときにも役立ちます。このサイトでは、情報Ⅰに対応した学習コンテンツを無料で提供しています。
情報Ⅰの準備と勉強法を見る →