情報Ⅰ「データの活用」をわかりやすく解説【表計算・グラフの読み方】

情報Ⅰ期末テストのデータの活用分野を高校生向けにわかりやすく解説。代表値・分散・標準偏差の計算方法、グラフの読み方、表計算の基本操作、テスト頻出問題パターンを具体例付きで学べます。

2026年5月2日

情報Ⅰのテストで「平均値と中央値の違いは?」「分散を求めよ」と出題されて、困った経験はありませんか?

データの活用分野は、計算の手順が多くて苦手に感じる人が多いです。でも、1つ1つのステップはシンプルです。手順を覚えれば、確実に解けるようになります。

この記事では、データの種類から代表値・分散の計算、グラフの読み方、表計算の関数まで、テストに出やすいポイントを具体的な数値例で解説します。

情報Ⅰの学習全体の進め方は「情報Ⅰの準備と勉強法」でまとめています。

データの種類と収集方法

データには大きく分けて2つの種類があります。

量的データと質的データ

量的データ(りょうてきデータ): 数値で表せるデータです。計算ができます。

  • 例: 身長(170cm)、テストの点数(85点)、気温(25℃)

質的データ(しつてきデータ): 分類やカテゴリを表すデータです。数値で計算できません。

  • 例: 血液型(A型)、好きな教科(数学)、性別

テストでは「次のデータは量的データか質的データか」と問われます。「数値で足し算や平均が計算できるか」を基準に判断しましょう。出席番号は数字ですが、足しても意味がないので質的データです。

一次データと二次データ

  • 一次データ: 自分で直接集めたデータです。アンケートや実験で得られます。
  • 二次データ: 他の人や機関が集めたデータです。政府の統計や論文のデータが該当します。

アンケート設計の基本

テストでは「良いアンケートの条件」が出ることがあります。

  • 質問は1つの内容だけを聞く(ダブルバーレル質問を避ける)
  • 誘導的な表現を使わない
  • 選択肢はもれなく、重なりなく設定する

悪い例: 「あなたは健康的で美味しい学食が好きですか?」

→ 「健康的」と「美味しい」の2つを同時に聞いている

良い例: 「学食の味に満足していますか?」

→ 1つの内容だけを聞いている

代表値(平均値・中央値・最頻値)

代表値とは、データ全体の特徴を1つの数値で表したものです。3種類あります。

平均値(へいきんち)

すべてのデータを足して、データの個数で割った値です。

例: テストの点数が 60, 70, 75, 80, 90 の5人の場合

平均値 = (60 + 70 + 75 + 80 + 90) ÷ 5 = 375 ÷ 5 = 75

中央値(ちゅうおうち)

データを小さい順に並べたとき、真ん中に来る値です。

例: 同じデータ 60, 70, 75, 80, 90 の場合

→ 真ん中(3番目)の値は 75

データが偶数個の場合は、真ん中の2つの平均を取ります。

例: 60, 70, 80, 90 の4人の場合

→ 真ん中の2つは 70 と 80

→ 中央値 = (70 + 80) ÷ 2 = 75

最頻値(さいひんち)

データの中で最も多く出てくる値です。

例: 70, 80, 80, 80, 90, 95 の場合

→ 80が3回で最も多い → 最頻値は 80

使い分けのポイント

テストでは「どの代表値を使うべきか」が問われます。

  • 平均値: 極端な値(外れ値)に影響されやすい
  • 中央値: 外れ値の影響を受けにくい
  • 最頻値: 質的データにも使える

例: 5人の月収が 20万, 25万, 30万, 30万, 500万 の場合

  • 平均値: 121万(500万に引っ張られる)
  • 中央値: 30万(実態に近い)

このように外れ値がある場合は、中央値のほうが実態を表します。

プログラミングで配列データを扱う方法は「JavaScriptの配列入門」で学べます。

データの散らばり(分散・標準偏差)

代表値だけではデータの特徴はわかりません。「散らばり具合」も重要です。

分散(ぶんさん)の計算手順

分散は「データが平均からどれくらい離れているか」を表す数値です。

  1. 平均値を求める
  2. 各データから平均値を引く(偏差)
  3. 偏差を2乗する
  4. 2乗した値の平均を求める

具体例: データが 2, 4, 6, 8, 10 の場合

手順1: 平均値 = (2+4+6+8+10) ÷ 5 = 30 ÷ 5 = 6

手順2・3: 各データの偏差と2乗

2 - 6 = -4 → (-4)² = 16

4 - 6 = -2 → (-2)² = 4

6 - 6 = 0 → 0² = 0

8 - 6 = 2 → 2² = 4

10 - 6 = 4 → 4² = 16

手順4: 分散 = (16+4+0+4+16) ÷ 5 = 40 ÷ 5 = 8

答え: 分散は 8

標準偏差(ひょうじゅんへんさ)

標準偏差は分散の正の平方根(ルート)です。単位が元のデータと同じになるので、解釈しやすくなります。

上の例の場合: 標準偏差 = √8 ≈ 2.83

偏差値との関係

テストの偏差値は標準偏差を使って計算されます。

偏差値 = 50 + 10 ×(自分の点数 − 平均点)÷ 標準偏差

偏差値50が平均、60なら平均より上、40なら平均より下です。

テストでのコツ: 分散の計算は手順が多いので、表を作って整理すると間違えにくくなります。「データ」「偏差」「偏差の2乗」の3列を書きましょう。

数値計算の基礎は「JavaScriptの数値と計算」でも学べます。

グラフの種類と読み方

データを視覚的に表すのがグラフです。テストでは「どのグラフを使うべきか」が問われます。

棒グラフ

用途: カテゴリごとの量を比較する

例: クラスごとの平均点、教科別の好き嫌いの人数

折れ線グラフ

用途: 時間の経過による変化を表す

例: 月ごとの気温の変化、年度ごとの生徒数の推移

円グラフ

用途: 全体に対する割合を表す

例: アンケートの回答割合、予算の内訳

注意: 項目が多すぎると見にくくなります。5〜6項目以内が目安です。

散布図(さんぷず)

用途: 2つの量的データの関係を表す

例: 勉強時間とテストの点数、気温とアイスの売上

特徴: 点の散らばり方から相関関係が読み取れます。

ヒストグラム

用途: データの分布(散らばり方)を表す

例: テストの点数分布(0〜10点が何人、11〜20点が何人…)

注意: 棒グラフと似ていますが、ヒストグラムは連続するデータの区間を表すため、棒の間に隙間がありません。

箱ひげ図

用途: データの散らばりと中央値を一目で比較する

構成要素:

  • 箱の中の線: 中央値
  • 箱の下端: 第1四分位数(下から25%の位置)
  • 箱の上端: 第3四分位数(下から75%の位置)
  • ひげの端: 最小値と最大値

テストでは「このデータに適切なグラフはどれか」という問題が出ます。「何を伝えたいか」で選びましょう。

表計算ソフトの基本操作

表計算ソフト(Excelやスプレッドシート)の操作もテストに出ます。

セル参照

セルとは、表の1つ1つのマスのことです。列(A, B, C…)と行(1, 2, 3…)で位置を表します。

相対参照: セルをコピーすると参照先が自動で変わる

例: A1のセルに「=B1+C1」と書いてA2にコピーすると「=B2+C2」になる

絶対参照: セルをコピーしても参照先が変わらない。「$」をつける

例: 「=$B$1+C1」→ B1は固定、C1はコピーで変わる

テストでは「次の数式をコピーしたとき、セルの値はいくつになるか」が頻出です。

基本関数

テストでよく出る関数を覚えましょう。

  • SUM(範囲): 合計を求める → =SUM(A1:A5)
  • AVERAGE(範囲): 平均を求める → =AVERAGE(A1:A5)
  • MAX(範囲): 最大値を求める → =MAX(A1:A5)
  • MIN(範囲): 最小値を求める → =MIN(A1:A5)
  • COUNT(範囲): 数値が入ったセルの個数 → =COUNT(A1:A5)
  • IF(条件, 真の値, 偽の値): 条件分岐 → =IF(A1>=60,"合格","不合格")

IF関数の考え方はプログラミングの条件分岐と同じです。「情報Ⅰの変数と条件分岐」で詳しく学べます。

相関と因果関係

相関関係とは

2つのデータの間に「一方が増えると他方も増える(または減る)」という関係があるとき、相関関係があると言います。

  • 正の相関: 一方が増えると他方も増える(例: 勉強時間と点数)
  • 負の相関: 一方が増えると他方は減る(例: 欠席日数と点数)
  • 相関なし: 関係が見られない

相関係数

相関の強さを-1から1の数値で表したものが相関係数です。

  • 1に近い: 強い正の相関
  • -1に近い: 強い負の相関
  • 0に近い: 相関なし

相関と因果の違い(超重要)

テストで最も出やすいポイントです。

  • 相関関係: 2つのデータに関連がある
  • 因果関係: 一方が原因で他方が結果である

相関があっても因果があるとは限りません。

例: 「アイスの売上」と「水難事故の件数」には正の相関があります。しかし「アイスを買うと水難事故が起きる」わけではありません。本当の原因は「気温が高い」ことです。これを疑似相関(ぎじそうかん)と言います。

テストでは「次の事例は相関関係か因果関係か」「疑似相関の例を挙げよ」という問題が出ます。「第三の要因がないか」を考える習慣をつけましょう。

テスト頻出問題パターン

パターン1: 代表値の計算

問題例: データ 3, 5, 7, 7, 8 の平均値、中央値、最頻値を求めよ。

平均値 = (3+5+7+7+8) ÷ 5 = 30 ÷ 5 = 6

中央値 = 7(3番目の値)

最頻値 = 7(2回出現)

コツ: まずデータを小さい順に並べてから計算を始めましょう。

パターン2: 分散の計算

問題例: データ 4, 6, 8 の分散を求めよ。

平均 = (4+6+8) ÷ 3 = 6

偏差の2乗: (4-6)²=4, (6-6)²=0, (8-6)²=4

分散 = (4+0+4) ÷ 3 = 8/3 ≈ 2.67

コツ: 偏差の合計は必ず0になります。計算の途中で確認すると、ミスに気づけます。

パターン3: セル参照の問題

問題例: セルA1に「=B1*$C$1」と入力し、A2にコピーした。A2の数式はどうなるか。

答え: =B2*$C$1

解説: B1は相対参照なのでB2に変わります。$C$1は絶対参照なので変わりません。

パターン4: グラフの選択

問題例: 「5年間の売上の推移を表すのに適切なグラフはどれか。」

答え: 折れ線グラフ(時間の経過による変化を表すため)

コツ: 「比較→棒グラフ」「変化→折れ線」「割合→円グラフ」「関係→散布図」「分布→ヒストグラム」と覚えましょう。

パターン5: 相関と因果の判別

問題例: 「靴のサイズが大きい子どもほど、テストの点数が高い傾向がある。これは因果関係と言えるか。」

答え: 因果関係とは言えない。靴のサイズとテストの点数の両方に影響する第三の要因(年齢・学年)が存在する疑似相関である。

コツ: 「AがBの直接の原因か?」「第三の要因はないか?」を考えましょう。

情報Ⅰの定期テスト対策全般は「情報Ⅰ中間テスト対策」でまとめています。

まとめ

  • ✅ データは量的データと質的データに分けられる
  • ✅ 代表値は平均値・中央値・最頻値の3種類
  • ✅ 外れ値がある場合は中央値が実態に近い
  • ✅ 分散 =「偏差の2乗の平均」、標準偏差 = √分散
  • ✅ グラフは「何を伝えたいか」で種類を選ぶ
  • ✅ 絶対参照は「$」をつけてコピーしても固定する
  • ✅ 相関関係があっても因果関係があるとは限らない
  • ✅ 疑似相関は「第三の要因」が原因

データの活用は計算手順を覚えれば確実に解ける分野です。この記事のパターンを繰り返し練習して、テスト本番に備えましょう。

🚀 情報Ⅰの学習をさらに進めよう!

データ分析の考え方は、プログラミングでデータを処理するときにも役立ちます。このサイトでは、情報Ⅰに対応した学習コンテンツを無料で提供しています。

情報Ⅰの準備と勉強法を見る →
目次

コースで実際に手を動かして学ぼう

レッスンではコードを書きながら基礎が身につきます

HTMLコースを始める →

同じテーマの記事

📣 この記事が役に立ったら

Xでシェア

💬 引用する場合はこちらをご利用ください:

情報Ⅰ期末テストのデータの活用分野を高校生向けにわかりやすく解説。代表値・分散・標準偏差の計算方法、グラフの読み方、表計算の基本操作、テスト頻出問題パターンを具体例付きで学べます。

出典: https://start-web-programming.com/blog/joho1-data-analysis/