2026年5月12日
情報Ⅰ「データ活用」を攻略しよう
情報Ⅰのテストで「データ活用」の問題が出る。でも、グラフの読み取り方がよくわからない——。
データ活用分野は、情報Ⅰの中でも配点が高い分野です。共通テストでも必ず出題されます。この分野で問われるのは主に3つ:
- グラフの種類と使い分け:どんなデータにどのグラフを使うか
- グラフの読み取り:グラフから何が読み取れるか
- 統計量の計算:平均値、中央値、分散などの求め方
情報Ⅰのデータ分析を学ぼうと合わせて勉強すれば、データ活用分野は完璧です。
グラフの種類と使い分け
テストでは「このデータにはどのグラフが適切か」を問う問題が出ます。5種類のグラフを覚えましょう。
1. 棒グラフ
用途:カテゴリごとの量を比較する。
使う場面:クラスごとのテスト平均点の比較、月ごとの売上の比較、都道府県別の人口。
ポイント:棒の高さ(長さ)で量を比較する。カテゴリ間に順序がない場合に使う。
2. 折れ線グラフ
用途:時間の経過による変化を見る。
使う場面:月ごとの気温の変化、年ごとの人口推移、株価の推移。
ポイント:線の傾きで「増加」「減少」「横ばい」を読み取る。急激な変化がある時期に注目する。
3. 円グラフ
用途:全体に対する割合を見る。
使う場面:アンケート結果の割合、予算の内訳、市場シェア。
ポイント:全体を100%として各項目の割合を示す。合計は必ず100%になる。項目が多すぎると見にくくなるので5〜6項目が限度。
4. 散布図(さんぷず)
用途:2つのデータの関係(相関)を見る。
使う場面:数学と英語の点数の関係、気温とアイスの売上の関係、身長と体重の関係。
ポイント:
- 右上がり → 正の相関(一方が増えると他方も増える)
- 右下がり → 負の相関(一方が増えると他方は減る)
- バラバラ → 相関なし
5. 箱ひげ図(はこひげず)
用途:データのばらつきを見る。
使う場面:クラスごとのテスト結果の比較、複数グループのデータのばらつき比較。
ポイント:箱の幅が広い=データのばらつきが大きい。中央値の位置で分布の偏りがわかる。ひげの長さで最大値・最小値がわかる。
各グラフのテストでの出題パターン
棒グラフ:「最も多いカテゴリはどれか」「2つのカテゴリの差はいくらか」が定番。目盛りの起点が0かどうかを確認すること。0から始まっていないグラフは差が誇張されて見えます。
折れ線グラフ:「最も変化が大きい期間はいつか」「増加傾向か減少傾向か」が頻出。線の傾きに注目。傾きが急なほど変化が大きく、水平に近いほど変化が小さいです。
円グラフ:「最も割合が大きい項目はどれか」「2つの項目を合わせると全体の何%か」が出ます。合計が100%になるか確認すること。複数回答可のアンケートでは円グラフは使えません。
散布図:「正の相関・負の相関・相関なしのどれか」「外れ値はどの点か」が定番。点の全体的な傾きを見ること。
箱ひげ図:「中央値が最も大きいグループはどれか」「ばらつきが最も大きいグループはどれか」が出ます。箱の中の線が中央値、箱の幅が四分位範囲(データの中央50%の広がり)を表します。
グラフ選択の早見表
| データの特徴 | 適切なグラフ |
|---|---|
| カテゴリの比較 | 棒グラフ |
| 時間変化 | 折れ線グラフ |
| 割合 | 円グラフ |
| 2変数の関係 | 散布図 |
| ばらつきの比較 | 箱ひげ図 |
グラフ読み取りのコツ
テストでグラフを読み取るとき、以下の4つを必ず確認しましょう。
コツ1: 軸のラベルと単位を確認する
縦軸は何か?(人数?金額?温度?)横軸は何か?(年?月?カテゴリ?)単位は何か?(人?万円?℃?%?)
コツ2: 目盛りの間隔を確認する
目盛りが等間隔でない場合があります。「0から始まっていない」グラフは要注意。縦軸が「90〜100」のグラフは、わずかな差が大きく見えます。
コツ3: 全体の傾向を読む
増加傾向か?減少傾向か?横ばいか?急激な変化がある時期はいつか?他と比べて突出しているデータはあるか?
コツ4: 外れ値に注目する
外れ値とは、他のデータから大きく離れた値のことです。外れ値があると平均値が大きく影響を受けます。テストでは「外れ値がある場合、平均値と中央値のどちらが適切か」を問う問題がよく出ます。答え:中央値。
統計量の基本
平均値(へいきんち)
すべてのデータを足して、データの個数で割った値です。
データ: 3, 5, 7, 8, 12
平均値 = (3 + 5 + 7 + 8 + 12) ÷ 5 = 35 ÷ 5 = 7 中央値(ちゅうおうち)
データを小さい順に並べたとき、真ん中に来る値です。
データ: 3, 5, 7, 8, 12
↑ 真ん中
中央値 = 7
データが偶数個の場合:
データ: 3, 5, 7, 8
中央値 = (5 + 7) ÷ 2 = 6 最頻値(さいひんち)
最も多く出現する値です。例:データ 3, 5, 5, 7, 5, 8 → 最頻値 = 5(3回出現)
分散と標準偏差
データのばらつきを数値で表したものです。分散の平方根が標準偏差です。
データ: 2, 4, 6, 8, 10
平均値 = 6
偏差: -4, -2, 0, 2, 4
偏差²: 16, 4, 0, 4, 16
分散 = (16 + 4 + 0 + 4 + 16) ÷ 5 = 40 ÷ 5 = 8
標準偏差 = √8 ≈ 2.83 練習問題
問題1
以下のデータの平均値と中央値を求めなさい。
テストの点数: 45, 62, 78, 85, 90, 92, 98
問題2
以下のデータの分散を求めなさい。
データ: 4, 6, 8, 10, 12
問題3
「気温と月の関係」を表すのに最も適切なグラフはどれか。
A. 棒グラフ B. 折れ線グラフ C. 円グラフ D. 散布図
問題4
あるクラスのテスト結果が以下のとき、外れ値はどれか。また代表値として平均値と中央値のどちらが適切か。
データ: 65, 70, 72, 75, 78, 80, 82, 85, 15
問題5
散布図で点が右上がりに分布しているとき、2つの変数の関係について正しいものはどれか。
A. 正の相関がある B. 負の相関がある C. 相関がない D. 因果関係がある
解答・解説
問題1の解答
平均値 = (45 + 62 + 78 + 85 + 90 + 92 + 98) ÷ 7
= 550 ÷ 7 ≈ 78.6
中央値: 45, 62, 78, 85, 90, 92, 98
7個のデータの真ん中(4番目)= 85 答え:平均値 ≈ 78.6、中央値 = 85
問題2の解答
平均値 = (4 + 6 + 8 + 10 + 12) ÷ 5 = 40 ÷ 5 = 8
偏差: 4-8=-4, 6-8=-2, 8-8=0, 10-8=2, 12-8=4
偏差²: 16, 4, 0, 4, 16
分散 = (16 + 4 + 0 + 4 + 16) ÷ 5 = 40 ÷ 5 = 8 答え:分散 = 8
問題3の解答
答え:B. 折れ線グラフ
気温は時間(月)の経過とともに変化するデータです。時間変化を表すには折れ線グラフが適切です。
問題4の解答
外れ値:15(他のデータが65〜85の範囲にあるのに対し、15だけ極端に低い)
データを並べる: 15, 65, 70, 72, 75, 78, 80, 82, 85
中央値 = 75(5番目)
平均値 = (15+65+70+72+75+78+80+82+85) ÷ 9 ≈ 69.1
平均値(69.1)は外れ値の影響で実態より低い。
中央値(75)のほうがデータの実態を正しく表す。 適切な代表値:中央値
問題5の解答
答え:A. 正の相関がある
右上がり = 一方が増えると他方も増える = 正の相関。
注意:「D. 因果関係がある」は不正解です。相関があっても因果関係があるとは限りません。例:「アイスの売上」と「水難事故の件数」は正の相関がありますが、アイスが水難事故を引き起こしているわけではありません(どちらも「気温が高い」ことが原因)。
練習問題の解き方の手順
各問題を3ステップで解く方法を紹介します。
問題1の解き方:ステップ1: データを確認する。7個の数値が並んでいるので、合計を7で割れば平均値が出る。ステップ2: 合計を計算する。45+62+78+85+90+92+98=550。550÷7≈78.6が平均値。ステップ3: 中央値を求める。7個のデータの真ん中は4番目。小さい順に並べて4番目の85が中央値。
問題2の解き方:ステップ1: 平均値を求める。4+6+8+10+12=40。40÷5=8が平均値。ステップ2: 各データから平均値を引いて2乗する。(-4)²=16, (-2)²=4, 0²=0, 2²=4, 4²=16。ステップ3: 2乗した値の平均を求める。(16+4+0+4+16)÷5=8が分散。
問題3の解き方:ステップ1: 「何を見たいか」を確認する。気温と月の関係=時間の経過に伴う変化。ステップ2: 各グラフの用途を思い出す。時間変化→折れ線、比較→棒、割合→円、関係→散布図。ステップ3: 時間変化を表すのは折れ線グラフ。答えはB。
問題4の解き方:ステップ1: データを小さい順に並べる。15だけ極端に離れている。ステップ2: 外れ値(15)がある場合、平均値は実態より低くなる。ステップ3: 中央値(75)は外れ値の影響を受けない。データの実態を正しく表すのは中央値。
問題5の解き方:ステップ1: 散布図の点の傾きを確認する。右上がり=正の相関。ステップ2: 「因果関係がある」は引っかけ。相関≠因果。ステップ3: 正の相関があるが因果関係は証明できない。答えはA。
テスト本番でのグラフ問題の時間配分
グラフ問題は1問あたり2〜3分で解くのが目安です。まず軸と単位を10秒で確認し、全体の傾向を20秒で把握します。計算が必要な問題(平均値、分散など)は時間がかかるので、先に読み取りだけの問題を片付けてから取り組みましょう。グラフの種類を選ぶ問題は30秒で解けるので最初に解くのがおすすめです。
テストでよくある間違い
間違い1: 相関と因果を混同する
「相関がある = 原因と結果の関係がある」ではありません。
- 相関:2つのデータが同じ方向に動く(統計的な事実)
- 因果:一方が他方の原因になっている(メカニズムの説明)
具体例1:「消防車の出動台数」と「火災の被害額」には正の相関があります。しかし消防車が被害を大きくしているわけではありません。火災の規模が大きいから、消防車も多く出動し、被害額も大きくなるのです。
具体例2:「アイスクリームの売上」と「溺水事故の件数」には正の相関があります。しかしアイスを食べると溺れるわけではありません。気温という第三の要因が両方に影響しているのです。テストでは「相関関係から因果関係は言えない」が正解になる問題が頻出です。
間違い2: 外れ値があるのに平均値を使う
外れ値がある場合、平均値は実態を反映しません。中央値を使うべきです。例えば年収データで1人だけ1億円の人がいると、平均年収が大きく引き上げられてしまいます。
間違い3: 円グラフの合計が100%にならない
円グラフは「全体に対する割合」を示すグラフです。合計は必ず100%になります。100%にならない場合は、データの扱いに問題があります。
間違い4: 棒グラフと折れ線グラフの使い分けを間違える
カテゴリの比較(A組 vs B組 vs C組)→ 棒グラフ。時間変化(1月→2月→3月)→ 折れ線グラフ。横軸が「時間」なら折れ線、「カテゴリ」なら棒グラフと覚えましょう。
情報Ⅰの試験対策まとめで、他の分野の対策も確認しておきましょう。
中間テスト対策の二進法や擬似コード読解も出題頻度が高い分野です。
まとめ
- ✅ 5種類のグラフの使い分けを覚える(棒、折れ線、円、散布図、箱ひげ図)
- ✅ グラフを読むときは軸・単位・傾向・外れ値を確認する
- ✅ 統計量(平均値、中央値、最頻値、分散)の計算方法を覚える
- ✅ 外れ値がある場合は中央値を使う
- ✅ 相関と因果は別物(テスト頻出!)
次のステップ
- 情報Ⅰのデータ分析を学ぼう — 表計算ソフトを使った実践的な分析
- 情報Ⅰの試験対策まとめ — テストに出る全分野を解説