統計検定準1級を4回受験した民の話し

はじめに

つい先日、統計検定準1級に無事(?)合格してくることができました。 試験対策の中で、先人達の合格体験記には大変お世話になったので、 自身の体験もネットの海に放流し、今後受験を考えている方々の参考に なったりならなかったりすればいいなといったモチベーションでまとめていきます。

目次

自身のスペック

自身のスペックを3行でまとめると

  • 国立情報系院卒
  • 2年ほど前に統計検定2級を取得済み
  • 現在はアラサーIT作業員として中小IT企業に勤務

みたいな感じです。学生時代は確率統計・機械学習分野に割りかし親和性の高い専攻に所属していましたが、 社会人になってからはこれらの知識(というか数学全般)を業務で使用することが皆無であり、 また、2級を取得したのがおよそ2年前だったので、 2級の知識があやふやな状態から準1級の勉強を開始しました。

勉強期間

4ヶ月間でおよそ250時間前後(平日1.5時間、休日4〜5時間)学習しました。 他の合格者の方々も大体同じ位勉強している感じでしたので、みんなこれくらいやろう。

CBT試験の難易度

2015年〜2021年のPBT試験とCBT試験問題の難易度について個人的に評価すると、

(2015年〜2019年の選択問題・部分記述問題) <<<<< CBT試験  \leq (2021年の選択問題・部分記述問題)

みたいな印象です。論述問題がなくなった分、選択問題・部分記述問題のレベルが全体的に上がっており、 体感として2021年過去問の難易度が最も近いと思います。

学習に使用した教材

準1級試験の合格に向けて使用してきた教材は以下の通りです。

公式教材

↑ただのバイブル。準1級の広大な試験範囲を(多少強引さは見られるものの)一冊の書にまとめた奇跡の書物。 本書の最後の方に各章の執筆担当者が掲載されており、オールスター感満載でした。

↑2015年〜2021年までのPBT試験の過去問題集。 公式サイトの合格者の声ページやその他合格体験記内でもちらほら言及されておりましたが、 どうにもPBT試験問題とCBT試験問題を比較すると、出題傾向や問題の難易度、知識の問われ方などに乖離があるように感じられたため、 こちらの教材は学習の初期段階で1〜2周だけして、残りの時間は上記ワークブックをひたすらやり込んだ方が合格率は上がるんじゃないかと思います。

数理統計学分野

↑みんな大好き赤本です。2級対策時のメイン教材として2年前にも使用していました。 学習開始当初は2級レベルの知識が抜けていたため、本書をパラパラめくりリハビリを行いました。

↑上記も2級対策時に使用していた教材の一つで、推定・仮説検定周りの問題の復習に使いました。

↑数理統計学分野(ワークブックの1章〜12章の内容)の理解力向上目的で購入しました。 数理統計学の代表的な教科書としては、新装改訂版 現代数理統計学(竹村本)や現代数理統計学の基礎 (共立講座 数学の魅力)(久保川本)が よく紹介されており、私自身も上記2冊を所持しているのですが、 個人的にこれらの書籍は準1級の学習用途で使用するにはオーバースペック(内容難しすぎ)だと感じました。 かといって、東大赤本だと若干物足りない(特に推定・仮説検定周り)なと感じ、 他にいい本はないかと書店を渡り歩いた結果、上記書籍に出会いました。 レベル感としては赤本と竹村本・久保川本のちょうど間くらいで、 各種概念がコンパクトに整理されているため逆引き辞書的な扱いがしやすく、 例題や演習問題が豊富なこと、各種概念の説明や証明などがわかりやすいことからめちゃめちゃお世話になった本です。 デメリットを挙げるとしたら、ノンパラメトリック法が載っていないことと章末問題の解答が略解しか載っていないことくらいですが、 自分としてはあまり気にはなりませんでした。

多変量解析分野

↑主成分分析、判別分析、クラスター分析(ワークブックの22章〜24章)の内容理解に使用しました。 本のレベルとしては、いわゆる"超初心者向けの本"ではなくある程度数式慣れしている中級者向けに書かれた本という印象でした。 全体を通して丁寧な説明と豊富な図を用いた解説が特徴的で、各種分析手法の用途から理論面にかけてバランスよく学べると思います。 ただし、この本で触れられていなくて準1級の試験範囲となっている手法がまあまあ多い(というか、一冊だけで準1級の多変量解析分野を完璧に網羅している本はおそらく無い)ため、それらについては他の書籍やwebで調べたりしました。

↑回帰分析に特化した古典的な名著という噂を前々から耳にしていて、今回の資格試験に関係なく個人的に気になっていた本です。 ワークブック16章の理解度向上(特に、最小二乗推定量の性質や幾何学的解釈)のために使用しました。 本当は回帰係数の検定周りも腰を据えて学ぶ予定でしたが、結構難易度高めに見えたのとあまりこれだけに時間を取れなかったため断念しました。

標本調査法

↑当該分野について重点的に学習したいと考え、色々な本を漁った結果たどり着いた本です。 各種標本抽出法の性質が薄いページ数にギュッと詰まっていて読みやすかったです。 おそらく実店舗には在庫が無いため、ネットで購入するか図書館などで借りるかしないといけないため他の書籍と比較して入手難易度が高め。

時系列解析

↑改めて紹介する必要もないくらい有名な時系列解析本。 各種時系列モデルの性質や単位根検定(DF検定、ADF検定)の概要について把握するために使用しました。

「学習開始→3回連続不合格→試験合格」までの時系列

学習を開始してから試験に合格するまでの時間の流れをざっくりまとめると以下のようになります。

4月〜5月末まで
  • 東大出版の赤本をベースに2級の知識の振り返り
  • ワークブックの各章の説明文を写経して理解しつつ、例題・演習問題を1回解く
  • 過去問ノータッチ(!?)

上記のような状態で1回目の試験を受けた結果・・・

無事落ちました^^

6月上旬〜6月中旬

流石に勉強不足だったと反省し、

  • 2015年〜2019年の過去問(論述問題を除く)を1〜2周ほど解く
  • ワークブック各章の説明文の行間埋めと例題・演習問題を1〜2周ほど解く

上記のような状態で2回目の試験に挑み、 試験中問題を解いている際は「7割はいったかな〜^^」と何故か手応えを感じてしまっており、 うきうきで試験結果画面を開いた結果・・・

無事落ちました^^

6月中旬〜6月下旬

記念受験的な立ち位置だった1回目の試験とは異なり、2回目の試験はかなり手応えを感じながら問題を解いていたため、 落ちた後のショックが大きく、2〜3日は勉強に手が付きませんでした。 それでも何とか気を持ち直すために、「あと少し勉強すれば合格するはずだから頑張ろう」と自らに言い聞かせ、 1回目、2回目ともに得点率が低かった「1. 確率と確率分布」分野を中心に学習し、 ワークブックの読み込みと過去問の解き直しも同時に行い、試験に挑んだ結果・・・

2回目よりも点数が下がりました^^

7月上旬〜試験合格日まで

1回目の試験に落ちてからはおよそ2週間に1回ペースで試験を受け続けていたのですが、 もっと長期スパンで学習しないと受かりそうにないと判断し、4回目の試験日は3回目の試験日のおよそ一ヶ月後に設定しました。 また、勉強の仕方も以下のように見直しを行いました。

  • 過去問への過学習をやめること
    他の方の合格体験記を見ていると、試験前に過去問をだいたい3周〜5周くらい行ってから本番に挑んでいる方がほとんどであり、 過去に行われたPBT試験問題はCBT試験問題の対策としてある程度有効に働くのかと勉強開始当初は考えていました。 が、3回目の受験を終える頃には過去問に対して抱いていた期待は消え去り、 むしろ過去問に対して信頼の比重を置けば置くほど合格率は下がるんじゃないかと思えるようになりました。 というのも、実際にCBT試験を受けてみた感じですと、PBT試験問題を2段階ほど発展させた問題やワークブックの重箱の隅をつついてくるような問題、そもそもワークブックにも過去問にも載っていないような知識が必要な問題も平気で出してきますし、おまけに出題傾向も過去問とは若干ずれているように感じたため最早過去問とは・・・といった感じでした(2級のときも似たような感想を抱きましたが、準1級ほど乖離はなかったように思えます・・・)。 2回目の受験の段階で論述問題を除いて約8〜9割ほどは理解していたこともあったため、3回目の試験に落ちた後は過去問は一度も解きませんでした。

  • ワークブック各章の説明本文はできるだけすべて覚えること
    上記でも触れましたが、本番ではワークブックの重箱の隅をつついたかのような問題も出題されます。 そのため、ワークブック各章の説明本文に対して他の書籍やwebページを参考にして行間を埋めつつ、 少なくともワークブック内に記載されている内容はすべて覚える勢いで学習しました。

  • ワークブックの各章に対して学習優先順位をつけること
    すべての章の説明文・演習問題を完全に理解・暗記することが理想っちゃ理想なのですが、 コンパクトにまとまっているとはいえ300ページ超えの教材のすべてを頭に入れるのは至難の業ですので、 以下のように各分野ごとに学習優先順位をつけた上でワークブックの読み込みを行いました。

■各分野の学習優先順位
①「2. 統計的推測」
②「1. 確率と確率分布」
③「4. 種々の応用」
④「3. 多変量解析」

■「2. 統計的推測」分野内での学習優先順位
①「9章 区間推定法」、「13章 ノンパラメトリック法」、「12章 一般の分布に関する検定法」、「8章 統計的推定の基礎」
②「10章 検定の基礎と検定法の導出」、「11章 正規分布に関する検定」

■「1. 確率と確率分布」分野内での学習優先順位
①「1章 事象と確率」、「5章 離散型分布」
②「2章 確率分布と母関数」、「4章 変数変換」、「6章 連続型分布と標本分布」
③「3章 分布の特性値」、「7章 極限定理、漸近理論」

■「4. 種々の応用」分野内での学習優先順位
①「28章 分割表」、「21章 標本調査法」、「29章 不完全データの統計処理」、「32章 シミュレーション」
②「14章 マルコフ連鎖」、「31章 ベイズ法」、「27章 時系列解析」、「15章 確率過程の基礎」
③「20章 分散分析と実験計画法」「30章 モデル選択」

■「3. 多変量解析」分野内での学習優先順位
①「16章 重回帰分析」、「17章 回帰診断法」、「23章 判別分析」
②「24章 クラスター分析」、「25章 因子分析・グラフィカルモデル」、「22章 主成分分析」、「26章 その他の多変量解析手法」
③「18章 質的回帰」、「19章 回帰分析その他」

自分にとって比較的得点源となりやすそうな数理統計分野で正答率8割〜10割、 それ以外の分野では6割前後の正答率となれるような状態を目指し、上記優先順位で学習を行いました。

上記勉強方針で1ヶ月ほど対策した結果・・・

受かってました。

今後

このまま統計検定1級の取得にもチャレンジしていこうかなと考えたのですが、 今後は

などに着手していこうかなーと思います(本当は上記以外にもまだまだ着手していきたいことがあるのですが、手が回らん・・・)。 統計検定1級は来年あたりでいいかな。