はじめに
こんにちは、先進運転技術部所属の島田です。普段の業務では車載向けAI技術の開発に取り組んでいます。
統計検定1級は公式HPによれば「実社会における様々な分野におけるデータ解析のニーズに応えるための基本的な能力の習得如何を問う」試験です。
統計学は弊社の主力ビジネス領域である深層学習とも深いつながりがあるため、基礎知識の再確認の意味も込めて2021年に受験しました。
幸いなことに一回目の受験で合格をすることができました。
この試験は公式ホームページに掲載されている試験範囲が広く、難易度が非常に高く見えます。
しかしポイントを抑えれば受かること自体はそこまで難しくありません。本記事では受験記と併せて対策のポイントについても触れたいと思います。
今後試験を受ける人の一助となれば幸いです。
試験概要
- 90分×2の完全記述式の筆記試験。5問のうちから3問を選択して回答します。以下の二つの試験の両方に合格しなければいけません。(合格判定はそれぞれの試験に大して独立に出るため、一方だけ受かるということもありえます。)
- 統計学に関する基本的な知識を問う「統計数理」
- 応用的なトピックや実践的な計算も含んだ「統計応用」
- 解答用紙は大学ノートのような感じで、ページ数含めかなり自由に記述することができます。
- 受験費用は1万円と、ベンダー系の資格やTOEFLなどと比べれば良心的。完全筆記試験であることを考えればかなり安いのではないでしょうか。
筆者の統計勉強歴
- 工学部卒、情報系院卒。
- 学部で統計学の講義を二コマとった。大学院でも一応測度論的確率論のさわりを勉強したが、あまりちゃんと理解はしていません。
- 機械学習関連の教科書を数冊読んだことがあるほか、業務で機械学習関連の論文を読みますが、各種統計的仮説検定を積極的に使うことは少ないです。
勉強方法
勉強方法については競技プログラミング解説で名高いNTTデータの大槻さん(けんちょんさん)による記事が特に参考になりました。
他にもいくつかのブログを参考にしたうえで以下の内容に取り組みました。
- 久保田達也『現代数理統計学の基礎』を通読
- 8章までの内容を理解していれば数理統計分野。「計算統計学の方法」の章は統計応用の理工学を解くうえで役に立つこともあります。
- 試験で問われるような各種確率分布の導出などの式展開が他著と比べて丁寧に書かれている印象があります。
- 演習問題の解説が著者HPで公開されているため、演習にも使うことが可能。あまり解くことはできませんでしたが……。
- 公式テキスト『統計学』(東京図書)は用語の列挙にとどまっているため、あまり役には立ちませんでした。名著として名高い竹村彰通『現代数理統計学』についても、この試験の内容に対してはやや過剰な内容が含まれているように思えます。
- 過去問をすべて解く
- 試験範囲内で作れ、試験時間内に解くことができる問題というのは限られているためか、似たようなトピックが複数回出題されています。過去問を解くことで類題に対する対応力が身につき(実質的な理解はさほど深まっていなくても)得点力はだいぶ上がるように思えます。
- 過去のものは二年ごとに出版されるが、直近のものは略解含めて公式ホームページからダウンロードできるようになっているため、少しでも受験を検討している場合はダウンロードしておきましょう。2020年の過去問は新型コロナウイルスの関係で試験が中止になったため、存在しないことに注意。
- 面倒だったので時間を測って解くといった練習は特にしませんでした。解く速度は人によると思うので、計算が遅い自覚がある人は、時間を意識した練習が必要かもしれないです。
統計数理の対策方法
先述した通り、記述されている試験範囲の割には
- 尤度を計算して微分する
- 簡単な積分をして各種母関数を導出する
- 簡単な積分や母関数の微分を通して期待値を算出する
といった問題がほとんどです。とはいえ単純に計算ができればいいというわけではなく、さすがに不偏推定量といった統計にまつわる各種概念を理解し、何を計算しなければいけないのかを理解する必要はあります。また理系のバックグラウンドがない場合は、計算練習もある程度必要だと思いました。
最近の問題をみると受験者の過去問対策が進みすぎたためか、論証が求められるような問題が増えてきているようです。とはいえ『現代数理統計学の基礎』に載っている用語の定義を理解していれば解ける問題がほとんどです。
時間が限られているので、手が止まらないように以下の頻出事項は事前に理解を深めておくと楽なように思います。
順序統計量の導出方法
順序統計量とは独立同分布からサンプルされるn個の確率変数を小さい順に並べたもの。「n個のサンプルをとってきたときに最小値や最大値が従う分布」を考えるときに有用です。
よく考えればさして難しい話でもないのですが、頻出なので導出までの道筋を覚えておくと手早く解くことができます。『現代数理統計学の基礎』では5.4章で詳しく扱われています。
変数変換
一変数の場合は分布関数をよく考えれば導出できるのですが、逆関数の微分などで意外と混乱しがちな気がします。多変数だとヤコビアンが出てきます。個人的には解析の理解が甘いせいか、分母と分子を逆に考えたりしてしまいがちであったので、暗記してしまうようにしていました。今回も出題されました。
ポアソン分布
問題が作りやすいためか、やたらとよく出る印象があります。今回も出題されました。
指数分布とハザード関数
統計応用の理工系で何回か見ました。初見だと戸惑いがちな概念であると思うので、事前に頭に入れておくとよい気がします。『現代数理統計学の基礎』では3.2.4節に該当します。
統計応用(理工学)の対策方法
理工学分野は、数年前までは、確率統計以外の知識がほとんどなくても解くことができました。現在は「理工学は予備知識なしで解ける」という言説が広まりすぎたためか、近年は実験計画法や機械学習に関する知識が一定程度問われる問題が出題される傾向があります。これはかえって統計からやや離れたトピックも扱うことになるため、機械学習や実験計画になじみがない人には難しくなっているかもしれません。(選択問題を選べばある程度は避けられるますが。)社会科学や人文科学に関しては統計に関する追加の知識は必要ですが覚えていれば簡単な計算で解けるものが多い印象です。検定に関する実践的な勉強にもつながるので、こちらの方を選択するのも良いかもしれません。医薬生物学分野はやや毛色が違い、当該分野にある程度知見がある人でないと追加の勉強が必要な印象が強いです。
試験当日の感想
近くの大学が受験会場になっており、そこで受験しました。
統計数理
問1,問3,問4を選択。
問1
問題文がシンプルですくなくとも小問の3/4までは確実に解けることがすぐにわかったために選択。[4]番は変数変換の公式から立式される微分方程式を解けば良いのですがやや混乱してしまい後から解きなおしました。
問3
過去問でもおなじみポアソン分布であり解きやすそうなので選択。実際[1]-[2]までは過去問にも何度か出てきた問題では?と感じました。
問4
あまり予備知識を必要としないようなパズル的な問題。[1]~[4]までは解けたが、[5]でタイムアップとなってしまいました。
ほぼ解けたと思います。優秀成績賞をもらえました。合格者と受賞者の統計を見ると上位3割ぐらいだと貰えるらしいです。
統計応用
問3、問4、問5 を選択。色々とあやふやな記述が多く、計算ミスもしていたようで不安でしたが一応合格をもらうことができました。
問3
問題文が短く解きやすそうだったので選択。しかし[3]の条件付き分布を求める部分が意外と重く、解き切ることができませんでした。(正規分布に従うことだけは書きました)逆に[4]はGibbsサンプリングを知っていれば記述することができたので書きました。
問4
Gini係数は知っていたので解いてみました。問題文の誘導に従うだけである程度解けたと思います。[4]でランダムフォレストの知識が問われるなど、機械学習よりの問題でした。
問5
疾病に関する検査に関して陽性的中率や陰性的中率を計算させる問題。時代を感じさせます。[4]でやや混乱してしまって時間切れ気味でした。[5]の記述は他の問題が解けていなくても普通に書ける内容であるので、書いておきました。
結局のところ、この試験が役に立つか?
深層学習を実務的に応用していくという側面ではあまり役に立つ局面は少ない気がします。一方で確率統計を勉強しなおしたい人にとっては非常に良いモチベーションになると感じました。
また試験自体はそこまで、深い理解をしていなくても突破可能である一方で、試験範囲をきちんと学習すれば発展的なトピックなどを追う上での参考になることは間違いないと思います。
We are hiring!
筆者以外にも、これまで学習したことの復習のため、また業務に必要な資格の取得に勤しむ社員が多く在籍しており、刺激のある環境です。
センスタイムジャパンでも会社として資格取得を奨励しており、業務に関連するものであれば費用の補助がでます。
ほかにも充実した福利厚生が用意されているので、関心のある方はお気軽に問い合わせください。
https://www.sensetime.jp/contact_recruit
投稿者プロフィール
-
研究開発センター 研究チーム所属 リサーチャー。博士(理学)。
趣味は主に科学関係の読書。
最新の投稿
- 2022.06.01STJ統計検定1級受験記
- 2021.12.17STJRendering 3D Fractals by Sphere Tracing
- 2021.12.13STJエッジAIコンピューティングについて
- 2021.10.06STJセンスタイムによるCVPR2020発表論文: DNN枝刈り(Pruning)手法 「DMCP」を紹介します