このブログは、筆者が数学や数理統計学、生物統計学について学んだことを人生の記録兼備忘録としてまとめたものです。
統計学を勉強したきっかけ
筆者はもともと、大学時代に読書の面白さを知ったことをきっかけに、新しいことや興味をもったことについて勉強してみることを趣味としています。そんな自分は、以前、仕事の中で大学の医学部との共同研究に携わる機会があり、その中で実験デザインや統計学に興味をもち、統計学について勉強してみることにしました。その中で、漫然と勉強するのではきりがないと思い、具体的な目標として、一般財団法人 統計質保証推進協会が実施している『統計検定』の1級の合格を目標として勉強することにしました。
勉強したことをブログに残そうと思ったきっかけ
勉強したことをブログに残そうと思った理由は、大きく分けて2つあります。
最も大きな理由は、冒頭にも述べたように人生の記録兼備忘録として残したいと思ったからです。自分は、「狭く、とても深く」というよりは「広く、そこそこに深く」というタイプで、何年も何年も興味・関心が持続するわけではありません。ただ、人間は時間をかけて学んだこともいつかは忘れるものなので、忘れないうちに記録として残し、「そういえば統計に興味をもった時期もあったな」と振り返れるようにしたいとも思いました。
もうひとつの理由は、自分と同じように統計検定1級のために勉強する人たちが勉強するうえでの手掛かりになりたいと思ったからです。統計検定は、2級までは過去問演習を繰り返し、知識を定着させたり、基本的な計算ができるようになれば何とかなる部分もありますが、1級はどちらかといえば、基本的な統計手法の成り立ちの証明や公式の導出に近いものが求められ、一筋縄ではいかない試験です。
つまり、「どうやって勉強すれば合格に近づけるのか」ということがまず問題となり、勉強の仕方を間違えてしまうと年に1度しかないチャンスを棒に振ってしまう点に難しさがある試験です。ただ、今はインターネット上の先人たちがいろいろアドバイスを残してくれているので、自分も勉強方法や文献などを参考にさせてもらいました。なので、自分としてもできる範囲で、インターネット上で探してもなかなか見つからなかった定理や公式の証明などを補完しつつ、他の人たちの道しるべになりたいと思いました。
ブログの構成
本ブログは、以下のような構成となっています。
生物統計学
統計検定1級は「統計数理」と「応用統計」の両方に合格する必要があります。「統計数理」は全員に共通ですが、「応用統計」は各専門から1分野を選択する方式で、自分の場合は、先述のような経緯から「医薬生物学」について勉強しました。
応用統計は、統計数理と共通する部分も多い「理工学」を選択する人が多く、それゆえにインターネット上の情報には事欠かないのですが、「医薬生物学」については受験者の少なさゆえか、情報を探すのにも苦労しました。この分野における勉強の手がかりになればというのが、最も大きな動機かもしれません。
コンテンツとしては、統計手法の理論だけでなく、疫学や研究デザインについても紹介しており、(自分の理解を助けるためにも)なるべく分かりやすい解説記事という体でまとめました。生物統計学の目次の最後の方に参考文献を載せていますが、理論的な部分については、ジョン・ラチン(2020)『医薬データのための統計解析』がメインの参考書です。
数理統計学
「統計数理」は全員に共通であり、応用統計の手法を理解するうえでの基礎となる部分です。基本的に数学の一分野なので、勉強する際には、数学書の文体に慣れるところから始めるという感じでしょうか。
コンテンツとしては、「確率と集合」から始まり、「確率分布」、「統計的推定・検定」に至るまで、標準的な数理統計学の教科書に載っている範囲のものが大半です。こちらは、解説記事という体ではなく、定理の証明や公式の導出をまとめたノートのような体裁となっています。
数理統計学の目次の最後の方に参考文献を載せていますが、野田 一雄(1990)『入門・演習数理統計』と久保川 達也(2017)『現代数理統計学の基礎』がメインの参考書です。
数学
統計検定1級は統計学や統計理論の数学的な側面を問われる試験なので、基礎的な数学の知識が前提となります。統計学を深く理解するためには、あらゆる数学に関する知識が必要となりますが、統計検定1級を目指すという文脈においては、そこに関連する部分の知識を押さえていれば問題ないと思います。
コンテンツとしては、「順列と組み合わせ」、「数列と級数」、「微分・積分」、「線形代数」が含まれます。三角関数や双曲線関数、曲線の長さなど、必要となることがほとんどないテーマについては、まとめていません。こちらも、解説記事という体ではなく、必要事項をまとめたノートのような体裁となっています。
数学の目次の最後の方に参考文献を載せていますが、松坂 和夫(2019)『数学読本』シリーズ、村上 正康(2016)『教養の線形代数』などがメインの参考書です。また、最近ではWebサイトやYoutubeでの解説記事・解説動画が充実しているので、そちらを参考にすると効率的です。
統計検定1級 過去問 自作解答集
どのような試験においても過去問演習は欠かせません。ここでは、統計検定1級の過去問について、自分が理解できた範囲で解答案を作成しています。ただ、公式ページで公開されている略解や他のWebサイトで公開されている解答を大いに参考にしている部分があるので、完全にオリジナルというわけでもありません。
統計検定1級の受験においては、問題の内容・難易度もさることながら、「時間との闘い」にも気を配らなければなりません。全体で90分、大問1問あたり30分という試験時間は想像以上にあっという間で、要領良くコンパクトに解答を作成する力も必要です。おそらく大多数の人にとって、始めから過去問を完璧に解けるということはないと思われますので、焦る必要はありませんが、最終的には、時間内に解答をまとめきれる力を身につけられるようにしましょう。
なお、統計検定1級 過去問 自作解答集の目次を見れば分かりますが、すべての解答が揃っているわけではなく、一部歯抜けになっています。また、応用統計は「医薬生物学」のみとなります。
医薬データのための統計解析 自作解答集
ここには、ジョン・ラチン(2020)『医薬データのための統計解析』の章末問題の自作解答案を載せています。こちらについても、すべて揃っているわけではありませんのでその点、ご了承ください。
留意点とメッセージ
勉強したことまとめるにあたり、可能な限り「文献による裏付けを行い、間違った情報だけは載せないようにする」という方針で記事を作成しました。ただ、筆者は統計学や数学の専門家というわけではなく、趣味で数年勉強したという程度で、間違っている部分や不十分な部分も多々あると思われますが、その点についてはご容赦いただければ幸いです。
統計学の基礎的な部分を一通り勉強してみて、痛感しましたが、本当に多種多様なテーマがあり(特に応用)、奥深い分野だなと感じています。生物統計学や数理統計学の参考文献の最後の方に「その他のテーマの参考文献」という節が設けられていますが、これらのテーマは、現状では理解が追いついていないけど、(特に実用上)重要と思われるテーマです。自分が記事としてまとめられるかが分からないので、興味がある方に向けて、有用そうな参考文献リストとして集めてみた次第です。
かように、統計学という分野の広さと深さを鑑みれば、不十分な部分が多いブログではありますが、使える部分は使っていただき、みなさまの学習に役立てていただければ幸いです。また、筆者がそうだったように、このブログなどを参考に、より完璧な統計学の解説サイトが生まれれば、望外の喜びです。