Last Update: December 26, 2021
2021年読書記録
- 「AI新生:人間互換の知能をつくる」"Human Compatible: AI and the Problem of Control", by Stuart Russell, スチュアート・ラッセル著、松井信彦訳、みすず書房(ISBN978-4-622-08984-1, 2021.4.16)
AI について勉強したいと常々考えていたが、実際何から始めればよいかわからなかった。この本がまさにそのような本だと思う。AI 研究を長く続け、有名な教科書 "Artificial Intelligence A Modern Approach - Third Edition"(2010) の著者で、かつ、倫理的な問題を十分な見識をもって扱っている。特に、功利主義や多体問題について、どうしても考えなければならない問題に正面から取り組んでいる。一回読んだだけでは、十分理解できていないので、できれば、英語原文も読んでみたい。少しずつ咀嚼して理解し、そして考えていきたい。TED の講演にも、Stuart Russell: 3 principles for creating safer AI があるが、素人にもわかりやすく伝えられる話し手でもある。しかし、TED では到底表現できない、理論的根拠が、研究論文のレベルではないが、より多くの人に理解できるように書かれている。このような研究者の存在も、重要である。TED には日本語の字幕付きのものもある。「スチュワート・ラッセル : 安全なAIのための3原則」。本書においても、一つの鍵がこの3原則であるが、より広い範囲から、さらに、そのさきまで論じている。三原則とは次の3つである。1. The robot's only objective is to maximaze the realization of human value - ロボット(AI:人工知能)が目指す(べき)ものは、ひとにとってたいせつなことを実現することである。2. The robot is initially uncertain about what those values are - ロボット(AI)は、ひとにとってたいせつなことが何であるかはわかっていないところからスタートする。3. Human behavior provices information about human values - ロボット(AI)は、ひとがどのように行動し・思考し・感じるかを観察して、ひとにとってたいせつなことが何であるかを学習していく。なお、上の訳は、私訳で、松井氏のものは、以下のようなものである。「1. 機械の唯一の目的は、人間の選好の実現を最大化することである。2. 初期状態の機械は、人間の選好について不確実である。3. 人間の選好に関する究極の情報源は人間の振る舞いである。」(p.179)以下は備忘録。「我々がみずからの目的を達成すべく、その動作に効果的な形では鑑賞できないような機械論的行為全体を使用する場合は、かかる機械に入力される目的が我々の真に望んでいる目的であることを念入りに確かめるべきである。Some Moral and Technical Consequences of Automation by Wiener, Norbert」(p.9)「人間は、私たちの行動が私たちの目的を達成すると見込める限りいおいて、知識を備えている。」(p.10)「機械は、その行動が私たちの目的を達成すると見込める限りにおいて、有益である。」(p.10)「機械は、その行動が私たちの目的を達成すると見込める限りにおいて、知識を備えている。」(p.10)「古代ギリシャ哲学の最初期から、知能という概念は、首尾よく知覚し、行動する能力と結び付けられて来た。」(p.21)「我々は目的についてではなく、目的のための事柄について思考する。というのも、医者は健康にするかどうかを思案しないし、弁論家も説得するかどうかを思案しない。目的を定めた上で、どのようにすればまた何によって目的が達成されるかを考察するのである。」(p.21)「AIはボードゲームやパズルのような、観測可能で、離散的で、決定的で、ルールが既知である問題について大きな進歩を遂げてきた。(中略)政府の運営や分子生物学の講義のような問題はさらに一層難しい。環境は複雑で、大部分(一刻の状態や、学生の頭の中の状態)が観測不可能であり、オブジェクトとその種類は途方もなく多く、行動の明確な定義はなく、ルールは不明、不確実性が非常に高く、ホライズンは実に長い。」(p.47)「グローバルラーニングXプライズ大会:発展途上国のこともたちが基本的な読み書きと計算を独習で15ヶ月以内にできるようなスケーラブルがオープンソースソフトウェアの開発 ーキットキット・スクール、ワンビリオン」(p.72)「ニック・ボスとロム『スーパーインテリジェンス』AIが成功すれば、文明のたどる道筋は、人類がこの宇宙からの授かりものを思いやりをこめて嬉々として利用するようなものとなる。」(p.104)「世界人権宣言代3条 すべて人は、生命、自由および身体の安全に関する権利を有する。これに加え、すべての人は精神の安全に対する権利-情報がおおむね真実である環境の中で暮らす権利も有するとしたい。」(p.109)「民主主義諸国は、『真実の情報にアクセスできずして思想の自由なし』を追求せず、『真実は最後に勝つ』と愚直に信じているらしく、そのせいで私たちは今なお無防備だ。」(p.110)「レピュテーションシステムの正常な機能を守る一つの手は、一次情報にできるだけ近い情報源を持ち込むことだ。」(p.110)「AIが仕事を奪う? マーティン・フォード『ロボットの脅威ー人の仕事がなくなる日』、カルム・チェイス『経済の特異点ー人工知能と資本主義の死』」(p.115)「天地創造以来はじめて、人類はまともな問題、永遠の問題に直面することになる。切迫した経済的な必要から自由になった状態をいかに使い、科学と福利の力で今後に獲得できるはずの余暇をいかに使って懸命に、快適に、裕福に暮らしていくべきなのかという問題である。」(p.123)「ケインズ:経済的な必要から自由になったとき、豊かさを楽しむことができるのは、生活を楽しむ術を維持し洗練させて、完璧に近づけていくひと、そして、生活の手段にすぎないものに自分を売り渡さない人だろう。」(p.125)「データ主体が、当該主体に関する法的効力を発生させるような、または当該主体に対して同様の重大な影響を及ぼすような、プロファイリングを含む自動化処理のみに基づく決定の対象にされない権利を有する。GDPR Article 23, 2018」(p.130)「人間は、思考を肩代わりする機械を発明することによって、自らを追い越し、自らの存在の必要性を排除する。だが、発明した機械の完成度が高められた場合に、その欠点をすべて改善して、人間の理解を越えた着想を次々と繰り出す、という計画をその機会が考えないとも限らないではないか。」(p.136)「程度にばらつきこそあれ、20世紀の主な技術課題-原子力発電、遺伝子組み換え生物 GMO、化石燃料問題にはどれも、議論に合理性を欠く、相手に好都合かもしれない合理的な論点の是認を一切拒むという部族主義に共通する兆候が見られる。」(p.164)「目的を最適化する機会をつくったなら、その機械に指示する目的が私たちの望みと一致していなければならないのだが、人間の目的を完璧に正しく定義する方法がわかっていないことだ。幸い中道路線がある。」(p.176)「税金逃れを防ぐ最善の解決策は、件のエンティティに税金を払いたいと確実に思わせること、不正を働きかねないAIシステム相手の最善の対策は、人間に判断を委ねたいと確実に思わせることである。」(p.211)「ワイヤーヘディング Wire Heading」(p.214)「アダム・スミス:人間というものをどれほど利己的とみなすとしても、なおその生まれ持った性質の中には他人のことを心に懸けずにはいられない何かの働きがあり、他人の幸福を目にする快さ以外に何も得るものがなくとも、そのひとたちの幸福を自分にとってなくてはならないと感じさせる。他人の不幸を目にしたり、状況を生々しく聞き知ったりしたときに感じる憐憫や同情も、同じ種類のものである。他人が悲しんでいるとこちらもつい悲しくなるのは、じつに当たり前のことだから例を上げて説明するまでもあるまい。」(p.237)
(2021.8.9)
- 「データ分析のための数理モデル入門〜本質をとらえた分析のために」江崎貴裕著著、ソシム(ISBN978-4-8026-1249-4, 2020.5.8)
まえがきには「本書では、数理モデルを使ったデータ分析の本質的な部分を抽出するという立場をとりながら、広い視野でデータ分析を眺めるという解説を目指しました。これにより、そもそも数理モデルを使ったデータ分析で何ができるかわからない。今自分が使っている数理モデルは適切なモデルなのか、また他の可能性があるとしたら、それをどうやって探せばよいのかわからない。数理モデルの振る舞いや性質を理解することで、より本質に迫ったデータ分析がしたい。といったニーズに対して、一定の回答ができるのではないかと期待します。」とある。この目的をもとに、読むと、私のような背景のものには、適切に書かれていると思う。あくまでも、この目的に限ったことであって、個人的には、ある程度の整理はできたと思う。しかし、多少の参考文献はあるものの、カリキュラムの一部として、今後どのように学んでいったらよいかの指針が体系的に添えられてはいないので、発展性には欠けるように思われる。以下は備忘録。出版社のリンクと目次「4.2 オイラー法による数値積分(numerical integration)とルンゲクッタ法(Runge-Kutta method)」(p.86)「4.4 制御理論:微分方程式を解くための便利な道具ラプラス変換(Laplace transform)」(p.91)「正規分布に従う確率変数の二乗和:χ2乗分布。χ2乗に従う確率変数の比:F分布。」(p.119)「7.2 ARモデル(自己回帰の関係性を記述)→ARMAモデル(移動平均の効果を追加)→ARIMAモデル(トレンドの効果を追加)→SARIMAモデル(周期(季節)変動の効果を追加)」(p.145)「動的線形モデル(dyanmic linear model: DLM)」(p.148)「ソフトマックス関数(softmax function)」(p.181)「機械学習モデルの選択例:scikit-learn algorithm cheat sheet」(p.219)
(2021.9.5)
- 「Scratch ではじめる機械学習:作りながら楽しく学べるAIプログラミング」石原淳也・倉本大資著、阿部和広監修、オライリー・ジャパン(ISBN978-4-87311-918-2, 2020.7)
出版社のリンクと目次と関連ファイル。MITが開発した子ども用プログラミング言語との認識だったが、ボランティアで学習支援をしている児童養護施設でも、夏休み、皆、NetBook か iPad を持って帰ってきて、Scratch で遊んでいる子が多く、何人かは、それなりのプログラムも作っていたが、指導者がいないので、ちょっと勉強してみることにした。ちょっと、できる子が、習い事をして、そのちからを伸ばすのは、児童養護施設ではなかなか難しいので。その、Scratch と、機械学習はミスマッチかと思っていたが、拡張して、様々な機械学習のコンポーネントが使えるようにしたもの(https://stretch3.github.io/)があることを知り、勉強になった。児童養護施設でも、スタッフは使えず、指導もできなかったが、いまは、おそらく、多くの家庭でもそうだと思う。そう考えると、大学の、一般教養で、特にその時間以外、プログラミングや、AI にふれる機会のない、いわゆる文系学生にもよいかなと思った。あとで、こどもたちと一緒に、使えるかもしれないし、AI や機械学習について、体験できていることは重要である。中で使われている、モジュールは、ImageClassifier2Scratch、ML2Scratch、TM2Scratch など。これらも、著者の石原淳也さんが開発したもののようだ。Junya Ishihara 正直ちょっと驚かされた。ちょっと調べてみると、なかなか魅力的なかたでもある。あまり調べもしないで、日本はまだまだと思っていたが、このような方が、たくさんおられるのかもしれないが。
(2021.9.8)
- 「虐待が脳を変える〜脳科学者からのメッセージ」友田明美・藤澤玲子著、新曜社(ISBN978-4-7855-1545-1, 2018.1.15)
出版社のリンクと目次。児童養護施設で学習支援をしていて、友田明美著「いやされない傷ー児童虐待と傷ついていく脳」(診断と治療社)に興味を持ち、読んでみたいと思ったが、いくつかの図書館になかったので、手にとったのがこの本である。私が読みたかった本が医学書で、一般向けでないので、友田氏の近くで働いているライターの藤澤さんが一般のひとでも読めるようにと書いたものとのことで、正直にいうと、物足りなかった。やはり、論文や医学書を読まないと、根拠が明確ではなく、かつ関連資料を当たることもできない。しかし、一般向けに伝えたいとの情熱は伝わってきた。最後の二人がそれぞれに書いたあとがきからも多少うかがい知れるが、友田氏自身の母親としての失敗談なども、書かれており、好感がもてたことも確かである。また、8章から11章にはある程度医学的な考察も書かれている。医学的な脳の研究の背景を書いた以下の箇所はわかりやすい。「最近まで心理学者たちは、児童虐待の被害者は社会心理学的発達が抑制され、精神防御システムが肥大するために、大人になってから自己敗北感を抱きやすいのだと考えていた。精神的・社会的に十分に発達しないまま、『傷ついた子ども』に成長してしまうというのだ。だから、その傷ついた『ソフトウェア』を治療すれば再プログラムすることができると考えた。つまり、前述のトラウマを引き起こす三つの要因ー生物学的要因・心理学的要因・社会的環境ーの中の、心理学的要因と社会的環境を修復すればよい。周りの環境(社会的環境)を整え、どのように物事を捉え考えるかという認知の方法(心理学的要因)を改善すれば、完治するはずだ。」(p.109)無論、そうではないことが、書かれている。また、脳が傷ついてしまっていることがわかった今も、それは修復できるのか、その部分は修復できなくても、その他の部分が補いうるのかなど、研究が進んでいることも書かれている。個人的な経験と照らしながら、研究結果についても、論文を読み、また、MOOCs の Brain Science のコースなども受講しながら、一つ一つ学んでいきたいと思った。以下は多少の備忘録:「正解を出すことはできないが、少なくとも親がこどもの安全や環境に気を配り守ってやろうとしう気持ちこそがもっとも重要だと思う。」(p.19)「娘のことば:さびしいと思ったことが無いといえばうそになる。でも、いつでもお母さんがわたしのことを愛してくれているということだけはわかったし、何でも相談できたから、それほどつらくはなかった。それに、働く母の姿を見て誇りに感じていたことも事実。だからわたしもお母さんと同じ道(娘も医療関係の道に進んでいる)を歩むことを決めたと思う。」(p.20)「DVとは、家庭内暴力の略で、特に配偶者や恋人間の身体的、精神的暴力のことである。虐待と同様、この暴力には、暴言などの精神的なもの、性的なもの、生活費を渡さないなどの経済的なもの、行動を制限するなどの社会的なものも含まれる。内閣府の調査では、婦人相談所など全国208ヶ所の配偶者暴力相談支援センターに寄せられた配偶者による暴力の相談件数は、平成22年度で、約77000件だった。」(p.25)「児童虐待防止法における児童虐待の定義:18歳に満たない児童に対し、保護者が行う以下の行為。1.身体への暴行、2. 児童へのわいせつ行為と、わいせつ行為をさせること、3. 心身の正常な発達を妨げる減食・長時間の放置、4. 保護者以外の同居人による前記の行為と、その行為を保護者が放置すること、5. 著しい暴言・拒絶的対応・著しい心理的外傷を与える言動を行うこと。」(p.37)「愛着障害とは、乳幼児期に長期にわたって虐待を受けたり、両親の死やその他の要因で養育者と安定した愛着関係を結ぶことができなくなることで引き起こされる障害の総称である。医療の現場では、DSM-5(精神障害の診断と統計マニュアルの最新版)などで示す『反応性愛着障害』と『脱抑制型対人交流障害』という障害名を用いるが、一般的にはそれよりも広い範囲を示し、愛着の不足によって引き起こされる様々な困った症状をすべて指し示すことが多い。」(p.41)「発達障害とは、脳機能の発達が関係する生まれつきの障害全般を指すもので、自閉スペクトラム症(ASD)、限局性学習症(LD)、注意欠陥・多動性(ADHD)などが含まれる。『こだわりが強い』『話が聞けない』『落ち着かない』など、特徴も様々で、知的障害のある人もいれば非常に高い知能を持つ人もいて、非常に症状が幅広い。人と違った行動や考え方を“個性”と捉える向きもあるが、親を含む周囲の人や本人が『生きにくさ』を強く感じる場合には、やはり“障害”とと耐えて対応する必要がある。しかし、症状が幅広いために、どこまでが個性でどこからが障害かという診断をつけるための客観的な指標の確率がいまだ課題とされている。」(p.63)「発達障害は現時点では基本的には治ることは無いと考えられている。しかし、特性を知り、行動の方法を学ぶことで外部や他人とうまく関わることができるようになり、問題が激減することが多い。これを療育というが、実際に、外来に来られる患者さんでは、療育を受けることで飛躍的に『生きにくさ』『育てにくさ』が軽減したと言われることが多い。」(p.68)「虐待を受けると、暴力や性的なものに対して過度の恐怖を抱くようになる人が多い。しかし、一見虐待とはまったく無関係に見えるような症状も多く見られる。多動性、摂食障害、不安症、抑うつ、薬物乱用、アルコール中毒、非行、暴力、殺人‥。」(p.71)
(2021.10.16)
- 「脳科学と発達障害〜ここまでわかった そのメカニズム」榊原洋一著、中央法規(ISBN978-4-8058-3008-6, 2007.12.20)
出版社のリンクと目次。少し古いが、基本的なことを確認したくて、この本を手にとった。広汎性発達障害(ASD(Austic Spectrum Disorders, 自閉症スペクトラム、アスペルガー症候群): 社会性の乏しさ、あるいは狭く繰り返される常動的な行動や関心q)、注意欠陥多動性障害(Attention Deficit Hyperactivity re, ADHD: 注意欠陥あるいは多動、衝動性)、学習障害(LD: 誤字、書字、計算の困難)について、それぞれの説明と、脳機能の可視化がどこまで進んでいるかを、磁気共鳴機能画像法(functional magnetic resonance imaging, fMRI)、陽電子断層撮影法(ガンマ線を利用、Positron Emission Tomography, PET)、脳磁図(磁場の変化を利用、非侵襲的脳機能検査、Magneto Encephalo Graphy, MEG) にわけて基本を解説している。現在は、DSM-5(精神障害の診断・統計マニュアル第5版)であるが、DMS-4 の基準のもとで診断基準の訳を掲載している。未発達領域で、少しずつ分かり始めているといった印象である。
(2021.10.24)
- 「アケメネス朝ペルシャ〜史上初の世界帝国」阿部拓児著、中央新書 2661(ISBN978-4-12-102661-3, 2021.9.25)
出版社のリンク。アケメネス朝ペルシャの初代は、キュロス二世で、捕囚となったイスラエル(ユダヤ人)の帰還を許し、エルサレム(第二)神殿の再建を始める勅令を出したとされ、聖書でも好意的に描かれている。そのあとも、ペルシャ帝国内に留まったユダヤ人も多くいるが、エルサレムを中心とした、営みが再開され、各地に散らばったユダヤ教徒(ディアスポラ)にとっても、エルサレムは重要な拠点なったことが聖書にも書かれている。(特に、エズラ記・ネヘミヤ記(ヘブル語聖書では一つの巻))アケメネス朝ペルシャの前のアッシリアについても知りたいと思っていたが、まずは、この新刊を手にとった。一般的にもよく知られている、ヘロドトスなど、ギリシャの著述家・歴史家とともに、ペルシャ側の記述としての碑文などこそ重要視すべきといるオリエンタリズムも、検証し、公平に見ようとしながら、不明な点は不明とし、しかし、著者の考えも披瀝する書き方に好感を持った。特に、ペルシャ側の資料の少なさは、大きな制約となるが、何度と無く起こったギリシャ・ペルシャ戦争のなかで、交流もダイナミックに起こり、実際に、ペルシャに行った経験のあるギリシャ人の記述などもあり、二元対立型ではなく、興味深い。わたしのような全くの素人が小学生のころから抱いていた、なぜ、アレクサンドロスは、短期間で、あのような版図を持つ大帝国を築いたのかという問には、少しでも歴史を知っている人にとっては常識であろうが、このペルシャが前にあり、それを滅ぼしたことで、広大な領土を確保したというあたりまえのことも理解できた。特に、著者が、アレクサンダーこそが、アケメネス朝最後の王とする見方もできると最後に書いていることも、興味深かった。ペルシャの衰退期、特に、エジプトや、バルカン半島(マケドニアとギリシャ)などの統治が困難であったことを、引き継いだ、アレクサンダーが結局、それらをまとめ上げるところまでは、行き着かなかったことも、ある連続性の中で理解できるように思った。中東の歴史は、これからも、少しずつ学んでいきたいと思う。備忘録:目次 はじめに:史上初の世界帝国、序章:アケメネス朝ペルシャ帝国前夜、第1章:帝国の創設者〜キュロス二世、第2章:エジプトを制服した狂気の王〜カンビュセス二世、第3章:帝国の完成者〜ダレイオス一世、第4章:ペルシャ戦争と語りなおされるペルシャ王〜クセルクセス、第5章:円熟の中期ペルシャ帝国〜アルタクセルクセス一世とダレイオス二世、第6章:文献資料に恵まれた長寿の王〜アルタクセルクセス二世、第7章:帝国最後の輝き〜アルタクセルクセス三世からダレイオス三世、おわりに:アケメネス朝最後の王?アレクサンドロス。年表(一部)BCE:609 アッシリアの滅亡、559 キュロス2世、ペルシャ王に即位?、550 メディア征服・アケメネス朝ペルシャの創建、530 キュロス死去、カンビュセス二世即位、522 カンビュセス死去、ダレイオス1世即位、515 エルサレム「第二神殿」竣工、486 ダレイオス一世死去、クセルクセス即位、465 クセルクセス死去(暗殺)、アルタクセルクセス一世即位、424/3 アルタクセルクセス死去、クセルクセス二世、セキュンディアノスの治世を経て、ダレイオス二世即位、405/4 ダレイオス二世死去、アルタクセルクセス二世即位、358 アルタクセルクセス二世死去、アルタクセルクセス三世即位、338 アルタクセルクセス三世死去、アルセス即位、336 アルセス死去(暗殺)、ダレイオス三世即位、マケドニアでアレクサンドロス三世(大王)即位、334 アレクサンドロスの東方遠征開始、330 ダレイオス三世死去(暗殺)
(2021.11.3)
- 「数式がなくてもわかる! Rでできる因子分析」松尾太加志著、北大路書房(ISBN978-4-7628-3166-9, 2021.9.20)
出版情報と目次のリンク。多変量解析は、それぞれの分野で様々な手法が用いられているが、その一つ、特に心理学などで用いられる、因子分析について、基本的なことを知っておこうと思い手にとった。「因子分析は、調査や実験などを行って得られたデータ(の変数)に共通する因子(要因)を見つけるだめの分析です。『共通する』ということがキーワードとして重要で、共通してない場合は因子分をする必要はありません。もう一つのポイントは、その因子(要因)を直接観察できないということです。知りたい因子(要因)から直接データを得ることができないので、『潜在している』という言い方をします。直接、その要因のデータを得ることができるのであれば、因子分析をする必要はありません。」(p.1)として、5つの教科の相関(架空のデータ)から、文系能力、理系能力を探ったり、授業評価調査から因子を見つけたりといった例を用いて説明している。主として、R の psych と、GPArotation の2つのパッケージを利用している。p.84 の実行例 8-2 のアルファ係数の算出以外は、すべて確認して、R Markdown として記述した。「因子分析の結果として出てくるのは、因子負荷量の値だけです。その結果からどのような因子であるのかを解釈するのは人間です。しかも、そこで必要とされるのは、統計学的な知識ではありません。そのデータに関しての専門的な知識です。」(77)これは、うっすら理解していたことだが、明確に書いてくださり、具体例からも確認することができた。似たものとして、主成分分析との違いについては「主成分分析は観測変数からの合成の変数を作り出すのに対して、因子分析は潜在的な共通因子を探る分析です。変数間の関係性を矢印などで示すパス図を描くとその違いは一目瞭然です。主成分分析での主成分(因子に相当するもの)は観測変数からの矢印であるのに対して、因子分析での潜在因子は、観測変数への矢印になっています。」(p.92)何をしているかを、多少理解することができた。
(2021.11.12)
- 「Scratchではじめよう! プログラミング入門 Scratch 3.0版」松尾太加志著、北大路書房(ISBN978-4-7628-3166-9, 2021.9.20)
出版情報と目次のリンク。Scratch は、初心者が、プログラムを学ぶのに、とても適していると思う。適当なテキストを探していたが、これは、非常に良い構成になっている。小学生には、難しいと思うが、高校生や大学生・社会人には、適しているだろう。大学の教養として、Scratch というより、プログラミングを教えるにも適していると思う。プログラミングの基礎知識をもっているかどうかは、これからの社会において、重要であろう。副題には「ゲームを作りながら楽しく学ぼう」とあり、シューティング・ゲームを作っていく構成になっている。だれでも、一回は、遊んだことがあるだろうから、イメージがつきやすく、目的も明確である。「15+1(micro:bit)ステージで着実に学べる、プログラミングの基本が、この1冊で、分かる」と表紙下に書いてある。教科書的なものに作り込んでいくためには、それぞれのステージで学んだことを利用して、多少発展させればできる、例題を載せ、回答のリンクを示す。または、それほど、複雑ではない、様々な作品を紹介して、リミックスを促すなどが考えられる。これが時間がかかるのだが。まずは、わたしも、いくつか、作成してみようと思う。時間を見つけて。
(2021.11.18)
- 「データサイエンスの基礎 Rによる統計学独習 An Introduction to Statistics with R : A Self-Learning Text」地道正行著、 裳華房(ISBN 978-4-7853-1578-8, 2018.10.25)
出版情報と目次と掲載データとコードなどのリンク。昨年、データ分析を一緒に教えることになった方から、自分で持っていたのでと、献呈本を頂いた。今年また同じコースを教えることになったので、自分とは違った視点からのものも勉強しておこうと思い、手にとった。流し読みの部分がなかったとは言えないが、コードもすべて実行し、著者が伝えたかったことを少しは受け取れたと思う。本にQRコードがついており、データもコードもダウンロードできるようになっている。理系の大学一年生程度の数学の訓練を受けていれば、書名の通り、独習も可能なのではないかと思われる。数学の部分を簡便にし、省略もしているものの、文系の学生には、式の形、変形などを考えると少しハードルが高いと思う。確かに、統計学はデータサイエンスの基礎ではあるが、パブリック・データの入手・分析などを考えると、このようなものを基礎とするのが良いのかは個人的には、疑問が残る。R については、読者が使いやすいように、いくつも独自の関数が定義されていて素晴らしいが、ggplot2 以外は、tidyverse package の活用について述べられておらず、少し古い感じがする。ここまで丁寧に、情報が提供されているなら、bookdown での出版が考えられてしかるべきだと思う。出版社にとっては、大きな脅威となると思われるが、日本はあまりにも遅れているように感じる。データサイエンスを一般の学生が学んでいくためには、質は下げず、もっとハードルを下げる必要があると思う。統計学や数学は、データサイエンスの基礎として学ぶのではなく、必要に応じて、徐々に学んでいくのでも良いのではないだろうか。実際のデータにおいては、どの程度正規分布かなど、母集団の分布を仮定できるかが課題で、十分、Data Visualization をいろいろな形で活用していく、Exploratory Data Analysis(EDA, 探索的データ分析)のほうが重要に思う。
(2021.12.26)