Pythonと実データで遊んで学ぶ データ分析講座
本書では理論と実践のどちらにもフォーカスを当てAIや機械学習について「ある程度、中身を知って使える」を目指す入門書です。
Twitter APIや国の統計データなど、生のデータを使い、遊んでいるような感覚で理解が進む1冊です。
■「はじめに」より抜粋
本書は、AIや機械学習について、「何だかよくわからないけどすごいもの」という理解から、「ある程度、中身を知っていて使える」にアップデートしたい人(もしくは、アップデートしなければいけなくなってしまった人)に向けた、導入となる最初の1冊になることを目指しています。
本書では、理論と実践、両方を抑えています。まず、なるべく数式を使わずに、直感的な理解ができるように機械学習の理論について解説します。「遊んで学ぶ」というタイトルの通り、理論の勉強も楽しめるように、具体例や図を多く使っています。しかし、だからといって不正確にならないように繊細な注意を払いながら、ギリギリまで噛み砕いて説明を行っています。
その後、よく使われるデータセットではなく、「APIで自由に取得できる、さまざまな企業が提供しているデータ」「国が提供している統計データ」などの生のデータを使い、実際に分析を行います。
本書は、実際にデータを取得するところからスタートすることで、「データの量を増やしたら結果はどうなるのだろう?」「このデータを可視化してみたらどうなるのだろう?」「変数を変えてみたらどうなるのだろう?」と、まるでデータを使って遊んでいるような感覚で理解が進むことを狙っています。
なお、データ分析を行うにあたり、多くの人は、RもしくはPythonというプログラミング言語を使います。どちらも、データ分析やデータ整形、そして可視化を行うのに有効なライブラリが多数存在しているため、非常に人気です。本書では、Pythonを用いて実装コードを記述しています。ただし、Rを使いたい人も進められるように、RとPython両方のコードを、Github上にて公開しています。ぜひ、参考にしてください。
目次
CHAPTER 01Pythonの導入
CHAPTER 02Pythonを使ったデータ処理
CHAPTER 03教師あり~回帰~
CHAPTER 04教師あり~分類~
CHAPTER 05教師なし
CHAPTER 06評価指標
CHAPTER 07ニューラルネットワーク
CHAPTER 08その他の手法
APPENDIX本編で省略した事項について
著者紹介
●梅津 雄一(うめづ・ゆういち)
1992年生まれ。
2016年東京工業大学社会理工学研究科社会工学専攻修士課程修了。
Webサイトのマーケティング業務を経て、現在データ解析と開発業務を行う。
使用言語は、Python、R、C++。
著書に『RとShinyで作るWebアプリケーション」(C&R研究所刊)。
中野 貴広(なかの・たかひろ)
1992年生まれ。
2016年東京工業大学情報理工学研究科情報環境学専攻修士課程終了。
広告会社でのデータ解析業務を経て、現在コンサルティング会社でデータ解析、開発を行う。
使用言語は、Python、R。
著書に『RとShinyで作るWebアプリケーション」(C&R研究所刊)。
担当編集者から
本書ではPythonを使ったデータ分析について、手法の理論と実践の両方を丁寧に解説しています。ぜひ、本書で、データ分析にチャレンジしてみてください。(吉成)