Rによるスクレイピング入門
本書では、統計解析ツール「R」を使って、膨大なウェブサイトから情報収集を行う方法(スクレイピングの手法)をわかりやすく解説しています。
HTMLやXMLの解析、APIを活用したデータ収集、データを取得した後の整形など、実践を交えながら、そのテクニックを紹介しています。
目次
●CHAPETR 01 ウェブスクレイピングの準備
●CHAPETR 02 ウェブ技術入門
●CHAPETR 03 ウェブスクレイピング・API入門
●CHAPETR 04 ウェブスクレイピング実践
●CHAPETR 05 API実践
●CHAPETR 06 オープンデータの活用
著者紹介
●石田 基広(いしだ・もとひろ)
徳島大学大学院 教授
大学ではプログラミング、データ分析、テキスト分析などの科目を担当している。著書に『新米探偵データ分析に挑む』(SBクリエイティブ)、『とある弁当屋の統計技師』(共立出版)、『Rによるテキストマイニング入門』(森北出版)など。
●市川 太祐(いちかわ・だいすけ)
医師。サスメド株式会社にて、スマートフォンアプリを用いた不眠症治療に従事している。「医療の現場でアプリが処方される未来」の実現に向けて、学問としての「デジタル医療」の確立を目指す。
訳書に『R言語徹底解説』(共立出版)、『データ分析プロジェクトの手引き』(共立出版)、著書に『Perfect R』(技術評論社、共著)。
●瓜生 真也(うりゅう・しんや)
エンジニア。株式会社ナイトレイにて、位置情報データを用いた分析、Shinyによるアプリケーション開発を担当。KPI設定や分析基盤構築にも取り組む。
好きなブログは「Technically, technophobic.(http://notchained.hatenablog.com)」
●湯谷 啓明(ゆたに・ひろあき)
インフラエンジニア。サイボウズ株式会社のSREチームに所属。グラフを描くツールを探していてggplot2と出会い、Rに興味を持つ。将来の夢はモジュラーシンセ廃人。
担当編集者から
Rといえば統計・解析ツールとしての使い方がメインですが、本書のようにウェブ上からデータを取得することもできます。本書でも紹介しているようにパッケージも豊富に揃っていますので、Rについての知識は最低限でも大丈夫です。ぜひ、ウェブスクレイピングに挑戦してみてください。(吉成 明久)