概要

情報社会の高度化に伴い,世界には大量のデータが溢れるようになりました.大量のデータから意味のある情報を抜き出すためには,実装ベースでの機械学習の手法の理解が必須です.本勉強会では,大量のデータから有益な情報を抜き出す手法の基礎を取得するべく,プログラミング言語Python,及びそのライブラリであるNumPy, pandas, scikit-learnを用いたデータ分析の手法を扱います.また,コードレビューを通じた,コーディングを行う上での常識の会得も試みます.

目的

  • 実践的なデータ分析の手法の基礎を身につける.
  • 身につけた手法をkaggleなどのデータコンペティッションで実用する.
  • コーディングを行う上での常識を身につける.

第1部 基礎編:データ加工
第1章:ウェブからの注文数を分析する10本ノック
第2章:小売店のデータでデータ加工を行う10本ノック

第2部 実践編①:機械学習
第3章:顧客の全体像を把握する10本ノック
第4章:顧客の行動を予測する10本ノック
第5章:顧客の大会を予測する10本ノック

第3部 実践編②:最適化問題
第6章:物流の最適ルートをコンサルティングする10本ノック
第7章:ロジスティクスネットワークの最適設計を行う10本ノック
第8章:数値シミュレーションで消費者行動を予測する10本ノック

第4部 発展編:画像処理/言語処理
第9章:潜在顧客を把握するための画像認識10本ノック
第10章:アンケート分析を行うための自然言語処理10本ノック

実施期間・日時

場所:  オンライン (Zoom)
日時: 2020年8月 - 2021年1月, 毎週土曜日までに実装とコードレビュー

参考資料

[1] 下山 輝晶 他. Python実践データ分析100本ノック. 秀和システム, 2019.