人工知能技術の研究を行っている東京大学の松尾研究室がデータサイエンス・Deeplearningの学習教材を無料で公開しているので内容や使い方などをまとめています。
松尾研は一般向けに公開講座を行っており、このコンテンツはその教材の一部です。
概要
・初学者向け(Google Colaboratoryを使えばPython等の環境構築不要)
・理論より実践重視(実際に手を動かすことで覚えるスタイル)
GCIデータサイエンティスト育成講座演習コンテンツ
こちらのページにダウンロードリンクや講座の紹介があります。
また、このコンテンツをもとに「東京大学のデータサイエンティスト育成講座」という本も出版されているのでそちらも紹介します。
講座の目次
- 本書の概要とPythonの基礎
- 科学計算、データ加工、グラフ描画ライブラリの使い方の基礎
- 記述統計と単回帰分析
- 確率と統計の基礎
- Pythonによる科学計算(NumpyとScipy)
- Pandasを使ったデータ加工処理
- Matplotlibを使ったデータ可視化
- データベースとSQLの基礎
- データベースとSQLの基礎 (Python)
- ドキュメント型DB(MongoDB)
- 機械学習の基礎(教師あり学習)
- 機械学習の基礎(教師なし学習)
- モデルの検証方法とチューニング方法
- データサイエンティスト中級者への道
- 総合演習問題
「東京大学のデータサイエンティスト育成講座」
基本的に内容は上の講座と同じです。
主な違いは、
- 練習問題、総合演習などの解答例がある。
- 8,9,10,14章がカットされている
- 参考文献、参考URLページがあり、深掘りしたい時に読むべきものが見つかる
- 「おわりに」に今後の学習や参考になる教材についてまとまっている。
です。
基本的にダウンロードコンテンツと同じですので、まずダウンロードしてみて、解答例を見たいなと思った場合に、書籍の購入をすればよいと思います。
※本の場合もマイナビのリンクからサンプルコードをダウンロードできます。
Deep Learning基礎講座演習コンテンツ
こちらのページにダウンロードリンクや講座の紹介があります。
講座の目次
- numpy, scipy, scikit-learn の使い方
- k-Nearest Neighbors (k-NN) を使った手書き文字認識
- ロジスティック回帰、活性化関数、多層パーセプトロン
- Tensorflowの基礎
- Denoising Autoencoder、Stacked Denoising Autoencoder
- 畳み込みニューラルネットワーク(CNN)
- CIFAR-10データセット、Data Augmentation、Preprocessing、Batch Normalization、CNN,Activationの可視化
- グラフ上でのLoop、RNNのsentiment analysis(感情分析)
- RNNでの日英翻訳
- Attentionを用いた機械翻訳モデル、キャプション生成モデル
内容
課題に取り組む過程でいろいろな機能に触れていくスタイル。
基礎的な内容ではあるのですが、理論や背景について説明があるわけではないので、別のもので一通り概念を理解した後に、手を動かして理解を深めるコンテンツとしておすすめします。
コメント