三菱UFJフィナンシャル・グループ主催のdata Science Basic Campに参加しました。
内容:
AI入門では、AIに関する基本的な知識を学びました。具体的にはAIの仕組み・歴史、機械学習との関係やAI事例など。更に、AI開発を進める上で、重要と考えられる3要素(AIクラウドサービス、データサイエンティスト、データ)について学習しました。
プログラミング入門では、プログラミングに関する基本的な知識を学びました。具体的にはプログラミングを学ぶ理由、プログラミング言語の種類、近年人気のプログラミング言語としてPythonの概要の理解を深めました。
Python入門では、データの分析をする上で必要となるプログラミング言語Pythonの基礎理解を深めました。(四則演算、変数とデータ型、文字列の操作、データ構造、リストの操作、論理演算と条件分岐、反復処理、内包表記、関数、ライブラリ、ファイルの入出力)
Python環境設定では、Pythonを動かすためにAnacondaをインストールし、Jupyter Notebook、Google Colaboratoryの使い方を学習しました。
pandas道場では、データの分析をする上で必要となるライブラリpandasの基礎理解を深めました。pandasパッケージを使ったデータの読み込みやデータの表示などの方法から、実際に保育園のデータを用いて、データの並び替えやデータの要約統計量の確認の方法を学び、pandasを用いてデータ操作を行い、より分析や可視化を行いやすいデータに整理していく方法、pandasを使った可視化の方法を学び、データの可視化を行いました。
scikit-learn道場では、Pythonでデータ分析や機械学習モデリングを行う上で欠かすことのできないオープンソースライブラリ「scikit-learn」を学び、scikit-learn」に実装されているAPIやアルゴリズムの使い方、データ分析やモデリングを行う際に必要不可欠である便利関数、教師あり学習(Supervised Learning)は学習データに正解ラベルを付けて、学習させる方法(線形回帰やロジスティック回帰などのアルゴリズム)、教師なし学習(Unsupervised Learning)は学習データに正解ラベルを付けないで学習する方法(k-means法やPCAなどのアルゴリズム)、機械学習のモデルを作成した際に必ず必要となるモデルの評価について学びました。
データ分析入門では、データ分析の基本となるプロセスや考え方など、基礎知識の習得、(データ分析の概要として、データ分析の本来の目的とは何か?どういったプロセスで進めるものなのか?)データ分析の各プロセスの詳細・実施方法について学びました。
健康経営のための疾患リスク予測
データ前処理道場