Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Workout報告会_資料づくり_Harada #139

Open
4 tasks done
forusufia opened this issue Aug 8, 2019 · 0 comments
Open
4 tasks done

Workout報告会_資料づくり_Harada #139

forusufia opened this issue Aug 8, 2019 · 0 comments

Comments

@forusufia
Copy link
Contributor

forusufia commented Aug 8, 2019

取り組む期間

~8/8

Workoutのメニューと照らし合わせ

準備編(プログラミング基礎)

  • Python
    Python環境づくり、パッケージの導入、Jupyter notebookの利用
  • Git
    Sourcetreeで作業履歴を残す
  • Github
    Githubへのプルリクエスト等進捗管理

Pythonの経験値はこれからも積むとして、準備編はほぼよし
Githubを使っていけるようになった 非常によし

理論編

線形代数

  • ビギナー:ベクトル空間
    ベクトル空間が何かを説明できる
    ベクトル空間に標準内積を導入できる
  • 常人:線形変換
    写像が説明できる
    射影が説明できる
    線形変換の定義が説明できる
  • 玄人:特異値分解と主成分分析
    線形次元削減の定義を説明できる
    データ行列の分散共分散行列を対角化して主成分を求めることができる
    SVDを用いて主成分を求めることができる
    求めた主成分を用いて次元削減ができる

ビギナーはなんとか。常人はイメージ。玄人はうーん・・・。固有値の向きと大きさのはなし?

ベイズルール

  • ビギナー:ベイズルール
    条件付き確率,周辺化,同時確率,独立の定義が書ける
    条件付き確率の定義からベイズの定理を導出できる
    ベイズの定理の式の各部分の名前が言える
  • 常人:点推定
    問題設定を説明できる
    最尤推定でデータからモデルのパラメータを推定できる
    MAP推定で(以下同)
  • 玄人:分布推定
    点推定との違いを説明できる
    ベイズ推定でデータからモデルのパラメータの確率分布を推定できる

ビギナーはよし。常人から説明となるとあやしい。

前処理編

ビギナー&常人

与えられたnumpy arrayを平均0,分散1に標準化できる
sklearnやUCIなどの任意の公開データセットデータを「使える」
タスクに応じて適切なデータセットを調べられる
標準的な形式のファイルを読み込める

常人まで。実践編全編通して調べながらプログラムを作っていく力は身についてきたと思う。記事を書きながら、使い分けとなると難しいなぁなど思った。データ解析おもしろそうね。

モデル編

ビギナー:sklearnを用いた実装済みモデルの利用

irisデータセットに対してPCAをかける
Boston house-pricesに対して線形回帰を行い予測できる
sklearnの以下のサンプルコードを写経し自身の環境下で実行せよ
単回帰
PCA

やはり自分の手で動かすとイメージづくりによし。ライブラリはすごいけど中身には注意という話を聞いた。確かに。

常人:Kerasを用いたNNモデルの構築

任意のニューラルネットワークを構築できる
チュートリアルを実行しmnist datasetをClassificationせよ
CNNを構築しmnist datasetに対するClassificationの精度を向上させよ
Autoencoderを構築しmnistデータを用いて学習させよ.また入力データと再構成した画像を比較せよ. 任意の潜在変数からデコードした画像を表示せよ.

AIセミナーもあったけれど、ニューラルネットワークについてはまだちょっと・・・。潜在変数からデコードされた画像に、確かに同じ数字には同じ特徴が表れていた。目で確かめて驚き。

玄人編が間に合わなかったのがSOM実装的に痛いところ。夏に進めよう。

検証編

ビギナー: matplotlibによる描画

結果を出力できる
print
plot
scatter
histgram

各種グラフによる数値の可視化。大事なところ。まだまだ適宜調べながらだけれど、まあよし。綺麗にカスタマイズするとなると奥は深い。慣らしていこう。

常人と玄人はまだ。特に常人編について、モデルの評価の部分は必須なのでこれも夏に進める。クロスバリデーションなどは授業で習ったものなのではやく実践してみたいと思う。

その他編

Workout への取り組み方とか、Qiita の話とか。
中身ももちろん大事だけど、進め方とか、忙しい?中タスクとの付き合い方とか。気持ちの整理の仕方とか。色々少しづつ身に付いたような。説明が難しいけど。
ペースを守ること。力のいれどころを考えること。工夫すればもっと時間作れた説。第二クォーターぐらいのタスク量あっても趣味の時間作れるくらいになれれば最強か。

Action list

  • 草案づくり(このIssue)
  • 仮スライド
  • 先輩に相談
  • 完成
@forusufia forusufia self-assigned this Aug 8, 2019
@forusufia forusufia changed the title Workout報告会_資料づくり Workout報告会_資料づくり_Harada Aug 8, 2019
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant