深層学習のセミナーにて(学習法とか)
Techfeedさんが開催した深層学習のセミナー(8/10 東京駅近く)にちょっと参加してみた。
機械学習を学習する場合、アルゴリズムだけでなく、データも必要であり、どのように調達すればよいのか?という意味で参考になった。また、新技術を組織に導入するのは大変であることと、画像処理技術が急発展した理由について聞けて参考になった。
ツイッターだと以下のような感じか
楽天の森所長も機械学習の使われている事例について説明されていた。たとえば、自然言語の機械学習を取り入れて、百億近い売り上げが増えたとか言っていた。似たような楽天の発表資料を引用しておく(今回の発表ではない。)
座談会で、いろいろと参考になることを伺った。
1つ目には、目標を考えて、勉強すべきと石山さんが仰っていた。たとえば、東大の松尾研は、基礎的な側面である機械学習のアルゴリズムの開発を考えているので、数学的側面を重点としている。しかし、応用を考えるなら、そこまで数学を重点的に学習せずライブラリを使って実際に使ってみるほうが良い。今後の機械学習の進展を考えても、目標設定は、(コンピュータでは出来ず)人間しか出来ないので、これからも目標を考えていくことが重要であるとおっしゃっていた。
2つ目には、画像処理技術が急に発展した理由について、楽天の森所長がコメントしていた。大量の画像データに、誰でもアクセスできるようになったことが、ひとつの要因であると説明していた。
感想として、これからも、利用可能なデータは増えていくということを考えると、この分野は発展する可能性がある。いずれにせよ、大量の有用なデータを保有または、共有していることの重要性を感じた。たとえば、マーケティングデータとかは重要な気がしている。
今回の勉強会で言及されたサイト
- 池澤氏のブログ(深層学習)
- learning.ikeay.net
- 東大松尾研の方に伺いながら(今年)2016年4月から学習しているらしい
- learning.ikeay.net
- 機械学習は苦しい(PFIの方のブログ)
- 機械学習は苦しい - 随所に主と作れば、立処皆真なり
- 機械学習の導入の組織への導入の難しさを記載した資料
- 機械学習は苦しい - 随所に主と作れば、立処皆真なり
- 学習に有用なサイト
- Kaggle
- Kaggle: Your Home for Data Science
- 機械学習をすはるには、大量データを準備する必要がある。コンテストに参加し学習するのが良いのでは?という示唆があった。
- Kaggle: Your Home for Data Science
- scikit-learn
- Kaggle