前言
難得在公司有蠻完整的機器學習跟資料分析團隊,也有相對完整的資源跟 pipeline,趁著這個機會一邊學習資料科學的知識,如果有不懂的地方也可以直接跟同事們請教。資料科學的範圍很廣,目前也沒有一個明確的方向,就邊學邊看可以迸出什麼火花吧,斜槓斜起來!
規劃
-
把大學統計課遺失的拼圖拼回來(2 weeks)
- 分布跟各種檢定方法
- R: 在複習的過程中一邊學
-
複習線性代數(3 weeks)
- 全部忘光光了
-
複習吳恩達的機器學習課程(1 week)
- 這個課在我上的時候是用 Octaves,但概念應該是相通的
-
CourseraDeep Learning Specialization(6 weeks)
-
把之前買的資料科學書看完(3 weeks)
-
跟著fast.ai的進度走然後一邊啃論文
- 之前看完了 1 ~ 4 但全忘光。
-
資料工程
- Airflow
- Kafka
- 私心想學這兩個
應該差不多這樣就可以花上 100 天了,可能再找一些資料分析相關的課來上吧,現在感覺都是機器學習和 Deep Learning 居多。總之先把現在想到的記錄在這裡以防忘記。
目標
主要是想看看前端跟資料科學有什麼好玩的東西,像是跟 ml.js 或是 tensorflow.js 整合感覺都很好玩。
另外就是自己有些想法都是需要資料科學的輔助,所以趁現在比較有時間把這方面的知識補一補。之前學的時候筆記散佈在各地,現在幾乎找不到,然後也忘了一大半,這次會好好記錄在部落格上。