2020年7月8日 · 2 分鐘閱讀

從零開始的資料科學之旅

前言

難得在公司有蠻完整的機器學習跟資料分析團隊，也有相對完整的資源跟 pipeline，趁著這個機會一邊學習資料科學的知識，如果有不懂的地方也可以直接跟同事們請教。資料科學的範圍很廣，目前也沒有一個明確的方向，就邊學邊看可以迸出什麼火花吧，斜槓斜起來！

規劃

把大學統計課遺失的拼圖拼回來（2 weeks）
- 分布跟各種檢定方法
- R: 在複習的過程中一邊學
複習線性代數（3 weeks）
- 全部忘光光了
複習吳恩達的機器學習課程（1 week）
- 這個課在我上的時候是用 Octaves，但概念應該是相通的
CourseraDeep Learning Specialization（6 weeks）
把之前買的資料科學書看完（3 weeks）
跟著fast.ai的進度走然後一邊啃論文
- 之前看完了 1 ~ 4 但全忘光。
資料工程
- Airflow
- Kafka
- 私心想學這兩個

應該差不多這樣就可以花上 100 天了，可能再找一些資料分析相關的課來上吧，現在感覺都是機器學習和 Deep Learning 居多。總之先把現在想到的記錄在這裡以防忘記。

目標

主要是想看看前端跟資料科學有什麼好玩的東西，像是跟 ml.js 或是 tensorflow.js 整合感覺都很好玩。

另外就是自己有些想法都是需要資料科學的輔助，所以趁現在比較有時間把這方面的知識補一補。之前學的時候筆記散佈在各地，現在幾乎找不到，然後也忘了一大半，這次會好好記錄在部落格上。

相關文章

探索其他主題

雜談改變人生觀的一句話前端前端使用圖片時需要注意的事程式語言如何學習寫程式 - Geohot