半熟前端

軟體工程師 / 台灣人 / 在前端的路上一邊探索其他領域的可能性

Data Science

從零開始的資料科學之旅

前言

難得在公司有蠻完整的機器學習跟資料分析團隊,也有相對完整的資源跟 pipeline,趁著這個機會一邊學習資料科學的知識,如果有不懂的地方也可以直接跟同事們請教。資料科學的範圍很廣,目前也沒有一個明確的方向,就邊學邊看可以迸出什麼火花吧,斜槓斜起來!

規劃

  • 把大學統計課遺失的拼圖拼回來(2 weeks)

    • 分布跟各種檢定方法
    • R: 在複習的過程中一邊學
  • 複習線性代數(3 weeks)

    • 全部忘光光了
  • 複習吳恩達的機器學習課程(1 week)

    • 這個課在我上的時候是用 Octaves,但概念應該是相通的
  • CourseraDeep Learning Specialization(6 weeks)

  • 把之前買的資料科學書看完(3 weeks)

  • 跟著fast.ai的進度走然後一邊啃論文

    • 之前看完了 1 ~ 4 但全忘光。
  • 資料工程

    • Airflow
    • Kafka
    • 私心想學這兩個

應該差不多這樣就可以花上 100 天了,可能再找一些資料分析相關的課來上吧,現在感覺都是機器學習和 Deep Learning 居多。總之先把現在想到的記錄在這裡以防忘記。

目標

主要是想看看前端跟資料科學有什麼好玩的東西,像是跟 ml.js 或是 tensorflow.js 整合感覺都很好玩。

另外就是自己有些想法都是需要資料科學的輔助,所以趁現在比較有時間把這方面的知識補一補。之前學的時候筆記散佈在各地,現在幾乎找不到,然後也忘了一大半,這次會好好記錄在部落格上。