· 2 分鐘閱讀
從零開始的資料科學之旅
# 開發筆記前言
難得在公司有蠻完整的機器學習跟資料分析團隊,也有相對完整的資源跟 pipeline,趁著這個機會一邊學習資料科學的知識,如果有不懂的地方也可以直接跟同事們請教。資料科學的範圍很廣,目前也沒有一個明確的方向,就邊學邊看可以迸出什麼火花吧,斜槓斜起來!
規劃
-
把大學統計課遺失的拼圖拼回來(2 weeks)
- 分布跟各種檢定方法
- R: 在複習的過程中一邊學
-
複習線性代數(3 weeks)
- 全部忘光光了
-
複習吳恩達的機器學習課程(1 week)
- 這個課在我上的時候是用 Octaves,但概念應該是相通的
-
CourseraDeep Learning Specialization(6 weeks)
-
把之前買的資料科學書看完(3 weeks)
-
跟著fast.ai的進度走然後一邊啃論文
- 之前看完了 1 ~ 4 但全忘光。
-
資料工程
- Airflow
- Kafka
- 私心想學這兩個
應該差不多這樣就可以花上 100 天了,可能再找一些資料分析相關的課來上吧,現在感覺都是機器學習和 Deep Learning 居多。總之先把現在想到的記錄在這裡以防忘記。
目標
主要是想看看前端跟資料科學有什麼好玩的東西,像是跟 ml.js 或是 tensorflow.js 整合感覺都很好玩。
另外就是自己有些想法都是需要資料科學的輔助,所以趁現在比較有時間把這方面的知識補一補。之前學的時候筆記散佈在各地,現在幾乎找不到,然後也忘了一大半,這次會好好記錄在部落格上。
相關文章
- 別再用 AWS Access Key 了Access Key 是 AWS 上容易被忽略的安全風險。用 OIDC 搭配 IAM Role,讓 GitHub Actions 不需要任何 secret 就能安全操作 AWS 資源
- 資料庫主鍵:AUTO_INCREMENT、UUID 與 UUIDv7後端開發常需要決定主鍵,要用 auto increment 還是 UUID?碰撞怎麼辦?UUIDv7 跟 created_at + index 的效能差多少?實際跑了 2000 萬筆資料與設計決策告訴你
- Zeabur 使用心得分享一般獨立開發者要部署服務時都會選擇 Vercel 之類的平台,但有時候需要更進階的需求如資料庫連接時,Vercel 就沒那麼方便,而一般雲端服務商的價格對獨立開發來說也很貴,這篇文章分享了一些使用 Zeabur 的心得,推薦給大家!
- 鍵盤入坑指南 - 韌體篇本篇為 IT 2023 鐵人賽文章:鍵盤入坑指南 - 韌體篇