<🚀 數據領航員札記>
<領航員:🧑🏻🚀 林紘宇/ 🧑🏻🚀 徐澍萭>
<時間:2023/03>
<航行目標:機器學習任務分類、訓練測試集/ 模型評估指標:分類>
恭喜各位!我們已經探索完資料科學宇宙的第一階段,接著我們即將進入一段全新的旅程。在新的旅程當中,我們將會帶領大家一起體驗大數據模,以及讓大家看看現今普遍的大數據模型可以帶給我們在數據上哪些意想不到的結果!
相信大家對於「機器學習」這個名詞已經不陌生,但是機器學習模型是可以做到什麼樣子的任務❓而我們要怎麼使用機器學習模型❓
行動支付、社群媒體普及,每天都有成千上萬比的資料被產出。根據DATAREPORTAL統計數據,在2023年一月份全球使用社群媒體的人數佔比已經將近全球人口的六成!😲可想而知這樣龐大數量的使用者他們每天替網路世界製造出了多少資料,這些資料可能跟購物相關,也有些和生活方式有關,但是這些資料我們只能儲存起來,等到日後需要資料時才需要拿出來使用嗎?
其實可以從這眾多數據當中找到一些有助於公司成長的線索,因為這些資料都可以是公司持續優化服務的資源!💪
所以此時我們就需要透過機器學習來幫助我們了解這些資料,從旁協助我們發覺資料中的蛛絲馬跡!🔍
現在我們就趕快來了解什麼是機器學習吧❗️
👇🏻👇🏻「模型評估指標:分類」👇🏻👇🏻
有淺略了解過機器學習的大家都知道,傳統機器學習可以分為「監督式學習」和「非監督式學習」,而監督式學習底下又可以分成「迴歸」和「分類」兩個主要問題。
🙋我們該怎麼知道我們的模型是否足夠精準呢?如果模型本身錯誤,它所做出的所有預測都是無用的。那我們究竟該如何知道模型是否正確呢❓這時候我們就需要一個客觀的標準來檢查了🧐。
大家也許知道我們在檢查「分類」模型精準度時,會先總結成一張混淆矩陣,但你知道混淆矩陣的四個象限分別是什麼嗎?其他準確度的評估標準又是怎麼透過四個象限繼續延伸的呢❓而這些評估標準的意義又是什麼呢❓趕快來了解吧❗️🤩
👇🏻👇🏻「任務分類、訓練測試集」👇🏻👇🏻
👇🏻👇🏻我們之後還會發更多有關資料科學的文章,大家記得追蹤數據領航員🚀喔!👇🏻👇🏻