機器學習教學,機器學習的學習目標種類及方式(回歸 分類 聚類分析)

Machine Learning

此篇適合入門的新人,尤其是自學或想嘗試了解的初學者。
筆者當初也是自學入門,因此希望可以給予各位一個好的開始。
至少了解概念,而不是東拼西湊學錯方向。

首先,先了解以下內容
通常分為以下三種方式做訓練,分別是 回歸  分類  集群

(分類)
首先先講分類,這個最容易理解,就是表面上的意思。使用機器學習將目標做分類,所以我們會有N個Label,Label就是我們標記的目標(註解1)。

(回歸)
再來是回歸,回歸通常計算的是最接近的值。
像是一個人的年齡、膚色深淺值、及痛苦的程度等等。
可能手頭上的資料在年齡上只會有0歲、10歲、20歲、30歲、40歲、60歲及70歲等等。
那麼就會用到回歸來計算該人的年齡,可能10歲的機率是50%,20歲的機率是50%,那麼機器學習的模型計算出的結果就會是15歲。
若以分類做的話,機器學習的模型只會將他分為10歲或20歲。
這就是區別。
當然,以上只是舉例而已,真實的機器學習計算並不是那麼簡單的。
但概念大概就是以上所描述的。

(集群)
這個就比較少會用到,筆者也並沒有去實作過。
因此也不過多講述,以下用圖片作為範例。

圖片可能可以讓各位更快速的理解,那麼以上就是本篇的內容。
下面是一些程式碼上的寫法,可以讓各位理解並上手。

(註解1.)
以動物為例,我們有N張照片,需要分類為貓 狗 雞 豬 牛。
假設貓的圖片,那該圖片的陣列會寫成 [1 0 0 0 0]
       牛的圖片,那該圖片的陣列會寫成 [0 0 0 0 1]
       雞的圖片,那該圖片的陣列會寫成 [0 0 1 0 0]
以此類推。

因筆者當初入門時,各大網站細節方面談論極少,因此每一篇都會盡量把所有細節寫出來。

請各位記得分類就是將目標物預測為某類,選擇機率最大的,是1就是1,2就是2。
回歸就是把各個機率做加權,可能會有小數點,也會有中間值的出現。

從資料輸入、標記、建模、模型存檔到讀取模型都會一一解釋。

Related Posts

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js