訂閱
糾錯(cuò)
加入自媒體

機(jī)器學(xué)習(xí)基礎(chǔ) | 監(jiān)督學(xué)習(xí)與無(wú)監(jiān)督學(xué)習(xí)的快速入門指南

介紹監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)有什么區(qū)別?

對(duì)于機(jī)器學(xué)習(xí)的初學(xué)者和新手來(lái)說(shuō),這是一個(gè)常見(jiàn)的問(wèn)題。答案是理解機(jī)器學(xué)習(xí)算法本質(zhì)的核心。如果沒(méi)有明白監(jiān)督學(xué)習(xí)與無(wú)監(jiān)督學(xué)習(xí)之間的區(qū)別,你的機(jī)器學(xué)習(xí)之旅就無(wú)法繼續(xù)進(jìn)行。實(shí)際上,這是你踏上機(jī)器學(xué)習(xí)之旅之初應(yīng)該學(xué)習(xí)的東西。如果我們不了解線性回歸,邏輯回歸,聚類,神經(jīng)網(wǎng)絡(luò)等算法的適用范圍,就不能簡(jiǎn)單地跳到模型構(gòu)建階段。

如果我們不知道機(jī)器學(xué)習(xí)算法的目標(biāo)是什么,我們將無(wú)法建立一個(gè)準(zhǔn)確的模型。這就是監(jiān)督學(xué)習(xí)與無(wú)監(jiān)督學(xué)習(xí)的由來(lái)。在這篇文章中,我將用例子討論這兩個(gè)概念,并回答一個(gè)大問(wèn)題——如何決定何時(shí)使用監(jiān)督學(xué)習(xí)或非監(jiān)督學(xué)習(xí)?什么是監(jiān)督學(xué)習(xí)?在監(jiān)督學(xué)習(xí)中,計(jì)算機(jī)是通過(guò)數(shù)據(jù)來(lái)訓(xùn)練的。它從過(guò)去的數(shù)據(jù)中學(xué)習(xí),并將學(xué)習(xí)到的東西應(yīng)用到現(xiàn)在的數(shù)據(jù)中,以預(yù)測(cè)未來(lái)的事件。在這種情況下,輸入數(shù)據(jù)和期望的輸出數(shù)據(jù)都為預(yù)測(cè)未來(lái)事件提供幫助。為了準(zhǔn)確預(yù)測(cè),輸入數(shù)據(jù)被標(biāo)記了正確的類別。

監(jiān)督機(jī)器學(xué)習(xí)分類重要的是要先記住,所有有監(jiān)督學(xué)習(xí)算法本質(zhì)上都是復(fù)雜的算法,分為分類或回歸模型。1) 分類模型:分類模型用于輸出變量可以分類的問(wèn)題,例如“是”或“否”、“通過(guò)”或“失敗”。分類模型用于預(yù)測(cè)數(shù)據(jù)的類別,F(xiàn)實(shí)生活中的例子包括垃圾郵件檢測(cè)、情緒分析、考試記分卡預(yù)測(cè)等。2) 回歸模型:回歸模型用于輸出變量為實(shí)際值的問(wèn)題,例如唯一的數(shù)字、美元、工資、體重或壓力。它通常用于根據(jù)先前的數(shù)據(jù)觀測(cè)預(yù)測(cè)數(shù)值。一些比較常見(jiàn)的回歸算法包括線性回歸、logistic回歸、多項(xiàng)式回歸和嶺回歸。

監(jiān)督學(xué)習(xí)算法在現(xiàn)實(shí)生活中有一些非常實(shí)際的應(yīng)用,包括:文本分類人臉檢測(cè)簽名識(shí)別客戶發(fā)現(xiàn)垃圾郵件檢測(cè)天氣預(yù)報(bào)根據(jù)當(dāng)前市場(chǎng)價(jià)格預(yù)測(cè)房?jī)r(jià)股票價(jià)格預(yù)測(cè)等什么是無(wú)監(jiān)督學(xué)習(xí)?另一方面,無(wú)監(jiān)督學(xué)習(xí)是訓(xùn)練機(jī)器使用既沒(méi)有分類也沒(méi)有標(biāo)記的數(shù)據(jù)的方法,這意味著不能提供任何訓(xùn)練數(shù)據(jù),機(jī)器只能自己學(xué)習(xí)。機(jī)器必須能夠?qū)?shù)據(jù)進(jìn)行分類,而無(wú)需事先提供任何有關(guān)數(shù)據(jù)的信息。其思想是將機(jī)器暴露在大量變化的數(shù)據(jù)中,并允許它從這些數(shù)據(jù)中學(xué)習(xí),以提供以前未知的見(jiàn)解,并識(shí)別隱藏的模式。因此,沒(méi)有必要定義無(wú)監(jiān)督學(xué)習(xí)算法的結(jié)果,相反,它確定了與給定數(shù)據(jù)集不同或有趣的內(nèi)容。這臺(tái)機(jī)器需要編程才能自動(dòng)學(xué)習(xí)。計(jì)算機(jī)需要理解結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。以下是無(wú)監(jiān)督學(xué)習(xí)的精確說(shuō)明:

1)聚類是最常見(jiàn)的無(wú)監(jiān)督學(xué)習(xí)方法之一。聚類的方法包括將未標(biāo)記的數(shù)據(jù)組織到稱為聚類的集群中。因此,集群是類似數(shù)據(jù)項(xiàng)的集合。這里的主要目標(biāo)是發(fā)現(xiàn)數(shù)據(jù)點(diǎn)之間的相似性,并將相似的數(shù)據(jù)點(diǎn)分組到一個(gè)集群中。2)異常檢測(cè)是指識(shí)別與大部分?jǐn)?shù)據(jù)有顯著差異的稀有項(xiàng)、事件或觀測(cè)值的方法。我們通常在數(shù)據(jù)中尋找異;虍惓V,因?yàn)樗鼈兪强梢傻摹.惓z測(cè)常用于銀行詐騙和醫(yī)療差錯(cuò)檢測(cè)。無(wú)監(jiān)督學(xué)習(xí)算法的應(yīng)用無(wú)監(jiān)督學(xué)習(xí)算法的一些實(shí)際應(yīng)用包括:欺詐檢測(cè)惡意軟件檢測(cè)數(shù)據(jù)輸入過(guò)程中人為錯(cuò)誤的識(shí)別進(jìn)行精確的購(gòu)物籃分析等你應(yīng)該怎么選擇監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)?在制造業(yè)中,哪種機(jī)器學(xué)習(xí)方法最適合給定的任務(wù)受著有許多因素的影響。而且,由于每個(gè)機(jī)器學(xué)習(xí)問(wèn)題都是不同的,決定使用哪種技術(shù)是一個(gè)復(fù)雜的過(guò)程。一般來(lái)說(shuō),磨練正確機(jī)器學(xué)習(xí)方法的一個(gè)好策略是:評(píng)估數(shù)據(jù)。它有標(biāo)簽嗎?是否有專家知識(shí)支持附加標(biāo)簽?這將有助于確定是否應(yīng)使用有監(jiān)督、無(wú)監(jiān)督、半監(jiān)督或強(qiáng)化的學(xué)習(xí)方法明確目標(biāo)。這個(gè)問(wèn)題是反復(fù)出現(xiàn)的嗎?或者,該算法是否有望預(yù)測(cè)新的問(wèn)題?回顧在維數(shù)(特征、屬性或特征的數(shù)量)方面可能適合該問(wèn)題的現(xiàn)有算法。候選算法應(yīng)該適合整個(gè)數(shù)據(jù)量及其結(jié)構(gòu)研究算法類型在相似問(wèn)題中的成功應(yīng)用最后的話監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域的關(guān)鍵概念。在學(xué)習(xí)不同的機(jī)器學(xué)習(xí)算法之前,對(duì)基礎(chǔ)知識(shí)的正確理解是非常重要的。

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)