《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > 資源 | 源自斯坦福CS229,機器學習備忘錄在集結

資源 | 源自斯坦福CS229,機器學習備忘錄在集結

2018-08-22

Github 上,afshinea 貢獻了一個備忘錄對經典的斯坦福 CS229 課程進行了總結,內容包括監督學習、無監督學習,以及進修所用的概率與統計、線性代數與微積分等知識。機器之心簡要介紹了該項目的主要內容,讀者可點擊「閱讀原文」下載所有的備忘錄。


項目地址:https://github.com/afshinea/stanford-cs-229-machine-learning


據項目介紹,該 repository 旨在總結斯坦福 CS 229 機器學習課程的所有重要概念,包括:


學習該課程所需的重要預備知識,例如概率與統計、代數與微積分等進修課程。

對每個機器學習領域知識的備忘錄,以及在訓練模型時需要的提示與技巧。

上面所有的元素最終匯編進來一個備忘錄里。


VIP Cheatsheets


在這一部分中,該項目根據 CS 229 提供了監督學習、無監督學習、深度學習、機器學習技巧等重點內容。其中監督學習主要介紹了回歸、分類和生成,無監督主要介紹了聚類與降維算法,深度學習概述了三種神經網絡。


監督學習


如下所示監督學習介紹了非常多基礎概念,包括損失函數、梯度下降和最大似然估計等。其中損失函數展示了常用的最小二乘損失函數、折頁損失函數和交叉熵損失函數等,每一種損失函數的圖像、定義和應用的算法都展示在其中。

微信圖片_20180822133507.jpg



監督學習部分一共有四頁備忘錄,除了一般的線性與 Logistic 回歸,還重點介紹了 SVM、樸素貝葉斯和 K 近鄰等其它一些非參模型。這些基本上都是直接給出的定義,因此不會有過多的冗余信息,這對于機器學習開發者與研究者作為參考還是非常有幫助的。


除了標準的定義外,很多重點概念還會用形象的圖示表達出來,如下展示了監督學習中的支持向量機:

微信圖片_20180822133608.jpg



上述定義清楚地描述了 SVM 的定義,它希望能根據「支持向量」最大化分類邊界之間的間隔,這樣的分類模型將更穩定?;旧现环鶊D就講述了 SVM 的基本想法,同時也展現了分類原理,根據它再「回憶起」合頁損失函數也就更容易了。


無監督學習


無監督學習主要記錄了 EM 算法、聚類算法和降維算法等,其中聚類又詳細介紹了 K 均值聚類、層級聚類和其他聚類距離度量方法等,而降維算法則主要展示了主成分分析法和獨立成分分析法這兩種。

微信圖片_20180822133739.jpg



除了標準的定義,這些算法的原理圖也非常重要,如上所示在 K 均值聚類中,四幅圖展示了該算法的具體過程。首先隨機初始化均值,然后將離均值近的樣本分配為均值所代表的那一類,隨后根據誤差更新均值的位置,并直到模型收斂。主成分分析同樣有非常好的可視化,如下 PCA 會先歸一化數據特征,然后根據奇異值分解找出主成分,最后再將所有數據映射到主成分而實現降維。

微信圖片_20180822133850.jpg



深度學習


很多讀者已經比較了解深度學習了,尤其是全連接網絡、卷積網絡和循環網絡。這一份備忘錄同樣也展示了這三種網絡重要的概念與定義,且同時描述了強化學習的一些基本概念,如馬爾可夫決策過程、貝爾曼方程價值迭代算法和 Q 學習等。

微信圖片_20180822133920.jpg



我們認為在圖 CNN 中,非常重要的是計算輸出特征圖大小的公式,即 N = (W-F+2P)/S + 1。其中 W 表示輸入特征圖的長寬,F 表示卷積核大小,P 表示在每一端填補零值的數量,S 表示卷積步幅,因此計算出來的 N 就表示輸出特征圖的尺寸。這對于設計卷積網絡非常重要,我們經常需要該公式控制網絡中間的特征圖大小。


機器學習技巧


這一份備忘錄從分類、回歸、模型選擇和模型診斷出發展示了 ML 中的一些技巧。其中分類與回歸主要從度量方法的角度探討,也就是說到底什么樣的方法才能確定模型的好壞,以及它們的特定屬性。同樣模型選擇與診斷也都希望判斷模型的好壞,只不過一個是從交叉驗證與正則化的角度考慮,另一個是從偏差與方差的角度考慮。

微信圖片_20180822133956.jpg



VIP Refreshers


這一部分作者提供了進修課程的備忘錄,包括對概率與統計、代數與微積分的介紹。


概率與統計


從排列與組合開始,這一部分介紹了概率與統計的概念定義。包括條件概率、貝葉斯法則、概率密度函數、概率分布函數與隨機變量的均值和方差等。后面的統計也展示了非常多的定義與規則,包括分布的 K 階矩、常見的離散型與連續型隨機變量分布,以及樣本均值、方差、協方差等數據特征。

微信圖片_20180822134638.jpg

微信圖片_20180822135139.jpg

微信圖片_20180822135226.jpg



最后,該備忘錄同樣記錄了參數估計,這對于機器學習來說是最為關鍵的概念之一,因為本質上機器學習就是需要通過大量樣本對模型的參數進行估計,或者稱為「學習」。此外,之所以高斯分布如此重要,最后面的中心極限定理可以給我們答案。也就是說,如果采樣 n 個服從獨立同分布的樣本,那么當 n 趨近于無窮大的時候,這個未知的分布一定是接近于高斯分布的。


線性代數與微積分


矩陣運算與微分在實際搭建模型時非常重要,因為不論是傳統的機器學習還是深度學習,我們實際都是使用矩陣甚至是張量進行運算,了解它們的法則才能理解模型的實際過程。在這一份備忘錄中,作者描述了向量與矩陣的定義、各種常見矩陣運算的定義,以及大量的矩陣概念,例如矩陣的跡、矩陣的逆、矩陣的秩、矩陣的正定和特征值與特征向量等。


微信圖片_20180822135256.jpg

微信圖片_20180822135407.jpg


矩陣微分的基本概念也展示在上面,因為我們在根據反向傳播更新參數時,基本使用的都是矩陣微分。這也就需要我們了解 Jacobian 矩陣和 Hessian 矩陣。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 一区二区三区欧美视频 | 日韩色爱| 午夜成年人视频 | 国产成人精品免费视频大全麻豆 | 国产精品手机视频一区二区 | 最近中文字幕免费在线看 | 五月综合激情网 | 国产最新进精品视频 | 91精品国产高清久久久久久io | 久久一区二区精品 | 中国xxxx视频播放50 | 甜性涩爱免费在线观看 | 国产亚洲欧美一区二区 | 色网在线观看 | 夜间福利在线观看 | 精品日韩欧美一区二区三区 | 人人澡天天澡夜夜澡 | 天天白天天谢天天啦 | 成人在线免费看 | 特黄特色一级aa毛片免费观看 | 免费一级毛片在线播放不收费 | 日韩麻豆国产精品欧美 | 久草视频免费在线看 | 热门国产xvideos中文 | 欧美一区二区三区在线视频 | 日韩一区二区三区不卡 | 欧美成人视 | 亚洲第一综合网 | 深爱开心激情网 | 在线天堂中文在线资源网 | www.一级片.com | 亚洲国产一区二区三区最新 | 女同志videos最新另 | 亚洲另类视频在线观看 | 日韩精品一区二区三区在线观看 | 欧美人体一区二区三区 | 天堂va欧美ⅴa亚洲va一国产 | 六月丁香综合 | 欧美18videosex性欧 | 精品91麻豆免费免费国产在线 | 91在线视频免费播放 |