機器學習與深度學習
深度學習確實是機器學習的一個分支領域。
機器學習旨在讓計算機系統通過數據學習規律,從而能夠對新的數據進行預測或決策等,它包含了眾多方法和技術,比如傳統的基于規則的機器學習算法(像決策樹、支持向量機等),通過人工提取特征后讓模型學習特征與目標之間的關系。
深度學習則側重于利用深度神經網絡結構,它能夠自動從海量的數據中學習到層次化的特征表示,不需要人工去刻意設計和提取復雜特征。例如在圖像識別中,深度學習模型可以直接從原始圖像像素數據里逐步挖掘出如邊緣、紋理、物體形狀等不同層次的特征,進而判斷圖像中的物體類別。
深度學習基礎知識
感知機:早期的簡單神經網絡模型,由單個神經元構成,可用于簡單的線性分類任務,如區分兩類線性可分的數據點。
神經元:是神經網絡的基本構成單元,模擬生物神經元工作原理。它接收多個輸入信號,每個輸入乘以相應的權重,然后將這些乘積求和,再通過激活函數處理后輸出結果。
神經網絡結構:
神經網絡是由大量神經元按照一定的層次結構和連接方式組織起來的計算模型。它一般包含輸入層、隱藏層以及輸出層。例如下
激活函數
無論神經網絡有多少層,其本質上都只是對輸入數據進行線性變換的組合,而現實世界中的很多問題,比如圖像識別中物體特征的復雜映射、自然語言處理里語義的復雜關聯等,都是高度非線性的,無法通過單純的線性關系去準確擬合。
而激活函數作用于神經元的輸出端,對神經元加權求和后的結果進行非線性變換,使得神經網絡能夠擬合各式各樣復雜的非線性函數關系,從而具備強大的表達能力,可用于處理各類復雜的實際任務.
常見的激活函數
模型評估指標:
分類任務常用準確率(預測正確的樣本數占總樣本數的比例)、精確率(預測為正例且實際為正例的樣本數與預測為正例的樣本數之比)、召回率(預測為正例且實際為正例的樣本數與實際正例樣本數之比)、F1 值(綜合精確率和召回率的指標)等。
回歸任務常用均方根誤差(RMSE)等指標衡量模型預測值與真實值的偏離程度。
模型部署與應用:
部署:將訓練好的模型部署到相應的平臺或設備上,如將圖像識別模型部署到移動端應用中,讓手機可以實時識別拍攝圖像中的物體。
應用領域:深度學習在圖像識別、自然語言處理、語音識別、推薦系統等眾多領域都有廣泛且成功的應用,極大地推動了人工智能技術的發展和落地。