亲，暂时无法评论！

機器學習建模步驟你知道嗎

2021-07-28 00:00:00 74U閱讀網

浏覽：0

機器學習建模步驟你知道嗎

1、實際問題抽象成數學問題：這裡的抽象成數學問題，指的我們明確我們可以獲得什麼樣的數據，目標是一個分類還是回歸或者是聚類的問題，如果都不是的話，如果劃歸為其中的某類問題。

2、獲取數據：獲取數據包括獲取原始數據以及從原始數據中經過特征工程從原始數據中提取訓練、測試數據。機器學習比賽中原始數據都是直接提供的，但是實際問題需要自己獲得原始數據。“ 數據決定機器學習結果的上限，而算法隻是盡可能的逼近這個上限”，可見數據在機器學習中的作用。總的來說數據要有具有“代表性”，對於分類問題，數據偏斜不能過於嚴重，不同類別的數據數量不要有數個數量級的差距。對評估數據的量級，樣本數量、特征數量，估算訓練模型對內存的消耗。如果數據量太大可以考慮減少訓練樣本、降維或者使用分佈式機器學習系統。

3、特征工程：特征工程包括從原始數據中特征構建、特征提取、特征選擇、特征工程做的好能發揮原始數據的最大效力，往往能夠使得算法的效果和性能得到顯著的提升，有時能使簡單的模型的效果比復雜的模型效果好。數據挖掘的大部分時間就花在特征工程上面，是機器學習非常基礎而又必備的步驟。數據預處理、數據清洗、篩選顯著特征、摒棄非顯著特征等。訓練模型、診斷、調優模型診斷中至關重要的是判斷過擬合、欠擬合，常見的方法是繪制學習曲線，交叉驗證。通過增加訓練的數據量、降低模型復雜度來降低過擬合的風險，提高特征的數量和質量、增加模型復雜來防止欠擬合。診斷後的模型需要進行進一步調優，調優後的新模型需要重新診斷，這是一個反復迭代不斷逼近的過程，需要不斷的嘗試，進而達到最優的狀態。

4、模型驗證、誤差分析：通過測試數據，驗證模型的有效性，觀察誤差樣本，分析誤差產生的原因，往往能使得我們找到提升算法性能的突破點。誤差分析主要是分析出誤差來源與數據、特征、算法。

5、模型融合：提升算法的準確度主要方法是模型的前端（特征工程、清洗、預處理、采樣）和後端的模型融合。在機器學習比賽中模型融合非常常見，基本都能使得效果有一定的提升。

6、上線運行：這一部分內容主要跟工程實現的相關性比較大。工程上是結果導向，模型在線上運行的效果直接決定模型的成敗。不單純包括其準確程度、誤差等情況，還包括其運行的速度(時間復雜度)、資源消耗程度（空間復雜度）、穩定性是否可接受。

機器學習建模步驟你知道嗎

今日熱點

小編精選

热门視頻

猜你喜歡

孩子逃學打工掙錢怎麼辦孩子逃學打工掙錢怎麼解決

梳子的種類有哪些梳子四個種類

女人吃獼猴桃的好處居然有那麼好的地方

紅薯片怎麼曬幹可以這麼做

油箱用不用定期清理很多人不知道快看看

包粽子需要的食材有哪些包粽子需要什麼食材

三檔社保一年有多少錢三檔社保如何繳費

地采暖怎麼放水隻需6步

凌雲諾如何切換服務器凌雲諾怎麼切換服務器

oppo手機怎麼隱藏應用 oppo手機隱藏的小技巧

艾葉枕頭禁忌艾葉枕頭的危害

生薑幾月份種需要註意哪些事項呢

楊姓獨特新穎的男孩名字楊姓獨特新穎的男孩名字介紹

定西市教師資格證考試地點在哪裡考試

冰凍牛肉和新鮮牛肉的區別原來新鮮更營養

機器學習建模步驟 你知道嗎

今日熱點

小編精選

热门視頻

猜你喜歡

孩子逃學打工掙錢怎麼辦 孩子逃學打工掙錢怎麼解決

梳子的種類有哪些 梳子四個種類

女人吃獼猴桃的好處 居然有那麼好的地方

紅薯片怎麼曬幹 可以這麼做

油箱用不用定期清理 很多人不知道快看看

包粽子需要的食材有哪些 包粽子需要什麼食材

三檔社保一年有多少錢 三檔社保如何繳費

地采暖怎麼放水 隻需6步

凌雲諾如何切換服務器 凌雲諾怎麼切換服務器

oppo手機怎麼隱藏應用 oppo手機隱藏的小技巧

艾葉枕頭禁忌 艾葉枕頭的危害

生薑幾月份種 需要註意哪些事項呢

楊姓獨特新穎的男孩名字 楊姓獨特新穎的男孩名字介紹

定西市教師資格證考試地點 在哪裡考試

冰凍牛肉和新鮮牛肉的區別 原來新鮮更營養

機器學習建模步驟你知道嗎

孩子逃學打工掙錢怎麼辦孩子逃學打工掙錢怎麼解決

梳子的種類有哪些梳子四個種類

女人吃獼猴桃的好處居然有那麼好的地方

紅薯片怎麼曬幹可以這麼做

油箱用不用定期清理很多人不知道快看看

包粽子需要的食材有哪些包粽子需要什麼食材

三檔社保一年有多少錢三檔社保如何繳費

地采暖怎麼放水隻需6步

凌雲諾如何切換服務器凌雲諾怎麼切換服務器

艾葉枕頭禁忌艾葉枕頭的危害

生薑幾月份種需要註意哪些事項呢

楊姓獨特新穎的男孩名字楊姓獨特新穎的男孩名字介紹

定西市教師資格證考試地點在哪裡考試

冰凍牛肉和新鮮牛肉的區別原來新鮮更營養