发新话题
打印

如果整個集合的元素均

如果整個集合的元素均

數據集特徵數據集特徵數據集樣本總體是原始源數據集。從一般人群中形成樣本的過程是數據的產物。總體中元素的有限子集稱為樣本。通過仔細研究最終子集原始集合的行為變得清晰。舉個例子我們可以舉一個例子總人口由萬網站訪問者組成但樣本中只有人。預期數據生成模型假設總體樣本是隨機生成的勻隨機且彼此獨立地分佈在原始集合上則這樣的樣本稱為簡單樣本。

這種類型的採樣由一系列獨立實驗的數學模型來表示根據統計它最 常用於訓練機器視圖。應該記住這種教育過程的每個階段都需要一組特定的數據訓練樣本對於模型的直接訓練 是必需的它用於調整和優化模型參數。當需要評估模型的質量時使用控製樣本或測試樣本。理想情況下該樣本應該獨立於訓練樣本。驗證或測試集用於選擇機器學習的最佳模型。



和之前的開發一樣這次的開發也不應該與訓練的開發重疊。信息挖掘採樣數據集數據操作。形成訓練和評估樣本的方法取決於問題的類別使用機器學習來解決該問題為了確定分類任務必須以這樣的方式劃分全部數據量使得在形成的集合中不同類的對像數量的比率與原始總體總體相似。為了解決回歸分析中的問題需要將目標變量均勻地分佈在結果集中以便將來用於訓練和質量控制。

[ 本帖最后由 bap1237 于 2023-9-4 13:49 编辑 ]

TOP

发新话题