您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 资汇入SQL及决策树探勘
1資料匯入SQL及決策樹探勘童冠燁編授2天氣範例資料匯入SQL1.匯入資料庫2.探勘模組之建立3SQLServerManagementStudio4填入資料庫名稱56789101112131415探勘模組之建立1617181920212223242526272829303132調整決策樹模型×切換至「採礦模型」分頁,將欲設定參數演算法反白×至「屬性視窗」點選「AlgorithmParameters」,即可顯示模型參數視窗。3334決策樹參數×Microsoft決策樹演算法支援數個會影響所產生之採礦模型的效能和精確度的參數。參數描述MAXIMUM_INPUT_ATTRIBUTES定義在叫用功能選項之前,演算法可以處理輸入屬性的數目。將此值設定為0來關閉功能選項。預設值為255。MAXIMUM_OUTPUT_ATTRIBUTES定義在叫用功能選項之前,演算法可以處理輸出屬性的數目。將此值設定為0來關閉功能選項。預設值為255。SCORE_METHOD決定用來計算分岔準則的方法。可用的選項:Entropy(1)、BayesianwithK2Prior(2)或BayesianDirichletEquivalent(BDE)Prior(3)。預設值為3。SPLIT_METHOD決定用來分岔節點的方法。可用的選項:Binary(1)、Complete(2)或Both(3)。預設值為3。MINIMUM_SUPPORT決定要在決策樹中產生分岔所需的最小分葉案例數目。預設值為10。COMPLEXITY_PENALTY控制決策樹的成長。低值會增加分岔數目,而高值會減少分岔數目。預設值是依據特定模型的屬性數目,如下列清單所述:針對1到9個屬性,預設值為0.5。針對10到99個屬性,預設值為0.9。針對100個以上的屬性,預設值為0.99。FORCED_REGRESSOR強制演算法使用指定的資料行作為迴歸輸入變數,不考慮演算法計算出來之資料行的重要性。此參數只用於預測連續屬性的決策樹。35調整決策樹模型參數36調整決策樹模型參數373839404142採礦精確度圖表×可以在BusinessIntelligenceDevelopmentStudio中使用資料採礦設計師的[採礦精確度圖表]索引標籤,來比較採礦結構中之採礦模型的預測精確度。43資料行對應×[採礦精確度圖表]索引標籤的[資料行對應]索引標籤上,按一下[採礦結構]資料表中的[選取結構]。[選取採礦結構]對話方塊就會開啟。×在[選取採礦結構]對話方塊中,選取包含您要使用之模型的採礦結構,然後按一下[確定]。×在[採礦精確度圖表]索引標籤的[選取輸入資料表]資料表上,按一下[選取案例資料表]。Ö[選取資料表]對話方塊就會開啟,其中可供您選擇包含要用於預測查詢中、決定模型精確度之資料的資料表。4445資料行對應×在[選取資料表]對話方塊中,從[資料來源]清單裡選取一個資料來源。×在[資料表/檢視名稱]方塊中,選取包含您要用來測試模型之資料的資料表。×按一下[確定]。×採礦結構中的資料行,會自動對應到輸入資料表中、名稱相同的資料行。×若要刪除對應,請按一下即可選取將[採礦結構]資料表中的資料行連結到[選取輸入資料表]資料表中之對應資料行的線條,然後按DELETE鍵。×您也可以手動建立對應,方法是按一下[選取輸入資料表]資料表中的資料行,然後將它拖曳到[採礦結構]資料表中的對應資料行。4647篩選輸入資料列×將資料行從[選取輸入資料表]資料表拖曳到[篩選用於產生增益圖的輸入資料]之下的方格中。×使用[群組]、[及/或]和[準則/引數]資料行來定義如何篩選資料列4849選取可預測採礦資料行×於[選取可預測的採礦模型資料行,以顯示在增益圖中]之下,從[可預測資料行名稱]資料行的清單中選取每一個模型的可預測資料行。×要判斷模型的增益,從[預測值]清單中選取模型的值5051增益圖52分類矩陣53資料採礦模型預測54
本文标题:资汇入SQL及决策树探勘
链接地址:https://www.777doc.com/doc-623849 .html