您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 薪酬管理 > 资料探勘在财务领域的运用—以债券型基金之绩效评估为例(ppt56页)
資料探勘在財務領域的運用-以債券型基金之績效評估為例2簡報大綱組員簡介研究目的研究架構研究方法與實證研究-BPN與MARS研究結論3組員簡介松山家商夜間部教學組組長教務行政工作游世文(MI0951049)連展科技資訊科技部副理集團Softwareteam管理與專案開發:含SAP,BW,SEM,BPM(J2EE)陳聖儒(MI0961007)連展科技資訊科技部電子流程開發課課長電子流程開發專案管理葉士宗(MI0961004)陽明大學教務處專案助理教務處資訊化業務陳思雅(MI0952011)研究目的研究目的•將資料探勘工具運用於財務領域•應用資料採勘工具:倒傳遞類神經網路(BPN)多元適應性雲形迴歸(MARS)分析債券型基金經理人的擇時能力•探討兩DATAMINING工具在分類問題的精確度5研究架構研究動機與目的文獻與研究方法介紹基金分群分類結果比較與分析結論MARS分類模式BPN分類模式資料探勘(DataMining):•從資料庫或大量資料儲存體中,挖掘有用資訊的過程。•過程包含以下步驟:資料選取(DataSelection)資料整理(Cleaning)資料擴充(Enrichment)資料編碼(Coding)資料探勘(DataMining)探勘報告(Reporting)研究方法-資料探勘7資料探勘•應用模式分類問題(Classification):依資料特定屬性判別其歸類趨勢分析(TrendAnalysis):利用現有數值預測一個連續變數的未來值分群模式(Clustering):依資料特性的相關性予以分組關聯分析(Associations):找出在群組中同時出現的事件順序型樣(SequentialAnalysis):找出事件「先後」發生的順序•分類問題的應用工具傳統統計方法:如羅吉斯迴歸、鑑別分析人工智慧:如類神經網路無母數統計:如多元適應性雲形迴歸研究方法-資料探勘資料探勘•資料探勘與傳統統計分析之比較資料探勘在分析前不需對資料提出假設在探勘過程中發掘出資料存在的可能訊息能更真實地反映出資料的隱藏特性研究方法-資料探勘9研究方法-基金選股暨擇時能力選股能力暨擇時能力理論模型•選股能力:經理人對個別證券價格的預測能力•擇時能力:經理人對整個市場波動的預測能力•張瑞芬(2002)模型定義:檢測能力判斷:當、兩個係數中任一係數顯著,即認定該基金具有擇時能力。ititititiitXvXvYea+++=--1,1,,,tiv,1,-tiv實證研究-樣本資料簡介研究期間為︰1999年7月至2001年6月變數︰11個,包括:月資料:基金成立長短季資料:贖回金額、申購金額、申購周轉率、基金規模、贖回周轉率、買斷債券比率、基金淨值、債券附買回投資比率、存放金融機構比率、申購金額與贖回金額差值樣本基金數︰34支基金訓練資料:27支基金測試資料:7支基金11實證研究-擇時能力分析擇時能力檢測模型根據1999年7月至2001年6月,共24個月之月資料,檢定vi,t、vi,t-1是否顯著為正,顯著水準為0.05。當二係數中任一係數為正,即判定此基金具有擇時能力檢測結果:15支具備擇時能力,19支不具備tYtiv,iatiX,ie:第t期之大華債券價格指數:第i支基金之價格指數:第t期第i支基金之債券買斷比率:第t期第i支基金之衝擊反應權數:第i支基金之干擾項ititititiitXvXvYea+++=--1,1,,,簡報大綱組員簡介研究目的研究架構研究方法與實證研究-BPN與MARS研究結論13類神經網路(ArtificialNeuralNetworks)•概念一種包含軟體與硬體的運算系統,使用相連的人工神經元來模仿生物神經網路的資訊處理能力,架構如同大腦神經組織神經元細胞由樹狀突(Dendrites)與軸突(Axon)(神經突)組成樹突接受其他神經元發出之訊息,將訊息傳入細胞本體處理後,再經由軸突傳達到另一個細胞的樹突•優點具高速計算能力、高容量記憶能力、學習能力及高容錯能力對於非線性資料型態的問題處理有不錯的表現研究方法-類神經網路類神經原理-人類神經元結構15類神經原理-神經元架構X1w1X2w2YX3w3輸入值權重加總轉換函數輸出轉換函數非線性,為兼具正、負向收斂的S型函數即輸入值無限大時,輸出值為1,反之為011IjOje-=+q+=ijiijjOwIq16倒傳遞類神經網路架構與學習(1)目標:透過權數的修正,以達到資料變數的正確分類。步驟:1.由亂數取得原始權數2.將每個輸入變數乘上權數後加總3.透過轉換函數求得輸出值4.計算輸出值與實際真值誤差error5.反向計算隱藏層神經元誤差並修正所有權數17倒傳遞類神經網路架構與學習(2)1.輸出值與實際結果的誤差Errj=Oj(1-Oj)(Tj-Oj)2.將誤差以權值分配給隱藏層Errj=Oj(1-Oj)(ΣkErrkwjk)3.修正權重Wij=wij+(1)ErrjOI((1)為學習率)18倒傳遞類神經網路實例(1)X1測試樣本為(1,0,1)W14輸出目標值1W15W24W46X2W25W56W34X3W35輸入層隱藏層輸出層1231245619倒傳遞類神經網路實例(2)輸入值依亂數求得各神經元權數神經元常數x1x2x3w14w15w24w25w34w35w46w56θ4θ5θ61010.2-0.30.40.1-0.50.2-0.3-0.2-0.40.20.1神經元總輸入訊號(Ij)輸出訊號(Oj)4(1*0.2)+(0*0.4)+(1*-0.5)-0.4=-0.71/(1+e0.7)=0.3325(1*-0.3)+(0*0.1)+(1*0.2)+0.2=0.11/(1+e-0.1)=0.5256(0.332*-0.3)+(0.525*-0.2)+0.1=-0.1051/(1+e0.105)=0.474+=ijiijjOwIqOj=1/(1+e-Ij)20倒傳遞類神經網路實例(2)Errj=Oj(1-Oj)(Tj-Oj)神經元Tj與實際值Tj比較公式610.474*(1–0.474)(1–0.474)=0.131150.13110.525*(1-0.525)(0.1311)(–0.2)=-0.006540.13110.332*(1–0.332)(0.1311)(-0.3)=-0.0087Errj=Oj(1-Oj)(Errkwjk)k權數常數初值學習率與修正公式修正結果w46-0.3Learningrate(L)=0.9wij=wij+(L)ErrjOiθj=θj+(L)Errj-0.3+(0.9)(0.1311)(0.332)=-0.261w56-0.2-0.2+(0.9)(0.1311)(0.525)=-0.138w140.20.2+(0.9)(-0.0087)(1)=0.192w15-0.3-0.3+(0.9)(-0.0065)(1)=-0.306w240.40.4+(0.9)(-0.0087)(0)=0.4w250.10.1+(0.9)(-0.0065)(0)=0.1w34-0.5-0.5+(0.9)(-0.0087)(1)=-0.508w350.20.2+(0.9)(-0.0065)(1)=0.194θ4-0.40.1+(0.9)(0.1311)=-0.261θ50.20.2+(0.9)(-0.0065)=0.194θ60.1-0.4+(0.9)(-0.0087)=-0.408類神經網路(續)•運算流程收集資料21選擇預測變數決定網路參數及結構預測變輸數入與網目路標值計算並調整鍵結權重計算誤差值符合終止條件否是預測研究方法-類神經網路22實證研究-類神經網路資料分析倒傳遞類神經網路架構•隱藏層數目:單一隱藏層•輸入層神經元數目:n(即預測變數個數)•隱藏層神經元數目:依根均方誤差(RMSE)為判斷標準,採用2n-2、2n-1、2n、2n+1、2n+2等五種情形進行比較分析•選擇輸入變數:各變數之前8季季資料(結果)•包含81個輸入變數,以0.005、0.01、0.03、0.07的學習率各變數之前4季季資料(結果)•包含41個輸入變數,以0.001、0.005、0.01、0.02的學習率23實證研究-類神經網路資料分析隱藏層數目學習率訓練資料RMSE測試資料RMSE1600.0050.0575850.6255470.010.0329740.640410.030.0149910.6442440.070.0089260.6505931610.0050.0584850.6218870.010.0329280.6348510.030.015240.6711250.070.6666670.6546541620.0050.0581030.6245460.010.0331940.64450.030.0152240.6317690.070.6666670.6546541630.0050.0577940.6209720.010.0329060.6584230.030.0152090.6675240.070.6666670.6546541640.0050.0576190.6228580.010.0330850.6381950.030.0152380.6800710.070.6666670.654654最終網路模式24實證研究-類神經網路資料分析返回判別後群體原始群體具擇時能力不具擇時能力具擇時能力1(33.3%)2(66.67%)不具擇時能力1(50%)3(50%)整體正確判別率57.14%(4/7)•輸入各變數前8季季資料之BPN判別結果25實證研究-類神經網路資料分析隱藏層數目學習率訓練期RMSE測試期RMSE800.0010.3775800.5961260.0050.2290740.5963030.010.1418970.5224270.020.0587250.516837810.0010.3731190.5945320.0050.2306290.5971570.010.1295650.5098010.020.0579070.506462820.0010.3781610.5874690.0050.2295650.5897200.010.1444140.5362350.020.0555130.509543830.0010.3648130.5821430.0050.2277470.05883590.010.1385010.5247270.020.0593200.509218840.0010.3670640.5923840.0050.2299890.5888290.010.1342660.5229850.020.0541840.505954最終網路模式26實證研究-類神經網路資料分析判別後群體原始群體具擇時能力不具擇時能力具擇時能力2(66.67%)1(33.33%)不具擇時能力1(25%)3(75%)整體正確判別率71.42%(5/7)•輸入各變數前4季季資料之BPN判別結果27MARS(Friedman,1991)•概念:利用數段線性方程式間的節點趨近非線性模型,一種有彈性的高維度問題分析工具•應用:經濟、化學、醫學、工程計算等專業領域•優點:運算時間短、自動篩選變數,可迅速建立分類模型•通用模型研究方法-多元適應性雲形迴歸---×+=Mmkkkmmkvkmmmtxsaaxf11),(0)]([)(ˆ+28•尋找最佳模型兩階段第一階段:前推式(Forward)演算法依資料本身參數的關係,產生解
本文标题:资料探勘在财务领域的运用—以债券型基金之绩效评估为例(ppt56页)
链接地址:https://www.777doc.com/doc-949347 .html