您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 新股上市时合理定价区间预测(总报告)
新股上市合理定价区间预测二〇〇五年四月第1页日期:2019/9/2目录1.项目概述2.时间安排3.研究内容4.团队分工5.源数据表6.数据预处理7.数数据转换和处理据转换和处理8.数据模型演算及项目展望9.知识发现第2页日期:2019/9/2项目目的1.11.1项目目的基金金融工程数据库中有着中国一千多只股票及几百只基金的基础财务数据、股权信息、资本运作信息及每个交易日的行情公告信息。金融工程数据库是一个海量的数据。作为基金管理单位,针对如此海量的信息记录,如何保证从这些数据中提取关键信息,找到有潜力的股票,改善持股结构,为基金管理部门相关决策提供依据与向导,是我们数据挖掘的目的。因为这个题目太大,我们选择其中一个较小范围的新股发行方面的数据进行挖掘。新股发行时,每个股票有所属行业,募集资金合计,发行市盈率,二级市场配售发行数量,预测净利润,上市首日表现等可统计信息。对这些数据进行挖掘,预测某只规模的新股上市时合理定价区间。过程中需要运用数据挖掘课程中的一些关键技术和思想,比如聚类分析、OLAP、决策树等方法体现在数据的抽取、数据的存储和管理、数据的展现和预测价值等过程中。第3页日期:2019/9/2项目步骤确定项目目标;选取典型范围的新股上市的数据源与相关数据字典;数据库建立与数据清理工作;定义数据堆积维度和衡量值;确定数据挖掘的理论方法(聚类、决策树);学会应用MicrosoftSQLServer2000Enterprise和AnalysisServerOLAP/DataMining工具;设计定义挖掘模型和算法;预测结果测试。1.2项目步骤第4页日期:2019/9/2项目概述1.3项目步骤图项目步骤图第5页日期:2019/9/21.4工具介绍SQLServer2000为用户提供了大规模联机事务处理(OLTP)、数据仓库和电子商务应用程序所需的最新的出色数据库平台。SQLServer2000为用户提供了完全集成的可扩展标记语言(XML)环境、在分析服务中添加了新的数据挖掘功能、用元数据服务增强了知识库技术项目概述工具介绍第6页日期:2019/9/2目录1.项目概述2.时间安排3.研究内容4.团队分工5.源数据表6.数据预处理7.数数据转换和处理据转换和处理8.数据模型演算及项目展望9.知识发现第7页日期:2019/9/2总体时间安排小组各成员分工协作,完成各自的目标完成课题报告初稿开题预备报告定稿,答辩4月16日4月18日4月20日4月22日4月24日4月26日4月28日4月30日5月2日5月4日5月6日5月8日5月10日提交结果报告确定课题研究内容和方向并明确各成员分工课题研究课题结束第8页日期:2019/9/2目录1.项目概述2.时间安排3.研究内容4.团队分工5.源数据表6.数据预处理7.数数据转换和处理据转换和处理8.数据模型演算及项目展望9.知识发现第9页日期:2019/9/2研究内容3.1建立基本概念数据挖掘概念;可用于数据挖掘的数据类型;数据挖掘功能及挖掘类型的模式;数据挖掘系统了解;数据挖掘预处理;决策树概念与算法了解;其它挖掘模式的了解;建立基本概念第10页日期:2019/9/23.2数据源基金金融工程数据库;新股发行——主要部分;证券列表,公司列表,板块列表;上市公司财务数据;股票交易数据;上市公司股权信息;上市公司高管信息;其他信息(法人代表、注册地址、邮编、电话等);研究内容数据源第11页日期:2019/9/23.3算法研究基本上我们小组采用决策树算法。决策树算法是以树的结构显示的分类形式,其中树结构中的节点代表进一步对数据进行分类的单个问题。创建决策树的各种方法数十年来广泛使用,而且有大量的著作讲述这些统计技术。决策树挖掘模型使用名为递归分区的过程,根据事例集提供的特性将数据划分为若干个分区。然后,它将这些新建分区划分为更多的分区,并且一直划分下去,直到无法执行有用的划分。研究内容算法研究第12页日期:2019/9/2目录1.项目概述2.时间安排3.研究内容4.团队分工5.源数据表6.数据预处理7.数数据转换和处理据转换和处理8.数据模型演算及项目展望9.知识发现第13页日期:2019/9/2团队分工小组各成员都分别负责课题的一部分研究内容,每个人都是课题能顺利完成不可缺少的一部分。第14页日期:2019/9/2目录1.项目概述2.时间安排3.研究内容4.团队分工5.源数据表6.数据预处理7.数数据转换和处理据转换和处理8.数据模型演算及项目展望9.知识发现第15页日期:2019/9/21.1.1.1.1行情(TB_OBJECT_1120)主键:OB_OBJECT_ID唯一性约束:(F1_1120,F2_1120)序号字段字段名1OB_OBJECT_ID对象ID2F2_1120日期3F1_1120证券ID4F4_1120昨收盘价5F5_1120开盘价6F6_1120最高价7F7_1120最低价8F8_1120最新价9F9_1120成交量(手)10F11_1120成交金额(千元)行情(TB_OBJECT_1120)行情第16页日期:2019/9/2新股发行(TB_OBJECT_1095)序号字段字段名1OB_OBJECT_ID对象ID2F1_1095证券ID3F72_1095发行对象4F13_1095上网发行代码5F42_1095上网发行简称6F64_1095投标询价申购价格下限7F63_1095投标询价申购价格上限8F8_1095面值9F10_1095发行价格10F9_1095货币代码新股发行第17页日期:2019/9/2证券(TB_OBJECT_1090)序号字段字段名1OB_OBJECT_ID对象ID2F16_1090交易代码3F22_1090交易代码24OB_OBJECT_NAME_1090证券简称5F3_1090简称拼音6F4_1090证券类型代码证券第18页日期:2019/9/22.数据仓库模型设计及建立序号字段字段名1OB_OBJECT_ID证券简称2DP大盘涨跌情况3LTG流通股大小4HY5SYL市盈率6ZF上市首日涨幅行业大类数据仓库第19页日期:2019/9/2目录1.项目概述2.时间安排3.研究内容4.团队分工5.源数据表6.数据预处理7.数数据转换和处理据转换和处理8.数据模型演算及项目展望9.知识发现第20页日期:2019/9/26.1数据清理原则基金金融工程数据库中新股上市时信息数据上市首日涨跌情况作为数据挖掘的重要指标历年来的不同盘子、不同市盈率、不同行业的新股上市时首日涨跌幅度的大小,具有预测价值数据清理原则第21页日期:2019/9/26.2数据清理过程数据清理过程过程中需要运用数据挖掘课程中的一些关键技术和思想,比如聚类分析、OLAP、决策树等方法体现在数据的抽取、数据的存储和管理、数据的展现和预测价值等过程中。预测一定经营规模企业具有良好盈利率曲线的所在行业、所属类型。第22页日期:2019/9/26.3研究目标数据从1991-2005年的股票发行范围内进行数据提取;新股发行——主要成分证券列表,公司列表,板块列表;上市公司财务数据股票首日交易数据研究目标数据第23页日期:2019/9/2目录1.项目概述2.时间安排3.研究内容4.团队分工5.源数据表6.数据预处理7.数据转换和处理据转换和处理8.数据模型演算及项目展望9.知识发现第24页日期:2019/9/27.1确定对象数据表关系确定对象数据表关系第25页日期:2019/9/27.2定义数据维度定义数据维度第26页日期:2019/9/27.3多维数据集处理过程多维数据集处理过程第27页日期:2019/9/27.4数据集查看数据集查看第28页日期:2019/9/2目录1.项目概述2.时间安排3.研究内容4.团队分工5.源数据表6.数据预处理7.数据转换和处理据转换和处理8.数据模型演算9.知识发现及项目展望第29页日期:2019/9/28.1微软决策树微软决策树决策树是以树的结构显示的分类形式,其中树结构中的节点代表进一步对数据进行分类的单个问题。创建决策树的各种方法数十年来广泛使用,而且有大量的著作讲述这些统计技术。决策树挖掘模型使用名为递归分区的过程,根据事例集提供的特性将数据划分为若干个分区。然后,它将这些新建分区划分为更多的分区,并且一直划分下去,直到无法执行有用的划分。第30页日期:2019/9/28.2挖掘模型挖掘模型第31页日期:2019/9/28.3挖掘结果查看挖掘结果查看第32页日期:2019/9/2目录1.项目概述2.时间安排3.研究内容4.团队分工5.源数据表6.数据预处理7.数据转换和处理据转换和处理8.数据模型演算9.知识发现及项目展望第33页日期:2019/9/2知识发现知识发现通过上述的数据演算和分析不难看出:上市新股中的小盘股涨幅大部分为1-5倍,而大盘股涨幅大部分都在1倍以内,说明小盘股首日的表现最佳;新股上市首日的表现基本与市盈率大小基本无关,说明中国股市还不成熟,投机成分较大;第34页日期:2019/9/2项目展望项目展望因为时间上的原因,以及小组成员都全职进行自己的工作,最近所学的课程考试密集,所以在项目控制上,以及挖掘技术研究、系统测试等方面都不是做得非常全面。但本小组认为,我们在数据的选取,挖掘目标的提出方面,考虑的非常周全,目标明确,且具有实际应用价值。对本挖掘模型,本小组认为可以通过更细化的算法设计,选取合适的前段挖掘显示工具,加上适当的数据挖掘代码,是可以做成一个更完善的系统。第35页日期:2019/9/2结束谢谢
本文标题:新股上市时合理定价区间预测(总报告)
链接地址:https://www.777doc.com/doc-684369 .html