Title : 大学比赛整理
Author : NightRaid-Hill
2018大数据建模比赛
把大学做过的比赛整理一下,也记不太清了,写个大概吧
- 题目为金融市场板块划分和轮动规律研究.
- 使用到的模型和算法:prophet 加性模型、Apriori 算法等。
- 问题重述:
金融市场轮动板块容易受到多种复杂多变的因素的影响,最终表现为行业股价的某种周期现象,投资者可以通过观察行业的近期涨跌现象等规律,对股票的未来行业进行预测,通过对附件中给出的数据,进行数据分析来对股票进行板块分类。
Let's begin!
使用 apriori 算法进行关联规则分析
关联规则是展现项集之间关联与相关性的规则。通过使用关联规则算法(本文为 Apriori 算法)对条件叠加下的联动规律进行挖掘,即找出当一个
或多个行业的表现组合在一起时,引起的其他行业上涨或下跌的规律。
Apriori 算法的核心思想是通过候选集生成和情节的向下封闭检测两个阶段来进行频繁项集。
通过支持度和置信度来衡量关联规则的好坏,支持度是对关联规则重要性的衡量,置信度是对关联规则准确度的衡量。
经过关联规则的分析,可以通过行业轮动的记忆性,提前配置未来表现强势的行业,就能够获得超额的收益。
在由 2010 年到 2017 年间每日涨跌的股市数据得出的频繁集与关联规则综合分析可知,在可信度最高的几条关联规则中:
金融保险投资板块股价上涨且轻工业板块股价上涨的情况下,
科技医疗板块股价上涨的可信度为 0.96;
重工业板块股价上涨且轻工业板块股价上涨的情况下,金融保险投资板块股价上涨的概率为 0.95;
重工业板块股价上涨且金融保险投资板块股价上涨的情况下,轻工业板块股价上涨的概率为 0.93;
使用 apriori 算法进行关联规则分析
长期和短期变化曲线的交点往往就是购入或卖出股票的时间点。对于短期投资者来说可以建立如下的交易策略:
当短期变化曲线从上方交与长期变化曲线,说明股票看跌,则卖出;
当短期变化曲线从下方交与长期变化曲线,说明股票看涨,则买入。
最后通过以上分析,运用 Prophet 加性模型预测,对股票市场的价格走势进行预测。一般来讲,股票的价格是难以预测的,由于市场交易往往是投机行为,并不理性,
可以预测到价格但是并不能准确预测到达该价格的时间,并且股票一定程度依赖于信息,但是基本无法知道明天的信息。
不过,我们可以从时间序列处理的角度去尝试捕捉价格变化的规律。
Tips:
1. 可以通过修改模型的敏感度对prophet加性模型的预测效果进行优化
2. 使用spass: EM 协方差表示的是两个变量的总体的误差,可以用于相关性分析,且协方差越大互相影响的相关
性越大
3. 回归分析和相关分析主要区别是: 在回归分析中,y被称为因变量,处在被解释的特殊地位,而在相关分析中,x与y处于平等的地位,
即研究x与y的密切程度和研究y与x的密切程度是一致的;