原文链接:http://tecdat.cn/?p=25675
一只 股票的_beta_值通常意味着它与市场的关系,当市场变动 1%时,我们期望股票会发生多少百分比的变动(点击文末“阅读原文”获取完整代码数据)。
市场,是一个有点模糊的概念,像往常一样,我们使用标准普尔500指数进行近似计算。上述关系(以下简称β)对交易和风险管理的许多方面是不利的。已经确定的是,波动率对于上涨的市场和下跌的市场有不同的动态。我们无论如何都要使用回归来估计贝塔值,所以对于希望拟合这种不对称性的投资者来说,分段线性回归是合适的。
相关视频
拓端
,赞11
拓端
,赞26
这个想法很简单,我们将数据集分成两个(或更多)部分,并分别、逐块或 _分段_估计每个部分。这个简单的想法可以用复杂的符号和代码来实现。
为了说明,我使用 Microsoft 股市收益率数据(MSFT)。
我对不同收益率估计了不同的β值,正日在零以上,负日在零以下,所以零是我们的突破点。(这个突破点在学术术语中被称为 "结",为什么是 "结 "呢?因为它把两部分联系在一起。) 下面的图显示了结果。
getSymbols for (i in 1:l){ dat0 = getSymbols rt\[,i\] = dt\[,4\]/dt\[,1\] - 1 } lal = lm plot abline
也许β值一直都是一样的,直到极端的负值,只有说当市场急剧下降时,关系才会改变。
点击标题查阅往期内容
R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测
左右滑动查看更多
01
02
03
04
这属于结构性变化的范畴。我考虑沿轴线的点的网格,并建立一个模型,在每个点上有一个断点,断点前有一个斜率,断点后有一个斜率。我寻找整个样本的平方误差之和的最小值,所以我把两个模型的平方误差相加。下图显示了结果。
plot(ret\[,1\]~ret\[,2\] segments grid1 grid2 ## 注意这里(ret\[,2\]<grid2\[i\]),是指标函数 for (i in 1:length(gid2) ) { rneg <-lm rpos <-lm d\[i\]<- summary } plot text points
在最优模型上进行网格搜索
数据显示,结点不是零,但几乎是零,为了使用正确的β值,你现在要做的就是决定,这是一个熊市还是一个牛市,谢谢阅读。
本文摘选《R语言样条曲线分段线性回归模型piecewise regression估计个股beta值分析收益率数据》,点击“阅读原文”获取全文完整资料。
点击标题查阅往期内容
【视频】CNN(卷积神经网络)模型以及R语言实现回归数据分析
用收缩估计股票beta系数回归分析Microsoft收益率风险
对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归
多项式Logistic逻辑回归进行多类别分类和交叉验证准确度箱线图可视化
R语言时变面板平滑转换回归模型TV-PSTR分析债务水平对投资的影响
R语言惩罚logistic逻辑回归(LASSO,岭回归)高维变量选择的分类模型案例
R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类
R语言中使用非凸惩罚函数回归(SCAD、MCP)分析前列腺数据
【视频】R语言实现CNN(卷积神经网络)模型进行回归数据分析
R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型
逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化
高维数据惩罚回归方法:主成分回归PCR、岭回归、lasso、弹性网络elastic net分析基因数据
分类回归决策树交互式修剪和更美观地可视化分析细胞图像分割数据集
Python支持向量回归SVR拟合、预测回归数据和可视化准确性检查实例
逻辑回归(对数几率回归,Logistic)分析研究生录取数据实例
广义线性模型glm泊松回归的lasso、弹性网络分类预测学生考试成绩数据和交叉验证
非线性回归nls探索分析河流阶段性流量数据和评级曲线、流量预测可视化
贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据
用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化
PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像
PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化
R语言集成模型:提升树boosting、随机森林、约束最小二乘法加权平均模型融合分析时间序列数据
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化
R语言基于树的方法:决策树,随机森林,Bagging,增强树
python在Scikit-learn中用决策树和随机森林预测NBA获胜者
python中使用scikit-learn和pandas决策树进行iris鸢尾花数据分类建模和交叉验证
R语言里的非线性模型:多项式回归、局部样条、平滑样条、 广义相加模型GAM分析
R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类
R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量
R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测
R语言样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化
R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测
R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者
R语言基于树的方法:决策树,随机森林,Bagging,增强树
R语言使用bootstrap和增量法计算广义线性模型(GLM)预测置信区间
R语言样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析
R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化