未来可以预测吗？

未来可以预测吗？

重新回来，回到现在

刚刚登录后，系统提示绑定手机号，欣然绑定。一切都是那么稳定，注册名，邮箱，手机号，翻看历史记录，感谢博客园！

回来看我的ID，也颇具禅意，子标题是“未来决定现在”，感觉好极了。

（其实写这篇的想法，是我正在做的系统，主要是数据的预测，有一些想法，但是还很模糊，一定要找个地方说说，就翻到了这里。加上上面的一些感慨，表明时间对了！）

预测未来也是人们常常提起的话题，包括影视剧文艺作品，以前还只有进入未来，如科幻。现在时间轴都已经布满了，比如穿越，是回到过去。不但时间，还有空间，时空穿越。

天气预报也越来越准了，昨天的雨，虽然仍然有偏差，但是已经超出我的期望值，我也相信未来预测会更加准确。

复杂系统和简单系统

跟人类社会以及相关系统相比，天气系统是一个相对单一的系统，可以说如果把影响天气的关键数据找到后，就可以准确预测天气的下一个运行状态。

当然，可能存在一种人工影响天气的行为，把本来正常的天气系统，比如在某时间，某个地点进行人工干预，让雨提前下来。

但是，在天气系统中，这个干预是少数的，甚至说也是可以预测的。

预测的结果值是一个巨大的数据集

至于说是1小时预测，24小时预测，还是7天预测，不同的时延准确率不同。还有覆盖空间的准确性，海淀是不是准确，昌平是不是准确，大兴是不是准确，不同空间的准确率都可能不同。所以说，到最后发现预测的结果是是一个庞大的数据集，不同需求的用户需要根据自己的期望来找到数据。

这就跟以往电台中的天气预报进步太多了。

以前天气预报只是说明天北京有雨，我们根本不知道什么时间有雨，我所处的区域是否会下雨，所以就会产生“天气预报不准”这种结论

现在的技术手段，手机等智能终端的普及，数据提供商，app开发商的不断创新，使手机app上就可以查到更多的预测数据，比如分区，分时的预报，不同区域的使用者针对自己的需求获取预测数据，准确率提高了很多。

其实目前这种不准论也还存在，除了预测系统的原因，（我觉）用别人的预测数据验证自己区域的情况。

预测和干预

假设预测数据非常准确，像天气系统这种，人们只要做好防范工作，避免天气原因带来的灾难就行。对于天气，人类社会的行为是一致的，利用天气系统进行战争，犯罪的行为是少数，利用天气预报进行获利虽然有，比如下雨天买伞？不去评说了

但是很多其他的数据预测就不一样了，比如股市，如果预测某支股票要大涨，那么股民为了获得后续上涨的收益，可能买入股票，同时，已经获利者可以趁机卖出已有股票，如果卖出量更大，则可能导致股票反而下跌

由于股市是一个复杂的系统，所谓的复杂就是参与其中的交易者可以影响到数据的成交和走势，这一点同天气系统是完全不一样的

还有同股市系统类似的交通系统，我们每天出门时看路况，地图系统往往会预测一下到达我的目的地的路途是不是有拥堵，我们发现有时预测时不堵，但是实际行驶过程中就会变得拥堵。

交通系统也是一样，预测不堵的信息被更多的参与者接收到后，都选择了这条路，那这条路就拥堵了。

还有很多这样的社会现象，也是一个复杂系统，比如农民种植农产品，工厂生产产品，都会有一定的预测（预测需求、产量、收益），但是实际结果是产品因过剩而导致收益下降。

这些已经接近博弈理论需要解决的问题了，我这里就不展开了。

到底要不要预测

既然像股市系统、交通系统这种复杂系统干预问题，我们到底要不要预测，如何利用预测数据？

还有应对干预（博弈）的预测系统吗？

答案当然是肯定的！

要预测，即使原始数据的获取聚合和清理工作非常大，预测数据的准确度目前可能不是很高，对应目标的收益率也不高，但是仍然不能阻挡我们对预测未来的努力。

要论证这个主题其实可以写一大堆。（可是我不写了）

从图像识别技术（图像识别也是预测吗？）的历史我们就行，从最初的60～70%的正确率，到现在识别率接近完美，甚至带上口罩都可以识别，人脸识别已经非常实用普及，收益已经显现。

那如何预测呢？

地球人都可以猜到，当然是机器学习了，不能用之前的技术了。

之所以用了“机器学习”这个术语，而不是用人工智能AI，因为AI范畴比较大了，不够具体。我想说的只是一个技术，不是一个虚无的方案和夸夸其谈。

其实在很多机器学习的课程中，都会有房价、股票预测和其他很多预测，但是我目前看到代码和课程中的预测准确率不高（我知道它为什么不高，公开的课程不便把关键数据的方法拿出来）

在量化交易中，很多团队也在使用机器学习构建投资策略，成绩非常不错。

具体如何做呢？

以股票数据预测为例：

尝试阶段：

建立一套机器学习的开发环境（tensorflow，pythorch都可以，我选择tensorflow 2.x）

获取股票，建立训练测试数据。基本的每日k线就行。我通过已有数据的训练验证可以达到100%准确率，这可以说明一些情况。

（以往股票分析出的股票规律和各种模型、线是有道理的，但是仍然对突然的变化无法预测）

通过不同的模型，数据元素选择，获得不同的正确率，目前我的可以达到60～80%，至于为何差距这么大，这主要跟训练数据集的选择有关系。但是这至少有60%以上的胜率了（有点像赌徒？）

每天收盘数据获得后预测第二天的预测数据，但是这时已经不能买卖，买不进来卖不出去。只是在第二天开盘到收盘判断预测的准确性，慢慢建立信心。

问题：

如果预测不准说明什么？

市场随机游走或博弈对抗

实操阶段

在尝试基础上，增加预测数据的库，并通过可视化方式进行展示分析。

通过预测第二天的关键数据，继续预测第三天和以后的数据。

建立基于2天的预测数据建立策略模型，每一个策略模型对每一支股票建立成长收益数据，形成新的增强训练

对于选股

由于初级阶段没有对大势的把握，所以无法选股，只有在全量股票的策略训练后，才可能找到成长好的个股

在策略池和成长数据中找到目标股

后续的文章将慢慢建立对于数据预测的信心
相关阅读:
心得
 构建之法--界面化的简单四则运算
 构建之法--简单四则运算
 构建之法--初识Git
构建之法---第一次作业
 【软件工程实践】结对项目-四则运算 “软件”之升级版
 第三次作业：个人项目-小学四则运算 “软件”之初版
 分布式版本控制系统Git的安装与使用
 第一次作业-准备
 字符串、文件操作，英文词率统计预处理
原文地址：https://www.cnblogs.com/haio/p/16418273.html