机器学习简介 - 润新知

机器学习简介

开始的时候，就是利用规则，但是有瓶颈，后来就有了基于统计学的方向，建立模型，让机器基于模型的规则，进行数据的拟合，模型里有很多参数，有可变化的东西，是机器自己学习的，效果有超过规则的可能，两个学派，基于规则，基于数学（统计学），后来机器学习慢慢后来居上，机器学习慢慢发展出很多的算法，逻辑树、决策树很早就有，神经网络雏形是比较早有的。

深度学习是机器学习里一个算法，就是神经网络，是比较璀璨的一个算法，开始的时候有限制，因为当时的计算机算力比较低，第二刚刚开始发展，数据量不是很大，神经网络模型复杂，需要海量的数据，现在数据量大，算力也提高，所以这个算法开始重新火起来，隐藏层很多，所以也叫深度学习，深度神经网络。

应用领域：自然语言处理（天气预报等）、计算机视觉（图像识别）：人脸识别；无人车（虚拟世界中的学习）；识别癌症（医生的辅助手段）、GAN（影视制作）、推荐系统（电商、电影等等，搜索引擎下一代东西）……

深度学习常用框架：……大部分都支持Python的调用，Python和机器学习结合比较好。

https://scikit-learn.org/stable/

需要我们掌握算法的原理，在调参的时候理解原理会有帮助（不仅仅是调包），从定性的角度理解即可，结合案例学习。

企业现状分析：行业在上升，涌入的人在增加，因此不容易入行了，比如算法工程师，要求越来越高了，但是整体行业的岗位在增加，企业对数据分析的价值认识在提高。

一、机器学习概述

1、什么是机器学习

二、数据来源与类型

企业日积月累的大量数据，尤其是互联网公司；政府掌握的各种数据；科研机构的实验数据……

大数据在中国发展的优势是中国的人多。

离散型数据和连续性数据，非常重要，理解它们的区分。最终带入模型的就是这两种数据，模型接受的是数

数据的类型会是机器学习不同问题的不同处理依据吗？

国家统计局、世界银行、联合国……

也有需要花钱的，我国的数据交易中心建立在贵阳

https://github.com/awesomedata/awesome-public-datasets

谷歌也有数据集的搜索……

常用数据集数据的结构组成：特征值+目标值。每一行数据是一个样本，这些列两部分，一部分是预测用，叫特征值，另外就是基于特征值做出的预测结果，就是目标值。
相关阅读:
东南亚“美团” Grab 的搜索索引优化之法
 linux中init.d文件夹的说明
 缓存踩踏：Facebook 史上最严重的宕机事件分析
 burp suite
千万实例可观测采集器iLogtail
grep 匹配多个关键字
 127.0.0.1和0.0.0.0
Python 爬虫进阶必备 | 某常见 cookie 加密算法逻辑分析（加速乐 jsl） https://mp.weixin.qq.com/s/fKuPs2b3MvOi8y4hPVbgNA
百度商业大规模高性能全息日志检索技术揭秘
 ECB加密 CBC
原文地址：https://www.cnblogs.com/BC10/p/11750994.html

Copyright © 2020-2023 润新知