AI现在随便一个人都能忽悠两句,网上甚至有三条python语句的傻瓜神经网络应用工具,似乎人人都能成为AI“砖家”。
AI入门还是比较简单的,尤其是现在python盛行,随便谁一天之内都能写出不错的AI程序。
但是AI的精通其实是非常难的,大部分玩的都是别人准备好的训练数据,根本就不知道怎么处理真实数据,其实AI的60%以上的工作都在原始数据的处理上。
你得足够了解自己的数据,这是你的命根子,你得用各种统计学方法来观察检测自己的数据,你都不了解自己的数据就去随便套模型,出来的结果自己都不知道是什么,还想忽悠别人相信?
数据准备好了之后,就可以根据自己的经验来挑选模型,其实经过这么多年的优化,不同模型之间的性能差距真的不大,比较几个常见模型就好了,真没必要每个模型都试一下。
调参。。。
言归正传~ 数学基础,机器学习离不开数学,非科班出生的同学一看到数学的部分就开始心烦,心里抱怨,为什么当初我就没学好数学呢?恨不得立马恶补各种公开课,教材。
我也一样,各种搜索,想要补回来数学基础。但都以失败而告终。
因为我对机器学习的兴趣仅仅限于我现有数据的应用上,从头开始啃大部头,一我没时间;二我没兴趣,所以实在没必要死磕到数学里。
数学专业:他们才是最有能力探索底层数学的人;
机器学习理论专业:探索最前沿的AI模型,从数学的角度;但数学能力和数学专业的人还是有差距的;
机器学习应用专业:偏重已有模型的解读和应用,数学基础以能理解现有模型为重;
交叉学科的机器学习应用者:我就在这,这些人都手握大量的珍贵数据,看着机器学习现在这么热,也想来探索一下自己的数据。有能力的大老板就会直接招机器学习专业的小老板;一般的老板就只能招个非科班出生的博士。我们的使命是探索数据中的知识,而不是开发最前沿的AI模型。这群人数学能力偏弱,甚至无法理解自己模型的数学原型。
所以,该不该补数学,怎么补,取决于你在哪个应用层。
作为交叉学科的应用者,精力有限,不可能从头开始补数学,所以只能在应用中零碎的去补了。要明确我们的优势,我们是数据导向的,不是算法导向的。
你一个交叉学科的非要去和纯AI学科的人在算法数学理论领域拼刺刀,那我只能说你傻。
呵护好自己的数据,选择一个自己能足够掌控的成熟模型,得到一些同行认可的有价值的结果,这就足够了。
如果你要全职转去AI行业,那就必须要提高对自己的要求了。
一些数学符号:
vector向量:lower case bold Roman letters. (default: column vector)
T转置:transcpose of a matrix or vector.
Matrices矩阵:uppercase bold roman letters
[a,b]:closed interval
(a,b):open interval
E, expectation:
var, vriance:
cov, covariance:
norm, 范数:有时候为了便于理解,我们可以把范数当作距离来理解。代码理解,加深理解。原来我之前在python中见到的L1和L2就是这里的范数。
待续~