参考这篇文章:
https://www.cnblogs.com/yeluzi/p/7491619.html
从这篇文章看,
1. 文章里面讨论的是两层隐藏层的,但是实际上一层网络就能拟合任意函数
2. 实际工作上,深的还是更好。