Universal Approximation Theorem

一个被误解的定理在深度学习面试中，经常会出现这样一个问题：为什么神经网络需要非线性激活函数？很多人会回答"因为线性函数的组合仍然是线性的"。但这个回答虽然正确，却只触及了问题的表面。更深层次的问题是：为什么加上非线性激活函数后，神经网络就能逼近任意复杂的函数？ ...