最大似然估计是估计分布的一种直接方法。先假设分布的形式,如假设 x 来自多元高斯分布,其中高斯分布的维度和图片的像素个数一致,待定参数如 。此时似然估计函数为 ,通过梯度下降或公式推导求解出最佳参数,从而求得分布。但这种方法有明显弊端,一是形式未知,需要丰富的领域知识才能确定分布形式,对于复杂问题只有上帝才知道分布的参数化表达式;二是参数量的空间太大,像 ImageNet 这种情况,是 150528 元高斯分布,需要海量数据才能估计准确。
估计分布有个最直接的方法,就是极大似然估计。先假设的形式为,然后待定其中的参数。例如我们假设$x$来自多元高斯分布,即,其中高斯分布的维度和图片的像素个数一致。于是这里的待定参数就是,此时似然估计函数为做最大似然估计,用梯度下降或者公式推导求解出最佳参数这样就求得了的分布为上述方法简单直观,但是弊端也很明显:形式未知。需要丰富的领域知识才能笃定就是某个形式,其实对于复杂问题来说只有上帝才知道分布的参数化表达式是啥参数量的空间太大。多元高斯分布的维度跟图片像素数一样大,例如ImageNet是维度,那么意味着是150528元高斯分布,那得需要多少海量的数据才能估计得准确呀