当前位置: > 投稿>正文

高斯分布详解,<又称高斯分布>为什么会在机器学习中应用广泛

04-10 互联网 未知 投稿

关于【高斯分布详解】,今天犇犇小编给您分享一下,如果对您有所帮助别忘了关注本站哦。

1、高斯分布详解:Day66:正态分布(又称高斯分布)为什么会在机器学习中应用广泛?

定义

正态分布(Normal distribution),也称“常态分布”,又名高斯分布,是一个在数学、物理及工程等领域都非常重要的概率分布,正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。

数学表达

若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。

那么为什么正态分布会在机器学习中得到广泛的应用?

机器学习基于统计学用的较多的是统计机器学习,统计学习的基础是统计,统计的基础之一就是中心极限定理,中心极限定理的结果就是高斯分布

中心极限定理:说白了就是一大堆乱七八糟的(有界)随机变量加起来就像是高斯分布,这使得实际遇到的很多分布(如噪声等)近似服从高斯分布(Gauss-like)

正态分布在现实中很多地方都能得到利用。

2、高斯分布详解,搞懂多变量高斯分布的由来

多变量高斯分布(multivariate Gaussian distribution)的形式如下:

其中, 是D维 mean vector, 是 协方差矩阵, 里面的第 i 行第 j 列元素表示第 i 个变量第 j 个变量的协方差 , 代表协方差矩阵的行列式。

二维高斯分布的图如下所示(来自wikipedia),它的每一个维度都是高斯分布:

高斯分布详解,<又称高斯分布>为什么会在机器学习中应用广泛

本文主要就是讲式(1)的由来。

前置知识:雅可比矩阵和雅可比行列式

设 是一个函数,它的输入是向量 ,输出是向量 :

那么雅可比矩阵是一个m×n矩阵:

由于矩阵描述了向量空间中的运动——变换,而雅可比矩阵看作是将点 转化到点 ,或者说是从一个n维的欧式空间转换到m维的欧氏空间。

如果m = n, 可以定义雅可比矩阵 的行列式,也就是 雅可比行列式(Jacobian determinant)

在微积分换元中,也就是给出了 从x到y的n维体积的比率,

二维雅可比矩阵的几何意义

在二维情况(有直观的图),雅可比行列式代表xy平面上的面积微元与uv平面上的面积微元的比值。

雅可比行列式是:

高斯分布详解,<又称高斯分布>为什么会在机器学习中应用广泛

如图所示:dA代表dx和dy张成的平行四边形的面积,如果du和dv充分接近于0,那么dA:

二重积分换元:

n维度情况以此类推。

多变量高斯分布

首先考虑单变量标准正态分布,概率密度函数为:

然后考虑 n 维独立标准高斯分布,就是 n 个 独立的一维标准正态分布随机变量的联合分布:

为了表达方便,用向量的形式来表示,设 ,式(3)写作:

一般的,设 由 的线性变换得到:

其中A是 的 非奇异矩阵 , 是n维向量

可把 用 表示:

注意到,式(6)线性变换的雅可比行列式 是 ,因此:

设 ,则 ,由联合概率分布密度的定义,有:

因此,向量 的联合概率概率密度函数是:

也就得到式(1)

可以看出:多变量高斯分布是单变量高斯分布向多维的推广。

本文关键词:高斯分布公式,高斯分布怎么理解,高斯分布图,高斯分布的前世今生,高斯分布函数是什么。这就是关于《高斯分布详解,<又称高斯分布>为什么会在机器学习中应用广泛》的所有内容,希望对您能有所帮助!更多的知识请继续关注《犇涌向乾》百科知识网站:http://www.029ztxx.com!

版权声明: 本站仅提供信息存储空间服务,旨在传递更多信息,不拥有所有权,不承担相关法律责任,不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的,请发送邮件至 举报,一经查实,本站将立刻删除。

猜你喜欢