问答1 问答5 问答50 问答500 问答1000

闲话矩阵求导

提问网友 发布时间:2022-11-09 10:51
声明声明:本网页内容为用户发布,旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:1656858193@qq.com
1个回答
热心网友 回答时间:2023-04-30 23:38

title: 闲话矩阵求导
原始文件没有办法把latex公式正常显示,所以一个一个弄出来了,保留了原来的公式。原始文章来自《闲话矩阵求导》。

矩阵求导,想必许多领域能见到。统计学,经济学,优化,机器学习等等,在对目标问题建立数学模型之后,问题往往被抽象为关于矩阵的优化问题。于是免不了需要对矩阵进行求导等操作。

简单的向量和矩阵求导,大多数熟悉这些计算的人,应该都能直接写下,然而复杂的矩阵函数求导则没那么简单,著名的 matrix cookbook 为广大的研究者们提供了一本大字典,里面有着各种简单到复杂矩阵和向量的求导法则,但是如果你的好奇心和我一样重,那么你肯定不会满足于查字典这种方法,特别是在推导公式一气呵成满纸乱飞的时候,查字典岂不是大煞风景?

事实上,所有求导的法则都可以从最基本的求导规则推导出来。不知你有没发现,不同的文献中,同样的式子求导的结果有时候会不一样,仔细观察会发现刚好相差一个转置,于是我们得先说说求导的两个派别(布局)。

不知道为什么会是这个名字,总之矩阵求导有两种布局,分子布局( numerator layout )和分母布局( denominator layout )。
为了阐明这两种布局的区别,我们先来看最简单的求导规则。
首先是向量 yy 对标量 xx 求导,我们假定所有的向量都是列向量,

分子布局 下,

而在 分母布局 下,

以下都是在分母布局下的定义

这一部分,我们将看到一些基本的求导规则,这些与其说是规则,倒不如说是定义。因此这一部分是需要好好理解并且记忆(如果你看一遍还记不住的话)的。
标量 !$\mathrm{\mathbf{y}}$ 对向量 !$x$ 求导:

注意到,标量对向量求导和向量对标量求导刚好反过来。
向量对向量求导,

事实上,直观上看,凡是对标量求导,结果的形式都要转置,而标量对向量和矩阵求导则位置保持不动。这样总结方便我们记忆。
总的来说,涉及矩阵和向量的求导不外乎五大类别,

接下来我们来看一些常见的求导,
首先是 !$\frac{\partial\mathbf{Ax}}{\partial\mathbf{x}} $ ,

注意到

理论上对于任意的表达式,我们都可以通过定义出发,利用上面这种形式推导得到。
但是对于一些复杂的求导,这个时候恐怕逐项展开分析就不是很靠谱了。
我们先来看求导分类的前三类,对于这三类问题,我们来看一个非常强大的方法,通过分析维度来得到结果。
1、

假如 !$\mathbf{A}\in\mathbb{R}^{m\times n},\mathbf{u}\in\mathbb{R}^{n\times1},\mathbf{x}\in\mathbb{R}^{p\times1}$
我们知道最后结果肯定和 !$\frac{\partial\mathbf{u}}{\partial\mathbf{x}}$ 有关,注意到 !$\frac{\partial\mathbf{u}}{\partial\mathbf{x}}\in\mathbb{R}^{p\times n}$ ,于是 !$\mathbf{A}$ 只能转置以后添在后面,因此

a,u是和x相关的标量
同样对于 !$\frac{\partial a\mathbf{u}}{\partial\mathbf{x}},a\text{}$ 和 !$\mathbf{x}$ 相关的标量,假定 !$\mathbf{u}\in\mathbb{R}^{m\times1},\mathbf{x}\in\mathbb{R}^{n\times1}$ 根据乘积法则(非精确版本),前一个部分肯定是 !$a\frac{\partial\mathbf{u}}{\partial\mathbf{x}}$ ,后一部分为 !$\frac{\partial a}{\partial\mathbf{x}}\in\mathbb{R}^{n\times1}$ 和 !$\mathbf{u}$ 的某种形式的积,分析维度发现只能是 !$\frac{\partial a}{\partial\mathbf{x}}\mathbf{u}^{\mathrm{T}}$
于是

我们发现,虽然乘积法则的精准形式无法应用于矩阵求导中,然而这种非精确的乘积法则可以准确的告诉我们哪些项一定会出现在结果中,然后通过分析维度,我们就可以写出结果。
再看 !$\frac{\partial\mathbf{x}^{\mathrm{T}}\mathbf{Ax}}{\partial\mathbf{x}}$ ,其中 !$\mathbf{A}$ 和 !$\mathbf{x}$ 无关,
为了分析这个问题,我们考虑一个更一般的问题,

我们利用非精确的乘积法则,可以将这个分成两部分

于是结果和两部分相关,一个是

,另一个是

,同样通过分析维度,我们可以得到

因此

最后看一个式子

所以,

注意到

所以(注意到 !$\mathbf{x}^{\mbox{T}}\mathbf{b}\in\mathbb{R}$ ),

接下来看五种类型中剩下的两类,在实际的问题中,主要是矩阵的迹对矩阵的求导问题。 正如我们在前面看到的,在矩阵的求导中,不存在精确的乘积法则,我们只是通过非精确的乘积法则分析出单项式中含有的项,再通过维度分析得到结果。 但是,有一种情形下,乘积法则是精确成立的,我们现在就来看这一种情形——迹的微分。因为在微分形式下,

等价于:

为了方便记忆,防止混淆,我们干脆将一下3个式子等同起来

等价于

注意这是分子布局下的,对应分母布局下应该为

为了方便记忆,防止混淆,我们干脆将

直接等同起来。
于是所有的迹形式对矩阵的求导都先转化为微分形式,比如

其实很简单,我们再看几个例子来加深理解:
先回忆一些非常有用的迹的性质:

所以,

所以

这是一份简短的矩阵求导介绍,它的目的是告诉你如何更好的快速推导这些公式,避免查阅手册的麻烦。当然如果你觉得你完全是一个工程师,查阅手册感觉很方便,那么继续按照你的方式生活吧。如果你觉得很有用,那么请继续: Have fun with math!

本文如未解决您的问题请添加抖音号:51dongshi(抖音搜索懂视),直接咨询即可。

WIN2003server下如何设置受限制用户 电脑组策略的软件限制策略是干什么用的? 强制刷新什么意思 什么是互联网银行及业务形式 互联网银行及业务形式简述 全国平均年收入 为什么下虾的时候,勺子要沾下水? 想去成都美熹国际医疗美容磨骨 这个医院评价怎么样? 上海九院做磨骨瘦脸哪个医生好? 深圳曙光医院整形美容科做磨骨瘦脸手术效果如何?做磨骨瘦脸手术权威吗? 月亮在白莲花般的云朵里穿行这句话中,研究对象是______,参照物是:______ 月亮在白莲花般的云朵里穿行缩句 月光在白莲花般的云朵里穿行,这句话出自哪里? 每次和女生聊天,都发现自己问的问题太无聊了,我该怎么办,有什么技巧 女生回答,当别人跟你谈起一种你觉得特别无聊的话题时,你会怎么处理?转移话题?结束谈话?还是干听? 禧玛诺shimano/鼓轮/calcutta conquest 201dc和shimano禧玛诺cq300 301哪个好 海伯和海宝军刀鼓轮哪个好 怎么才知道变蛋味道好于坏 请问怎么投诉京东订单取消? 如何更换支付宝健康码 现代文女主在酒吧领舞,为了救重病的弟弟一百万把自己卖了,跟一位总裁假结婚,后来女主走了? 1.矩阵求导 矩阵向量求导 我是学市场营销专业的学生,家在双流,想找离家近,实力又比较强的房地产公司实习,有没有好的推荐? 坂田集团商务中心有值班的吗 深圳坂田商务大厦写字楼租赁价格多少钱一个月? 深圳坂田国际中心有哪些基本信息? 深圳市启疆科技有限公司怎么样? 深圳欧芙美科技网销好做吗 深圳坂田国际中心具体地址是哪个?属于哪个区? 深圳坂田科技中心写字楼信息有哪些? 我是一个农民工在瓷砖厂上班工作时间是十二个小时,没有国际假期管理和老板各_百度问一问 戏王之王 SIMPLY ACTORS怎么样 请问影片<<戏王之王>>里饰演"小曼"的那个女的叫什么? 有个电影香港的里面男主角是*爱演戏是什么片 他还上戏剧学院了 汤姆是怎么死的 许多年以后,汤姆是怎么去世的 爱的教育——《杀死一只知更鸟》 有没有可以做为手机铃音的好听的歌曲 汽车如何通过usb放歌? 汽车上的usb接口是干什么用的