凸函数定义判定和性质简介

凸集

给定集合 S S S,对任意元素 x 1 x_1 x1, x 2 x_2 x2属于该集合 S S S,若对于任意 ϑ ∈ [ 0 , 1 ] \vartheta\in[0,1] ϑ[0,1],有 x = ϑ x 1 + ( 1 − ϑ ) x 2 x=\vartheta x_1+(1-\vartheta )x_2 x=ϑx1+(1ϑ)x2, x x x也在集合 S S S中,则集合 S S S是凸集。
以向量的角度来理解,就是点 x 1 x_1 x1 x 2 x_2 x2在集合 S S S中,两点的连线也在该集合中。
凸函数定义判定和性质简介_第1张图片
凸函数定义判定和性质简介_第2张图片

凸函数定义

f ( x ) f(x) f(x)为凸集 S S S在上的函数,任意 x 1 , x 2 x_1,x_2 x1,x2 ∈ S \in S S,任意 λ ∈ ( 0 , 1 ) \lambda \in(0,1) λ(0,1) f ( λ x 1 + ( 1 − λ ) x 2 ) ≤ λ f ( x 1 ) + ( 1 − λ ) f ( x 2 ) f(\lambda x_1+(1-\lambda)x_2) \leq \lambda f(x_1)+(1-\lambda)f(x_2) f(λx1+(1λ)x2)λf(x1)+(1λ)f(x2) 恒成立,则 f ( x ) f(x) f(x)为凸集 S S S上的凸函数。当等号去掉时,是严格意思上的凸函数。
注: 线性函数既是凸函数也是凹函数。
凸函数定义判定和性质简介_第3张图片

凸函数判断

f ( x ) f(x) f(x)在凸集 S S S上连续二阶可微,则 f ( x ) f(x) f(x)为凸函数的充分必要条件为,二阶导 f ′ ′ ( x ) > 0 f^{\prime \prime}(x)>0 f(x)>0,对于多元函数,则Hassion矩阵为半正定矩阵。

凸函数的性质

琴生不等式

f ( ∑ i = 1 n w i x i ) < = ∑ i = 1 n w i f ( x i ) f(\sum_{i=1}^nw_ix_i) <= \sum_{i=1}^nw_if(x_i) f(i=1nwixi)<=i=1nwif(xi)
i = 2 i=2 i=2时,由定义知是满足条件的,可由数学归纳法进行证明。

凸优化问题的局部最小是全局最小值

机器学习中将问题转化成凸优化问题后,便可以求解全局最小,这也是都希望所研究的问题是凸优化问题的原因。由图形可知,不会存在局部平衡点,存在则不是凸函数。

凸函数相加还是凸函数

f ( x ) , g ( x ) f(x),g(x) f(x)g(x)都是凸集 S S S上的凸函数,则 y ( x ) = f ( x ) + g ( x ) y(x)=f(x)+g(x) y(x)=f(x)+g(x)也是凸函数。

Jessen不等式

f ( x ) f(x) f(x)为凸集 S S S上的凸函数, E ( x ) E(x) E(x) x x x的期望,则
f ( E ( x ) ) ≤ E ( f ( x ) ) f(E(x))\leq E(f(x)) f(E(x))E(f(x))

参考博客

  • https://blog.csdn.net/feilong_csdn/article/details/83476277 作者:feilong_csdn
  • https://blog.csdn.net/u014170677/article/details/21873981 作者:滴水札记

你可能感兴趣的:(机器学习数学基础)