数学表达式: 从恐惧到单挑 (7. min 与 argmin)

7. min 与 argmin

  • min 和 argmin 在机器学习中常用.
  • max 和 argmax 同理.

7.1 min

  • min 是 minimal 的缩写, 用于获得集合中的最小值. 如:
    min ⁡ { 3 , 1 , 9 , 8 } = 1 \min \{3, 1, 9, 8\} = 1 min{3,1,9,8}=1. 源码: \min {3, 1, 9, 8} = 1, 即 \min 是定义好的一种符号.
  • min 可以与向量/矩阵配合使用. 如:
    给定向量 x = [ 3 , 1 , 9 , 8 ] \mathbf{x} = [3, 1, 9, 8] x=[3,1,9,8], 则
    min ⁡ 1 ≤ i ≤ 4 x i = 1 \min_{1 \le i \le 4} x_i = 1 min1i4xi=1 本质与前面的集合方式相同.
  • min 可以和函数配合使用. 如:
    f ( x ) = x 2 + x + 1 f(x) = x^2 + x + 1 f(x)=x2+x+1, 则
    min ⁡ − 1 ≤ x ≤ 1 f ( x ) \min_{-1 \le x \le 1} f(x) min1x1f(x) 表示 x x x [ − 1 , 1 ] [-1, 1] [1,1] 区间的任意数, 都会获得一个函数值, 这些函数值构成了一个集合 (重复元素只算一次), 最终取最小的元素.
    源码: \min_{-1 \le x \le 1} f(x), 其中 \le 表示 less than or equal, 也可以写作 \leq.

7.2 argmin

  • argmin 是argument minimal 的缩写, 用于获得使函数取最小值的参数. 我也不清楚为啥用 argument 而不是 parameter.
  • \arg\min 总是可用的. 如果你的 Latex 模板不支持 \argmin, 可以在 tex 文件头部加上
    \DeclareMathOperator*{\argmin}{argmin}
  • argmin 后面不能再直接跟集合, 如
    arg min ⁡ { 3 , 1 , 9 , 8 } \argmin \{3, 1, 9, 8\} argmin{3,1,9,8} 没法计算.
  • argmin 可以与向量/矩阵配合使用, 这时参数可以是向量下标. 如:
    给定向量 x = [ 3 , 1 , 9 , 8 ] \mathbf{x} = [3, 1, 9, 8] x=[3,1,9,8], 则
    arg min ⁡ 1 ≤ i ≤ 4 x i = 2 \argmin_{1 \le i \le 4} x_i = 2 1i4argminxi=2 的值是使得 x i x_i xi 最小的参数值, 即下标 i i i 的值.
    给定矩阵
    X = [ 3 2 9 8 7 6 1 4 ] \mathbf{X} = \left[\begin{array}{llll}3 & 2 & 9 & 8\\ 7 & 6 & 1 & 4 \end{array}\right] X=[37269184]
    源码: \mathbf{X} = \left[\begin{array}{llll}3 & 2 & 9 & 8\ 7 & 6 & 1 & 4 \end{array}\right].
    arg min ⁡ i , j x i j = ( 2 , 3 ) \argmin_{i, j} x_{ij} = (2, 3) i,jargminxij=(2,3) 的值是使得 x i j x_{ij} xij 最小的参数值, 即 i = 2 i = 2 i=2, j = 3 j = 3 j=3. 注意这是返回了两个数据, 在 Java 里面要专门处理, 但 Python 可以直接支持.
  • argmin 与函数配合最常见. 如:
    f ( x ) = x 2 + x + 1 f(x) = x^2 + x + 1 f(x)=x2+x+1, 则
    arg min ⁡ − 1 ≤ x ≤ 1 f ( x ) = − 1 2 \argmin_{-1 \le x \le 1} f(x) = -\frac{1}{2} 1x1argminf(x)=21 表示 x x x − 1 2 -\frac{1}{2} 21 时函数取最小值 3 4 \frac{3}{4} 43. 只是这个最小值已经没人关心.

7.3 作业

解释 推荐系统: 问题、算法与研究思路 2.1 中的优化目标
min ⁡ ∑ ( i , j ) ∈ Ω ( f ( x i , t j ) − r i j ) 2 \min \sum_{(i, j) \in \Omega} (f(\mathbf{x}_i, \mathbf{t}_j) - r_{ij})^2 min(i,j)Ω(f(xi,tj)rij)2
各符号及含义.

你可能感兴趣的:(数学表达式魔训,机器学习,java)