【读书笔记】数学之美(下)

作者:LogM

本文原载于 https://segmentfault.com/u/logm/articles,不允许转载~

文章中的数学公式若无法正确显示,请参见:正确显示数学公式的小技巧

本文为《数学之美》的读书笔记。


第19章 谈谈数学模型的重要性

  • 数学很重要

第20章 谈谈最大熵模型

  • 思想:对一个随机事件的概率分布进行预测时,我们的预测应当满足全部已知条件,而对未知的情况不要做任何主观假设。
  • $$P(d|x_1,x_2,...,x_{20}) = \frac{1}{Z(x_1,x_2,...,x_{20})} e^{\lambda_1 (x_1,d)+ \lambda_2(x_2,d)+ ... + \lambda_{20}(x_{20},d)}$$
  • 归一化因子:
    $$Z(x_1,x_2,...,x_{20}) = \sum{e^{\lambda_1 (x_1,d)+ \lambda_2(x_2,d)+ ... + \lambda_{20}(x_{20},d)}}$$

第21章 拼音输入法的数学原理

  • 语言模型

第22章 自然语言处理的教父马库斯和他的优秀弟子们

  • 人物传记

第23章 布隆过滤器

  • 本质和哈希表一样,区别是映射函数精心设计过,在可接受的冲突率前提下,减少了内存的占用。

第24章 贝叶斯网络(信念网络)

  • 马尔科夫链假设依赖关系是一维的,所以建立一维的链。但实际问题很复杂,很多依赖关系不能用链上的状态转移描述,需要用图描述。
  • 为了计算方便,依旧保持马尔科夫假设成立,即每一个状态只与和它直接相连的状态有关。

第25章 条件随机场、文法分析及其它

  • 条件随机场:在隐马尔科夫模型中,$x_1,x_2,...$ 为观测值,$y_1,y_2,...$ 为隐状态,$x_i$ 只与 $y_i$ 有关。而条件随机场中,$x_i$ 与 $y_i$、$y_{i-1}$、$y_{i+1}$ 都有关。
  • 可以认为条件随机场是一种特殊的概率图模型。仍遵守马尔科夫假设。条件随机场是无向图。
  • 条件随机场通常用最大熵模型建模:
    $$P(x_1,x_2,..,x_n,y_1,y_2,...,y_m) = \frac{e^{f_1+f_2+...+f_k}}{Z}$$

第26章 Viberti 算法

  • 隐马尔科夫模型可以转换为篱笆网络。Viberti 使用动态规划思想在这个网络中求最短路径。

第27章 期望最大化算法


第28章 逻辑回归和搜索广告

  • 搜索广告的发展:竞价排名 -> 预测用户点击 -> 全局优化
  • 预测广告点击率一般用逻辑回归做

第29章 各个击破算法和 Google 云计算的基础

  • MapReduce

第30章 Google 大脑和人工神经网络

  • 人工神经网络
  • 人工神经网络与贝叶斯网络的关系:

    • 有向图,且遵从马尔科夫假设
    • 训练方法相似
    • 对于很多模式分类问题,两种方法效果相近
  • Google 大脑:分布式的人工神经网络

第31章 大数据的威力

  • 数据很重要

你可能感兴趣的:(数学,统计,统计学习,机器学习,读书笔记)