2018-05-17

《算法》

摇摆序列

  1. 当有连续递增或递减的子序列时,此时一定不是摇摆序列,只能从这个连续递增或递减的子序列中取某一个或多个值时,才能使得序列为摇摆序列,为此选择递增或递减子序列中的哪个值便成为了目标。
  2. 贪心策略:选择其中的什么数才能使摇摆序列最长?选择递增或递减序列的首尾元素。

移除k个数字

贪心策略:移除数组中的哪个数字才能使得剩下的字符组成的数值最小?
2018-05-17_第1张图片
图1. 贪心策略

《机器学习》

TF-IDF

  1. TF-词频


    2018-05-17_第2张图片
    图2. 词频计算示例
  2. IDF-逆文档概率


    2018-05-17_第3张图片
    图3. 逆文档概率计算示例
  3. TF-IDF计算


    2018-05-17_第4张图片
    图4. TF-IDF计算示例

朴素贝叶斯算法

  1. 为什么说朴素
    整个形式化过程,只做最简单,最原始的假设。
  2. 条件概率公式


    图5. 条件概率公式

    上式的含义:在B发生的条件下A发生的概率,其中P(AB)为联合概率,即A和B同时发生的概率

  3. 全概率公式
    若事件B1,B2,…构成一个完备事件组且都有正概率,则对任意一个事件A有如下公式:
图6. 全概率公式
  1. 贝叶斯公式
    由图5和图6两个公式可得,贝叶斯公式如下:


    图7. 贝叶斯公式

《机器学习相关库的使用》

pandas库的使用

  1. pandas读取文件,将数据加载为DataFrame格式
    pd.read_table()
    pd.read_csv()
    ......
  2. DataFrame格式数据的常用操作
    data.head() # 查看头上的元素
    data.列名或data["列名"] # 获取Series,代表某一列的所有数据
    data.shape # 查看data的行和列数
    data["列1"] + data["列2"] # 合并两个列,并且可以给data添加新的列
    data["新列名"] = 数据
    data.dtypes # 查看每一列的数据类型

你可能感兴趣的:(2018-05-17)