python机器学习记录

PS:初遇机器学习,自己的一点笔记,对机器学习还有很多不是特别清楚的地方,以后来补

中国mooc北京理工大学礼欣老师讲的python机器学习真的很适合入门,主要讲了无监督学习,监督学习和深度学习。

无监督学习主要是聚类和降类

聚类:根据数据的相似性,将数据分类的过程
常用的聚类算法有K-Means,DBSCAN

降维:在保证数据具有代表性或分布的情况下,高维数据变成低维数据

监督学习:利用一组带标签的数据,学习输入到输出的映射,将映射关系应用到未知数据,达到分类/回归的目的

常用的分类算法有KMN,朴素贝叶斯,决策树

回归:主要用于时序信息数据的预测
线性回归:普通线性回归,岭回归,lasso

非线性回归:利用sklearn.preprocessing模块生成原始数据的非线性特征,调用线性回归模型将非线性按线性进行拟合实现

强化学习
马尔可夫决策过程(MDF)
蒙特卡洛强化学习(不依赖于环境建模):多次采样,求取平均累计奖赏作为期望,累计奖赏的近似。不足:需采样一个完整轨迹,更新值函数,效率较低
Q-learning:动态规划与蒙特卡洛方法思想,学习更加高效

深度强化学习:
传统强化学习:状态数目过多,求解困难
深度强化学习:将深度学习和强化学习结合在一起

Deep Q Network(DQN)
神经网络与Q-learning结合

你可能感兴趣的:(python机器学习,python,机器学习,监督学习,无监督学习,强化学习)