学习笔记1

  1. 机器学习相关 (列举这些大部分我只是了解,并没有使用,仅供学习)
    • 机器学习的基本流程:确定研究问题——采集数据——人工标注(处理数据)——选择模型和算法——看结果调参数 根据我种子杯的经验,最重要的就是处理数据和选择模型两步,就种子杯的项目而言我想处理数据是最重要的,数据处理会决定最后结果的高度,模型主要是优化算法,虽然也影响最后结果,但是仅那种比较明了的项目而言,各种适用的模型效果可能没有数据处理的效果差异大。(仅个人想法,没有做过大项目,只做过一点种子杯)。
    • 机器学习数据预处理
      • 归一化处理了
      • 降维 - PCA
      • 组合特征提取(GBDT)
      • Eembed - L1正则化
      • Filter 子集搜索
      • Wrapper 搜索方法+学习算法
      • ......
    • 机器学习的三种方式
      • 有监督学习:类似与我知道一个问题的答案,所以我可以从这个答案问题出发设计出一个推理逻辑。
      • 无监督学习:类似于我给你一堆数据,你也不知道它是干什么用的,但是你或许可以找出这些数据中蕴含的某种规律
      • 半监督学习:大概就是综合利用有类标和无类标的数据来进行处理
    • 机器学习常用方法
      • 决策树
      • 神经网络
      • 支持向量机
      • 贝叶斯分类
      • 序列分析 聚类 分类
      • 最近邻,k近邻,改进近邻
    • 机器学习相关模型
      • LR逻辑回归模型
      • 线性回归模型
      • 决策树
      • 随机森林
      • RF、GBDT、XGBoost
      • 神经网络
      • 。。。
    • 机器学习深入学习需了解的基本数学知识
      • 线性代数
      • 微积分
      • 统计学/概率论
      • 信息论
  2. nginx+ uwsgi + flask + python + linux + mysql 以前做过类似的配置,所以没有遇到大问题,暂时可以在本地使用postman调试通过,但是没有配置docker
  3. JWT
    • header eg. { "typ": "JWT", "alg": "HS256" }
    • payload 标准字段:
      • iss:Issuer 发行者
      • sub:Subject 主题
      • aud:Audience 观众
      • exp:Expiration time 过期时间
      • nbf:Not before
      • iat:Issued at 发行时间
      • jti:JWT ID eg. { "iss": "ninghao.net", "exp": "1438955445", "name": "wanghao", "admin": true}
    • signature 这部分内容有三个部分,先是用 Base64 编码的 header.payload ,再用加密算法加密一下,加密的时候要放进去一个 secret . 注:JWT会生成一个token客户端收到这个 token 以后把它存储下来,下回向服务端发送请求的时候就带着这个 token 。服务端收到这个 token ,然后进行验证,通过以后就会返回给客户端想要的资源。
  4. leetcode
    • https://git.bingyan.net/tofar/leetcode.git
  5. 《HTTP权威指南》看完前三章,《计算机网络:自顶向下》看完第一章,但是看过之后没什么印象。。。
  6. Linux命令
    • ssh 远程连接
    • scp 不同Linux系统之间的cp
    • ps 获取程序运作情况
    • netstat 显示网络相关的信息,如网络连接,路由表,接口状态
    • chmod 改变文件存储模式
    • uname 显示系统信息
    • ping 测试网络连通
    • kill 杀进程
    • grep 正则搜索文本
    • 。。。
  7. 其他
    • 用Python flask 做了一个微信小程序的demo
    • 准备另一个团队机器学习的分享

你可能感兴趣的:(学习笔记1)