在机器学习大热的前景之下,计算机视觉与自然语言处理(Natural Language Process, NLP)及语音识别(Speech Recognition)并列为机器学习方向的三大热点方向。
而计算机视觉(Computer vision):是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图像处理,用计算机处理成更适合人眼观察或进行仪器检测的图像。
计算机视觉五大技术:图像分类、对象检测、目标跟踪、语义分割和实例分割。
近几年随着人脸识别在生活中的应用场景不断增加,计算机视觉开始渐渐走入大众视野,近年来的一些实际的使用中:
人脸识别: Snapchat 和 Facebook 使用人脸检测算法来识别人脸。
图像检索:Google Images 使用基于内容的查询来搜索相关图片,算法分析查询图像中的内容并根据最佳匹配内容返回结果。
游戏和控制:使用立体视觉较为成功的游戏应用产品是:微软 Kinect。
监测:用于监测可疑行为的监视摄像头遍布于各大公共场所中。
生物识别技术:指纹、虹膜和人脸匹配仍然是生物识别领域的一些常用方法。
智能汽车:计算机视觉仍然是检测交通标志、灯光和其他视觉特征的主要信息来源。
除了上面这些看起来高大上的技术,其实在现实生活中,我们都有过接触类似的。比如美图秀秀里的美妆,就用到了人脸检测、人脸关键点定位的技术。百度识花,用到了通用物品识别的技术等等。
本视觉训练营,从传统NLP技术到基于深度学习的NLP技术,帮助学员理解技术深层次的本质关系。学员有机会选择并完成自己感兴趣的课题,无论应用性的还是学术性的课题,导师助教团队都可以很好地指导你。或许这样的一个项目可以让你实现拥有顶会论文的目标。同时,将邀请国内外的AI博士与资深工程师,来对NIPS, ICM-L,ACL, EMNLP等AI顶级会议的热点paper进行详解与讨论。
第1章: 开学典礼(直播课20190303)
任务1: 机器学习、深度学习简介
任务2: 深度学习的发展历史
任务3: 现代深度学习的典型例子
任务4: 深度学习在计算机视觉中的应用
任务5: 深度学习的总结
任务6: 开发环境的配置, Python, Numpy, Keras入门教程
任务7: GPU驱动程序安装
任务8: CUDA的安装
任务9: cuDNN的安装, Tensorflow, PyTorch的GPU测试
任务10: 问答环节
第2章: 编程环境配置(录播课20190306)
任务11: 环境安装
第3章: 逻辑回归(录播课20190306)
任务12: 二元分类问题
任务13: 逻辑函数
任务14: 指数与对数 、逻辑回归
任务15: 示例
任务16: 损失函数
任务17: 损失函数推演
任务18: 梯度下降法
任务19: 应用
第4章: 深度学习经典案例讲解(直播课20190309)
任务20: 直播答疑
任务21: 自动驾驶方向盘预测论文分析
任务22: 使用PyCharm Keras建立深度网络模型
任务23: 数据预处理 数据增强
任务24: 建立BatchGenerator高效读取数据
任务25: 训练网络 保存训练的中间过程数据
任务26: 查看网络训练过程 判断网络是否过拟合 欠拟合
第5章: 神经网络(录播课20190313)
任务27: 神经网络分类问题的经典数据(集鸢尾花数据集)介绍,神经网络Python库Keras的介绍
任务28: 使用Pandas读取鸢尾花数据集, 使用LabelEncoder对类别标签进行编码
任务29: 使用Keras创建一个用于鸢尾花分类识别的神经网络
任务30: 训练用于鸢尾花分类的神经网络 解读训练输出的日志 了解如何评价神经网络的性能
任务31: 神经网络数学原理(1): 神经网络的结点,权值,激活函数
任务32: 神经网络数学原理(2): 神经网络的前馈(Feed Forward)算法
任务33: 神经网络数学原理(3):神经网络的前馈(Feed Forward)算法续,Softmax层的数值问题
任务34: 神经网络数学原理(4):神经网络BP(误差反向传播)算法
任务35: 神经网络数学原理(5):神经网络BP(误差反向传递)算法续
任务36: 神经网络数学原理(6):手动演算神经网络BP算法(误差向后传递)
任务37: 神经网络数学原理(7):手动演算神经网络BP算法(误差向后传递)续
第6章: Neural.Network.Loss 20190316直播
任务38: Neural.Network.Loss-直播01
任务39: Neural.Network.Loss-直播02
任务40: Neural.Network.Loss-直播03
第7章: 深度神经网络
任务41: 梯度消亡
任务42: 梯度消亡问题分析
任务43: 梯度消亡解决方案
任务44: 过拟合
任务45: DropOut 训练
任务46: 正则化
任务47: 最大范数约束 神经元的初始化
第1节: 自动梯度求解
第8章: 作业讲解与答疑
任务48: 作业讲解与答疑-01
任务49: 作业讲解与答疑-02
第9章: 递归神经网络LSTM
任务50: 为什么需要递归神经网络?
任务51: 递归神经网络介绍
任务52: 语言模型
任务53: RNN的深度
任务54: 梯度爆炸和梯度消失
任务55: Gradient Clipping
任务56: LSTM的介绍
任务57: LSTM的应用
任务58: Bi-Directional LSTM
任务59: Gated Recurrent Unit
任务60: 机器翻译
任务61: Multimodal Learning
任务62: Seq2Seq模型
任务63: 回顾RNN与LSTM
任务64: Attention for Image Captioning
任务65: Attention for Machine Translation
任务66: Self-Attention
任务67: Attention总结
第10章: neural network optimizer直播
任务68: neural network optimizer直播-01
任务69: neural network optimizer直播-02
任务70: neural network optimizer直播-03
第11章: Project1:看图说话
任务71: 项目介绍
第1节: Part1: VGG16定义的CNN网络结构创建
任务72: 看图说话任务一-01
任务73: 看图说话任务一-02
任务74: 看图说话任务一-03
第2节: Part2:VGG16网络提取图像特征
任务75: 任务介绍
任务76: 如何实现 load_img_as_np_array 这个函数
任务77: 如何实现“load_vgg16_model”函数
任务78: 如何实现“extract_features”函数
第3节: Part3:图像生成
任务79: 创建Tokenizer01
任务80: 创建Tokenizer02
任务81: 产生模型需要的输入数据01
任务82: 产生模型需要的输入数据02
第4节: Part4:Keras搭建图像生成网络, 训练网络
任务83: 任务的概述
任务84: Input Embedding和Dropout层介绍
任务85: LSTM Add层的介绍
任务86: 如何训练模型
第5节: Part5:BLEU指标评价图像生成的质量
任务87: 如何使用深度神经网络模型做预测 产生标题 完成generate_caption函数01
任务88: 如何使用深度神经网络模型做预测 产生标题 完成generate_caption函数02
任务89: 如何调用generate_caption函数
任务90: 如何评价标题生成模型的性能
第12章: 图像处理和计算机视觉简介
任务91: 读取和显示数字图像
任务92: 数字图像大小缩放
任务93: 数字图像直方图均衡
任务94: 图像去噪声
任务95: 图像边缘检测
任务96: 图像关键点检测
任务97: 道路行车道检测简介
任务98: Canny边缘检测
任务99: 霍夫变换用于直线检测
任务100: 道路行车道检测代码讲解
任务101: 在图像和视频上面演示道路行车道检测
第13章: Project 2:自动驾驶之交通指示牌识别
任务102: 项目介绍
第1节: Part 1: 数据增强
任务103: 交通指示牌识别的简介
任务104: 交通指示牌识别课程的编程任务
任务105: 如何分析数据 (util.py 的详细介绍)
任务106: 如何预处理图像数据、建立神经网络模型、训练网络模型 (train.py 的详细介绍)01
任务107: 如何预处理图像数据、建立神经网络模型、训练网络模型 (train.py 的详细介绍)02
第2节: Part 2: 图像预处理
任务108: 色彩空间转换
任务109: 直方图均衡
任务110: 图像标准化
任务111: 使用ImageDataGenerator做图像增强
任务112: 作业上传的要求
第3节: Part 3: 设计卷积神经网络进行神经学习
任务113: 介绍经典交通指示牌卷积神经网络模型
任务114: 代码实现经典交通指示牌识别卷积神经网络模型
任务115: 卷积神经网络的数学原理01
任务116: 卷积神经网络的数学原理02
第14章: 用于视觉识别的卷积特征
任务117: 深度学习调参-直播-01
任务118: 深度学习调参-直播-02
任务119: 深度学习调参-直播-03
任务120: 卷积层的启发
任务121: 卷积层的定量分析
任务122: 单通道输入 单通道输出的卷积层的实例
任务123: 多通道输入 多通道输出的卷积层的实例
任务124: 池化层的原理 定量分析
任务125: 卷积神经网络和全连接神经网络的比较
任务126: 卷积神经网络在围棋 语言识别和自然语言处理中的应用
任务127: 基于深度学习的图像分类历史回顾
任务128: AlexNet的结构分析
任务129: ZFNet的结构分析
任务130: VGG的结构分析
任务131: GoogleNet Inception的结构分析
任务132: Inception V3的结构分析
任务133: ResNet的结构分析
任务134: ResNet的代码实现
任务135: 基于内容的图像搜索理论基础
任务136: 基于去噪自动编码器的图像搜索代码实现
任务137: 使用卷积神经网络进行语义图像嵌入在目标检测, 自动驾驶, 图像超分辨率重构, 工业探伤等等领域的应用
任务138: 项目1-看图说话(助教)讲解和答疑-01
任务139: 项目1-看图说话(助教)讲解和答疑-02
第15章: 开放式项目:自动驾驶之方向盘操纵
任务140: 项目介绍
第1节: Part 1: 图像预处理
任务141: 自动驾驶方向盘转动方向预测的背景知识
任务142: 如何收集训练数据
任务143: 理解分析训练数据
任务144: 自动驾驶方向盘转动方向预测的网络结构和网络训练代码讲解
任务145: 提高网络性能的思路 图像处理、数据增强、网络结构优化
任务146: 探索数据01
任务147: 探索数据02
第2节: Part 2: 数据增强
任务148: 图像增强01
任务149: 图像增强02
任务150: 解决数据不平衡的问题 DataGenerator的应用
任务151: 网络结构实例
任务152: 图像增强部分的代码讲解
任务153: DataGenerator部分的代码讲解
任务154: 网络结构实现部分的代码讲解
第3节: Part 3: 设计网络结构
任务155: 方向盘转动方向预测网络模型的性能评估方法
任务156: 使用模拟器定性的判断网络性能的方法以及代码讲解
任务157: 模拟器自动驾驶的展示
任务158: 通过损失函数的变化判断网络性能、识别和解决过拟合和欠拟合的问题
任务159: 如何安装Python 连接模拟器的Python 库
任务160: windows 下面使用自动驾驶模拟器的教程
任务161: mac 下面使用自动驾驶模拟器的教程
第16章: 目标检测
任务162: 目标识别综述
任务163: 基于HOG(梯度直方图)的目标识别
任务164: Non-Max Suppression IoU 和 Hard Negative Mining
任务165: R-CNN的工作原理
任务166: R-CNN中的边界框(Bounding Box)预测原理
任务167: R-CNN的不足之处
任务168: Fast R-CNN详解
任务169: Faster R-CNN Region Proposal Network
任务170: R-CNN Fast R-CNN Faster R-CNN的总结
任务171: 目标识别 R-CNN家族的回顾
任务172: SSD的简介 SSD与R-CNN的比较
任务173: SSD的网络结构
任务174: 如何使用卷积作为最后的预测层
任务175: SSD的训练过程
任务176: SSD的实验结果分析
任务177: VGG16到SSD网络的演化 L2Normalization层的实现
任务178: SSD各个技术对失败率的影响 Atrous卷积层的原理
任务179: 使用卷积作为最后的预测层详解
任务180: SSD定位损失函数详解
任务181: SSD中Anchor尺寸 宽高比 中心位置的确定
任务182: SSD中分类损失函数详解
任务183: Non-Max Suppression的原理
任务184: SSD和YOLO的比较 SSD的总结
第17章: 图像分割和合成
任务185: 图像分割简介
任务186: 基于深度学习的图像分割U-Net的原理
任务187: Transposed Convolution原理与运用
任务188: U-Net的代码讲解
任务189: 图像生成的原理
任务190: 使用深度学习自动图像生成手写数字的代码讲解
任务191: 图像风格转移的原理
任务192: 使用深度学习实现图像风格转移的代码讲解
第18章: 自动驾驶之道路目标检测
任务193: SSD的原理回顾
任务194: 编程项目的训练数据介绍
任务195: 对SSD模型对产生Anchor有影响的参数讲解
任务196: 对候选框精选处理有影响的参数讲解
任务197: 对输入模型参数的合法性检测和转换
任务198: 具有7层的SSD的网络结构讲解
任务199: 编译模型, 使用模型做预测
任务200: SSD解码的实现
任务201: 帮助函数IoU, 坐标转换, SSD损失函数, Non-Max-Suppression的实现
第19章: 二值化神经网络(BNNs)
任务202: 二值化神经网络的简介
任务203: 二值化网络的前向后向传播, 梯度计算原理
任务204: 二值化网络的训练算法
任务205: 二值化网络的实验结果
任务206: 二值化全连接网络的代码讲解
任务207: DropoutNoScale层的实现
任务208: BinaryDense层的实现
任务209: 二值化卷积神经网络的代码讲解
任务210: 项目作业要求
第20章: light weight-network直播
任务211: 神经网络在实际应用中面临的挑战, 轻量级深度神经网络的必要性
任务212: MobileNet, Depthwise Seperable Convolution的原理计算量分析
任务213: ShuffleNet, Group Convolution, Channel Shuffle的原理
任务214: EffNet, Spatial Seperable Convolution的原理计算量分析和实验效果
任务215: lightweight-network答疑时间
第21章: EffNet.Self.Steering
任务216: 回顾EffNet的原理
任务217: EffNet的代码讲解
第22章: One-Shot-Learning
任务218: One-Shot Learning 的意义和工作原理
任务219: 用于One-Shot Learning 的Siamese 深度神经网络的介绍
任务220: Siamese 深度神经网络的实验和结果分析
任务221: Transposed Convolution 的应用, 算法回顾, 以及使用矩阵乘法实现
任务222: Transposed Convolution 的梯度推导
任务223: 将卷积核转换为Toeplitz Matrix用于矩阵乘法实现Transposed
第23章: Siamese Network
任务224: 同学对课程的效果反馈调查
任务225: 使用 Siamese 网络做门禁卡系统的入门介绍, 数据集的介绍
任务226: PyTorch 基础教程
任务227: Siamese One-Shot learning 知识回顾
任务228: 使用 PyTorch torchvision 库高效读取数据
任务229: 使用 PyTorch 定义 Siamese 网络结构
任务230: 使用 PyTorch 写训练网络的代码
任务231: 使用 PyTorch 写测试网络的代码
获取方式(备注:CV集训)