OpenMMlab 学习笔记

OpenMMlab 学习笔记

  1. 计算机视觉是一门让计算机学会看的学科,研究如何自动理解图像和视频中的内容
    如, 识别图中的物体,确认图中物体的位置,理解物体的动作,自动生成物体
  2. 计算机视觉应用
    如, 动漫特效,航拍转地图,虚拟主播,视频理解与自动剪辑
  3. 计算机视觉的发展
    早起萌芽(1960-1980): Machine perception of 3d solids (Larry Roberts 1964) , 三维的视觉计算理论 (David Marr 1982)
    统计机器学习与模式识别(1990-2000):Eigen Face (Turk & Pentland 1991), VJ 人脸测试 (Viola & Jones 2001)
    ImageNet 大型数据库(2006): 斯坦福华人教授 李飞飞 于2006年启动ImageNet,旨在为计算机视觉算法研究提供一个大规模,优质的图片数据库,ImageNet 迄今包含约2万类, 共计约1500万张图片
    初有成效的视觉系统(~2010):ImageNet Classification 72% Top-5 Accuracy (NEC-UIUC2010), Deformable Part Model for object detection
    深度学习时代(2012~):AlexNet 突破传统视觉系统性能, Fast R-CNN 目标检测走入深度学习时代, 深度生成对抗网络实现图片生成
    时至今日:文字描述生成图片,视觉大模型,神经渲染CityNeRF
  4. 开源成为人工智能领域的发展引擎
    OpenMMlab 学习笔记_第1张图片
  5. OpenMMlab (https://openmmlab.com/)
    目前深度学习时代最完整的计算机视觉开源算法体系
    2000+ 预训练模型
    300 + 算法
    20+ 研究方向
    1个统一易用的框架
  6. 观后感
    课程分享了很多的内容, 都是干货,需要细嚼慢咽,起初不是很明白openMMlab 中的open是什么意思,现在我想来应该是开源的意思,集广大人类的智慧才是人类进步的阶梯,又想虽然是开源,如果这个是社区是西方人做的,语言文化的障碍估计又会卡主大部分的国人吧,我可能也没有机会听各位大佬深入浅出的讲这门有趣又有用的课程,希望能做大做强,做出辉煌。还有一个小担忧,pytorch 会不会有一天 也卡我们脖子不让我们用了。

你可能感兴趣的:(深度学习,人工智能)