OpenMMlab学习笔记(一)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 前言
  • 一、课前预习
    • Python 入门
    • Pytorch 入门
    • MMCV:OpenMMLab 基础库
  • 二、课程主要内容
    • 计算机视觉的介绍和发展历程
    • OpenMMlab的介绍
    • 机器学习和神经网络简介
      • 机器学习
        • 开发流程
        • 分类
      • 神经网络
        • 训练步骤
  • 课堂总结


前言

提示:这里可以添加本文要记录的大概内容:

OpenMMLab 为香港中文大学-商汤科技联合实验室 MMLab 开源的算法平台,不到两年时间,已经包含众多 SOTA 计算机视觉算法。本文将介绍这次学习收获。


提示:以下是本篇文章正文内容,下面案例可供参考

一、课前预习

Python 入门

文档:(https://github.com/datawhalechina/learn-python-the-smart-way)
视频:https://www.bilibili.com/video/BV1hv411n7Yg/?spm_id_from=333.337.search-card.all.click&vd_source=7a863785a93380d229ded645710a0031

Pytorch 入门

在线阅读地址:https://datawhalechina.github.io/thorough-pytorch/
配套视频教程:https://www.bilibili.com/video/BV1L44y1472Z

MMCV:OpenMMLab 基础库

  • 介绍与安装:https://mmcv.readthedocs.io/zh_CN/latest/get_started/article.html

二、课程主要内容

计算机视觉的介绍和发展历程

计算机视觉是计算机科学的一个分支,旨在使计算机能够“看”和理解真实世界中的图像和视频。它的发展始于 20 世纪 60 年代,当时的研究重点是图像处理和模式识别。随其主要内容包括图像处理、模式识别、机器学习、三维重建、目标检测和识别等。着计算机处理能力的提高和深度学习技术的出现,计算机视觉在近年来取得了显著的进展,并在许多领域,如自动驾驶、图像搜索、人脸识别等应用得到了广泛的使用。

计算机视觉是一门多领域的学科,它的发展历程可以追溯到1960年代。主要的里程碑有:
1960年:弗朗茨·贝叶斯(Franz Bauer)发明了首个计算机视觉系统。
1965年:美国麻省理工学院开发了较早的图像处理系统。
1970年代:研究人员开发出了许多基础技术,包括图像分割、特征提取和模板匹配。
1980年代:深度学习和神经网络的出现,使计算机视觉发生了重大的技术突破。
1990年代:随着硬件的进步和算法的改进,计算机视觉成为了计算机图形学的一个重要领域。
2010年代:深度学习算法的不断改进,使计算机视觉在诸如目标检测、图像分类和语义分割等任务中取得了显著的进展。
至今,计算机视觉仍在不断发展,并在诸如自动驾驶、机器人、医学影像分析等领域中得到广泛应用。

OpenMMlab的介绍

OpenMMLab是一个开源的人工智能研究机构,专注于计算机视觉,自然语言处理和其他人工智能技术的研究。它是由华为云智能实验室(Huawei Cloud AI Lab)和中国科学院计算机网络信息中心(CASIA)共同创建的。

OpenMMLab致力于开发领先的人工智能技术,并将其通过开源方式与世界分享。它维护了一系列开源项目,包括基于PyTorch的计算机视觉模型库MMDetection和预训练语言模型库MegEngine等。

OpenMMLab团队在计算机视觉、自然语言处理等领域的研究成果得到了广泛的认可,其中包括国际顶级会议和期刊的发表论文。OpenMMLab还与许多全球知名的科研机构和公司合作,共同推动人工智能领域的发展。
OpenMMlab学习笔记(一)_第1张图片

机器学习和神经网络简介

机器学习

机器学习(Machine Learning)是人工智能的一个分支,它的目标是让计算机在不需要明确编程的情况下通过学习从数据中找出规律并做出预测或决策。

开发流程

在这里插入图片描述

分类

监督学习(预测)
输入数据是具有特征标签,函数的输出可以是一个连续的值(称为回归),或是输出是有限个离散值(称作分类)。例如: k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络回归 、线性回归、岭回归。
无监督学习
输入数据有特征值无标签,例如:聚类 k-means
OpenMMlab学习笔记(一)_第2张图片

神经网络

神经网络(Neural Network)是机器学习的一种方法,它模仿了人脑的神经元网络结构,通过计算不断调整权重和阈值来学习特征和关系,并做出预测。 神经网络有多种不同的结构,如卷积神经网络(Convolutional Neural Network)和循环神经网络(Recurrent Neural Network)。

训练步骤

通过神经网络训练一般需要以下几个步骤:

  • 准备训练数据,通常需要大量的标记数据。
  • 选择一个模型结构,如卷积神经网络(CNN)或循环神经网络(RNN)。 初始化模型参数。
  • 通过计算损失函数,并使用优化算法(如随机梯度下降)不断更新模型参数。
  • 对模型进行评估,并在需要时调整模型结构或超参数。
  • 训练得到的最终模型可以在新的数据上进行预测。

课堂总结

本节课主要讲了三个方面的内容:计算机视觉、OpenMMlab和机器学习和神经网络。

首先,讲师介绍了计算机视觉的概念,并详细介绍了计算机视觉的发展历程。计算机视觉是一门研究如何使计算机理解、分析和处理图像的学科。它的发展史始于20世纪50年代,随着计算机科技的发展和普及,计算机视觉也在不断地进步。

接着,讲师介绍了OpenMMlab,它是一个开源的机器学习框架,提供了一系列的工具和技术,帮助开发者快速构建和评估计算机视觉算法。OpenMMlab的出现,使得计算机视觉研究变得更加容易和方便。

最后,讲师简要介绍了机器学习和神经网络。机器学习是一门研究计算机如何从数据中学习的学科,它为计算机视觉研究带来了极大的帮助。神经网络是一种常用于机器学习的技术,它模拟人脑神经系统的工作原理,可以解决复杂的图像分析问题。

你可能感兴趣的:(学习,深度学习,人工智能)