视觉学习

21天趁早手账学习之旅

无意中看到了趁早发起的活动内容，觉得很有助于新年视觉学习的目标，带着好奇和怀疑报名了（怀疑自己可能无法打满卡，再之后就满怀期待的等着开营，把这作为新年第一个Flag。

Sugar_沫沫·2025-07-21 00:46

计算机视觉（图像算法工程师）学习路线

计算机视觉学习路线Python基础常量与变量列表、元组、字典、集合运算符循环条件控制语句函数面向对象与类包与模块Numpy+Pandas+Matplotlibnumpy机器学习回归问题线性回归Lasso

陳錄生·2025-05-27 01:50

Meta 推出 WebSSL 模型：探索 AI 无语言视觉学习，纯图训练媲美 OpenAI CLIP

Web-SSL探索了视觉自监督学习（SSL）在网络规模数据上的扩展潜力。通过调整模型大小和训练数据，我们证明了纯视觉模型可以与CLIP等语言监督方法相媲美，甚至超越它们，从而对"语言监督是学习多模态建模所需的强大视觉表征的必要条件"这一普遍假设提出了挑战。我们提出了Web-SSL：一个参数从0.3B到7B不等的纯视觉模型系列，它为多模态建模和经典视觉任务提供了CLIP的有力替代方案。主要发现：SS

吴脑的键客·2025-04-30 06:10

00计算机视觉学习内容

计算机视觉（ComputerVision）开发需要掌握数学基础、编程语言、图像处理、机器学习、深度学习等多个方面的知识。以下是一个系统的学习路线：1️⃣数学基础（核心理论支撑）计算机视觉涉及很多数学概念，以下是必备数学知识：✅线性代数（矩阵运算是计算机视觉的核心）向量、矩阵运算（加减、乘法、转置）特征值与特征向量SVD（奇异值分解），用于图像压缩、降维齐次坐标变换（用于3D计算机视觉）✅概率统计（

依旧阳光的老码农·2025-03-07 21:26

01计算机视觉学习计划

计算机视觉系统学习计划（3-6个月）本计划按照数学→编程→图像处理→机器学习→深度学习→3D视觉→项目实战的顺序，确保从基础到高级，结合理论和实践。第一阶段（第1-2个月）：基础夯实✅目标：掌握数学基础、Python/C++编程、基本图像处理1️⃣数学基础（2周）每日2小时线性代数：矩阵运算、特征值分解（推荐《线性代数及其应用》）概率统计：高斯分布、贝叶斯定理微积分：偏导数、梯度下降傅里叶变换：图

依旧阳光的老码农·2025-03-07 20:15

2024 最新计算机视觉学习路线（入门篇）_计算机视觉课程主线

Python是机器学习项目中最流行的编程语言之一，因为与Java和C++等其他编程语言相比，它简单易读。Python附带了许多可以加快开发速度的库，其中一些重要的库是OpenCV、TensorFlow、PyTorch等，它们专门用于图像处理相关任务。本文旨在向初学者介绍这一领域，为他们提供有关涉及图像的机器学习应用程序背后概念的基本知识，并从高层次的角度深入了解这些库如何在底层协同工作，以便他们在

m0_60721823·2025-03-03 17:53

计算机视觉学习路线

计算机视觉学习路线是一个系统而全面的过程，涵盖了从基础知识到高级应用的多个方面。

不会代码的小林·2024-09-12 12:11

OpenCV计算机视觉学习（16）——仿射变换学习笔记

OpenCV计算机视觉学习（16）——仿射变换学习笔记如果需要其他图像处理的文章及代码，请移步小编的GitHub地址传送门：请点击我如果点击有误：https://github.com/LeBron-Jian

牛马程序员24·2024-09-10 06:31

计算机视觉学习指南（划分为20个大类）

计算机视觉的知识领域广泛而庞杂，涵盖了众多重要的方向和技术。为了更好地组织这些知识，我们需要遵循无交叉无重复（MutuallyExclusiveCollectivelyExhaustive，MECE）的原则，并采用循序渐进的方式进行分类和划分。按照无交叉无重复的原则，我们将计算机视觉划分为20个重要的方向，每个方向都具有明确的定义和特定的应用领域。通过这种划分方式，可以确保每个方向都在整个计算机视

superdont·2024-02-20 15:32

IVY｜05阅读书卡＿视觉思维基本要素-对话泡泡

视觉学习的第五天,与图卡相结合。

ivyWang靖蕙·2024-02-19 15:16

教师要有课程观

陈教授在报告中让老师们亲自参与了一项感觉倾向性调查，验证了有人善于听觉学习，有人善于视觉学习，

海风轻吹·2024-02-05 14:25

让学习更真实、开放地发生 ——《班本课程的设计与实践》听课反思

王老师讲到，我们面对的学生是有个性差异的，有些学生是视觉学习型的，有些学生是听觉学习型的，有些学生是动手操作型的，有些学生是演讲思辩型的。

梧桐雨_·2024-01-18 18:26

【论文解读】SiamMAE：用于从视频中学习视觉对应关系的 MAE 简单扩展

学姐论文链接：https://siam-mae-video.github.io/resources/paper.pdf项目主页：https://siam-mae-video.github.io/1.背景时间是视觉学习背景下的一个特殊维度

深度之眼·2024-01-14 11:03

世间有痴，才生凡尘

我是一个视觉学习者，我喜欢看字，不

海边的蓝兔子·2024-01-13 06:55

3万字计算机视觉学习笔记及重要知识点总结

文章目录计算机视觉IoU如何计算mIoU？mAP如何计算mAP？目标检测度量标准图像分割度量标准非极大值抑制NMS目标检测中的Anchor原始图片中的ROI如何映射到到featuremap?请问FasterR-CNN和SSD中为什么用smoothl1loss，和l2有什么区别？给定5个人脸关键点和5个对齐后的点，求怎么变换的？Boundingboxes回归原理/公式

搬砖成就梦想·2024-01-10 14:33

机器视觉技能培养：桥接学院与工业界的鸿沟

本文将探讨机器视觉学习的重要性，分析技术指导和实践项目的必要性。并提出一个全面的机器视觉学习路线图。机器视觉及其在现代工业中的应用机器视觉是指利用计算机视觉技术对图像进行自动分析和理解的技术。

机器视觉知识推荐、就业指导·2024-01-07 19:27

孩子爱乱涂乱画，你还在制止吗？

绘画，之所以能使学习更高效，并不是因为学生是所谓的视觉学习者。绘画，之所以能更具优势

细听子语·2024-01-05 15:05

小白怎样学习机器视觉（转载）

谈一谈：机器视觉学习方法和路径，并找到对应的工作写这篇帖子，只是想谈一谈自己对该技术学习的一些理解。机器视觉，是很大的范畴。本篇只谈本人接触到的，工业自动化方面的机器视觉学习。

黄金小码农·2024-01-04 12:22

视觉学习笔记13——既是模型，又是模型中转站的onnx

系列文章目录入门级深度学习环境搭建文章目录系列文章目录前言一、ONNX是什么？二、环境安装1、在Anaconda环境中安装onnx2、在Anaconda环境中卸载onnx3、anaconda安装onnxruntime未完待续。。。前言假设一个场景：现在某组织因为主要开发用TensorFlow为基础的框架，现在有一个深度算法，需要将其部署在移动设备上，以观测变现。传统地我们需要用caffe2重新将模

RanceGru·2024-01-01 05:45

砍柴写作营之如何写出好标题

我是一个喜欢视觉学习的人，听一遍老师的课，好像听到了东西，但马上就忘得差不多了。有了文字笔记，可以在有空的时候，找

曲奇小溪·2024-01-01 04:52

视觉学习（7） —— 接收数据和发送数据以及全局变量和浮点数

1、前提创建一个四个字节的地址2、发送数据（1）直接发送数据再观察地址里的值与我们想要值不一样输入0，而实际值则为结论：直接输入值到地址，值会发生变化（2）走全局变量发送数据添加全局变量（值为1，更好的区分）走全局变量发送数据查看地址的数据值发现问题：这里可以观察到，地址数值为00010000，与预想不符查看地址的绑定虽然寄存器个数是2个，但是Int类型是16位所以结果只在前两个字节显示，我们将其

走丢的男孩·2023-12-30 16:36

【绘分享『英文启蒙规划师』训练营】第三课作业

图片发自App第三课自然拼读一听完课程回顾了一下自己给孩子教授字母的方法，确实没有遵循先听觉学习后视觉学习的规律，一般都是指着卡片带孩子读，就像老师说的，确实存在搞混淆的情况，课程中的方法，先辨音练习，

Maytotoro·2023-12-30 09:16

视觉学习（5） —— 绑定流程

1、前提2、接收事件绑定参数3、规则列表的设置（1）字节起止位置0到1是两个字节当输入值为整数1（2）比较规则配置大于等于小于上升沿等等而后是范围值等于1到5之间都算满足条件4、全局触发以上的逻辑：当输入值在范围内，将执行流程15、注意使用此方法绑定流程时，流程中功能块必要有清理数据的功能，否则流程将重复执行（1）全局变量以上逻辑：向Modbus通信里的Address地址发送数据值0这样的话，就是

走丢的男孩·2023-12-26 10:24

视觉学习（6） —— 接收事件规则列表

条件：两个地址绑定地址1，条件是值为1才执行流程（1）字节起止位置为0-0向100写入值1，流程次数是否会增加答案是不会，字节0是在哪里所以当写入值1而因为字节起止位置是00，所以只读字节0的数据，而此时字节0数据为00，所以不符合触发条件（2）字节起止位置为1-1向100写入值1，流程次数则会增加此时读取的是字节1的值，而字节1的值为01，也就是值为1（3）字节起止位置为0-1向100写入值1，

走丢的男孩·2023-12-26 10:24

视觉学习（4） —— 添加地址传递数据

ModbusSlave选择一个地址右键，选择发送的数据类型视觉软件一、添加地址当地址为100时，先将首地址改为100，第0个地址为100，第1个地址为101，往后累加若想使用100—150的地址，即首地址为100，寄存器个数为50或50以上二、写地址鼠标停留在红色方框内，会出现一个+图标点击出现弹出设备管理设备地址就是SlaveID寄存器个数，若接收16位数据，只需要1位，若接收32位数据，则需要

走丢的男孩·2023-12-26 10:54

视觉学习（2） —— 连接通讯

一、初始界面二、通信设置三、通信设置初始界面四、绑定设备这里其实就是谁控制视觉就绑定谁，机器设计中一般都是ModbusTCP，由PLC直接控制选择ModBus通信，直接点击确定，通信参数可以进入之后再输入五、通信参数目标IP：PLC的IP端口号：PLC的端口号轮询时间：每多少ms就检查一次地址自动重连：如果掉线会自动重连首地址：即地址范围的首地址寄存器个数：即地址范围，从首地址开始数六、注意值的注

走丢的男孩·2023-12-26 10:22

视觉学习（1）—— 理论

一、提问初入视觉的几个问题：1、视觉是怎么被控制的2、怎么让视觉启动3、视觉需要完成什么东西4、视觉启动如何将完成的东西反馈给我二、回答1、视觉都是通过通讯协议控制，如串口、ModbusTCP等协议2、视觉中的所有功能块都在流程中，想要启动这些功能即执行流程3、视觉的功能都是由不同的功能块进行搭配从而完成所需求的功能4、视觉的数据也是通过通讯协议进行数据反馈三、补充视觉不仅只关心软件里的功能，还需

走丢的男孩·2023-12-25 04:08

视觉学习之注意力机制（SE、ECA、CBAM）

没空写，先看这个应急吧，写的还怪好咧【深度学习】(1)CNN中的注意力机制（SE、ECA、CBAM），附Pytorch完整代码_se注意力机制_立Sir的博客-CSDN博客

黑夜寻白天·2023-12-23 00:40

2023 英特尔On技术创新大会直播 |探索视觉AI的无限可能

2023英特尔On技术创新大会直播|探索视觉AI的无限可能前言一·未来的AI：释放视觉AI真正潜力二·AI技术突破、视觉Al挑战及前沿研究创新三·全尺度视觉学习全尺度视觉学习示例1.GridConv实现三维人体姿态估计更高准确率

以山河作礼。·2023-12-22 12:37

视觉学习笔记10——opencv的卸载、安装与多版本管理

系列文章目录参考文献参考文献参考文献参考文献文章目录系列文章目录前言一、opencv卸载二、opencv安装1、下载opencv2、cmake-gui编译3、终端编译安装4、配置环境变量报错一报错二报错三报错四5、opencv的多版本安装与管理多版本安装环境变量管理前言之前在ubuntu18系统上已经安装了opencv4.4.0和扩展库opencv_contrib，但是最近需要跑一个SLAM的源代

RanceGru·2023-12-15 22:05

视觉学习笔记11——TensorRT安装配置及使用

系列文章目录参考文献参考文献参考文献文章目录系列文章目录前言1.安装首先解压下载的TensorRT安装包然后添加环境变量python调用TensorRTAPI安装UFF安装graphsurgeon安装onnx_graphsurgeon安装pycuda2.测试终端测试版本号测试自带的例子sampleMNIST3.onnx模型转engine模型4.报错解决前言一般的深度学习项目，训练时为了加快速度，会

RanceGru·2023-12-15 22:05

视觉学习笔记12——百度飞浆框架的PaddleOCR 安装、标注、训练以及测试

系列文章目录虚拟环境部署参考博客1参考博客2参考博客3参考博客4文章目录系列文章目录一、简单介绍1.OCR介绍2.PaddleOCR介绍二、安装1.anaconda基础环境1）anaconda的基本操作2）搭建飞浆的基础环境2.安装paddlepaddle-gpu版本1）安装2）验证3.pip安装paddleocrwhl包1）2.6版本的paddleocr安装2）验证4.安装PPOCRLabel1

RanceGru·2023-12-15 22:53

上课不专心的原因

2，视觉学习力弱。3，听觉太好（敏感）4，体能偏弱5，归属感不足（班级的关系不好）表现神魂不在。6，师生关系。问:这几天在学校开心吗？7，内容听不懂【特别是后额叶低于5】（1），预习。

鑫燃·2023-11-30 20:30

机器学习与图像识别（二）—— OpenCV环境折腾。。

文章目录进入正题之前版本说明Python环境搭建安装aruco算法C++环境搭建安装VS+opencv验证Aruco算法，opencv==4.8.0进入正题之前OpenCV是一个优秀的开源视觉处理软件框架，也是计算机视觉学习道路上必须掌握的一套工具

24K纯学渣·2023-11-19 22:49

浙大博士整理的计算机视觉学习路线

点击“开发者技术前线”，选择“星标”让一部分开发者看到未来因工作需要，浙大博士年初花了4个月左右时间学习了机器学习、神经网络相关的知识，工作日每天大概学习4-6个小时，周末每天大概10个小时，工作中的需求应对也得心应手了。想快速入门的话，从自己的经验看，可以先不看高等数学和线性代数，因为机器学习和深度学习中涉及的相关知识并不多。视觉的知识部分建议分成两部分学习，第一部分传统图像处理，第二部分基于深

DevolperFront·2023-11-14 12:00

感恩日记第472篇2021.02.01

2.我万分荣幸并深深感恩蔓兮老师的分享，除了语音，还有每天公众号的文章补充，特别适合视觉学习型的我，谢谢，谢谢，谢谢！

宇宙宠儿·2023-11-05 05:19

ROS-机器视觉学习笔记（二）人脸识别和二维码识别

开学啦，不想开学阿，烦死了，开学我就大三啦，啥也不会阿，咋办？在线等很急！按照网上的学习流程来往往枯燥乏味，所以在这篇文章里我会教大家如何使用Opencv来进行人脸识别、物体跟踪和二维码识别1.OpencvOpencv的安装：sudoapt-getinstallros-melodic-vision-opencvlibopencv-devpython-opencv//ROS版本melodic模板：s

星影沉璧·2023-11-02 03:51

C#人脸识别、人脸68特征点识别

几年前我接触的计算机视觉学习库emgucv、aforge.net因为识别率低误差大，加上我没有时间去训练模型因此关于人脸识别领域被我搁置了很久，直到今年我接触了dlib，从效果演示来看让我非常满意特别是它可以匹配出人脸的

搬砖狗-小强·2023-10-28 07:37

计算机视觉学习笔记之torchvision.transforms

torchvision.transforms是包含一系列常用图像变换方法的包，可用于图像预处理、数据增强等工作，但是注意它更适合于classification等对数据增强后无需改变图像的label的情况，对于Segmentation等对图像增强时需要同步改变label的情况可能不太实用，需要自己重新封装一下。官方文档：https://pytorch.org/docs/stable/torchvis

林空鹿饮溪_DrChen·2023-10-19 03:02

SegGPT_分割上下文中的所有内容

静静AI学堂·2023-10-17 05:05

机器视觉学习参考 — ROS SLAM相关

近来发生了许多事，从一线回老家（二三线）了，也放弃了ROSSLAM方向（个人也已在通信行业工作四五年了，ROSSLAM技术更多的还是处于研究状态，实际很有说服力的产品大都在医疗和工业应用上，自动驾驶初创企业风险较大，老家那边几乎没有机会，转行待遇也是比较大的问题），下面是我学习过程中觉得很不错的资料以及个人一些总结，做了些整理，供参考。书籍书籍是学习时最好的参考资料，书籍是经过严格校阅的，条理性更

打出了枫采·2023-10-16 17:24

一文详解草图，线框，模型和原型

人们是视觉学习者，视觉比文字更能解释想法。如何做？草图可以用纸

LDesign1·2023-10-16 06:47

机器学习与知识发现_机器视觉学习之工业镜头--硬件知识扫盲学习

在前些章节，我介绍了关于光源的知识，没看的同学可以前往观看机器视觉学习之光源--硬件知识扫盲必看如果工业相机没有镜头，那么Sensor感光就是一片噪点，聚焦不在物体上。

weixin_39732866·2023-10-12 16:24

你会使用视觉时间表来帮助自闭症孩子吗？

自闭症的孩子大多是视觉学习型的。也就是说，相比于听到的，他们更加能够接受看到的。所以帮助他们学会使用视觉工具非常重要和实用，而视觉时间表就是一种常用的视觉工具。

大连嘉洋爸爸·2023-10-07 06:59

浅谈机器视觉

跟大家分享几点关于视觉学习的问题，希望对大家有所帮助。1、视觉分为两大类，分别是计算机视觉和机器视觉，我们常说的视觉都是指机器视觉，计算机视觉离我们比较遥远，一般研究计算机视觉，对学历要求他比较高。

常哥说编程·2023-10-04 11:03

与机器学习相比，人类的学习包括视觉、听觉、触觉、嗅觉、味觉的串并行混合学习...

视觉学习、听觉学习和触觉学习是人类感知和认知过程中的三个重要方面。视觉学习：视觉学习是通过视觉感知信息进行学习和认知的过程。

人机与认知实验室·2023-09-28 13:05

《如何成为一个学习忍者》摘抄（3）

第二部分学习忍者的方法论第4章你是哪种学习者视觉学习者听觉学习者动觉学习者第5章常规性学习脚踏实地慢慢构建我称之为“日积月累的魔法”的学习方式，并建立应对不时之需的知识基础。

守正出奇赢辉煌未来·2023-09-16 18:37

ResNet结构解析及pytorch代码

结构解析及pytorch代码标签：pytorchResNet是恺明大神提出来的一种结构，近些年的一些结构变种，很多也是基于ResNet做的一些改进，可以说ResNet开创了更深的网络的先河，并且在很多计算机视觉学习上都取得了不错的效果

coderwangson·2023-09-14 15:37

以可视化方式解释 Go 并发 - 通道

在本文中，我将使用Gopher运行他们的虚构咖啡馆的可爱比喻来阐述通道，因为我坚信人类更容易通过视觉学习。情景Partier、C

小技术君·2023-09-10 04:01

使用通信顺序进程（CSP）模型的 Go 语言通道

在本文中，我将使用愉快的比喻，描述Gophers运营他们的想象中的咖啡馆，因为我坚信人类更适合通过视觉学习。场景Partier、Candi

小技术君·2023-08-27 08:17

推荐频道