jewey_leo

YOLO V1

You Only Look Once: Unified, Real-Time Object Detection

Abstract

作者提出了一种新的物体检测方法YOLO。YOLO之前的物体检测方法主要是通过region proposal产生大量的可能包含待检测物体的 potential bounding box，再用分类器去判断每个 bounding box里是否包含有物体，以及物体所属类别的 probability或者 confidence，如R-CNN,Fast-R-CNN,Faster-R-CNN等。

YOLO不同于这些物体检测方法，它将物体检测任务当做一个regression问题来处理，使用一个神经网络，直接从一整张图像来预测出bounding box 的坐标、box中包含物体的置信度和物体的probabilities。因为YOLO的物体检测流程是在一个神经网络里完成的，所以可以end to end来优化物体检测性能。

YOLO检测物体的速度很快，标准版本的YOLO在Titan X 的 GPU 上能达到45 FPS。网络较小的版本Fast YOLO在保持mAP是之前的其他实时物体检测器的两倍的同时，检测速度可以达到155 FPS。

相较于其他的state-of-the-art 物体检测系统，YOLO在物体定位时更容易出错，但是在背景上预测出不存在的物体（false positives）的情况会少一些。而且，YOLO比DPM、R-CNN等物体检测系统能够学到更加抽象的物体的特征，这使得YOLO可以从真实图像领域迁移到其他领域，如艺术。

Introduction

YOLO之前的物体检测系统使用分类器来完成物体检测任务。为了检测一个物体，这些物体检测系统要在一张测试图的不同位置和不同尺寸的bounding box上使用该物体的分类器去评估是否有该物体。如DPM系统，要使用一个滑窗（sliding window）在整张图像上均匀滑动，用分类器评估是否有物体。

在DPM之后提出的其他方法，如R-CNN方法使用region proposal来生成整张图像中可能包含待检测物体的potential bounding boxes，然后用分类器来评估这些boxes，接着通过post-processing来改善bounding boxes，消除重复的检测目标，并基于整个场景中的其他物体重新对boxes进行打分。整个流程执行下来很慢，而且因为这些环节都是分开训练的，检测性能很难进行优化。

作者设计了YOLO（you only look once），将物体检测任务当做回归问题（regression problem）来处理，直接通过整张图片的所有像素得到bounding box的坐标、box中包含物体的置信度和class probabilities。通过YOLO，每张图像只需要看一眼就能得出图像中都有哪些物体和这些物体的位置。

如图所示，使用YOLO来检测物体，其流程是非常简单明了的：
1、将图像resize到448 * 448作为神经网络的输入
2、运行神经网络，得到一些bounding box坐标、box中包含物体的置信度和class probabilities
3、进行非极大值抑制，筛选Boxes

下图是各物体检测系统的检测流程对比：

YOLO模型相对于之前的物体检测方法有多个优点：

1、YOLO检测物体非常快。
因为没有复杂的检测流程，只需要将图像输入到神经网络就可以得到检测结果，YOLO可以非常快的完成物体检测任务。标准版本的YOLO在Titan X 的 GPU 上能达到45 FPS。更快的Fast YOLO检测速度可以达到155 FPS。而且，YOLO的mAP是之前其他实时物体检测系统的两倍以上。

2、YOLO可以很好的避免背景错误，产生false positives。
不像其他物体检测系统使用了滑窗或region proposal，分类器只能得到图像的局部信息。YOLO在训练和测试时都能够看到一整张图像的信息，因此YOLO在检测物体时能很好的利用上下文信息，从而不容易在背景上预测出错误的物体信息。和Fast-R-CNN相比，YOLO的背景错误不到Fast-R-CNN的一半。

3、YOLO可以学到物体的泛化特征。
当YOLO在自然图像上做训练，在艺术作品上做测试时，YOLO表现的性能比DPM、R-CNN等之前的物体检测系统要好很多。因为YOLO可以学习到高度泛化的特征，从而迁移到其他领域。

尽管YOLO有这些优点，它也有一些缺点：

1、YOLO的物体检测精度低于其他state-of-the-art的物体检测系统。
2、YOLO容易产生物体的定位错误。
3、YOLO对小物体的检测效果不好（尤其是密集的小物体，因为一个栅格只能预测2个物体）。

下图是各物体检测系统的检测性能对比：

Unified Detection

YOLO将输入图像划分为S*S的栅格，每个栅格负责检测中心落在该栅格中的物体,如下图所示：

每一个栅格预测B个bounding boxes，以及这些bounding boxes的confidence scores。
这个 confidence scores反映了模型对于这个栅格的预测：该栅格是否含有物体，以及这个box的坐标预测的有多准。
公式定义如下：

如果这个栅格中不存在一个 object，则confidence score应该为0；否则的话，confidence score则为 predicted bounding box与 ground truth box之间的 IOU（intersection over union）。

YOLO对每个bounding box有5个predictions：x, y, w, h,
and confidence。
坐标x,y代表了预测的bounding box的中心与栅格边界的相对值。
坐标w,h代表了预测的bounding box的width、height相对于整幅图像width,height的比例。
confidence就是预测的bounding box和ground truth box的IOU值。

每一个栅格还要预测C个 conditional class probability（条件类别概率）：Pr(Classi|Object)。即在一个栅格包含一个Object的前提下，它属于某个类的概率。
我们只为每个栅格预测一组（C个）类概率，而不考虑框B的数量。

注意：
conditional class probability信息是针对每个网格的。
confidence信息是针对每个bounding box的。

在测试阶段，将每个栅格的conditional class probabilities与每个 bounding box的 confidence相乘：

这样既可得到每个bounding box的具体类别的confidence score。
这乘积既包含了bounding box中预测的class的 probability信息，也反映了bounding box是否含有Object和bounding box坐标的准确度。

将YOLO用于PASCAL VOC数据集时：
论文使用的 S=7，即将一张图像分为7×7=49个栅格每一个栅格预测B=2个boxes（每个box有 x,y,w,h,confidence，5个预测值），同时C=20（PASCAL数据集中有20个类别）。
因此，最后的prediction是7×7×30 { 即S * S * ( B * 5 + C) }的Tensor。

Network Design

YOLO检测网络包括24个卷积层和2个全连接层,如图所示：

其中，卷积层用来提取图像特征，全连接层用来预测图像位置和类别概率值。

YOLO网络借鉴了GoogLeNet分类网络结构。不同的是，YOLO未使用inception module，而是使用1x1卷积层（此处1x1卷积层的存在是为了跨通道信息整合）+3x3卷积层简单替代。

Training

首先利用ImageNet 1000-class的分类任务数据集Pretrain卷积层。使用上述网络中的前20 个卷积层，加上一个 average-pooling layer，最后加一个全连接层，作为 Pretrain 的网络。训练大约一周的时间，使得在ImageNet 2012的验证数据集Top-5的精度达到 88%，这个结果跟 GoogleNet 的效果相当。

将Pretrain的结果的前20层卷积层应用到Detection中，并加入剩下的4个卷积层及2个全连接。
同时为了获取更精细化的结果，将输入图像的分辨率由 224* 224 提升到 448* 448。
将所有的预测结果都归一化到 0~1, 使用 Leaky RELU 作为激活函数。
为了防止过拟合，在第一个全连接层后面接了一个 ratio=0.5 的 Dropout 层。
为了提高精度，对原始图像做数据提升。

损失函数

损失函数的设计目标就是让坐标（x,y,w,h），confidence，classification 这个三个方面达到很好的平衡。
简单的全部采用了sum-squared error loss来做这件事会有以下不足：
a) 8维的localization error和20维的classification error同等重要显然是不合理的。
b) 如果一些栅格中没有object（一幅图中这种栅格很多），那么就会将这些栅格中的bounding box的confidence 置为0，相比于较少的有object的栅格，这些不包含物体的栅格对梯度更新的贡献会远大于包含物体的栅格对梯度更新的贡献，这会导致网络不稳定甚至发散。

解决方案如下：
更重视8维的坐标预测，给这些损失前面赋予更大的loss weight, 记为 λcoord ,在pascal VOC训练中取5。（上图蓝色框）
对没有object的bbox的confidence loss，赋予小的loss weight，记为 λnoobj ，在pascal VOC训练中取0.5。（上图橙色框）
有object的bbox的confidence loss (上图红色框) 和类别的loss （上图紫色框）的loss weight正常取1。

对不同大小的bbox预测中，相比于大bbox预测偏一点，小box预测偏相同的尺寸对IOU的影响更大。而sum-square error loss中对同样的偏移loss是一样。
为了缓和这个问题，作者用了一个巧妙的办法，就是将box的width和height取平方根代替原本的height和width。如下图：small bbox的横轴值较小，发生偏移时，反应到y轴上的loss（下图绿色）比big box(下图红色)要大。

在 YOLO中，每个栅格预测多个bounding box，但在网络模型的训练中，希望每一个物体最后由一个bounding box predictor来负责预测。
因此，当前哪一个predictor预测的bounding box与ground truth box的IOU最大，这个 predictor就负责 predict object。
这会使得每个predictor可以专门的负责特定的物体检测。随着训练的进行，每一个 predictor对特定的物体尺寸、长宽比的物体的类别的预测会越来越好。

神经网络输出后的检测流程

非极大值抑制

获取Object Detect 结果

参考文档

https://zhuanlan.zhihu.com/p/25236464
http://blog.csdn.net/surgewong/article/details/51864859
https://deepsystems.io/en/reviews
https://zhuanlan.zhihu.com/p/24916786?utm_source=qq&utm_medium=social
https://arxiv.org/abs/1506.02640

你可能感兴趣的:(deeplearning.ai)

Coursera | Andrew Ng (02-week2-2.10)—局部最优的问题 ZJ_Improve 深度学习正则化以及优化深度学习吴恩达局部最优深度学习
该系列仅在原课程基础上部分知识点添加个人学习笔记，或相关推导补充等。如有错误，还请批评指教。在学习了AndrewNg课程的基础上，为了更方便的查阅复习，将其整理成文字。因本人一直在学习英语，所以该系列以英文为主，同时也建议读者以英文为主，中文辅助，以便后期进阶时，为学习相关领域的学术论文做铺垫。-ZJCoursera课程|deeplearning.ai|网易云课堂转载请注明作者和出处：ZJ微信公众
6、5 门关于 AI 和 ChatGPT 的免费课程，带您从 0-100 AI算法蒋同学一起来学习下ChatGPT吧人工智能 chatgpt
5门关于AI和ChatGPT的免费课程，带您从0-100想在2024年免费了解有关AI和ChatGPT的更多信息吗？图片由DALLE3提供活着是多么美好的时光啊。还有什么比现在更适合了解生成式人工智能（尤其是ChatGPT）等人工智能元素的呢！许多人对这个行业感兴趣，但有些人需要更多关于如何到达那里的知识。该博客为您提供了来自哈佛、IBM、DeepLearning.AI等可信机构的免费课程列表。让
吴恩达深度学习-学习笔记p1-p6 丢了橘子的夏天深度学习学习笔记
哔哩哔哩网站视频-[双语字幕]吴恩达深度学习deeplearning.ai网站：up主：mHarvey，视频：[双语字幕]吴恩达深度学习deeplearning.ai一.p11.1欢迎二.p21.2什么是神经网络1.举例：根据面积预测房价假设有六个房子的房屋面积和价格，根据这个数据集，房屋面积预测房价的函数，这些是一个简单的神经网络神经元的功能就是输入面积完成线性运算，取不小于0的值，最后得到预测
【吴恩达机器学习】第一周课程笔记 Estella_07 机器学习笔记人工智能
Hello，这里是小梁。下面是我近期学习机器学习的笔记，出发点是希望对自己起到一个督促和输出的作用如果你对我的笔记感兴趣欢迎Like，有不足之处也欢迎评论留言B站【2022吴恩达机器学习Deeplearning.ai课程】笔记参考【吴恩达《MachineLearning》精炼笔记】1机器学习的定义与分类1.1监督学习Supervisedlearning1.2无监督学习Unsupervisedlea
Coursera | Andrew Ng (01-week-2-2.11)—向量化 ZJ_Improve 深度学习深度学习吴恩达吴恩达深度学习
该系列仅在原课程基础上部分知识点添加个人学习笔记，或相关推导补充等。如有错误，还请批评指教。在学习了AndrewNg课程的基础上，为了更方便的查阅复习，将其整理成文字。因本人一直在学习英语，所以该系列以英文为主，同时也建议读者以英文为主，中文辅助，以便后期进阶时，为学习相关领域的学术论文做铺垫。-ZJCoursera课程|deeplearning.ai|网易云课堂转载请注明作者和出处：ZJ微信公众
ML学习安排和资源链接 Nice night #ML吴恩达机器学习
第一阶段：学习前置数学知识机器学习的数学基础_二进制人工智能的博客-CSDN博客第二阶段：认知机器学习吴恩达机器学习【2022中文版教程全集】_哔哩哔哩_bilibili视频5h，看了一点发现后面没字幕了，这个(强推|双字)2022吴恩达机器学习Deeplearning.ai课程_哔哩哔哩_bilibili视频19h。但是这个是属于新课，所以还是先看第三阶段上：仔细了解机器学习视频链接：[中英字幕
吴恩达《ChatGPT Prompt Engineering for Developers》学习笔记 stay_foolish12 人工智能
来自：口仆本笔记是deeplearning.ai最近推出的短期课程《ChatGPTPromptEngineeringforDevelopers》的学习总结。1引言总的来说，当前有两类大语言模型（LLM）：「基础LLM」和「指令微调LLM」。基础LLM基于大量文本数据训练而成，核心思想为预测一句话的下一个单词（即词语接龙）。基于语料的限制，有时会返回不符合预期的结果（如上图所示）。指令微调LLM基于
Assignment | 04-week1 -Convolutional Neural Networks: Application Part_2 ZJ_Improve 深度学习吴恩达-Assignment 汇总深度学习吴恩达卷积神经网络 tensorflow
该系列仅在原课程基础上课后作业部分添加个人学习笔记，如有错误，还请批评指教。在学习了AndrewNg课程的基础上，为了更方便的查阅复习，将其整理成文字。因本人一直在学习英语，所以该系列以英文为主，同时也建议读者以英文为主，中文辅助，以便后期进阶时，为学习相关领域的学术论文做铺垫。-ZJCoursera课程|deeplearning.ai|网易云课堂转载请注明作者和出处：ZJ微信公众号-「SelfI
【机器学习小记】【平面数据分类】deeplearning.ai course1 3rd week programming LittleSeedling #初学深度学习机器学习神经网络
带有一个隐藏层的平面数据分类数据集介绍数据集形状模型搭建参数初始化前向传播隐藏层输出层反向传播输出层隐藏层梯度下降更新参数预测其他np.dot()与np.multiply()的区别结果使用简单逻辑回归测试不同的隐藏层神经元数测试其他数据集原始数据集测试不同的隐藏层神经元数目标：带有一个隐藏层的平面数据分类神经网络参考自：【中文】【吴恩达课后编程作业】Course1-神经网络和深度学习-第三周作业数
Coursera | Andrew Ng (02-week-1-1.3)—机器学习基础 ZJ_Improve 深度学习正则化以及优化深度学习吴恩达机器学习深度学习吴恩达 coursera
该系列仅在原课程基础上部分知识点添加个人学习笔记，或相关推导补充等。如有错误，还请批评指教。在学习了AndrewNg课程的基础上，为了更方便的查阅复习，将其整理成文字。因本人一直在学习英语，所以该系列以英文为主，同时也建议读者以英文为主，中文辅助，以便后期进阶时，为学习相关领域的学术论文做铺垫。-ZJCoursera课程|deeplearning.ai|网易云课堂转载请注明作者和出处：ZJ微信公众
进大厂全靠自学，微软&头条实习生现身说法：我是这样自学深度学习的丨课程传送门... QbitAl
作者SannyKim郭一璞编译量子位出品|公众号QbitAI跟着网络资料自学、刷MOOC是许多人学深度学习的方式，但深度学习相关资源众多，应该从哪儿开始学呢？富有自学经验的GitHub用户SannyKim贡献出了一份深度学习自学指南。她自学成才，有Udacity、deeplearning.ai、Coursera的一大堆课程认证，甚至连大学都是上的以自学、MOOC著称的Minerva大学，自学卓有成
吴恩达机器学习Deeplearning.ai课程学习笔记(Supervised Machine Learning Regression and Classification---week1) 智能提桶工程师人工智能学习
一、机器学习定义：机器学习即Machinelearning，涉及很多学科，简单点来说，就是使用计算机通过“学习“大量的数据模拟实现人类的行为，也就是让计算机自己学习到一些所谓的”知识与技能“（例如什么是苹果？什么是香蕉？），而且能够通过一些算法组织其实现不断学习不断完善自身的性能与知识架构，换句话说，让计算机越来越”知识渊博“，也就是-----人工智能。二、机器学习分类：机器学习一般分为监督学习与
大手笔！吴恩达一口气开放了 3 个 AIGC 教程。。机器学习社区自然语言机器学习 AIGC 人工智能自然语言处理大模型算法
一个月前，DeepLearning.ai创始人吴恩达与OpenAI开发者IzaFulford联手推出了一门面向开发者的技术教程：ChatGPT提示工程。该教程总共分为9个章节，总一个多小时，里面主要涵盖：提示词最佳实践、评论情感分类、文本总结、邮件撰写、文本翻译、快速搭建一个聊天机器人等等。你除了能在这个教程里面学到如何使用Prompt，你还能学到GPT接口调用开发知识。一个月时间过去了，因课程质
GitHub Copilot Chat将于12月全面推出；DeepLearning.AI免费新课 go2coding AI日报 github copilot 人工智能
AI新闻GitHubCopilotChat将于12月全面推出，提升开发者的生产力摘要：GitHub宣布将于12月全面推出GitHubCopilotChat，这是GitHubCopilot的一个新功能，旨在帮助开发者编写代码。它能够集成到开发者的桌面IDE环境中，并能够根据上下文联想出后文，不仅限于代码缺省补充和纠错。与此同时，CopilotChat还能够与开发者进行对话，提供更加细致的人机交互体验
【深度学习】Coursera的TensorFlow课程练习题精华部分风度78
大家好，这次给大家翻译的是来自Coursera，由deeplearning.ai提供的TensorFlowinPractice的课程系列的QUIZ部分本文来源：www.kesci.com该系列课程共分为4个专项一、人工智能、机器学习和深度学习的TensorFlow简介二、TensorFlow中的卷积神经网络三、TensorFlow中的自然语言处理四、序列、时间序列与预测原教程链接在此：Tensor
sheng的学习笔记-【目录】【中文】【deplearning.ai】【吴恩达课后作业目录】 coldstarry 吴恩达作业-深度学习人工智能
学习吴恩达的深度学习，用于记录笔记知识目录和引用文章原文见下面，但已经变为收费的：【目录】【中文】【deplearning.ai】【吴恩达课后作业目录】_吴恩达深度学习何宽-CSDN博客免费的用于学习的github地址，包含笔记和代码，资料来源于深度学习GitHub-fengdu78/deeplearning_ai_books:deeplearning.ai（吴恩达老师的深度学习课程笔记及资源）机
微调大型语言模型(一)：为什么要微调(Why finetune)? -派神- NLP Langchain ChatGPT 语言模型人工智能自然语言处理 chatgpt
今天我们来学习Deeplearning.ai的在线课程微调大型语言模型(一)的第一课：为什么要微调(Whyfinetune)。我们知道像GPT-3.5这样的大型语言模型(LLM)它所学到的知识截止到2021年9月，那么如果我们向ChatGPT询问2022年以后发生的事情，它可能会产生“幻觉”从而给出错误的答案，再比如我们有一些关于企业的某些产品的业务数据，但是由于ChatGPT没有学习过这些数据，
2022吴恩达机器学习Deeplearning.ai课程编程作业C1_W2: Linear Regression alterego2380 机器学习 python numpy 机器学习线性回归人工智能
PracticeLab:LinearRegressionWelcometoyourfirstpracticelab!Inthislab,youwillimplementlinearregressionwithonevariabletopredictprofitsforarestaurantfranchise.Outline1-Packages2-Linearregressionwithonevar
LangChain 手记 Conclusion结语从流域到海域大语言模型 langchain
整理并翻译自DeepLearning.AI×LangChain的官方课程：ConclusionConclusion结语本系列短课展示了大量使用LangChain构建的大语言模型应用，包括处理用户反馈、文档上的问答系统甚至使用LLM来决定发起外部工具的调用（比如搜索）来回答复杂问题。使用LangChain的好处在于能很大程度上提升开发效率，仅需要适量代码，就可以实现复杂的llm应用。课程作者希望大家
卷积神经网络之一维卷积、二维卷积、三维卷积 bebr 机器学习卷积神经网络一维二维
1.二维卷积图中的输入的数据维度为14×1414×14，过滤器大小为5×55×5，二者做卷积，输出的数据维度为10×1010×10（14−5+1=1014−5+1=10）。如果你对卷积维度的计算不清楚，可以参考我之前的博客吴恩达深度学习笔记（deeplearning.ai）之卷积神经网络（CNN）（上）。上述内容没有引入channel的概念，也可以说channel的数量为1。如果将二维卷积中输入的
LangChain手记 Agent 智能体从流域到海域大语言模型 langchain 人工智能
整理并翻译自DeepLearning.AI×LangChain的官方课程：Agent（源代码可见）“人们有时会将LLM看作是知识库，因为它被训练所以记住了来自互联网或其他地方的海量信息，因而当你向它提问时，它可以回答你的问题。有一个更加有用的认知模式是将LLM看作是一个推理引擎，如果提供给他文本块或者额外信息，它可以理由从互联网或者其他地方学会的背景知识利用新信息来帮助回答问题或者进行文本推理或者
LangChain手记 Evalutation评估从流域到海域大语言模型 langchain 人工智能
整理并翻译自DeepLearning.AI×LangChain的官方课程：Evaluation（源代码可见）基于LLM的应用如何做评估是一个难点，本节介绍了一些思路和工具。“从传统开发转换到基于prompt的开发，开发使用LLM的应用，整个工作流的评估方式需要重新考虑，本节会介绍很多激动人心的概念。”Evaluation评估构建一个上节课介绍过的QAchain：不同之处仅在于加了一个参数：chai
DeepLearning.ai学习笔记（一）神经网络和深度学习--Week4深层神经网络 marsggbo 机器学习神经网络深度学习前向传播反向传播 Andrew-ng
一、深层神经网络深层神经网络的符号与浅层的不同，记录如下：-用L表示层数,该神经网络L=4-n[l]表示第l层的神经元的数量，例如n[1]=n[2]=5,n[3]=3,n[4]=1-a[l]表示第l层中的激活函数,a[l]=g[l](z[l])二、前向和反向传播1.第l层的前向传播输入为a[l−1]输出为a[l],cache(z[l])矢量化表示：Z[l]=W[l]⋅A[l−1]+b[l]A[l]
LangChain手记 Question Answer 问答系统从流域到海域大语言模型 langchain
整理并翻译自DeepLearning.AI×LangChain的官方课程：QuestionAnswer（源代码可见）本节介绍使用LangChian构建文档上的问答系统，可以实现给定一个PDF文档，询问关于文档上出现过的某个信息点，LLM可以给出关于该信息点的详情信息。这种使用方式比较灵活，因为并没有使用PDF上的文本对模型进行训练就可以实现文档上的信息点问答。本节介绍的Chain也比较常用，它涉及
LangChain手记 Chains 从流域到海域 langchain 人工智能
整理并翻译自DeepLearning.AI×LangChain的官方课程：Chains（源代码可见）Chains直译链，表达的意思更像是对话链，对话链的背后是思维链LLMChain（LLM链）首先介绍了一个最简单的例子，LLMChain：将一个大语言模型和prompt模板组合起来调用LLMChain，即可得到一个LLMChain对象，该对象的run实现的功能即给定输入自动使用prompt模板生成p
LangChain手记 Memory 从流域到海域大语言模型 langchain
整理并翻译自DeepLearning.AI×LangChain的官方课程：MemoryMemory使用openai的API调用GPT都是单次调用，所以模型并不记得之前的对话，多轮对话的实现其实是将前面轮次的对话过程保留，在下次对话时作为输入的message数组的一部分，再将新一轮对话的提问也放入message数组，再发起一次API调用，即构手动建对话流（以上笔者注）。构建对话流（LangChain
LangChain手记 Models,Prompts and Parsers 从流域到海域大语言模型 langchain
整理并翻译自DeepLearning.AI×LangChain的官方课程：Models,PromptsandParsers模型，提示词和解析器（Models,PromptsandParsers）模型：大语言模型提示词：构建传递给模型的输入的方式解析器：获取模型输入，转换为更为结构化的形式以在下游任务中使用为什么使用提示词模板提示词会非常长且具体在可以的时候能直接复用提示词LangChain也为常用
使用 Gradio 构建生成式 AI 应用程序(一): 图片内容读取app -派神- NLP 自然语言处理人工智能自然语言处理深度学习神经网络机器学习
今天我们来学习DeepLearning.AI的在线课程：BuildingGenerativeAIApplicationswithGradio，该课程主要讲述利用gradio来部署机器学习算法应用程序,今天我们来学习第一课：Imagecaptioningapp，该课程主要讲述如何从图片中读取图片的内容信息，如下图所示：今天我们会使用huggingface的Salesforce/blip-image-
深度学习阶段性回顾猫咪的白手套深度学习人工智能
本文针对过去两周的深度学习理论做阶段性回顾，学习资料来自吴恩达老师的2021版deeplearning.ai课程，内容涵盖深度神经网络改善一直到ML策略的章节。视频链接如下：吴恩达深度学习视频链接（注：本文出自深度学习初学者，此文内容将以初学者的感悟与见解讲述。当然我也会努力搜寻资料以弥补自身认知的不足，希望本文能对深度学习的其他初学者也有所帮助，文章若有不当之处，望大家在评论区多多指正，我将虚心
LangChain手记 Overview 从流域到海域大语言模型 langchain
整理并翻译自DeepLearning.AI×LangChain的官方课程：Overview综述（Overview）LangChain是为大模型应用开发设计的开源框架LangChain目前提供Python和JavaScript（TypeScript）两种语言的包LangChain的主攻方向是聚合和模块化核心附加值：模块化的组件用例：针对常见组合组件的方式提供了简单易用的模板组件模型（Models）集
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他