u012878523

机器学习讲座总结-读图时代的识图技术

在车库咖啡见到了传说的中的大牛黄畅博士 @黄畅_了解的不只是人脸，黄博士对于识图技术进行了一个综述，下面是这次报告的总结。

1. 关于机器学习优化的目的：黄博士提到机器学习并非以求最优为目的，而是以控制overfitting为目的。

这个非正式报告中提到的问题，而是在讲座开始前和黄博士交流的时候提到的，引来几个同学的疑问，首先来解释一下这个问题

微博上大家也都提到了一些看法：
@ 等魔炮3rd的高町薇薇欧：其实overfitting原因不就是陷入局部最优解么？求解全局最优解和客服overfitting其实也是具有等价性吧// @机器学习讲座 :回复 @Copper_PKU :微博太短，只能记录大概，实际上黄博士讲的更多，是有一定道理的 // @Copper_PKU :这个说法不是很赞同

这个地方我解释一下，这个问题源于我问黄博士为什么Deep learning现在会火这个话题，我提到原来无法求得最优解，现在由于有了好的初始化方法，导致求解最优是有可能的了。黄博士此时说其实他并不看重一个机器学习问题是否有最优解，而更关注的是是否能够将overfitting控制到一定的范围内，这个一定范围是指的稍微有一点overfitting（毕竟可观察到的数据更具有可信性）。

这样来说的主要原因是最优解在实际操作中是很难获取的：

a. 在很多大规模的学习任务中，机器学习算法都是在试图学习一个复杂的非线性的函数，这样的函数实际上存在很多局部极值点，因此求解容易陷入局部极值。

b. 因此在寻优的过程中，通常都会有一个初始值，然后再根据使得目标函数下降的方向不断的迭代，直到满足收敛条件，但是这样的解不一定就是最优的。

c. 为什么呢？原因是你求解的目标函数根本就不是原来的问题，而是原来问题的一个近似（说到这里我只能呵呵）。近一步解释一下，我们通常在求解一个问题的时候，如果原问题很难直接求解（如NP-Hard的问题），那么我们就relax一下（如使用1范数来近似0范数），通过求解原来问题的bound来近似，所以这里的问题不再是原始的我们想求解的问题的解，对于原来问题来说，最后求出的所谓的最优解还可能没有你选择的初始值好呢。

d. 既然问题已经被偷换成了最小化bound的问题，那么就没有必要太关注于最优这个概念。因为最后的目的是想让训练出的结果在有更好的泛化能力，这个是通过求test error的bound来完成的，而test error< traing error + O(d/N)，所以这里问题就转变成了控制training error和函数的复杂度问题，实际上也可以看做在控制overfiting的问题。

下面来正式的介绍黄博士的讲座。黄博士的讲座主要对于图像处理的技术做了一个综述，然后重点介绍了deep learning在百度图像产品中的应用。由于是综述，这里也就简单的罗列一些黄博士讲到的东西，然后最后我会把自己对于图像的一些理解加入到里面来。

2. 和图像相关的一些任务和数据集：

a.和图像相关的任务：从Object层面上来说，有 Detection和Recognition；从Image/Scene层面上来说：有Categorization和Segmentation。
b. 下面着重介绍Categorization，与此有关的数据集：
Caltech101 有101class，9K images；
Scene15 15 classes，5K images；
Caltech256 有256 classes 30k images；
Pascal Voc‘07 20 classes，10k images；
TINY（32*32）75 classes 80M images；
SUN397 899 classes，131K images；
ImageNet 22K classes，14M images；（li feifei v587）

3. Descriptors and Model

a. Descriptors: 在具体描述一张图像的时候，有两类特征可提供我们选择，一类是全局特征，如histogram，GIST；还有一类是Local descriptors，如著名的Sift，HOG、LBP、Haar-like等，这些特征都具有各自的特点，是为不同的任务而生的。

黄博士也提到了关于good Descriptors的几个原则：scale，viewpoints，lighting，occlusion，也就是尽量满足在这些条件下的不变性。

上述提到的的特征也就满足good Descriptors的一个或者部分条件，绝对不变的特征目前还没有见到，也许试图寻找绝对不变的特征这个想法就是错误的，任何不变都是暂时的。所说的在线学习方法，我到感觉就是在学习一些动态不变的特征。

b. Model

Rigid Model: 这一类Model黄博士举了两种，一种就是经典的Haar-like + Boosted Cascade；另外一种就是HOG+SVM。
Deformable Part Based Model：这是 2008年Felzenszwalb搞出的一个方法，出现之后，就有点一统天下的感觉了

在后边的讲座中，黄博士主要综述了一下基本的BOW的方法，然后罗列了一下baidu使用deeplearning一类方法所做的工作，具体的可以参考一下黄博士的slides。

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

下面主要想谈一下我对于传统的图像的描述方法以及现在比较火热的deeplearning之间关系的简单理解，首先谈一下传统的方法。

1. 传统的BOF框架

在归类的任务中，其实就在做一件事情：如何拿到数据的描述，有了描述我们再用一些分类器（如SVM）去分类就好了。

在如何生成图像的描述方面，BOW（Bag of words）和BOF（Bag of features）是先前比较成功的框架，主要分为几个步骤：

a. 图像基本特征的提取,如sift，hog，histogram等。这个步骤就是在提取图像中的基本特征。

b. Codebook的生成，这个就跟文本中的单词表一样的（我们常用的汉字词汇表有大概6W左右），在图像中这个初始的book的生成一般是通过聚类算法来完成的，如基本的k-means或者层次化的k-means等。另外这个book后边一般还要优化，这就是图像和文本处理的一个不同。

c. Encode features：有了这个codebook之后，我们就要用它来对于基本的a中提出的特征点进行encode。为什么要encode呢，实际上是为构建图像的描述做准备。这里顺带提一下，我们看到的汉字词表就是一个一个的高度抽象的词，而文本就是直接使用用这样一个一个词组合起来得。但图像跟文本是不同的是，图像不是人脑抽象过的，因此如果想要使用类似文本的方法来描述图像，需要有一个抽象的过程：原始图像是由像素构成，然后我们再提取sift，hog这样底层特征，然后在进行encode。

这个过程实际上是使用Codebook中的word来表示我们提出的sift,hog这样的特征（x = c*codebook，这个优化有很多种方法）这样就得到一组系数c，我们可以认为就是把每个底层特征（sift，hog）映射到了另外一个空间，这个空间是由系数c来构成的。有了c之后，我们就可以来构建图像的描述了。

d. Pooling（这个被很多同学翻译成池化）：这个就是构建图像描述的一个过程，常用的有average以及max两种操作，一种是把图像patch中所有出现的底层特征的code取一个平均，一个是取一个最大，这个实际上是在local建立一个feature competition的机制，一个是统计平均，一个是优者胜出，实际在局部区域的特征选择上有了And 和 Or的这两种逻辑（有点UCLA的Zhu老板的与或图的意思）。这样经过几次pooling后，就得到了不同level的图像的表示，把这些level的值级联起来或者经过某种组合，就得到了图像的描述，其实更深层的是因为Pooling这个过程跟人的神经元筛选的机制类似。（还要看神经学方面的文献，都要哭了…...）

总结一下：以上这4个步骤，仔细看来每一步就是一个函数映射，不断的把上层空间的特征映射到下层的新空间中，就是 f = f3（f2（f1（x）））这样一个过程，这不就是一个深度的模型吗？

2. CNN（卷积神经网络）模型

现在用在图像上的最成功的DL模型就是convlutional Neural NetWork（感谢LeCun和Hinton老人家）。在讨论CNN前，先来看一个图像处理的流程。

Input一副图像，我把图像分成了4*4一共16块，使用一个filter（如Gabor）对于图像的每一块提取了Gabor特征（级联后不就是Gist么），然后我再把4个2*2区域的Gabor特征进行Pooling，然后最后得到了一个2*2的一个map，然后最后我把这个2*2的map展成一个vector来作为图像的描述。每一副图像都这样做，把最后的描述都拿去用svm去train一个model，然后新来的图像就可以用这个分类器来分类。至少我们用BOF一类的模型就可以这样来做（以上没有encode的过程，如果加上也只不过相当于多加一个函数映射而已），不同是可以调整一下filter，调整一下Pooling的策略，调整一下map和pooling的次数。

下面问两个问题：
a. Gabor filter是人工设计的，一个Gabor出来参数是定死的，用这样一个filter就真正可以来把某一类的图像的某种代表性的特征提取出来吗？

答案是否定的，因为图像的类别是千变万化的，但是目前人工设计的filter又是有限的，把有限的filter应用到无限的图像类别中，很难做到普适的。那怎么办呢？

b. 如果针对不同的图像类别能把这样的filter给学习出来那问题不就解决了，那怎样学习呢?

这时候问题变成了我们用的filter的参数未知的，只能给它一个大小，比如5*5，10*10。数目上可以假设为6，7，8….。好了先暂且假定这些filter已经被求出来了，我们就可以拿它们对图像进行卷积了，每一个filter可以对应一个map，每个map可以做pooling，pooling完使用另外的一批filter再卷积映射成map，卷积完再pooling，如此往复一定数目就得到了图像的描述比如是di。到这里，跟本节开始提到的图像处理的流程是一致的，问题是这里面每个filter是未知的，需要求解。我们可以加一个分类器，通过一个求解目标min(sum(lable_est(di) - lable))，来对于这些参数构成一个约束。这个目标就是让估计的图像的类别和真实图像类别一致，这样一个过程就是使用CNN同时实现图像描述构建以及分类器求解的的一个过程。

那我们反过头来看其中未知的参数，每一次映射map就会产生一批filter，这一批filter的某种组合方式（比如前面的两个map映射到后边的一个map）又会产生一批参数，这些参数都是要求的，求解就是由构成的目标函数min(sum(lable_est(di) - lable))来控制的。每一次map或者pooling就是产生一个新的映射函数的过程，最后也就构成了第一节中提到的函数 f = f3（f2（f1（x））），不同的是本节这个函数中的参数要求解，是个求解的过程，而第1节之中的那个是设计的过程，不用求解。

3. 关于Deep learning结构的求解

下面讨论一下deep model 任务的求解方法

a. convex & non-convex function: 一般的目标函数可以分为两类，一类是Convex的，一类是non-Convex的。前一类就是有一个全局极小值点，后一类就是有多个局部极值点，神经网络构成的函数就是一个non-convex的，而且是高度复杂非线性的，非线性的结构按照道理来说比线性的结构更能近似任意函数的分布，这也就是为什么如果神经网络的参数调好了，就能显示出对于数据精确的拟合能力。

b. 优化的思路：对于前一类，所有的参数随意初始化一个，可以使用一些基本的优化方法（如基本的梯度下降方法）求得最优解。而对于后一类，如果初始值不好，则非常容易陷入局部最小。由此给出一个基本思路就是选取尽量好的初始值，然后使用梯度下降类的方法来求解。另外一个思路就是采用多次试探求最优的方法，如模拟退火算法，理论上尝试无限次肯定能拿到最优解，这类算法耗时较多，在大规模的数据中非常不适用。

（在大规模数据的优化算法上 @jingdongc @夏粉_百度是专家，正在招人呢，小伙伴们快联系吧）

c. DNN中的问题：DNN模型80年代就提出来，但是没有火，原因是DNN参数非常多，因此计算量非常非常大，效率非常低，另外初始值不好找因此一直没有火起来，直到Hinton老先生在2006年发表的那篇论文出现，似乎找到了提高效率的方法。现在大家努力在多个维度上提升效率，设备上适应GPU，框架上进行并行计算、算法上使用Dropout策略，同时改进SGD算法。在精确度上，则使用pretraining进行神经网络的预先训练得到一个比较好的初始值，这样原来神经网络中效率和精度的问题就逐渐的解决了。

d. 如何看待Deep learning现在的火爆程度：DL火到一个什么程度，基本上跟Machine learning沾边的领域，如果不知道Deep learning就是out了。一般说来，一旦一个很久找不到答案的问题，突然有了曙光，会很快的刺激大家的兴奋点，兴奋过头了，就无所不用其极了，一下子就崇拜的不得了。我听过一些老师的讲座或者课程，比如baidu的余凯老师、黄畅博士、微软的邓力老师也请教过他们一些问题，感觉他们还是挺淡定的，呵呵。所以选择深度学习作为课题的博士生们，祝你们好运…...：）

4. 总结一下：

a. 图像在分类一个最为重要的任务是在找图像描述，那这个描述可以通过设计一个规则来建立，比如提取sift，Hog等一些底层结构的规则，也可以对于这些底层的结构使用一些已知的结构的函数进行再次变换，这些都属于人工设计的范畴。

b.Deep learning的一个最大的不同，就是尝试去自动的学习我们所想要的一些feature，而且可以多任务去做（2013年底 LeCun搞的overFeat），只要能把这些问题formulate成一坨参数，直接扔进去做就可以了，现在DL的火爆其实跟Deep learning这个模型关系只有一半，另外一半是因为高度复杂非线性的函数可以快速的求解了…

c. 关于百度翻译中的实拍翻译功能：看到过baidu的 @ 余轶南在他们主页上提到过一些，这个功能应该就是使用CNN做的，图像的标注采用的是自动标注（大家可以看到很多图像拍摄后翻译出的一些词汇都不像人工标注的结果）和手工标注结合，因为加入了文本标注的技术，有可能采用了google的word2vec的技术通过词的距离来对图像的相似程度做一个参考，晚上的数据识别结果不是太好，应该和训练样本有关。

转自：http://blog.sina.com.cn/s/blog_eb3aea990101f3uo.html

云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
linux查看jupyter运行,在Linux服务器上运行Jupyter notebook server教程天启大烁哥
在Linux服务器上运行Jupyternotebookserver教程很多deeplearning教程都推荐在jupyternotebook运行python代码，方便及时交互。但只在本地运行没有GPU环境，虽然googlecolab是个好办法，但发现保存模型后在云端找不到模型文件，且需要合理上网才能访问。于是想给实验室的服务器配置jupyternotebook，供本机远程访问。踩了不少坑，码一下教
使用matlab的热门问题七十二五值得关注 matlab 开发语言青少年编程算法经验分享
MATLAB广泛应用于科学计算、数据分析、信号处理、图像处理、机器学习等多个领域，因此热门问题也涵盖了这些方面。以下是一些可能被认为当前最热门的MATLAB问题：深度学习与神经网络：如何使用MATLAB的深度学习工具箱（DeepLearningToolbox）来构建和训练神经网络？如何利用MATLAB进行图像识别、语音识别或自然语言处理等深度学习应用？数据分析与可视化：如何使用MATLAB进行大数
COI实验室技能：图像到图像的深度学习开发框架（pytorch版）山颠海涯深度学习 pytorch 人工智能
Basicdeeplearningframeworkforimage-to-image这个开发框架旨在帮助科研人员快速地实现图像到图像之间的模型开发。github连接：https://github.com/SituLab/Basic-deep-learning-framework-for-image-to-image目录1模型开发1-1克隆项目到本地1-2深度学习开发2环境配置2-1安装conda
Python深度学习-环境 cunzai1985 tensorflow python 深度学习人工智能 anaconda
Python深度学习-环境(PythonDeepLearning-Environment)Inthischapter,wewilllearnabouttheenvironmentsetupforPythonDeepLearning.Wehavetoinstallthefollowingsoftwareformakingdeeplearningalgorithms.在本章中，我们将学习为Python
深度学习-OpenCV运用（3）红米煮粥深度学习 opencv 人工智能
文章目录一、简介二、OpenCV运用1.图片扩充2.图像阈值处理3.添加椒盐噪声三、总结一、简介深度学习（DeepLearning）与OpenCV（OpenSourceComputerVisionLibrary）的结合为计算机视觉领域带来了强大的解决方案。OpenCV是一个开源的计算机视觉和机器学习软件库，它提供了大量的视觉处理算法，包括但不限于图像和视频处理、特征检测、对象识别等。二、OpenC
【论文阅读】Purloining Deep Learning Models Developed for an Ultrasound Scanner to a Competitor Machine Bosenya12 科研学习模型窃取论文阅读深度学习人工智能模型安全
TheArtoftheSteal:PurloiningDeepLearningModelsDevelopedforanUltrasoundScannertoaCompetitorMachine（2024）摘要Atransferfunctionapproach（传递函数方法）hasrecentlyproveneffectiveforcalibratingdeeplearning(DL)algorit
【论文阅读】QUEEN: Query Unlearning against Model Extraction（2024） Bosenya12 科研学习模型窃取论文阅读提取攻击模型安全
摘要Modelextractionattacks（模型提取攻击）currentlyposeanon-negligiblethreat（不可忽视的威胁）tothesecurity（安全性）andprivacy（隐私性）ofdeeplearningmodels.Byqueryingthemodelwithasmalldataset（通过小数据集查询模型）andusingthequeryresultsa
【论文阅读33】Deep learning optoacoustic tomography with sparse data 弹伦琴的雷登【论文阅读系列】人工智能深度学习论文阅读图像处理
Deeplearningoptoacoustictomographywithsparsedata论文题目：基于稀疏数据的深度学习光声断层扫描论文链接：Deeplearningoptoacoustictomographywithsparsedata|NatureMachineIntelligence代码链接：GitHub-ndavoudi/sparse_artefact_unet数据链接：Data发
python里的i_Python 中[::] 与 [:,:,i] 总结桌游顽主的航仔 python里的i
最近在学吴恩达的DeepLearning中的第五门课SequenceModel,第一个lab是用Numpy搭建RNN，在搭建RNN的时候用到了Numpy的Slicing([:,:,i]),在这里想总结下[:,:,i]与[::i]的用法，有写的不对的地方请随时指教。总的来说，[::i]是Python中的基础索引，而[:,:,i]是Numpy中对于多维度Array的提取，在StackOverflow中
智能合约漏洞检测论文 weixin_45332030 智能合约
综述TestingEthereumSmartContracts:AComparisonofSymbolicAnalysisandFuzzTestingTools符号执行与模糊测试工具的比较综述DeepLearningBasedVulnerabilityDetection:AreWeThereYet?基于深度学习的漏洞检测研究https://github.com/VulDetProject/ReVe
机器学习概述与应用：深度学习、人工智能与经典学习方法刷刷刷粉刷匠人工智能机器学习深度学习
引言机器学习（MachineLearning）是人工智能（AI）领域中最为核心的分支之一，其主要目的是通过数据学习和构建模型，帮助计算机系统自动完成特定任务。随着深度学习（DeepLearning）的崛起，机器学习技术在各行各业中的应用变得越来越广泛。在本文中，我们将详细介绍机器学习的基础概念，包括无监督学习、有监督学习、增量学习，以及常见的回归和分类问题，并结合实际代码示例来加深理解。1.机器学
【现学现卖】CHEER中的概念解释——k-mer 番茄随笔
“概念理解”CHEER:HierarCHicaltaxonomicclassificationforviralmEtagEnomicdataviadeepleaRning对这篇文章中概念的理解：【现学现卖】CHEER与病毒宏基因组数据分析（1）【现学现卖】CHEER与病毒宏基因组数据分析（2）k-mer单独的k-mer很好理解，就是从一段序列中迭代分割提取长度为k的几个子序列（一般k为奇数，使用例
Learning Deep Learning（学习深度学习） weixin_34056162 开发工具人工智能 python
作者：chen_h微信号&QQ：862251340微信公众号：coderpai简书地址：https://www.jianshu.com/p/e98...LearningDeepLearning（学习深度学习）TherearelotsofawesomereadinglistsorpoststhatsummarizedmaterialsrelatedtoDeepLearning.SowhywouldI
【论文阅读】APMSA: Adversarial Perturbation Against Model Stealing Attacks（2023） Bosenya12 科研学习模型窃取论文阅读模型窃取防御对抗性扰动
摘要TrainingaDeepLearning(DL)model（训练深度学习模型）requiresproprietarydata（专有数据）andcomputing-intensiveresources（计算密集型资源）.Torecouptheirtrainingcosts（收回训练成本）,amodelprovidercanmonetizeDLmodelsthroughMachineLearni
DeePhage：预测噬菌体的生活方式 CAAS_IFR_zp 生活
GitHub-shufangwu/DeePhage:Atoolfordistinguishtemperatephage-derivedandvirulentphage-derivedsequenceinmetaviromedatausingdeeplearning安装condacreate-ndeephagecondaactivatedeephagepipinstallnumpypipinstal
机器学习、深度学习、神经网络之间的关系你好，工程师 AI 机器学习
机器学习（MachineLearning）、深度学习（DeepLearning）和神经网络（NeuralNetworks）之间存在密切的关系，它们可以被看作是一种逐层递进的关系。下面简要介绍它们之间的关系：机器学习（MachineLearning）：机器学习是一种人工智能的分支，关注如何通过数据让计算机系统从经验中学习，提高性能。机器学习算法可以分为监督学习、无监督学习、半监督学习和强化学习等不同
认识小波-DWT CWT Scattering 闪闪发亮的小星星数字信号处理与分析计算机视觉人工智能信号处理
这里写自定义目录标题小波变换的种类连续小波变换（CWT）DWTANexampleapplicationofDWTANexampleofCWT5.MachineLearningandDeepLearningwithWaveletScattering小波散射网络大家好。在本次介绍性课程中，我将介绍一些基本的小波概念。我将主要使用一维示例，但相同的概念也可以应用于图像。首先，我们回顾一下什么是小波。现实
Mastering Convolutional Neural Networks: A Comprehensive Practical Exploration Bio大恐龙人工智能深度学习数据可视化机器学习
ConvolutionalNeuralNetworks(CNNs)haverevolutionizedthefieldofcomputervisionandimagerecognition,enablinggroundbreakingadvancementsinvariousdomains.Thesepowerfuldeeplearningmodelshaveproventheirprowessi
精读《深度学习 - 函数式之美》可口可乐Vip 前端深度学习人工智能
1引言函数式语言在深度学习领域应用很广泛，因为函数式与深度学习模型的契合度很高，TheBeautyofFunctionalLanguagesinDeepLearning — ClojureandHaskell就很好的诠释了这个道理。通过这篇文章可以加深我们对深度学习与函数式编程的理解。2概述与精读深度学习是机器学习中基于人工神经网络模型的一个分支，通过模拟多层神经元的自编码神经网络，将特征逐步抽象
苹果手机怎么学python_我是如何在 Python 内使用深度学习实现 iPhone X 的 FaceID 的... weixin_39693437 苹果手机怎么学python
雷锋网按：本文为AI研习社编译的技术博客，原标题HowIimplementediPhoneX'sFaceIDusingDeepLearninginPython，作者为SHIVAMBANSAL。翻译|陶玉龙余杭校对|Lamaric整理|MY在最近推出的iPhoneX中，它被讨论最多的特点之一是它采用了新的解锁方法，即TouchID：FaceID。在研发出无边框手机后，苹果公司想开发一种新的方法来快捷
解决conda环境下import TensorFlow失败的问题绿竹巷人功能安装 conda tensorflow 人工智能
问题描述安装了anaconda的电脑，新建了一个名叫deeplearning的环境，在该环境下已经成功安装了tensorflow。于是在终端打开python并执行代码importtensorflowastfprint(1)除了提示2024-02-2721:50:00.801427:Iexternal/local_tsl/tsl/cuda/cudart_stub.cc:31]Couldnotfind
Deep Learning with OpenCV DNN Module介绍 lida2003 Linux 深度学习 opencv dnn 计算机视觉人工智能
DeepLearningwithOpenCVDNNModule介绍1.源由2.为什么/什么是OpenCVDNNModule?2.1支持的不同深度学习功能2.2支持的不同模型2.3支持的不同框架3.如何使用OpenCVDNN模块3.1使用从Keras和PyTorch等不同框架转换为ONNX格式的模型3.2使用OpenCVDNN模块的基本步骤4.参考资料1.源由看了一些资料和数据，感觉他讲的非常好，也
文献阅读（42）——使用深度学习在眼底照中检测糖网并分类（综述）柚子味的羊文献阅读深度学习分类人工智能
使用深度学习在眼底照中检测糖网并分类（综述）Deeplearningfordiabeticretinopathydetectionandclassificationbasedonfundusimages:AreviewIF=6.698/Q1文章目录使用深度学习在眼底照中检测糖网并分类（综述）先验知识/知识拓展文章结构文章结果1.introduction方法1.眼底图像一般的分析pipeline2.
深度学习——概念引入韶光流年都束之高阁深度学习日记深度学习人工智能职场和发展
深度学习深度学习简介深度学习分类根据网络结构划分：循环神经网络卷积神经网络根据学习方式划分：监督学习无监督学习半监督学习根据应用领域划分：计算机视觉自然语言处理语音识别生物信息学深度学习简介深度学习（DeepLearning，DL）是机器学习领域中的一个新的研究方向，主要是通过学习样本数据的内在规律和表示层次，让机器能够具有类似于人类的分析学习能力。深度学习的最终目标是让机器能够识别和解释各种数据
ChatGPT魔法1：背后的原理王丰博 GPT chatgpt
1.AI的三个阶段1）上世纪50~60年代，计算机刚刚产生2）Machinelearning3）Deeplearning，有神经网络，最有代表性的是ChatGPT,GPT(GenerativePre-TrainedTransformer)2.深度神经网络llyaSutskever:做图像识别，使用了GPT去并行计算及训练。Alexnet数据库已经label好的（李飞飞）GPU算力3.GPT3.1T
中科院一区论文复现，改进蜣螂算法，Fuch映射+反向学习+自适应步长+随机差分变异，MATLAB代码... 今天吃饺子算法学习 matlab 开发语言
本期文章复现一篇发表于2024年来自中科院一区TOP顶刊《Energy》的改进蜣螂算法。论文引用如下：LiY,SunK,YaoQ,etal.Adual-optimizationwindspeedforecastingmodelbasedondeeplearningandimproveddungbeetleoptimizationalgorithm[J].Energy,2024,286:129604
速读-张量流处理器（TSP） Reacubeth 徐奕的专栏机器学习人工智能体系结构深度学习
Paper:Abts,Dennis,etal.“Thinkfast:atensorstreamingprocessor(TSP)foracceleratingdeeplearningworkloads.”2020ACM/IEEE47thAnnualInternationalSymposiumonComputerArchitecture(ISCA).IEEE,2020.简介本文介绍了一种名为张量流处
如何在6个月内学习深度学习(翻译) 三猫后端
原文链接：如何在6个月内学习深度学习(翻译)微信公众号：机器学习养成记搜索添加微信公众号：chenchenwings机器学习工程师Bargava的文章《HowtolearnDeepLearningin6months》介绍了6个月内学习并掌握深度学习的实现步骤，每个步骤列出了相应的学习材料和学习目标。本周公众号内容为原文的部分内容翻译。准备6个月内，每周将花费10-20小时。需要一些编程基础。这样便
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

机器学习讲座总结-读图时代的识图技术

你可能感兴趣的:(DeepLearning)