lovecencen1893

吴恩达深度学习课程笔记（三）：结构化机器学习项目2

吴恩达深度学习课程笔记（三）：结构化机器学习项目2
- 第二周机器学习（ML）策略（2）
  - 2.1 进行误差分析
  - 2.2 标签错误的数据
  - 2.3 快速搭建你的第一个系统，并进行迭代
  - 2.4 训练集和开发集、测试集不同分布
  - 2.5 训练集和开发/测试集不同数据分布时候的偏差和方差
  - 2.6 数据不匹配问题
    - 人工数据合成：
  - 2.7 迁移学习
  - 2.8 多任务学习（并行学习）
  - 2.9 什么是端到端的深度学习
  - 2.10 是否要使用端到端的深度学习

第二周机器学习（ML）策略（2）

2.1 进行误差分析

一个猫咪分类器，总是将一些狗识别成猫。为此，你想实现一个狗狗分类器，将狗狗识别出来，这可能会花费几个月的时间，真的必须这样做才能解决问题吗？

不是的。

应该先进行误差分析：

拿出100个误分类的开发集数据；
人工检查其中有多少只是狗。

假设有5只狗狗，也就是说，误分类的数据中有5%是狗，那么，即使解决狗的问题，误差也只能下降0.5%（假设原本误差为10%），即下降到9.5%。这样来看，花费几个月时间折腾狗的问题不值得。

误差分析给出的解决狗的问题的性能上限就是下降0.5%。

但如果有50只狗，那么，解决狗的问题，误差下降5%，从10%下降到5%。花费几个月时间去解决该问题是值得的。

误差分析可以找到提升性能的关键所在，从而节省大量时间。

并行评估多个想法：

找一组错误分类的数据（开发集or测试集），统计属于不同错误类型的错误数量，在这个过程中，可能会得到启发，归纳出新的误差类型。
总之，通过统计不同错误标记类型占总数的百分比，可以帮助你发现哪些问题需要优先解决。或者给你构思新的优化方向的灵感。

上图中，误差分析的统计结果显示，错误分类的类型中，模糊图片和其他猫科动物占得比重很大。那么，接下来的优化方向就是great cat 和 blurry images。

2.2 标签错误的数据

理想的数据集应该是标签都是正确的。但人工标准的数据总是有一部分数据是带着错误的标签。

训练集：

深度学习算法对训练集的随机误差有相当强的鲁棒性。只要错误标记的数据离随机误差不太远（即，近似随机误差，错误足够随机：标记者没注意、不小心按错键），就可以不用去考虑。
系统误差（一直将白色狗的图片打上猫的标签）对深度学习算法有很大的影响。需要修正。

开发集、测试集：

误差分析，分析标签错误占到总错误数的比重。
如果标签错误严重影响在开发集上评估算法的能力，那么就花时间去修正错误的标签。
如果没有严重影响到用开发集评估成本偏差的能力，那么就不处理。
- 比如，在上图中，假设开发集的error=10%，那么由错误标签引起的占到0.6%，而由于其他原因（比如great cat占到4.3%）占到很大比重，那么应该把精力放在其他地方。
  当其他误差已经解决掉的时候，比如此时开发集error=2%，那么错误标签在开发集误差中所占的百分比上升到30%，此时，应该集中精力解决标签错误问题。
- 又比如，开发集的作用之一就是比较不同的模型的性能，如果模型A的误差为2.1%，模型B 为1.9%，那么似乎应该选择模型B。但由于开发集存在标签错误，上述误差中的0.6%是标签出错的误差，由于该错误的存在，没办法公正的评估两个模型的好坏，那么应该修正开发集的错误标签。

修正开发集、测试集标签误差的方针和原则：

用同样的手段修正开发集和测试集（因为开发集和测试集必须保持同一分布）；
同时检查算法判断正确和判断错误的样例（标签错误。算法预测结果与标签不符，好判断；算法预测结果与标签相符合，这需要功夫去修正）；——由于检查标签错误且算法预测结果与标签一致的工作量太大，所以通常这部分工作无法进行。只修改算法预测结果与标签不符合的数据。
训练集可以不修正（近似随机误差，算法具有鲁棒性），所以训练集和开发集、测试集的数据分布允许有轻微的不一致。

在构建深度学习算法的过程中，需要很多的人工误差分析。

有时候，必须花几个小时的时间去手工统计一小批数据，虽然无聊，但是有用。

2.3 快速搭建你的第一个系统，并进行迭代

尽快建立第一个系统原型，并快速迭代。

几乎所用的机器学习程序，可能会有几十个不同的方向可以前进，并且每个方向都是相对合理的，可以改善系统。
那么，如何选择一个方向集中精力处理？

快速设置开发集、测试集、指标；
快速建立原型系统；
用偏差方差分析、误差分析来决定下一步优先做什么；

Build your first system quickly, then iterate!

注：本建议不适用于在要做的东西上已经有很多经验的人，以及有大量文献的项目（比如人脸识别，由于可以阅读文献，然后一开始就可以搭建一个比较复杂的系统）。本建议适用于第一次做一个全新领域的机器学习项目的人，这时不应该考虑太多，不应该一开始就搞一个复杂的系统，而应该构建一些快速而“肮脏”的实现，然后一步一步的迭代。

2.4 训练集和开发集、测试集不同分布

算法训练需要大量的数据，要尽量的搜集数据，所以一般情况下训练集和开发集、测试集的数据分布不同。

如何处理训练集和开发集、测试集不同分布的情况？

开发集就是算法要瞄准的目标，必须和现实一致。现实是要识别手机用户拍摄的照片，所以开发集和测试集的数据必须来自于手机app的用户数据。而训练集需要大量数据，除了少部分来自App用户的数据，大量图像都是来着网站爬取。训练集和开发集、测试集数据分布不一致。但是一般不会影响模型性能，反而由于其他来源的数据大大扩充了训练集，对模型的训练带来好处。

2.5 训练集和开发/测试集不同数据分布时候的偏差和方差

训练集和开发集、测试集不同分布，导致分析其偏差和方差的方式可能不一样。

对猫分类器：

训练集和开发集同分布，那么这是方差大的问题。训练集训练的算法无法很好的泛化到开发集（在训练集上过拟合）。
训练集和开发集不同分布，是什么问题？
- 可能在开发集上算法表现也很不错，但是由于图像是模糊图像，而训练集都是高质量图像。所以导致在开发集上误差大。所以很难界定这到底是一个高方差问题，还是说仅仅是开发集包含更难以准确分类的图像。
  也就是说，在训练集和开发集不同分布的时候，无法区分是高方差还是由于不同分布导致的误差不同。

训练集和开发集不同分布时，分析偏差、方差的解决办法：加入训练-开发集

训练-开发集：和训练集同分布，但不参与训练。

注：训练集和训练-开发集同分布；开发集和测试集同分布。

现在假设haman error = 0%
- training error = 1%
  training-dev error = 9%
  dev error = 10%
  显然，存在方差问题。
  即算法无法很好的泛化到来自同一分布，但以前没见过的数据中。
- training error = 1%
  training-dev error = 1.5%
  dev error = 10%
  显然，不存在方差问题。
  但存在数据不匹配问题（data mismatch problem）。
  即算法擅长处理的数据分布和实际要处理的数据分布不一致。
- training error = 10%
  training-dev error = 11%
  dev error = 12%
  存在可避免偏差问题。
- training error = 10%
  training-dev error = 11%
  dev error = 20%
  存在可避免偏差问题、数据不匹配问题。

训练-开发集的作用：

区分是高方差问题和数据不匹配问题；

从上到下依次为：

可避免偏差；
方差；
数据不匹配程度；
（算法）在开发集上过拟合程度。

如果在开发集上过拟合，应该去收集更多的开发集数据。

测试集不能用于算法开发过程，仅用于测试算法性能。否则会引入测试集过拟合问题，测试集应该是真实世界数据的代表，不应该被算法过拟合。

如果出现上图右侧情况，开发集、测试集误差小于训练集、训练-开发集误差，有可能是训练集、训练-开发集数据要比开发集、测试集难识别得多。

对这种情况，需要更普适的分析方法：

现在假设在开发一款后视镜语音助手。
横列：一般语音识别任务（训练集和训练开发集使用数据）、和后视镜有关的语音数据（开发集、测试集数据）；
纵列：人类水平误差、参与训练数据的误差、未参与训练数据的误差。

注：dev/test error 是开发集误差= 6%，同时测试集误差= 6%。一个框内两个数据集的误差。在开发集和测试集之间也存在开发集过拟合程度。

先分析一般语音数据集，这部分数据集的大部分用于训练模型，如图所示，分析完红框内数据集之间的误差差距，发现存在可避免偏差、方差。但开发-测试集误差=10%，开发集误差=6%。不是一般的数据不匹配问题。

这时候，再去后视镜语音数据集的人类水平（发现即使是人类，后视镜语音识别误差也高于一般语音识别误差，说明确实难识别）。

将后视镜语音数据集放入训练集中，喂给同一个算法训练，然后测量该数据子集的误差=6%。也就是说其实已经在后视镜语音识别上算法达到人类水平了。

那么，训练-开发集误差高于开发集、测试集的原因也许就是之前训练的算法已经在后视镜语音识别这一部分做的很不错了。

一般情况下，能用到的就是上图中红色框部分。

2.6 数据不匹配问题

如何处理数据不匹配问题？
没有系解决数据不匹配问题的办法。

解决数据不匹配问题的一些方法：

对数据集做误差分析，了解训练集和开发集的数据分布的差异之处（为了避免对测试集过拟合，误差分析应该只看开发集，不看测试集）。
让训练集的数据分布更像开发/测试集：
- 收集更多类似开发/测试集的真实数据加入训练集；
- 人工数据合成；

人工数据合成：

人工数据合成可能会出现的问题：

现实世界中，后视镜语音数据存在噪声。那么，开发集、测试集数据跟现实世界数据为同一分布。但是收集到的训练集、训练-开发集数据没有噪声。为了让训练集、训练-开发集的数据分布更像开发/测试集，对训练集、训练-开发集进行人工合成数据。
上图中，对10000小时的训练集数据循环加入时长为1小时的汽车噪声。那么神经网络会出现噪声过拟合的问题，虽然人听不出，但是机器可以。这一个小时的噪声仅为整个现实世界噪声数据的一个小小的子集。
那么寻找到10000小时不重复的噪声数据和原始数据合成，可能效果就比1小时循环合成的好。
也就是说，在这个例子中，人工数据合成的挑战在于，人耳无法分辨10000小时噪声和1小时噪声的区别，所以有可能合成的数据是整个真实世界数据的一个小的多的子集。如上图紫色部分所示。

即，人工数据合成，有可能合成的数据仅为整个真实世界数据的一个很小的子集，但人很难凭自身去发现（肉眼、耳朵等），而算法却对这个合成的小子集过拟合。

针对数据不匹配问题，先进行误差分析，了解训练集和开发集的不同；之后，收集类似于开发集的数据，或者人工数据合成，人工数据合成的时候注意合成数据不能仅为真实世界的一个很小的子集。

2.7 迁移学习

迁移学习：从一个任务中学到知识，然后将这些知识用到另一个独立的任务中。

一个猫咪图像分类器，已经训练好后，它具有了图像识别的能力，比如线条检测，阳性物体检测等。
现在要训练一个放射科医学影像检测网络，为了尽快训练出该网络，或者放射科医学影像数据过少，那么可以使用迁移学习（等于是复用猫咪分类器已经学习到的一些能力）。

如果数据量少，可以只替换原网络最后一层（也可以是最后一两层，也可以添加新的层，改变替换层的单元个数），初始化最后一层的权重，其他层权重固定。然后用这些数据训练。

如果数据量多，可以在原网络（即猫咪分类器）的基础上，用放射科医学影像接着训练整个网络的权重。

训练猫咪分类器的过程叫做预训练，训练放射科医学影像数据的过程叫做微调。

迁移学习什么时候有意义？

迁移的来源有很多数据，迁移的目标数据很少。

比如图像识别任务中，有着几百万条数据，所以可以学习到低层次的特征。可以在神经网络的前几层学到如何识别很多有用的特征。

但放射图像识别任务，也许只有100个样本。

那么，就可以把图像识别任务中学到的很多知识迁移到放射图像任务。这样可以提升放射图像识别任务的性能。

2.8 多任务学习（并行学习）

和迁移学习的区别是：迁移学习是串行的，先用任务A训练，再迁移到任务B。而多任务学习是并行的，同时用多个任务训练，同时开始学习多个任务。用单个网络同时处理好多事情。同时希望每个任务都可以帮助到其他任务。
和softmax的区别：softmax是一个多分类器，网络每次的预测值是一个，比如一张图像预测的结果是猫。多任务学习可以同时预测图像中是否存在猫咪，行人等。即一个样本有多个标签。

上图中，多任务学习的图像标签表示，存在车和停车标志，不存在行人和交通信号灯。

代价函数会增加 ∑4j=1 ，即标签的四个分量之和。
一般情况下，损失函数是对数损失函数。

如果图像中标签值缺失，只需要将 ∑4j=1 ，即分量，变成对为0/1 值的项进行求和即可。

在上例中，用一个网络预测四个任务，可以利用到神经网络的一些早期特征。这些早期特征在识别不同的物体时都会用到。这样一来，（在相同数据集的情况下）训练一个网络做四个任务比训练四个完全独立的网络分别做四个任务性能更好。

多任务学习有意义的地方：

多个任务共享低层次特征；
一般来说，每个任务的数据量接近；
网络足够大。

2.9 什么是端到端的深度学习

以前的数据处理系统和学习系统需要多个阶段的处理。
而端到端只用一个神经网络。

需要大量数据才能让端到端系统表现的良好。

在人脸识别作为门禁的任务里边，直接将图片喂给单个网络，网络输出该人的身份。这样做的挑战是这种场景的图像太少了。

将问题一分为二。第一个任务，将图像中的人脸从环境中识别出来，然后裁剪居中。第二个任务将第一个任务处理完的图像拿来学习。这样，两个任务的数据量都很大。同时每个任务都足够简单。

也就是如果端到端算法所需要的数据不足，但是拆分成小的任务数据量足够，就可以拆分，不一定用端对端。

2.10 是否要使用端到端的深度学习

端对端优点：

让数据说话；
- 这样不会引入人类的成见。比如早期的语音识别系统用到了音位这个人类专家发明的概念。尽管用音位描述语言是合理的，但是最好还是不要强迫算法以音位为单位去思考。算法可能会找到更好的表达方法。
所需的手工设计组件更少；
- 这样能简化设计工作流程。

端对端缺点：

需要大量数据；
排除了可能有用的手工设计组件；
- 在数据量小的时候手工设计组件可以将人类知识直接注入到算法。算法通过数据和手工设计组件来获取知识。在数据量大的时候，可以忽略手工设计组件。但是数据量小的时候，将人类知识注入算法是有帮助的。手工设计组件是一把双刃剑，有可能非常有用，也有可能由于人类的局限性而伤害到算法表现。

是否使用端对端学习的关键问题是：

是否有足够的数据去直接学习出一个从x映射到y的足够复杂的函数。

尽管端对端的学习算法是听起来是激动人心的。但是在今天，无论是所能收集到的数据，还是能够用神经网络学习的数据类型，端到端都不是最有希望的办法。

在今天，端对端算法的前景不如复杂的多步方法。因为数据有限，训练神经网络的能力也有局限性。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

吴恩达深度学习课程笔记（三）： 结构化机器学习项目2

吴恩达深度学习课程笔记（三）： 结构化机器学习项目2

第二周 机器学习（ML）策略（2）

2.1 进行误差分析

2.2 标签错误的数据

2.3 快速搭建你的第一个系统，并进行迭代

2.4 训练集和开发集、测试集不同分布

2.5 训练集和开发/测试集不同数据分布时候的偏差和方差

2.6 数据不匹配问题

人工数据合成：

2.7 迁移学习

2.8 多任务学习（并行学习）

2.9 什么是端到端的深度学习

2.10 是否要使用端到端的深度学习

你可能感兴趣的:(机器学习,深度学习)

吴恩达深度学习课程笔记（三）：结构化机器学习项目2

吴恩达深度学习课程笔记（三）：结构化机器学习项目2

第二周机器学习（ML）策略（2）