ZJ_Improve

Coursera | Andrew Ng (03-week2)—机器学习 ML 策略（2）

在吴恩达深度学习视频以及大树先生的博客提炼笔记基础上添加个人理解，原大树先生博客可查看该链接地址大树先生的博客- ZJ

Coursera 课程 |deeplearning.ai |网易云课堂

CSDN：http://blog.csdn.net/JUNJUN_ZHAO/article/details/79492193

2.1 Carrying out error analysis (进行误差分析)

误差分析

当我们在训练一个模型的时候，如一个猫和狗分类模型，最终得到了 90% 的精确度，即有 10% 的错误率。所以我们需要对模型的一些部分做相应调整，才能更好地提升分类的精度。

如果不加分析去做，可能几个月的努力对于提升精度并没有作用。所以一个好的误差分析的流程就相当重要。

收集错误样例：

在开发集（测试集）中，获取大约100个错误标记的例子，并统计其中有多少个是狗。

假设一种情况是 100 个数据中，有 5 个样例是狗，那么如果我们对数据集的错误标记做努力去改进模型的精度，那么可以提升的上限就是 5%，即仅仅可以达到 9.5% 的错误率，这有时称为性能上限。那么这种情况下，可能这样耗时的努力方向就不是很值得的一件事情。
另外一种假设是 100 个数据中，有 50 多个样例是狗，那么这种情况下，我们去改进数据集的错误标记，就是一个比较值得的改进方向，可以将模型的精确度提升至 95%。

并行分析：

修改那些被分类成猫的狗狗图片标签；
修改那些被错误分类的大型猫科动物，如：狮子，豹子等；
提升模糊图片的质量。

为了并行的分析，建立表格来进行。以单个错误分类样本为对象，分析每个样本错误分类的原因。

最后，统计错误类型的百分比，这个分析步骤可以给我们一个粗略的估计，让我们大致确定是否值得去处理每个不同的错误类型。

个人理解：

0.误差分析，找出误差，然后分析它。
1.我希望我的算法可以完成人类能够完成的一些任务。
2.但是算法表现不好，无法达到人类表现。
3.那问题出在哪里了？那我就分析下错误的样例，去看看哪里出了问题，然后对应的进行解决。
4.怎么进行错误分析呢？人工做个电子表格吧，总体来看是省时间的。
5.罗列样本，分类错误原因，备注，等等，逐一样本查看，进行统计归类，最后计算分类占比，看哪些问题占比大？
6.占比小的呢，尽量就不要耗时了，占比大的问题，要想办法解决下，这样才能提高算法性能，怎么解决呢？
7.针对问题，相对应办法解决。

2.2 Cleaning up incorrectly labeled data (清除标注错误的数据)

清除错误标记的样本

下面还是以猫和狗分类问题为例子，来进行分析。如下面的分类中的几个样本：

情况一：

深度学习算法对训练集中的随机误差具有相当的鲁棒性。

只要我们标记出错的例子符合随机误差，如：做标记的人不小心错误，或按错分类键。那么像这种随机误差导致的标记错误，一般来说不管这些误差可能也没有问题。

所以对于这类误差，我们可以不去用大量的时间和精力去做修正，只要数据集足够大，实际误差不会因为这些随机误差有很大的变化。

情况二：

虽然深度学习算法对随机误差具有很好的鲁棒性，但是对于系统误差就不是这样了。

如果做标记的人一直把如例子中的白色的狗标记成猫，那么最终导致我们的分类器就会出现错误了。

dev、test 中错误标记的情况：

如果在开发集和测试集中出现了错误标记的问题，我们可以在误差分析的过程中，增加错误标记这一原因，再对错误的数据进行分析，得出修正这些标记错误的价值。

修正开发、测试集上错误样例：

对开发集和测试集上的数据进行检查，确保他们来自于相同的分布。使得我们以开发集为目标方向，更正确地将算法应用到测试集上。
考虑算法分类错误的样本的同时也去考虑算法分类正确的样本。（通常难度比较大，很少这么做）
训练集和开发/测试集来自不同的分布。

个人理解：

0.清除标注错误的数据
1.错误数据所处数据集？训练集中的如何分析处理？开发测试集的又如何处理？
2.统计分析，视情况而定。严重影响，占比大，可处理，影响不严重，占比小，可以不管。
3.开发测试集，需来自同一分布。

2.3 Build your first system quickly then iterate (快速搭建你的第一个系统，并进行迭代)

搭建系统

设置开发、测试集和优化指标（确定方向）；
快速地建立基本的系统；
使用偏差方差分析、误差分析去确定后面步骤的优先步骤。

总的来说，如果我们想建立自己的深度学习系统，我们就需要做到：快速的建立自己的基本系统，并进行迭代。而不是想的太多，在一开始就建立一个非常复杂，难以入手的系统。

2.4 Training and testing on different distributions (在不同的划分上进行训练并测试)

**不同分布上的训练和测试**

在深度学习的时代，因为需求的数据量非常大，现在很多的团队，使用的训练数据都是和开发集和测试集来自不同的分布。

下面是一些处理训练集和测试集存在差异的最佳的做法。以前一周中的猫的分类问题为例：

我们可以从网上获取大量的高清晰的猫的图片去做分类，如 200000 张，但是只能获取少量利用手机拍摄的不清晰的图片，如 10000 张。但是我们系统的目的是应用到手机上做分类。

也就是说，我们的训练集和开发集、测试集来自于不同的分布。

方法一：

将两组数据合并到一起，总共得到 21万张图片样本。将这些样本随机分配到训练、开发、测试集中。

好处：三个集合中的数据均来自于同一分布；
坏处：我们设立开发集的目的是瞄准目标，而现在我们的目标绝大部分是为了去优化网上获取的高清晰度的照片，而不是我们真正的目标。
这个方法不是一个好的方法。

方法二：

训练集均是来自网上下载的 20 万张高清图片，当然也可以加上 5000 张手机非高清图片；对于开发和测试集都是手机非高清图片。

好处：开发集全部来自手机图片，瞄准目标；
坏处：训练集和开发、测试集来自不同的分布。

从长期来看，这样的分布能够给我们带来更好的系统性能。

个人理解：

0.数据很贵，需要买，对个人开发者而言，经济不允许就 Python 爬虫去爬数据。
1.真正拥有的所需要的目标数据量小，其他不是目标数据量大，导致训练集，开发，测试集不能满足完全的同一分布，那么，优先保证开发和测试集是同一分布。所用数据是真正目标定义的数据，然后少量珍贵的数据放到训练集中。

2.5 Bias and Variance with mismatched data distributions (不匹配数据划分的偏差和方差)

不同分布上的偏差和方差

通过估计学习算法的偏差和方差，可以帮助我们确定接下来应该优先努力的方向。但是当我们的训练集和开发、测试集来自不同的分布时，分析偏差和方差的方式就有一定的不同。

方差和分布原由分析

以猫分类为例，假设以人的分类误差0%作为贝叶斯误差。若我们模型的误差为：

Training error：1%
Dev error：10%

如果我们的训练集和开发、测试集来自相同的分布，那么我们可以说模型存在很大的方差问题。但如果数据来自不同的分布，那么我们就不能下这样的定论了。

那么我们如何去确定是由于分布不匹配的问题导致开发集的误差，还是由于算法中存在的方差问题所致？

设立“训练开发集“

训练开发集，其中的数据和训练数据来自同一分布，但是却不用于训练过程。

如果最终，我们的模型得到的误差分别为：

Training error：1%
Training-dev error：9%
Dev error：10%

那么，由于训练开发集尽管和训练集来自同一分布，但是却有很大的误差，模型无法泛化到同分布的数据，那么说明我们的模型存在方差问题。

但如果我们的模型得到的误差分别为：

Training error：1%
Training-dev error：1.5%
Dev error：10%

那么在这样的情况下，我们可以看到，来自同分布的数据，模型的泛化能力强，而开发集的误差主要是来自于分布不匹配导致的。

分布不同的偏差方差分析

通过：Human level、Training set error、Training-dev set error、Dev error、Test error 之间误差的大小，可以分别得知我们的模型，需要依次在：可避免的偏差、方差、数据分布不匹配、开发集的或拟合程度，这些方面做改进。

通常情况下来说，通过不同的集合上的误差分析，我们得出的结果会是中间一列误差由小变大，即误差上升的情况。但是也有一定的可能会出现右边一列误差在开发测试集上又表现的好的情况。

下面通过一个后视镜语音检测的例子来说明。我们以该例子建立更加一般的表格。

其中，横向分别是：普通语音识别数据、后视镜语音识别数据；纵向分别是：Human level、训练数据误差、未训练数据误差。表格中不同的位置分别代表不同的数据集。

通常情况下，我们分析误差会是一个递增的情况，但是可能对于我们的模型，在后视镜语音识别的数据数据上，已经可以达到人类水平误差的 6%了，所以最终的开发测试集也会是 6%的误差，要比训练误差和训练开发误差都要小。所以如果遇到这种情况，就要利用上表进行分析。

2.6 Addressing data mismatch (定位数据不匹配)

定位解决数据分布不匹配问题

如果通过上一节的误差分析，我们可以得知，模型最终在开发和测试集上的误差最终是由于数据分布不匹配而导致。那么这样的情况下如何解决？

进行人工误差分析，尝试去了解训练集和开发测试集的具体差异在哪里。如：噪音等；
尝试把训练数据变得更像开发集，或者收集更多的类似开发集和测试集的数据，如增加噪音；
获取数据的一种方法是，人工合成数据，它确实有效，但是要谨慎，从所有可能性的空间只选了很小一部分去模拟数据，可能会导致过拟合。

2.7 Transfer learning (迁移学习)

迁移学习

将从一个任务中学到的知识，应用到另一个独立的任务中。

迁移学习的意义：

迁移学习适合以下场合：迁移来源问题有很多数据，但是迁移目标问题却没有那么多的数据。

假设图像识别任务中有1百万个样本，里面的数据相当多；但对与一些特定的图像识别问题，如放射科图像，也许只有一百个样本，所以对于放射学诊断问题的数据很少。所以从图像识别训练中学到的很多知识可以迁移，来帮助我们提升放射科识别任务的性能。

同样一个例子是语音识别，可能在普通的语音识别中，我们有庞大的数据量来训练模型，所以模型从中学到了很多人类声音的特征。但是对于触发字检测任务，可能我们拥有的数据量很少，所以对于这种情况下，学习人类声音特征等知识就显得相当重要。所以迁移学习可以帮助我们建立一个很好的唤醒字检测系统。

迁移学习有意义的情况：

任务 A 和任务 B 有着相同的输入；
任务 A 所拥有的数据要远远大于任务 B（对于更有价值的任务 B，任务 A 所拥有的数据要比 B 大很多）；
任务 A 的低层特征学习对任务 B 有一定的帮助；

2.8 Multi-task learning (多任务学习)

多任务学习

与迁移学习的串行学习方式不同，在多任务学习中，多个任务是并行进行学习的，同时希望各个任务对其他的任务均有一定的帮助。

自动驾驶的例子

假设在自动驾驶的例子中，我们需要检测的物体很多，如行人、汽车、交通灯等等。

对于现在的任务，我们的目标值变成了一个向量的形式向量中的每一个值代表检测到是否有如行人、汽车、交通灯等，一张图片有多个标签。

y^(i)=[1 0 1 0]∣∣∣∣∣∣PedestriansCarsRoad signs−StopTraffic lights y ^ ( i ) = [ 1 0 1 0 ] | P e d e s t r i a n s C a r s R o a d s i g n s − S t o p T r a f f i c l i g h t s

模型的神经网络结构如下图所示：

该问题的Loss function：

loss=1m∑i=1m∑j=14L(y^(i)j,y(i)j)=1m∑i=1m∑j=14(y(i)jlog(y^(i)j)+(1−y(i)j)log(1−y^(i)j))

对于这样的问题，我们就是在做多任务学习，因为我们建立单个神经网络，来解决多个问题。

特定的对于一些问题，例如在我们的例子中，数据集中可能只标注了部分信息，如其中一张只标注了人，汽车和交通灯的标识没有标注。那么对于这样的数据集，我们依旧可以用多任务学习来训练模型。当然要注意这里Loss function求和的时候，只对带0、1标签的 j 进行求和。

多任务学习有意义的情况

如果训练的一组任务可以共用低层特征；
通常，对于每个任务大量的数据具有很大的相似性；（如，在迁移学习中由任务A“100万数据”迁移到任务B“1000数据”；多任务学习中，任务 A1，...，An ，每个任务均有1000个数据，合起来就有1000n个数据，共同帮助任务的训练）
可以训练一个足够大的神经网络并同时做好所有的任务。

2.9 What is end- to-end deep learning (什么是端到端的深度学习)

端到端深度学习

定义：

相对于传统的一些数据处理系统或者学习系统，它们包含了多个阶段的处理过程，而端到端的深度学习则忽略了这些阶段，用单个神经网络来替代。

语音识别例子：

在少数据集的情况下传统的特征提取方式可能会取得好的效果；如果在有足够的大量数据集情况下，端到端的深度学习会发挥巨大的价值。

优缺点：

优点：

端到端学习可以直接让数据“说话”；
所需手工设计的组件更少。

缺点：

需要大量的数据；
排除了可能有用的手工设计组件。

应用端到端学习的 Key question：是否有足够的数据能够直接学习到从 x 映射到 y 的足够复杂的函数。

2.10 Whether to use end-to-end learning (是否要使用端到端的深度学习)

端到端深度学习

定义：

相对于传统的一些数据处理系统或者学习系统，它们包含了多个阶段的处理过程，而端到端的深度学习则忽略了这些阶段，用单个神经网络来替代。

语音识别例子：

在少数据集的情况下传统的特征提取方式可能会取得好的效果；如果在有足够的大量数据集情况下，端到端的深度学习会发挥巨大的价值。

优缺点：

优点：

端到端学习可以直接让数据“说话”；
所需手工设计的组件更少。

缺点：

需要大量的数据；
排除了可能有用的手工设计组件。

应用端到端学习的 Key question：是否有足够的数据能够直接学习到从 x 映射到 y 的足够复杂的函数。

参考文献：

[1]. 大树先生.吴恩达Coursera深度学习课程 DeepLearning.ai 提炼笔记（3-2）– 机器学习策略（2）

PS: 欢迎扫码关注公众号：「SelfImprovementLab」！专注「深度学习」，「机器学习」，「人工智能」。以及「早起」，「阅读」，「运动」，「英语」「其他」不定期建群打卡互助活动。

【Python办公】Python如何批量提取word文档中的表格小庄-Python办公 Python笔记 python word 提取word表格 python读取word文档 word文档 python办公
目录专栏导读环境准备核心库介绍单个Word文档表格提取基础提取方法转换为DataFrame批量处理多个Word文档批量提取并保存到Excel高级功能表格数据清洗按条件筛选表格表格格式检测完整示例：智能批量提取注意事项总结专栏导读欢迎来到Python办公自动化专栏—Python处理办公问题，解放您的双手️‍博客主页：请点击——>一晌小贪欢的博客主页求关注该系列文章专栏：请点击——>Python办公自
ica算法c语言,独立成分分析(ICA)的模拟实验(R语言) weixin_39632212 ica算法c语言
本笔记是ESL14.7节图14.42的模拟过程。第一部分将以ProDenICA法为例试图介绍ICA的整个计算过程；第二部分将比较ProDenICA、FastICA以及KernelICA这种方法，试图重现图14.42。ICA的模拟过程生成数据首先我们得有一组独立(ICA的前提条件)分布的数据$S$(未知)，然后经过矩阵$A_0$混合之后得到实际的观测值$X$，即$$X=SA_0$$也可以写成$$S=
转载：十年驾车经验总结：活着，才是硬道理 weixin_30920853
一个优秀的驾驶员，应该对自己负责、对家人负责、对他人负责，对生命心存敬畏！现实生活中，违章又无处不在，为什么呢？原因一、侥幸心理。平时不系安全带，偶尔酒后驾驶，平时闯闯红灯，晚上出来飚飚车，从来没出过事故，安全意识越来越淡薄，总感觉车技好无所谓，其实，靠侥幸是不可能幸运一辈子的，据统计：驾龄5~6年属于事故高发期。原因二、环境因素。我在都江堰生活过3个月，在那里，闯红灯属于普遍现象，后来我去西宁，
波的时频分析方法——短时傅里叶变换（STFT）变换详解 DuHz 傅立叶分析数学建模信号处理信息与通信算法人工智能概率论
短时傅里叶变换：理论基础、数学原理与信号分析应用1.引言时频分析是现代信号处理的核心技术之一，旨在同时描述信号在时间和频率域的局部特性。传统的傅里叶变换虽然能够完美描述信号的频域特征，但其全局性质使其无法处理非平稳信号的时变特性。短时傅里叶变换通过引入窗函数的概念，在保持傅里叶变换优良性质的同时，实现了时频域的局部化分析，为非平稳信号处理提供了重要的理论工具。STFT自1946年由Gabor提出以
支持向量回归（Support Vector Regression, SVR）详解 DuHz 回归数据挖掘人工智能信号处理算法数学建模机器学习
支持向量回归（SupportVectorRegression,SVR）详解支持向量回归（SupportVectorRegression，简称SVR）是一种基于支持向量机（SVM）的回归分析方法，广泛应用于预测和模式识别领域。SVR通过在高维空间中寻找一个最优超平面，以最大化数据点与超平面的间隔，从而实现对连续型变量的预测。本文将深入探讨SVR的理论基础、数学原理、模型构建、参数选择、训练与优化、应
烧脑长文！近乎完美的DDS正弦波信号音生成器！ BinaryStarXin 嵌入式硬件开发提升之路2 DDS技术 DDS正弦波信号音生成器 DSP处理器硬件工程精益工程基带工程射频工程
在测试和验证分辨率高于16位的高精度快速模数转换器(ADC)的交流性能时，需要用到近乎完美的正弦波生成器，该生成器至少支持0kHz至20kHz音频带宽。通常会使用价格高昂的实验室仪器仪表来执行这些评估和特性表征，例如AudioPrecision提供的音频分析仪AP27xx或APx5xx系列。大多数情况下，24位或更高分辨率的现代高速SAR和宽带ADC都采用单电源和全差分输入，因此要求用于DUT的信
Android8.0一些系统数据库的变更总结留给时光吧
1.SettingsProvider之前的一些系统设置内容如亮度、音量大小等都存储在settings.db这个数据库中，但在8.0上数据库不见了。在8.0上都存在几个xml文件中了，其实从6.0开始就已经开始了这种操作，只不过6.0上并没有删除原始数据库，从7.0开始系统删除了原始数据库。简单看一下源码：android\frameworks\base\packages\SettingsProvid
不完美的家庭会议水煮毛豆
第一天上网课加上我没在家。孩子还算自律，按时上课按时完成作业。就是我发现作业以“完成为目的”写的不好。提出建议似乎还有情绪……请教完奋赢老师我俩开始商量怎么“收拾”她——开个会！（这次由爸爸组织，爷爷奶奶也参加。）时间：2022年1月10日地点：客厅主持人：爸爸记录：妈妈参会成员：爸爸，妈妈，爷爷，奶奶，等等，仓鼠会议主题：总结2021规划2022会议流程：1.感谢家人。2.总结，规划3.一日流程
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用青云交大数据新视界 Java 大视界 java 大数据机器学习情绪分析智能投资多源数据
Java大视界--Java大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用）引言：正文：一、金融情绪数据的立体化采集与治理1.1多模态数据采集架构1.2数据治理与特征工程二、Java机器学习模型的工程化实践2.1情感分析模型的深度优化2.2强化学习驱动的动态投资策略三、顶级机构实战：Java系统的金融炼金术四、技术前沿：Java与金融科技的未来融合4.1量子机器学习集成4.2联邦学习在合
生成式人工智能实战 | 像素卷积神经网络（PixelCNN）盼小辉丶生成式人工智能实战150讲深度学习生成模型 aigc
生成式人工智能实战|像素卷积神经网络0.前言1.PixelCNN工作原理1.1掩码卷积层1.2残差块2.PixelCNN分析3.使用混合分布改进PixelCNN3.1模型构建3.2模型训练0.前言像素卷积神经网络(PixelConvolutionalNeuralNetwork,PixelCNN)是于2016年提出的一种图像生成模型，其根据前面的像素预测下一个像素的概率来逐像素地生成图像，模型可以通
TensorFlow深度学习实战——DCGAN详解与实现盼小辉丶深度学习 tensorflow 生成对抗网络
TensorFlow深度学习实战——DCGAN详解与实现0.前言1.DCGAN架构2.构建DCGAN生成手写数字图像2.1生成器与判别器架构2.2构建DCGAN相关链接0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetwork,DCGAN)是一种基于生成对抗网络(GenerativeAdversarialNetwork,GAN)的深度学
Python爬虫【二十四章】分布式爬虫架构实战：Scrapy-Redis亿级数据抓取方案设计程序员_CLUB Python入门到进阶 python 爬虫分布式
目录一、背景：单机爬虫的五大瓶颈二、Scrapy-Redis架构深度解析1.架构拓扑图2.核心组件对比三、环境搭建与核心配置1.基础环境部署2.Scrapy项目配置四、分布式爬虫核心实现1.改造原生Spider2.布隆过滤器集成五、五大性能优化策略1.动态优先级调整2.智能限速策略3.连接池优化4.数据分片存储5.心跳监控系统六、实战：新闻聚合平台数据抓取1.集群架构2.性能指标七、总结1.核心收
2019.06.19 进阶的小宇宙
今天班长来找我，觉得最近数学和地理作业做的不好，这时候我突然意识到，我对学生的单独关注太少了，我也注意到她的作业并不是很好，但是她给我的感觉就是压力很大，对自己要求很高，所以做不到的时候，可能会着急。我跟她说，放松心态，那么对于数学，现在因为天天综合卷，所以知识很杂乱，那么自己复习的时候应该注意归纳总结。理清楚知识点和题目。
c语言学习15四则运算
四则运算练习需求：进入一个界面选择+-*/printf选择运算法则（如果选择错误，提示重新选择）switchcasedefult显示100以内两个随机数，输入运算结果rand系统显示正确答案，并且判断正确错误要求：封装函数分析：intmain(void){//界面程序-----界面函数//输入和识别程序-----按键识别函数//随机数程序----产生随机数函数//系统计算并且对比答案----对比答
分布式爬虫架构：Scrapy-Redis+Redis集群实现百万级数据采集傻啦嘿哟分布式爬虫架构
目录当单机爬虫遇到百万数据量架构设计核心原理分布式任务调度弹性去重机制Redis集群部署实践集群规模计算高可用配置Scrapy项目改造分布式爬虫编写百万级数据优化策略流量控制机制动态IP代理数据存储优化实战案例分析监控与维护集群健康检查日志分析架构演进方向当单机爬虫遇到百万数据量想象你正在搭建一个电商价格监控系统，需要每天抓取十万条商品数据。使用传统Scrapy框架时，单台服务器每天最多只能处理3
红林主人《红语堂十言集》第五十章红林主人
《红语堂十言集》第五十章1、治国尚且如烹小鲜，治司岂能儿戏。2、一次事故是万次错误的积累。3、江山易改，本性难移，真是这样。4、公司高管，在公司危机时刻，发生事故时，应该是统帅之谋，不是勇士之举。5、曾经的经验，虽不是什么金科玉侓，但确实是将一个投资3千万的企业做到价值五个亿。经验经过实践总结，就汇集为了管理方案。《公司团队建设方案》《公司品牌传播方案》《公司市场管理方案》《公司营销管理方案》《公
【Python】socket 宅男很神经 python 开发语言
第一章：网络通信基石——深入理解OSI与TCP/IP模型在深入探究Pythonsocket模块之前，我们必须首先建立对网络通信底层原理的深刻理解。socket作为操作系统提供的低级网络接口，其行为和功能直接映射着网络协议栈的各个层次。因此，对OSI（开放系统互连）模型和TCP/IP模型的透彻分析，是理解socket操作精髓的先决条件。1.1网络通信的起源与核心概念网络通信的本质是数据在不同物理位置
LeetCode - 剑指 Offer 66. 构建乘积数组翊棽312 LeetCode leetcode 算法职场和发展
原题地址。剑指Offer66.构建乘积数组题目描述解题思路遍历乘法源代码运行结果总结反思题目描述解题思路遍历乘法先将其分为上下两个三角：下三角从上往下：从第二行开始，并且给B[0]赋初值1。累乘结果等于前一个的B[i-1]乘以a数组当前索引的前一个的元素a[i-1]（这是因为相邻两行之间，下一行比上一行的左三角多了一个**a[i-1]**元素）。一个循环下来之后，每个B元素得到了a数组左下角各自的
开学第一天月城风
我叫程樱，一个出生在南方的姑娘，从小爸爸妈妈教育我要努力学习才能出路，所以从小到大我都是别人口中的“别人家的孩子”。我也很享受这种被夸赞的感觉，所以我拼了命去学习，学习一直都是名列前茅，初三时我以全级第一名的成绩进入到市重点高中。我很期待我的高中生活，中考结束后，我和我的闺蜜赵雯彻夜未眠，因为太兴奋了，终于要结束初中生活，再过三年高中，我们就可以去到那个向往的大学。这年的夏天格外的炎热，坐在院子里
深入详解DICOM医学影像定位线相关知识：理解定位线的概念、定位线的作用以及定位线显示和计算原理猿享天开 DICOM医学影像专业知识精讲 DICOM 医学影象 PACS 定位线
DICOM医学影像中的定位线（LocalizationLine）在医学影像学中，DICOM是用于存储和交换医学影像的标准格式。定位线（LocalizationLine）在医学影像的显示和分析中起着重要作用，它帮助医生和医学专业人员在影像中精确地标定重要的解剖结构、区域或特征，辅助进行定位、治疗计划和诊断分析。目录DICOM医学影像中的定位线（LocalizationLine）引言1.定位线的概念2
【机器学习【9】】评估算法：数据集划分与算法泛化能力评估 roman_日积跬步-终至千里 #机器学习机器学习
文章目录一、数据集划分：训练集与评估集二、K折交叉验证：提升评估可靠性1.基本原理1.1.K折交叉验证基本原理1.2.逻辑回归算法与L22.基于K折交叉验证L2算法三、弃一交叉验证（Leave-One-Out）1、基本原理2、代码实现四、ShuffleSplit交叉验证1、基本原理2、为什么能降低方差3、代码测试五、选择建议在机器学习中，评估算法的核心目标是衡量模型在“未知数据”上的表现，而不是仅
我总结的制作酵素快步骤婷依1988
我总结的制作酵素快步骤：首先将水果喷上果蔬宝，接下来1、桶；2、倒入水6L；3、将大滤芯放入桶内；4、直接将白砂糖倒入水中（不要搅拌，给糖自然融化也很快的，有了加热垫会更快，不一定需要先化糖）；5、洗净水果，处理切片（切越小或者越薄越好）；6、倒入桶中并搅拌（搅拌时用手按住大滤芯，不要让滤芯随着搅动而转动摩擦到桶壁和桶底）勺子搅动时也尽量不要碰到桶壁和桶底，因为桶壁和桶底有一层还原酶，负责杀菌的；
三轴云台之控制算法协同技术篇 SKYDROID云卓小助手人工智能算法机器学习网络自动化
三轴云台的控制算法协同技术是确保云台在复杂动态环境下实现高精度、高稳定性运动控制的核心，其技术体系涵盖多传感器融合、多算法协同以及多目标优化三个关键维度。以下从技术架构与实现路径展开分析：一、多传感器融合：构建环境感知基础三轴云台通过集成IMU（惯性测量单元）、编码器、视觉传感器等多源数据，构建高鲁棒性的环境感知系统。IMU与编码器融合IMU提供高频率的姿态角速度数据，编码器提供低延迟的关节位置反
叙事疗法的问话～ showtomato的精彩人生
《叙事治疗的精神与实践》第六章6-1、6-2读后感本章主要围绕叙事治疗的方法与介入技术进行阐述，主要内容涵盖了6类问话，它们分别是：1）反思性问话2）开启空间的问话3）解构式的问话4）意义性的问话5）较喜欢的选择的问话6）发展故事的问话本章阅读起来不仅易于理解，而且让人很感兴趣~其中第6-1节是有关反思性问话的内容，第6-2节是有关开启空间的问话。下面我结合我最近的咨询案例对文章内容进行理解和分析
每日一读|阿兰·德波顿：想象旅行沉鱼_58ae
对旅行的期望和旅行的现实总会出现矛盾。我碰巧读到于斯曼的小说《逆流》。小说发表于1884年，主人公德埃桑迪斯公爵是一个衰朽厌世的贵族，正筹划一趟伦敦之旅。他百般思索，分析了对一个地方的想象和实际情形之间令人极度沮丧的差异。在于斯曼的小说中，德埃桑迪斯独自住在巴黎市郊的一处宽敞别墅。他几乎足不出户，因为这样，可以避免看见他心中的人之丑陋和愚蠢。但有一天清早，德埃桑迪斯突然有一种强烈的意愿，想去伦敦旅
2018-6-12 Day9 预算日伍羽卿桁
【百日生涯营DAY9】制定下周的预算；然后制定下个月的预算吧。预算这件事，就跟你制定愿景一样，既要期待又要以现实为基础。通过不断试错和总结复盘，以后你的预算能力也会越来越强的！1.6月16日为来贵阳租房:1700×6（半年）＋1700（押金）＋1700（中介费）＝136002.家具:100003.搬家:50004.三餐:20005.昆明结算工资:500018-卿心-贵阳-2组
多表代替密码与维吉尼亚密码：古典密码学的“动态魔法” 算法第二深情密码学密码学
一、多表代替密码：从“固定规则”到“动态变化”的密码革命1.定义与核心思想多表代替密码（PolyalphabeticSubstitutionCipher）是古典密码学的巅峰之作，其核心思想是“用多个替换表轮换加密”，彻底打破单表代替密码（如凯撒密码）的频率分析漏洞。单表代替密码的弱点：单表密码（如凯撒密码）的替换规则固定，导致明文字母的频率特征在密文中保留（例如英语中E最常见）。攻击者只需统计字母
炒股思维和纪律决定成败，同时知道做超短线看什么选股指标，月盈利30%以上。股海救星
炒股思维和纪律决定成败，同时知道做超短线看什么选股指标，月盈利30%以上。（请加老师微信：hxw128126进入到“股票强化训练营”一起学习，领取涨幅大于40%的选股指标和战法）做交易的，尤其是做交易的，几乎每个人都会了解一些技术分析。趋势线、支撑压力、各种价格形态、超买超卖、背离、百分比回撤，等等，这些技术手段几乎每个人都了解它的主要内容和使用方法。可是，为什么很多人总是用不好技术分析的这些工具
19、大规模 MIMO系统中的混合预编码与自动重传请求性能分析 wood5 大规模MIMO 混合预编码自动重传请求(ARQ)
大规模MIMO系统中的混合预编码与自动重传请求性能分析1引言现代无线通信系统中，大规模多输入多输出（MIMO）技术通过增加天线数量显著提升了频谱效率和链路可靠性。然而，由于硬件复杂性和功耗的限制，传统的全数字实现方式在大规模天线阵列中变得不切实际。混合射频-基带预编码/合并架构通过引入射频模拟预编码阶段，有效降低了硬件复杂性，并在频谱效率和可靠性方面表现出色。本篇文章将探讨在大规模MIMO系统中，
高情商沟通案例分析2 Vimfi
题目：反思一次话题终结者的经历，可以是你的，也可以是其他人的。他们都有什么共同特点？你认为该如何避免？话题终结者的案例：有一次办公室同事聚餐，饭桌上大家讨论起来了购物。然后就有同事说，现在基本上都是在手机上购物了。于是我接着说是啊，我也很少逛街了，现在是电商时代呀，京东、淘宝啊太便利了。现在社会发展太快了，我们都快跟不上社会步伐了。然后一个同事说，现在手机上还兴起了很多微商，经常会被刷屏，还有什么
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =

Coursera | Andrew Ng (03-week2)—机器学习 ML 策略（2）

2.1 Carrying out error analysis (进行误差分析)

个人理解：

2.2 Cleaning up incorrectly labeled data (清除标注错误的数据)

个人理解：

2.3 Build your first system quickly then iterate (快速搭建你的第一个系统，并进行迭代)

2.4 Training and testing on different distributions (在不同的划分上进行训练并测试)

2.5 Bias and Variance with mismatched data distributions (不匹配数据划分的偏差和方差)

2.6 Addressing data mismatch (定位数据不匹配)

2.7 Transfer learning (迁移学习)

2.8 Multi-task learning (多任务学习)

2.9 What is end- to-end deep learning (什么是端到端的深度学习)

2.10 Whether to use end-to-end learning (是否要使用端到端的深度学习)

你可能感兴趣的:(深度学习,吴恩达-,Notes重点总结,误差分析,偏差,方差,迁移学习,多任务学习)