zrenjie

构建机器学习应用的基本步骤

定义问题

收集标记数据

分析我们的数据

特征处理

将数据分为训练数据和评估数据

训练模型

训练参数

学习率

模型大小

迭代次数

打乱数据（Shuffling）

正则化

评估模型的准确率

二元分类（Binary Classification）

多类分类（Multiclass Classification）

回归（Regression）

提高模型的精度

模型拟合：欠拟合与过拟合

使用模型做预测

批量预测

在线预测

使用新数据重新训练

构建机器学习应用是一个迭代的过程，主要包括以下几个步骤：

根据观察到的数据和你想要模型回答的问题来构建核心的ML问题；
收集、清洗、准备数据，使其适合ML模型的训练；对数据进行可视化和分析、进行完整性检查、验证数据的有效性并理解数据；
通常来讲，原始数据（输入变量）和答案（目标）并不是以一种能够训练高预测性模型的形式展现出来的。因此，通常我们需要利用原始输入构造更具预测性的输入表达（特征）；
用得到的特征训练模型，利用未参与训练的数据评估模型的性能；
使用模型对新的数据进行预测；

定义问题

机器学习的第一个步骤是要决定我们想要预测的是什么，也就是数据的标签或是目标答案。设想这样一个场景：我们生产各种各样的商品，并基于预期销量来决定每种商品要生产多少。在这个场景下，我们想要预测每种商品会被购买多少次，即预测销售量。有多种方法来定义这个问题，具体如何选择依赖于我们的使用场景或商业需求。

我们是想要预测客户对每个产品的采购量呢（此时是一个回归问题）还是想要预测哪些产品的采购量会超过10个呢（此时是一个二元分类问题）？

非常重要的是要避免把问题过度复杂化，并选择能够满足我们需求的最简单的方案。花些时间来决定预测哪个指标最有意义能够让我们免于构建那些无法回答我们问题的模型。

收集标记数据

机器学习问题始于数据，特别是大量的我们知道答案的数据。那些我们已知道答案的数据便是标记数据。在监督学习中，算法能够利用我们提供的标记数据自己学习。

我们的数据中的每个样本都必须包括两个元素：

目标——我们想要预测的答案。我们提供标记有正确答案的数据给机器学习算法去学习，然后便可以利用训练好的模型对我们不知道答案的数据进行预测。
变量/特征——可以用来识别模式、预测答案的样本属性。

举个例子，对于邮件分类问题来说，目标是判断某封邮件是不是垃圾邮件。变量则是诸如发信人、邮件内容、邮件主题、邮件发送时间等信息。

通常来讲，数据并不总是已经标记好了，可以直接拿来用的。在处理机器学习问题时，收集和准备变量和标记常常是最重要的一个步骤。这些样本数据应该能够代表那些我们想要用模型去预测的数据。

在有了标记数据以后，我们可能还需要把它们转换成我们的算法或模型可以接受的形式。比如，可能需要把数据保存在CSV（comma-separated value）文件中。

分析我们的数据

在把标记数据输入给ML算法之前，最好能够对数据进行一些检视，以便发现问题，对数据有一些了解。必须记住的是我们的模型的预测能力完全受限于我们提供给它的数据。

在分析数据时，需要记住以下几点：

变量和目标数据的大致情况——理解变量由哪些值组成以及哪些值占主导地位是很有用的。问自己一些问题：这些数据符合我们的预期吗？是否有某一类的数据比其他类更常见？缺失的值或无效的值是否比预期的多？

变量-目标的相关性——知道每个变量与目标值之间的相关性是很有帮助的，相关性高意味着变量和目标之间存在某种关系。通常，我们想要包含高相关性的变量（因为它们的预测能力较高），而忽略掉那些低相关性的变量（因为它们可能无关紧要）。

特征处理

在大致了解了我们的数据之后，可能还会想要对其做一些变换，使它们更有意义，这便是特征处理。例如，我们有一个变量是某个事件发生时的日期和时间，这个日期和时间以后肯定不会再出现，所以也就对预测目标没什么用处。但是，如果我们把这个值处理成一天里的某个时段，一周或者一个月里的某天，那这些变量就可能用来学习这个事件是否倾向于发生在某个特定的时段、日期或月份。这种特征处理能够形成更通用的数据，可以显著提升预测模型的性能。

常见的特征处理的例子：

用更有意义的值替换缺失值或无效值。一个常用的策略是用均值或中值替换缺失值。在选择替换缺失值的策略前有必要先理解我们的数据。
构造不同变量之间的笛卡尔乘积。比如，我们有两个变量，一个是人口密度（城市、郊区、农村），一个是省份（江苏、山东），这两个变量的笛卡儿乘积就可能形成一些有用的特征（城市_江苏、郊区_江苏、农村_江苏、城市_山东、郊区_山东、农村_山东）。
非线性变换，如把数值型变量变换成不同的类别。在很多情况下，某个数值型的变量与目标之间的关系并非是线性的（特征值并不随着目标值单调增加或降低）。此时，将数值型变量转换成表示不同数值范围的类别特征可能会有效果。例如，我们知道年龄这个连续数值型变量与购买某本书的可能性并不呈现线性关系。我们可以通过把年龄转换到年龄段，或许能够得到更精确的对应关系。至于应该将一个数值变量转换到几个区间段，则是依赖于变量的特性以及其与目标的关系的，最好通过实验来确定。
特定领域的特征。例如我们有长度，宽度，高度作为单独的变量，我们可以把它们的乘积作为一个新的特征。
特定变量的特征。某些变量类型（如文本特征，网页结构特征等）有一些通用的处理方法能帮助提取结构和上下文。

包含更多相关的特征有助于提高预测性能。很显然，事先了解哪些特征是相关的往往是不现实的。所以，最好把所有可能的特征都包括进来，然后让模型训练算法来挑选那些强相关的特征。

将数据分为训练数据和评估数据

ML的基本目标是基于用于训练模型的数据得到泛化到其他数据的能力。由于未来的样本的目标值是未知的，我们现在也就没办法评估我们对未来样本的预测准确性，我们需要用一些我们已知其目标值的数据来代表未来的数据。用训练数据来评估模型是没什么用的，因为这样会奖励那些“记住了”训练数据的模型，而不是那些从训练数据中进行泛化的模型。

一个常见的策略是将所有可用的标记数据分成训练集和测试集，通常训练集占70-80%，测试集占20-30%。ML系统利用训练集来训练模型以发现模式，用测试集评估训练得到的模型的预测能力。通常，我们会用在测试集上表现“最好的”模型对我们不知道目标答案的数据进行预测。

训练模型

现在我们准备好向ML算法提供训练数据了。算法会从训练数据中学习将变量映射成目标值的模式，并输出一个习得了这种关系的模型。

学习算法包括一个损失函数和一种优化技术。损失是当模型给出的目标值的估计与实际目标值不一致时的惩罚。损失函数将这个惩罚量化为一个单独的值。优化技术则致力于将损失最小化。

训练参数

在训练过程中，我们可以通过一些训练参数或者叫超参数来控制模型的训练效果。下面介绍几个常见的超参数。

学习率

学习率是用在随机梯度下降（SGD）算法中的一个常数，其能够影响算法收敛到最优权重的速度。学习率太大可能会导致权重无法收敛到最优解，而太小则会导致得到最优解需要很多次迭代。

模型大小

大模型意味着在训练或预测时需要更多的内存来容纳模型，而模型太小的话则可能会影响模型的预测能力。

迭代次数

迭代次数表示在训练数据上进行多少次训练。训练次数更多会使得数据拟合得更好（学习率不能太大），但是太多也就没效果了。所以，对于小数据集来说，我们可以将迭代次数设的较大，以获得更好的拟合效果。而对于超级大的数据集而言，可能遍历一次就够了。

打乱数据（Shuffling）

因为SGD算法会受到训练数据顺序的影响，所以我们需要把数据打乱。之所以把训练数据打乱能够得到更好的模型是因为它帮助SGD算法避免了那些只是对它见到的第一种类型的数据而言最优，而不是对所有数据类型最优的模型。Shuffling打乱了训练数据的顺序，使得SGD算法不会连续遇到太多同一类型的数据。如果在连续很多次的权重更新过程中只遇到一种类型的数据，算法可能无法在遇到另一种数据类型时纠正模型的权重，因为这个变动可能过大。另外，如果数据不是随机出现的，算法可能很难很快地找到对所有数据类型而言都是最优的解。

举个例子，假设我们需要训练一个模型来预测商品类型，在我们的训练集中有电影、玩具和视频游戏三种类型的商品。如果我们的数据是以商品类型排序的，那么算法将会先看到类型为电影的数据，我们的模型也将会开始学习电影的模式。然后，当我们的模型遇到类型为玩具的数据时，算法所作的每次更新都会使得模型更适合玩具类型，即使这有可能会损害其对电影类型的适配能力。这种从电影到玩具类型的突然切换会使得我们的模型不能够准确地预测产品类型。

正则化

正则化通过惩罚极端的权重值来帮助避免过拟合训练数据样本（即记住了模式，而没能进行泛化）。L1正则通过把那些原本有很小权重的特征值的权重推至0来减少特征的数量。因此，L1正则会导致一个稀疏模型，降低模型的噪声。L2正则会使得整体权重更小，当输入特征具有高相关性时能够稳定权重。

评估模型的准确率

ML模型的目标是学习那些能够在未见过的数据上有很好泛化能力的模式，而不是仅仅记住在训练时遇到的数据。在我们有了一个模型后，非常有必要去检查一下我们的模型是否能够很好的处理它在训练时没有见过的数据。

在ML中有许多度量指标可以用来评估模型的预测准确率。我们需要根据ML任务来选择合适的度量指标。

二元分类（Binary Classification）

基于预测值和实际值，可以将预测结果分成四组：正确的阳性预测（真阳性）、正确的阴性预测（真阴性）、错误的阳性预测（假阳性）和错误的阴性预测（假阴性）。

二元分类任务典型的度量指标包括准确率（ACC）、精确率（Precision）、召回率（Recall）、假阳性率和F1度量。每一个指标都反应了模型的不同方面。准确率（ACC）衡量的是预测正确的比例。精确率衡量的是被预测为阳性的样本中确实是阳性的比例。召回率衡量的是有多少确实是阳性的样本被预测为了阳性。F1度量则是精确率和召回率的调和平均值。不同的业务场景下，我们可能会选择这些度量中的一个特定子集。具体的信息可以看我的另一篇文章：超越准确率（Accuracy）：精确率（Precision）和召回率（Recall）。

多类分类（Multiclass Classification）

与二元分类不同的是，我们不用在做预测时选择一个阈值，预测结果就是得分最高的那个类。

在多类分类中使用的度量是与在二元分类中使用的一样的。这一部分我准备另外写一篇文章专门总结。

回归（Regression）

回归任务典型的度量指标是均方根误差（Root Mean Square Error, RMSE）和平均绝对百分比误差（Mean Absolute Percentage Error, MAPE）。这些指标测量的是预测的数值和实际的目标值（Ground Truth）之间的距离。

$\large RMSE = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(\tilde{y}_{i} - y_{i})^2}$

$\large MAPE = \frac{100\%}{n}\sum_{i=1}^{n}\left | \frac{\tilde{y}_{i} - y_{i}}{y_{i}}\right |$

在实践中通常会对回归问题的残差进行检视。残差是指测试集中的一条数据中目标的实际值和预测值之间的差。残差代表的是模型未能预测出来的那部分目标值。正残差表示模型低估了目标值（即实际值大于预测值），负残差表示模型高估了目标值（即实际值小于预测值）。如果测试集残差的直方图是以钟形分布且中心在0附近，说明这个模型产生的错误是随机的，不会系统性地低估或高估某个特定范围内的目标值。如果残差呈现出的不是中心在0附近的钟形分布，说明模型的预测错误有某种结构。增加更多的变量可能会帮助模型习得当前模型没有学到的模式。

提高模型的精度

得到一个满足我们需求的ML模型通常都会经过多次迭代和实验一些改动。为了提高性能，我们需要迭代以下步骤：

收集数据：增加用于训练的样本数量
特征处理：增加更多的变量和更好的特征处理
调参：考虑改变学习算法使用的超参数

模型拟合：欠拟合与过拟合

理解模型拟合对于理解模型表现不好的根本原因是很重要的，它可以引导我们采取纠正措施。我们可以通过观察模型在训练集和测试集上的预测误差来判断模型是欠拟合还是过拟合。

如果模型在训练集上就表现不好说明模型是欠拟合的，这是因为模型没能学到样本的输入和目标值之间的关系。如果模型在训练集上表现良好，但是在测试集上表现不好，说明模型是过拟合的，这是因为模型记住了它见过的数据但没能泛化到它未见过的数据。

在训练集上的糟糕表现可能是因为模型太小了。此时通过增加模型的弹性可以提高性能。可以尝试以下方式来增加模型的弹性：

增加新的特定领域的特征，更多的特征笛卡尔乘积，变换特征处理的类型；
减少正则化的使用；

如果模型是过拟合的，那么应该降低模型的弹性。可以尝试以下方式来降低模型弹性：

特征选择：考虑使用更少的特征组合，减少数值型变量转换成的类别个数；
加大正则化的使用；

在训练集和测试集上的准确率不高也可能是因为算法没有足够的数据来学习。我们可以通过以下方式提高性能：

增加训练样本的数量；
增加在训练集上的迭代次数；

使用模型做预测

有两种预测方式：

批量预测

当我们想要一次对一组数据进行预测，然后对其中的一部分进行处理时，批量预测就很有用。举个例子，如果我们想要为某个商品的促销活动确定目标客户，我们会用模型得到所有用户的预测分数，然后根据分数进行排序后选取得分最高的前5%用户作为目标客户。

在线预测

在线预测适用于低延时的，需要一条一条样本进行预测的场景。比如迅速地判断某项事务是否可能是欺诈性的事务。

使用新数据重新训练

为了模型能够准确的预测，预测时使用的数据必须和训练时使用的数据具有相似的分布。因为数据分布可能随着时间发生漂移，模型部署并不是一次性的事务，而是一个持续的过程。持续性的监控输入的数据并在发现数据分布与最初训练时的数据分布发生显著变化时使用新的数据重新训练模型是一种很好的做法。如果持续地监控数据分布的变化代价太大，简单一些的策略是定期地训练模型，比如每天，每周或者每月。

算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
C++STL-queue s15335 C++STL c++开发语言
一.基本概念和数据结构里面的队列一样，只支持先进先出，队尾插，队头删。二.基本用法1.queue对象创建1.默认构造函数queueq1;2.拷贝构造函数queueq2(q1);2.queue赋值操作queueq1;queueq2;q2=q1;3.queue入队queueq;q.push(5);//5q.push(4);//54q.push(3);//543q.push(2);//5432q.pus
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
深入解析 “void(0)；” 的用法与作用_void(0)；
关键要点void(0);是JavaScript中的一个表达式，研究表明它通常用于超链接中，防止页面跳转。它通过void运算符计算表达式并返回undefined，常用于创建“死链接”。证据显示，这种用法简单易用，但现代开发更推荐使用事件监听器。基本概念void(0);的作用void(0);是JavaScript的void运算符的一个实例，void运算符会计算一个表达式但不返回任何值，而是始终返回un
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
上位机知识篇---Linux中的文件挂载 Atticus-Orion 上位机操作篇 linux 运维网络文件挂载
文章目录前言1.挂载的基本概念文件系统挂载点设备文件2.挂载的命令挂载文件系统示例卸载文件系统示例3.挂载的常用选项示例4.自动挂载（/etc/fstab文件）示例使用UUID挂载5.挂载网络文件系统（NFS）挂载NFS示例6.挂载ISO文件挂载ISO文件示例7.查看已挂载的文件系统8.挂载的注意事项9.挂载的常见问题挂载失败卸载失败10.总结前言在Linux系统中，文件挂载是指将一个文件系统（如
Python装饰器（decorator）
Python装饰器（decorator）是一种高阶函数，用于在不修改原函数代码的情况下，动态地为函数添加额外的功能。它本质上是一个接受函数作为输入并返回新函数的函数，常用于日志记录、性能测试、权限验证等场景。以下是关于Python装饰器的详细讲解：1.基本概念装饰器是一个函数，它接受一个函数作为参数，并返回一个新的函数。新函数通常会在调用原函数前后执行一些额外的逻辑。装饰器的语法糖是@decora
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
udev 规则文件命名规范奇妙之二进制 #嵌入式/Linux linux 网络运维
文章目录udev规则文件名的含义、规范及数字开头的原因一、udev规则文件的基本概念二、udev规则文件名的规范与含义1.文件名格式规范2.名称各部分的含义3.文件扫描路径三、为何规则文件名通常以数字开头？1.执行顺序的精确控制2.便于分类和管理3.兼容性与标准化四、示例与实践建议1.常见规则文件示例2.自定义规则命名建议五、总结udev规则文件名的含义、规范及数字开头的原因一、udev规则文件的
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
【C#】依赖注入知识点汇总 Mike_Wuzy c#
在C#中实现依赖注入（DependencyInjection,DI）可以帮助你创建更解耦、可维护和易于测试的软件系统。以下是一些关于依赖注入的关键知识点及其示例代码。1.基本概念容器(Container)容器负责管理对象实例以及它们之间的依赖关系。IoC容器（InversionofControlContainer）是实现依赖注入的核心工具，常见的DI框架包括Unity、Autofac、Castle
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
使用ceph-ansible部署分布式存储Ceph-octopus版本降世神童云计算技术专栏分布式 ceph ansible
使用ceph-ansible部署分布式存储Ceph-octopus版本1.Ceph基础概念及部署方式1.1.Ceph基本概念1.2.Ceph部署方式2.系统初始化配置3.Ceph集群部署3.1.Ansible安装与配置3.2.ceph-ansible安装与配置3.2.1.下载ceph-ansible3.2.2.安装ceph-ansible依赖3.2.3.修改ceph配置文件3.3.开始部署ceph
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
JVM初学者指南：Java虚拟机基础知识笔记 lenyan~ 笔记技术 JVM jvm java 笔记
JVM初学者指南：Java虚拟机基础知识全解析摘要：本文记录了Java虚拟机(JVM)的基本概念、架构、内存模型及工作原理的相关笔记-lenyan。一、JVM简介1.1什么是JVM？JVM(JavaVirtualMachine，Java虚拟机)是运行Java字节码的虚拟机。JVM是Java"一次编写，到处运行"这一特性的关键所在。无论什么平台，只要安装了对应的JVM，就能运行Java程序。JVM有
SQL 索引与日志知识点详解及练习题
索引和日志在数据库的高效运行和数据安全中扮演着重要角色。下面我们详细梳理索引和日志的相关知识，并通过练习题加深理解。一、知识点梳理（一）索引基本概念：索引是为了加速查询的数据结构，其数据结构为B+树。B代表Balance（平衡），数据保存在叶子结点中。分类主键索引：唯一标识一行，不允许为空，一张表只能有一个主键。唯一索引：标识一行，允许为空，一张表可以有多个唯一索引。普通索引：允许重复和空值。联合
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
【软件测试】- 软件测试面试题2 阿寻寻大厂软件测试面试题软件测试测试工具
软件测试面试题**1.自我介绍(切记不要把简历上的内容复述一遍，尽可能把自己的优势展现出来)****2.做过哪些项目，介绍一下简历上的项目流程****3.在项目测试中有没有遇到比较严重的bug****4.黑盒测试，白盒测试的基本概念和区别****5.数据库了解吗?说说左连接，右链接，内连接****6.Mysql基本场景的简单语句****7.给你一个登录界面从哪方面入手设计测试用例?****8.熟悉
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
C语言中的宏是什么玩意er?
在C语言中，宏（Macro）是由预处理器处理的文本替换机制，本质上是将一个标识符（宏名）定义为特定的字符串或代码片段。它在编译前展开，不涉及运行时计算。以下是核心要点：⚙️1.基本概念与分类无参宏：定义常量或表达式格式：#define宏名字符串例如：#definePI3.14159，后续所有PI会被替换为3.14159。注意：若字符串是表达式（如#defineSUMa+b），直接替换可能导致运算优
Go从入门到精通（19）-协程（goroutine）与通道（channel）
Go从入门到精通（19）协程（goroutine）与通道（channel）文章目录Go从入门到精通（19）前言并发、并行和协程什么是协程使用GOMAXPROCS基本概念如何设置GOMAXPROCS适用场景性能调优建议示例：对比不同GOMAXPROCS的性能小结协程间的信道概念通信操作符synchronous,unbuffered(阻塞）value>0->asynchronous,buffered（
Java 与 MySQL 性能优化：MySQL连接池参数优化与性能提升程序员岳彬 Java 与 MySQL 性能优化 mysql 数据库性能优化服务器后端 java
文章目录引言一、连接池的基本概念与作用二、关键连接参数详解2.1max_connections2.2wait_timeout2.3interactive_timeout2.4connect_timeout2.5thread_cache_size三、连接池参数不合理导致的性能问题3.1连接耗尽3.2响应变慢3.3连接失效3.4资源浪费四、连接池参数优化方法与策略4.1max_connections的
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
Python 入门手札：从 0 到会--第三天Python的基本数据类型之容器类型 dict ，set，frozenset 趁早折枝 Python 入门手札：从 0 到会 python 哈希算法数据结构
目录一、集合类型-set&&frozenset1.基本概念2.集合的创建3.集合常用操作4.集合之间的操作5.集合的比较6.集合更新操作（只能用于set，frozenset不支持）7.不可变集合：frozenset8.集合运算符与方法的非运算符版本9.集合和字典的关系二、字典（dict）1.映射类型2.字典的键（key）3.字典的创建4.字典的常见操作5.字典视图对象6.常见字典方法7.字典的排序
搜广推校招面经九十一
美团机器学习/数据挖掘算法工程师_二面一、介绍一下ESMM模型，是否有进行过函数推导传统的转化率建模方式：只用发生点击（click=1）的样本来训练CVR模型。CVR定义如下：CVR=P(y=1∣x,z=1)CVR=P(y=1|x,z=1)CVR=P(y=1∣x,z=1)y=1表示用户发生了转化（如购买）z=1表示用户点击了广告这样做的问题：样本选择偏差（SampleSelectionBias,S
【TCP/IP】14. 远程登录协议
14.远程登录协议14.远程登录协议14.1基本概念14.2Telnet命令14.3Telnet选项及协商14.4Telnet子选项协商14.5Telnet操作模式本章要点14.远程登录协议14.1基本概念Telnet协议是TCP/IP协议族的重要成员，核心功能是实现本地计算机对远程主机的终端仿真，使本地用户能像直接操作远程主机一样访问其资源。远程登录的定义本地用户通过TCP/IP协议进入远程主机
python 计算生态概览的概述
文章目录前言python计算生态库的介绍1.网络爬虫2.数据分析3.文本处理4.数据可视化5.机器学习6.图形用户界面7.游戏开发8.网络应用开发前言python计算生态概览的解释Python计算生态概览是对Python作为一门强大而广泛使用的编程语言所拥有的庞大软件集合的整体描述和概述。这个生态体系不仅包含了Python的标准库（stdlib），即随Python解释器安装的基本模块，还涵盖了极其
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地

构建机器学习应用的基本步骤

定义问题

收集标记数据

分析我们的数据

特征处理

将数据分为训练数据和评估数据

训练模型

训练参数

学习率

模型大小

迭代次数

打乱数据（Shuffling）

正则化

评估模型的准确率

二元分类（Binary Classification）

多类分类（Multiclass Classification）

回归（Regression）

提高模型的精度

模型拟合：欠拟合与过拟合

使用模型做预测

批量预测

在线预测

使用新数据重新训练

你可能感兴趣的:(机器学习,机器学习,基本概念)