fioccy

《Hands-On Machine Learning》学习笔记-1.4 机器学习面临的挑战

机器学习概述

机器学习的主要挑战

简单来说，机器学习的主要任务就是挑选一个算法，并在数据集上训练它。因此，就有两个方面主要的问题：坏数据和坏算法。

训练数据数量不够

要教一个幼儿学习什么是苹果，你只需要指着一个苹果说“这是苹果”，多重复几次，小孩子就能认出各种各样苹果了，但是机器学习不是这样的，大多数机器学习算法要想正常工作，都需要大量的数据。即使对于非常简单的问题，往往也需要上千组数据，对于一些复杂的问题，比如图像或语音识别，可能需要上百万组数。

The Unreasonable Effectiveness of Data(不知道咋翻译)

在2001年的一篇著名的文章中，微软的两位研究人员指出，如果有足够多的数据，不同的机器学习算法，包括很简单的算法，在自然语言消歧问题上都能有较好的表现。

正如作者所说“这个结果提示我们要重新思考该把钱和时间花在算法的研发还是语料库（数据集）的开发上”

对于复杂问题，数据比算法更重要这一想法最早是由Peter Norvig 于2009年在一篇名为 The Unreasonable Effectiveness of Data 的文章中提出的。但是需要注意的是，小型和中型的数据集仍然非常普遍，获取大量数据仍然不是一件非常便宜或者简单的事情，因此，不要抛弃算法

训练数据不具有代表性

要想算法泛化的好，就要求训练数据能够代表想要泛化的新实例，无论你采用基于实例的算法还是基于模型的算法。

比如，我们之前所使用的用来训练线性模型的国家数据集就不具有很好的代表性，一些国家的数据是缺失的。将缺失国家的数据添加进去之后，数据的表现如图1.21所示

图1-21 更具代表性的训练样本

如果使用现在的数据集训练线性模型，将会得到实线所表示的模型，而原来的模型是虚线所表示的。可见，将缺失的数据加上不仅改变了模型的参数，更重要的是这说明原来的模型可能无法做出正确的预测。

使用对于要归纳的情形具有代表性的数据十分重要，但是说起来容易做起来难，如果样例集过小，可能会有样本噪声，即使样本量足够，如果采样方法不当，同样可能存在样本不具有代表性的问题，这被称为“抽样偏差”。

低质量数据

显而易见，如果训练集中的数据满是错误、异常和噪声，那么想要发现数据中隐含的模型是很困难的，因此系统往往也不可能很好的工作。因此，清洗数据往往是一件很有意义的工作，真相就是，大部分的数据科学家都在这件事情上花费了很大的时间和精力。例如：

如果一些实例明显是异常，那么剔除它或者人工修改数据异常都是很有用的
如果一些实例中缺少一些特征，那就要决定是忽略这些缺失的属性、忽略这个样本、将缺失的数据补齐还是训练两个模型，一个包含这些特征，另一个不包含，如此种种。

不相关的特征

训练数据只有包含了足够多的的相关特征，而不是不相关特征，系统才能不断的“学习”。机器学习项目成功的关键就是要在足够好的特征上进行训练。这个过程被称为特征工程，包括：

特征选择：在多种特征中荀泽最有用的特征进行训练
特征抽取：将已存在的特征组合成一个更有用的特征
通过收集新数据来创造新的特征

接下来介绍“坏算法”的例子。

过拟合训练数据

假设你在一个完全陌生的国家乘坐出租车，司机抢劫了你，你就会觉得这个国家的所有的司机都是贼。以偏概全是人类通常会犯的错误，不幸的是，如果我们不足够小心，机器学习也会陷入同样的陷阱，这被称作“过拟合”，通常是指模型在训练集上表现的很好，但是泛化效果却欠佳。

图1-22就是高阶多项式拟合的幸福指数模型，由图可见，虽然它在训练集上拟合的很好，但是你真的相信这个模型的预测么？
图1-22 过拟合训练数据

复杂模型，如深度神经网络等，可以检测到数据中的微妙的模型，但是如果数据中噪声较多，或者数据集过小，模型就很可能检测到噪声中的模型，显然这样的模型不可能泛化的很好。比如在上边的生活幸福指数的例子中，如果在模型中假设幸福指数与国家的名字有关，那么复杂模型就可能会发现名字中含有w的国家的幸福指数都超过7，那这个模型对卢旺达和津巴布韦怎么解释？显然，“名字中含有w的国家的媳妇指数都超过7”这件事情在纯属偶然，但是模型却无法判断哪些特征是真的，哪些是噪声。

警告：当模型相对训练数据的数量和噪声而言过于复杂时，就会发生过拟合。通常的解决途径是：

简化模型，选择一个特征少一点的模型

收集更多的训练数据

减少训练数据中的噪声

简化模型，降低过拟合的风险称为”正则化“。例如，我们之前定义的线性模型有两个参数， $\theta_1$ 和 $\theta_2$ ，这就是说算法有2个自由度去调整参数以适应训练数据：它既能调整 $\theta_1$ ，也能调整 $\theta_2$ 。如果我们设定 $\theta_1=0$ ，算法就只有1个自由度，也就是只能调整 $\theta_2$ ，这样的话算法想要适应训练数据就很难，因为它只能上下移动直线，最终也就只能停留在平均值附近。如果我们允许算法调整 $\theta_1$ ，但是将其限制在一定范围内，那么算法就获得了1到2之间的自由度。这样的话，算法比2自由度的算法要简单，比1自由度的算法要复杂。我们需要在拟合训练数据和保持模型的简单以使其更好的泛化之间谋求一种平衡。

图1-23展示了3个模型：点虚线代表原始模型，即使用缺失了一部分国家数据的训练集训练的模型，线段虚线代表了使用全部国家数据训练得到的模型，实线所代表的模型使用与第一个模型相同的数据，但是进行了正则化限制。可以看到正则化后的模型斜率更小，对训练数据的拟合也不是最好，但是对于新数据的泛化却是不错的。

图1-23 正则化减小过拟合的风险

正则化的数量通过一个超参来控制。超参是机器学习算法的一个参数，不受算法本身影响，必须在训练之前设定而且在训练过程中不能变。微调超参是构建机器学习系统的重要部分。

欠拟合

如果模型过于简单，无法体现数据背后的结构关系，就会出现欠拟合的情况。解决欠拟合的主要方法有：

选择一个参数更多的，更有效的模型
为算法提供更好的特征
减小对模型的限制（比如降低正则化超参）

回顾

回顾一下已经介绍的概念：

机器学习是一种通过从数据中学习的方法使得机器在处理某些特定任务的时候表现的更好，区别与传统的硬编码的方式。
机器学习系统有许多种：有监督/无监督、批量/在线、基于模型的和/基于实例的等等
在机器学习项目中，首先要从训练集中获取数据，然后将其提供给学习算法。如果算法是基于模型的，它通过调整参数的方式使得模型与训练数据拟合，并寄希望于能够预测新的情况。如果算法是基于实例的，则它会记住所有的样例，并通过简单的方式去泛化至新的实例。
如果训练数据过小，或者数据不具有代表性，有噪声或者被一些不相关的特征污染了，那么机器学习系统就会表现的不好。最后，模型既不能太简单（欠拟合），也不能太复杂（过拟合）

如果你已经训练完一个模型了，那么你不可能仅仅“祈祷”它表现的好，而是需要去评估它，必要的时候对其参数进行调整。

测试和验证

验证一个模型是否好用的唯一方式就是将其投入到实际的使用场景中使用真实的数据去测试它。

往往会将数据分为训练集和测试集。顾名思义，在训练集上训练模型，在测试集上测试模型。在新数据上的错误率被称为泛化误差。通过在测试集上运行模型来对泛化误差进行估计。该值能够告诉模型在它从来没见过的数据上的表现如何。

如果训练错误很小，但是泛化错误很好，就说明过拟合了。

通常使用80%的数据作为训练集，20%的数据作为测试集

如果不知道在两个模型（比如线性模型和多项式模型）之间如何取舍，通常会训练完这两个模型之后在测试集上进行验证。那假设线性模型泛化的更好，但是你希望通过正则化来避免过拟合，那么如何选择正则化超参呢？通常的做法是选择100个超参，然后使用这些超参分别训练100个模型。假设找到了一个最好的超参，训练误差为5%，但是其泛化误差却达到15%，那么问题出在哪？

问题就在于在同一测试集上对泛化误差进行了多次度量，通过调整模型和超参使其在**“此测试集”**上表现的最好，那么这也就意味着该模型和参数对于新数据的泛化结果很有可能会不好。

这个问题就跟过拟合相似了。就是在同一测试集上进行多次验证，最终的结果就是选择的模型和参数肯定是对这个固定的测试集表现的很好。

通常的解决方案是验证集***。在训练集上使用不同的超参训练不同的模型，然后选择在验证集上表现最好的超参，最后在测试集上仅进行一次*测试并得到泛化误差。

为了避免验证集浪费训练数据，通常的做法是使用“交叉验证”：训练集的数据被分为互补子集，每个模型都在不同的子集上训练，在剩下的子集上进行验证。一旦选定了一个模型和超参，最终的模型将会使用该超参在整个训练集上进行训练，并使用测试集来对泛化误差进行度量。

模型就是对观察的简化，简化就意味着需要忽略一些看起来似乎对泛化无用的细节。但是忽略哪些，保留哪些？此时你就需要先做出一个假定。比如使用线性模型其实就意味着你首先假定数据就是遵循线性规则的，实例和线之间的距离就是可以被忽略的噪声

如果不做假定，就没法说这个模型比那个好。对一些数据集，最好的模型是线性模型，而对于另外一些数据集，可能神经网络更好一些。要想知道哪个模型更好，只有一个个的去验证。但是，这往往又是不可能的。实际上，人们往往会先对数据做一些预设，然后仅对一部分模型进行验证。例如，对于一些简单的任务，可能只需要验证不同正则化水平的线性模型，但是对于复杂的任务，可能需要验证不同的神经网络

练习

本章介绍了机器学习的一些重要的概念。下一章将会探索更深入的细节并开始编写代码。在那之前，我们需要先复习一下：

如何定义机器学习
- 机器学习就是
指出4个机器学习适用的问题
什么是有标签的训练集
- 训练数据都带有真实值
最常见的2种有监督任务是什么
- 分类和回归
说出4种常见的无监督学习
- 聚类，数据可视化，数据降维
如果让机器人在不同的位置的地形下行走，你会选择什么机器学习算法？
- 强化学习
把顾客分成不同的组，应该选用什么算法？
- 聚类？
垃圾邮件分类器是有监督学习问题还是无监督学习问题？
- 有监督学习
什么是在线学习？
- 部署上线后，算法能够根据新数据不断更新，进步
什么是“out-of-core”学习？
- 当数据量太大而无法一次加载至机器内存时，将数据分成一个个的子集，利用在线学习的方式进行训练
什么样的机器学习算法依靠比较相似性来进行预测/
- 基于实例的机器学习（instance-based）
模型参数和超参的区别
- 模型参数在训练的过程中改变，而超参在训练的过程中保持不变
基于模型的算法寻找的是什么？通常的步骤是？如何做预测？
- search for underlying patterns of the data
- 步骤：
  - study the data
- 如何做预测：将new instance带入模型
机器学习面临的主要挑战？
- 数据不具有代表性
- 数据噪声大
- 过拟合
- 欠拟合
如果模型在训练集上表现出色，但是却在泛化新实例的时候表现糟糕，为什么？能说出三种可能的解决方法么
- 数据过拟合了
- 方法：
  - 选一个简单一点的模型
  - 将多个特征融合为一个特征
测试集是什么？怎么用？
- 测试集是用来验证模型在未知数据上的表现的
- 模型训练完了之后，使用测试集计算模型的预测偏差
验证集的目的是啥?
- 验证不同的超参和模型
使用测试集微调超参会怎样？
- 这样选出来的超参在测试集上表现很好，但是往往泛化至新实例却表现不好。
什么是交叉验证？为啥要用交叉验证？
- 交叉验证就是将训练集分成数个互补子集，在不同的子集上训练模型和超参，使用剩下的子集验证超参。
- 使用交叉验证能够避免训练数据的浪费，能够避免在测试集上验证超参时，导致的模型对测试集的过拟合

ACI EP Learning Whitepaper 1. ACI EP组件 m0_54931486 思科 ACI 网络思科 ACI Endpoint ACI fabric Nexus EP 学习
1.ACIEndpointACI网络架构的Endpoint表整合了传统MAC地址表和ARP表的功能。其核心机制是通过硬件层直接学习数据包的源MAC地址与IP地址映射关系，摒弃了传统ARP协议依赖广播请求获取下一跳MAC地址的模式。这种设计优化体现在两方面：1）减少控制面ARP流量处理带来的资源消耗；2）基于终端实际流量即可实时感知主机IP/MAC地址的拓扑迁移，无需依赖GARP通告即可实现终端移动
机器学习课堂4线性回归模型+特征缩放木尘152132 机器学习线性回归 python
一、实验2-2，线性回归模型，计算模型在训练数据集和测试数据集上的均方根误差代码：#2-2线性回归模型importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#参数设置iterations=3000#迭代次数learning_rate=0.0001#学习率m_train=3000#训练样本的数量flag_plot_lines=False
Virtual Machine Platform is not enabled. Enable it using the following PowerShell script (in an admi 朋也透william docker
DockerDesktop安装指南以及Windows下WSL2和Hyper-V相关问题追查-寂寞姜大虎-博客园(cnblogs.com)https://www.cnblogs.com/qfl-blog/p/18200575
部分标签数据集生成与过滤特定标签方法阳光明媚大男孩机器学习人工智能
完整代码总结这段代码的目的是通过构建一个部分标签学习（PartialLabelLearning,PLL）框架来生成一个包含部分标签的数据集，并且支持根据给定的标签列表对数据集进行筛选和过滤。代码包含了多个类和函数，主要分为以下几部分：数据预处理与加载：使用PyTorch和torchvision来加载CIFAR-10数据集，并对其进行标准化处理。部分标签数据集的生成：为每个样本生成多个候选标签，并模
使用spring data MongoDB对MongoDB进行简单CURD操作示例其实我就是个萌新 spring mongodb java
本文章为作者个人学习笔记，仅作参考。1.application.properties配置spring.data.mongodb.database=[数据库名]spring.data.mongodb.host=localhost[主机名,本机：localhost]spring.data.mongodb.port=[数据库端口，默认:27017]2.根据数据库文档定义实体类：@RequiredArgs
推测未来Agentic形态：Dynamic Cognitive Contextual Agent with Reinforcement Learning (DCCA-RL) weixin_40941102 语言模型
在AIAgent设计模式领域，我们见证了从简单的ReAct到复杂的LATS的演进，这些模式通过反思、工具使用、规划和多代理协作，极大地提升了AI的自主性和智能性。然而，随着任务复杂度和动态性需求的增加，现有模式逐渐显现出局限性——多Agent协作带来的联合误差和单Agent设计的适应性不足。为此，我们基于对现有模式的全面分析，提出了一个更先进的单Agent框架：DynamicCognitiveCo
JDK8 Stream 数据流效率分析，Java开发你需要了解的那些事气质大叔程序员后端面试 java
此外还有一系列特化流，如IntStream，LongStream，DoubleStream等），Java8引入的的Stream主要用于取代部分Collection的操作，每个流代表一个值序列，流提供一系列常用的聚集操作，可以便捷的在它上面进行各种运算。集合类库也提供了便捷的方式使我们可以以操作流的方式使用集合、数组以及其它数据结构；作为阅读福利，小编也整理了一些Java学习笔记（包含面试真题+脑图
PyTorch 深度学习实战（19）：离线强化学习与 Conservative Q-Learning (CQL) 算法进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们探讨了分布式强化学习与IMPALA算法，展示了如何通过并行化训练提升强化学习的效率。本文将聚焦离线强化学习（OfflineRL）这一新兴方向，并实现ConservativeQ-Learning(CQL)算法，利用Minari提供的静态数据集训练安全的强化学习策略。一、离线强化学习与CQL原理1.离线强化学习的特点无需环境交互：直接从预收集的静态数据集学习数据效率高：复用历史经验
一切皆是映射：DQN训练加速技术：分布式训练与GPU并行 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度强化学习的兴起近年来，深度强化学习（DeepReinforcementLearning，DRL）在游戏、机器人控制、自然语言处理等领域取得了令人瞩目的成就。作为一种结合深度学习和强化学习的强大技术，DRL能够使智能体在与环境交互的过程中学习最优策略，从而实现自主决策和控制。1.2DQN算法及其局限性深度Q网络（DeepQ-Network，DQN）是DRL的一种经典算法，它利用
numpy学习笔记3：三维数组 np.ones((2, 3, 4)) 的详细解释宁宁可可 #机器学习 #Python基础与进阶 numpy 学习笔记
numpy学习笔记3：三维数组np.ones((2,3,4))的详细解释以下是关于三维数组np.ones((2,3,4))的详细解释：1.三维数组的形状形状(2,3,4)表示：最外层维度：2个“层”（或“块”）；中间维度：每个层有3行；最内层维度：每行有4个元素。可以类比为：2本书（外层），每本书有3页（中间层），每页有4行文字（内层）。2.创建全1三维数组代码示例：importnumpyasnp
Ts学习笔记初学者7. 学习笔记 typescript
一、Ts与Js区别TsJsJavaScript的超集，用于解决大型项目的代码复杂性一种脚本语言，用于创建动态网页。强类型，支持静态和动态类型动态弱类型语言可以在编译期间发现并纠正错误只能在运行时发现错误不允许改变变量的数据类型变量可以被赋予不同类型的值二、Ts基础类型：boolean,number,string,undefined,null,any,unknown,void，neverany,un
numpy学习笔记2：ones = np.ones((2, 4)) 的详解宁宁可可 #机器学习 #Python基础与进阶 numpy python 开发语言
numpy学习笔记2：ones=np.ones((2,4))的详解np.ones()是NumPy中用于创建全1数组的核心函数，其用法和参数与np.zeros()类似，但生成的数组元素值全部为1。以下是详细解释：1、语法numpy.ones(shape,dtype=float,order='C')作用：生成一个指定形状和数据类型的全1数组。参数：shape：数组的形状，以元组形式传递（如(2,4)表
Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
书籍-《动手学深度学习（英文版）》
书籍：DiveintoDeepLearning作者：AstonZhang，ZacharyC.Lipton，MuLi，AlexanderJ.Smola出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《动手学深度学习（英文版）》01书籍介绍深度学习已经彻底改变了模式识别，为计算机视觉、自然语言处理和自动语音识别等领域提供了强大的工具。应用深度学
根据论文复现大模型方法以及出错处理技巧 Ai玩家hly 从0倒1 论文复现大模型复现 Ai大模型复现
复现一篇论文中的大模型搭建涉及以下几个关键步骤：理解论文的模型架构、数据集处理、超参数设置以及实验环境的搭建。这里给出一个基本的实现方法示例，假设我们选择复现一个图像分类任务中的经典模型，例如ResNet。实现步骤示例1.理解论文和模型架构选择一篇关于ResNet的论文作为示例，例如《DeepResidualLearningforImageRecognition》（Heetal.,2015）。2.
numpy学习笔记10：arr *= 2向量化操作性能优化宁宁可可 #机器学习 #Python基础与进阶 numpy 学习笔记
numpy学习笔记10：arr*=2向量化操作性能优化在NumPy中，直接对整个数组进行向量化操作（如arr*=2）的效率远高于显式循环（如foriinrange(len(arr)):arr[i]*=2）。以下是详细的解释：1.性能差异的原理(1)底层实现不同显式循环（错误示范）：Python的for循环是解释执行的，每次迭代需要动态解析变量类型、执行函数调用等操作。对每个元素的操作会触发多次Py
集成学习（Ensemble Learning）基础知识1 代码骑士 #机器学习集成学习机器学习人工智能
文章目录一、集成学习1、基本概念2、回顾:误差的偏差-方差分解3、为什么集成学习有效？4、基学习器：“好而不同”5、集成学习的两个基本问题（1）如何训练出具有差异性的多个基学习器？（2）如何将多个基学习器的预测结果集成为最终的强学习器预测结果？二、自助法（Bagging）1、Bagging2、BootstrapBootstrap采样的数学性质3、Bagging:集成学习的两个基本问题（1）如何训练
Python个人学习笔记（17）：模块（sys、pickle&json） NEET_LH 樵夫老师Python零基础课程个人学习笔记 python 学习笔记
五、sys模块sys.exit()：退出while1:print(123)sys.exit(0)#程序退出，0是正常退出，1是非正常退出，记录在日志中sys.version：得到当前解释器的运行环境sys.platform：运行平台，win32=windows代码：print(sys.version)print(sys.platform)结果：3.13.0(tags/v3.13.0:60403a5
python学习笔记之异常（内置标准异常总结） Molly_DD Python学习笔记 python 软件测试
python异常处理机制异常处理是python的一种高级工具，当异常发生时，程序会停止当前的所有工作，跳转到异常处理部分去执行。异常既可以是程序错误引发的，也可以由代码主动触发。异常处理基本结构try:可能引发异常的代码except异常类型名称：异常处理代码else：没有发生异常时执行的代码异常报错：try：classtest:defgetdata(self):returnself.datay=t
Chainlink 预言机的原理解析 Chainlink资讯预言机 Chainlink 智能合约
本文来自于8月19日Chainlink开发者社区中国负责人Frank，在DAppLearning分享会上对于Chainlink预言机的原理的讲解，以下是这节分享会的总结内容。有兴趣的小伙伴可以结合视频一起学习：为什么区块链无法主动获取外界数据区块链的特点区块链是一个封闭的确定性系统，每一笔交易都需要不同节点共识，只有超过一定数量的节点共识成功，交易才会被真正认可，并写入区块链。因为对于外部API的
TCP/IP学习笔记(5) --IP选路 ox0080 Linux 网络 linux网络
静态IP选路一个简单的路由表选路是IP层最重要的一个功能之一。前面的部分已经简单的讲过路由器是通过何种规则来根据IP数据包的IP地址来选择路由。这里就不重复了。首先来看看一个简单的系统路由表。命令:routeprint|more对于一个给定的路由器，可以打印出五种不同的flag。U表明该路由可用。G表明该路由是到一个网关。如果没有这个标志，说明和Destination是直连的，而相应的Gatewa
ros smach 教程——（二）白云千载尽自动驾驶 ros python smach 状态机
ROSSMACH中级教程一、SMACH容器1.1状态机容器1.1.1创建状态机容器首先引入状态机容器fromsmachimportStateMachine由于SMACH状态机还提供状态接口，因此必须在构造时指定其结果和用户数据交互。sm=StateMachine(outcomes=['outcome1','outcome2'],input_keys=['input1','input2'],outp
嵌入式C语言学习笔记（2）愿抬头有阳光 c语言学习笔记
1.数组指针数组指针本质上就是一个指针，它里面存放的是数组的首地址。#includevoidshow(int(*p)[4],intn){for(inti=0;i4*4=16;3.命令行传递参数，main函数的标准格式intmain(intargc,constchar*argv[]){return0;}//argc：参数的个数包括./a.out//argv：参数的值列表argv[0]="./a.ou
C++学习笔记：引用 etp_ c++学习笔记
引用是已知变量的别名，通过将引用变量用作参数，函数将使用原始数据而不是其副本。下面将r作为a的别名：inta;int&r=a;就像char*是指向char的指针一样，int&是指向int的引用。（a和r指向相同的值和内存单元)注意：&r表示r引用变量的地址。引用和指针的区别1.必须在声明引用时将其初始化，而不能像指针那样先声明再赋值。2.引用更接近const指针，一旦与某个变量关联起来便有一直效忠
论文笔记-Contrastive Learning for Unpaired Image-to-Image Translation kingsleyluoxin 计算机视觉论文笔记深度学习 python 计算机视觉机器学习人工智能深度学习
论文信息标题：ContrastiveLearningforUnpairedImage-to-ImageTranslation作者：TaesungPark,AlexeiA.Efros,RichardZhang,Jun-YanZhu机构：UniversityofCalifornia,Berkeley;AdobeResearch代码链接https://github.com/taesungp/contra
React学习笔记20 充气大锤 React学习笔记学习笔记 javascript 前端算法开发语言 react.js
一、React.forward1.1、作用通过ref暴露子组件的DOM1.2、场景说明1.3、语法实现//子组件constInput=forwardRef((props,ref)=>{return})//父组件functionfather_component(){constinputRef=useRef(null)constfocus=(ref)=>{ref.current.focus()}ret
【迁移学习入门之域适应的背景、理论与方法】进一步理解迁移学习啦？ 985小水博一枚呀深度学习学习笔记迁移学习人工智能机器学习域适应
【迁移学习入门之域适应的背景、理论与方法】进一步理解迁移学习啦？【迁移学习入门之域适应的背景、理论与方法】进一步理解迁移学习啦？文章目录【迁移学习入门之域适应的背景、理论与方法】进一步理解迁移学习啦？1.背景介绍2.理论基础2.1分布差异（DomainShift）2.2迁移学习理论（TransferLearningTheory）2.3领域不变特征（Domain-invariantFeatures）
C++学习笔记:函数重载及函数模板 etp_ c++学习笔记
函数重载默认参数能让你使用不同数目的参数调用同一个函数，而函数多态（函数重载）能让你使用多个同名函数。----一般完成类似的工作，但一定使用不同的参数列表（函数特征标）。下面定义一组原型如下的print()函数voidprint(constchar*str,intwidth);voidprint(doubled,intwidth);voidprint(longl,intwidth);编译器根据参数
Gymnasium学习笔记 songyuc gymnasium
1.Customwrapper[doc]1.1reset()方法重写说明重写函数模板：defreset(self,**kwargs):obs=super().reset(**kwargs)...returnobs1.1.1签名解释Deepseek-r1-Cursor:reset()方法的定义如下：defreset(self,*,seed=None,options=None):...注意参数前的星号
宝石组合第十五届蓝桥杯大赛软件赛省赛C/C++ 大学 B 组 Geometry Fu 蓝桥杯蓝桥杯 c语言 c++
宝石组合题目来源第十五届蓝桥杯大赛软件赛省赛C/C++大学B组原题链接蓝桥杯宝石组合https://www.lanqiao.cn/problems/19711/learning/问题描述P10426[蓝桥杯2024省B]宝石组合题目描述在一个神秘的森林里，住着一个小精灵名叫小蓝。有一天，他偶然发现了一个隐藏在树洞里的宝藏，里面装满了闪烁着美丽光芒的宝石。这些宝石都有着不同的颜色和形状，但最引人注目
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地