不要卷我啊

【学习周报】深度学习笔记第四周

学习目标：

深度学习吴恩达lesson2-week3：超参数调试、Batch正则化和程序框架（Hyperparameter tuning）
深度学习吴恩达lesson3-week1：机器学习（ML）策略（1）
深度学习吴恩达lesson3-week2：机器学习（ML）策略（2）

学习内容：

目录

学习目标：

学习内容：

学习时间：

学习产出：

lesson2-week3

3.1 参数的统计与选择

3.2 参数合适的取值范围

3.3 Batch归一化

3.4 Softmax 回归

lesson3-week1

1.1 什么是机器学习（ML）策略？

1.2 正交化（Orthogonalization）

1.3 训练/开发/测试集划分

1.4 什么是人的表现？

1.5 可避免偏差（Avoidable bias）

lesson3-week2

2.1 进行误差分析

2.2 一些针对错误的小技巧

2.3 迁移学习

2.4 多任务学习

2.5 端到端深度学习的概念

学习时间：

10.17-10.21

学习产出：

lesson2-week3

在lesson2-week2这一周的学习中，我们又接触到了许多新的调整训练集合的方法，讨论了各种减小偏振误差，加快学习速度的方法。其中引入了许多的超参数。对于这些超参数的值的确定，或者说是选择，往往是需要大量分析的。所以week3我们讨论如何去分析这些参数，确定超参数的值从而得到更适应的模型。

3.1 参数的统计与选择

如图吴老师给出的各种常见的超参数。

1学习率a

2Momentum动量梯度下降法参数β

4如果使用Momentum或Adam优化算法的参数，β1，β2和ε

3层数layers

2隐藏单元个数

3学习率衰减

2mini-batch的大小m

（前面数字代表重要程度，标号越小越重要）

以上是我们分析出的一些超参数

下面讨论如何选择调试这些参数的值。

假设我们采用图一的方法：正方形选取25个点（两个变量的情况下），那么横向或者纵向两个变量其实仅仅只选取了5个值，优点是我们很容易就可以找出两个变量的最优选取值，例如控制某个变量不变，就可以很好的看出另一个变量的优劣变化从而选出结果。但是缺点是在多个变量互相影响的情况下效果不好。

采用图二方法：我们采取随机选取25个点的方法，那么不管是横向还是纵向取值都有25个不同。对于许多变量的情况，我们跟希望取到更多的不同的情况，这样我们就能探究更多的情况。

另外一种方法就是，我们在第一次实验结果基础上发下最优的点在某个更小的矩阵中，那么我们就可以在下一次取值中放在该小矩阵就继续运行，最终就可以确定最优解所在的某个小范围。

所以这种从粗到细的搜索也经常使用。

3.2 参数合适的取值范围

在上一个小节中，你已经看到了在超参数范围中，随机取值可以提升你的搜索效率。但随机取值并不是在有效范围内的随机均匀取值，而是选择合适的标尺，用于探究这些超参数，这很重要。

均匀取值并不是很好的方法。

如上图对隐藏单元，神经网络层数在50-100、2-4中的随机均匀取值是可行的。

但是有些变量是不可以等概率随机取值的，可以要在某些范围有所侧重。

如上图，用对数标尺搜索超参数的方式会更合理，因此这里不使用线性轴，分别依次取0.0001，0.001，0.01，0.1，1，在对数轴上均匀随机取点，这样，在0.0001到0.001之间，就会有更多的搜索资源可用，还有在0.001到0.01之间等等。

那么为什么会这样，原因可以如下说明：学习率在0.0001-0.001中取值或许对于深度学习并没有太大影响，但是如果在0.1-1中选取会变得特别敏感，所以不使用均匀的随机选取有利于发现这种情况。

3.3 Batch归一化

让a或者z矩阵变得均匀分布的整体。

那么batch归一化为什么会有效呢？
首先，从之前的输入特征归一化可以看到，它可以将不同参数的范围变换到相似的范围，可以加速学习。但是batch归一化不仅仅是对输入值，而且还对隐藏单元进行归一化。
第二个原因是，它可以使权重比你的网络更滞后或更深层。比如第10层的权重比第一层的权重更能经受的住变化。这是什么意思呢？下面给出一个生动形象的例子。
对于下面这个猫脸识别的神经网路，可能是深层也可能是浅层。假设你已经在所有黑猫的图像上训练了数据集，如果现在你要把此网路应用于有色猫，这种情况下，正面的例子不仅是黑色猫还有有色猫。那么你的cosfa可能适用的不会很好（cosfa是啥意思？是classify吗？）。如果在黑猫图像中，你的训练集是一种情况，加上有色猫以后，如果你试图把黑猫和有色猫统一与一个数据集，那么你就不应该期待左边训练很好的模块同样在右边也运行的很好。

3.4 Softmax 回归

一种多分类的方法，可以理解成逻辑回归的复杂模型，回归的简化就是逻辑回归。

lesson3-week1

lesson3中主要涉及神经网络计算的训练，验证测试集合的准确率进行分析，并确定下一步应该如何改正提供思路。

1.1 什么是机器学习（ML）策略？

学习过程中，对于测试结果不满意，例如测试正确率90%我们应该如何改进做出的策略即我们现在要学习的内容。

1.2 正交化（Orthogonalization）

举一个简单例：当电视机的音量加与频道加两个键结合在一起时，我们没办法做到频道加且音量不变的情况，就会产生互相影响，正交化在机器学习中即代表如何消除这种影响。

如上图，即我们实现正交化，确保知晓调整某些参数改变一个功能。

1.3 训练/开发/测试集划分

在一般情况下，我们尽量使得训练集与测试集来自同一分布。

理由：以辨别猫的问题为例，假设各个国家的猫都有数据获得。

上图中我们将前四个国家与后四个国家分别用作训练、测试集，，那么测试集的准确率可能下降，原因时各个国家的猫可能因地域不同而有不同的特征，我们使用南美的猫图片去识别印度的猫咪图片，可能降低识别准确度。

为了抹平这种地域差异带来的学习影响，我们可以打乱各个数据，均匀分配。

1.4 什么是人的表现？

我们的深度学习最终目的是模拟人类大脑，或者超越人类大脑。

以识别猫为例，人在识别猫的准确率上的表现，往往是我们能够训练达到的大概上限。

这里引出贝叶斯最优错误率的概念

随着时间的推移，当您继续训练算法时，可能模型越来越大，数据越来越多，但是性能无法超过某个理论上限，这就是所谓的贝叶斯最优错误率

贝叶斯错误率一般高于人类的行为表现，但是两者都是用于估计我们训练的模型距离理论还有多少的差距。

1.5 可避免偏差（Avoidable bias）

在以前的讨论中，假设验证集合的错误率为10%，我们会认为偏差有10%那么多，因为在当时我们认为人的正确率可以高达100%，错误率为0，所以机器学习距离最优结果的偏差为10%，我们称这个偏差叫做可避免偏差。

lesson3-week2

在lesson-week1中的课程学习可能在深度学习中遇到的误差问题，接下来我们细致了解这些误差问题，并且讨论如何针对各种问题提供大体解决思路。

2.1 进行误差分析

假设在搭建好的深度学习网络中，识别猫的正确率为90%，这里我们对于识别错误的10%做出讨论：

假设我们10%错误率中有0.5%把狗识别成了猫，那么我们修改神经网络对狗的识别程度，对网络改进并不会很好。

假设我们10%错误率中有9%把狗识别成了猫，那么改进网络让他对狗猫的识别特征更具体，就能很好的改进该系统。

这个样本里狗的问题是否值得解决。有时你在做错误分析时，也可以同时并行评估几个想法，比如，你有几个改善猫检测器的想法，也许你可以改善针对狗图的性能，或者有时候要注意，那些猫科动物，如狮子，豹，猎豹等等，它们经常被分类成小猫或者家猫，所以你也许可以想办法解决这个错误。或者也许你发现有些图像是模糊的，如果你能设计出一些系统，能够更好地处理模糊图像。

2.2 一些针对错误的小技巧

一、如果本身的训练数据中就存在错误的标签，例如：将本身不是猫的图片标记成猫。有以下考虑：如果数据量足够庞大并且标记错误对识别的正确率影响不大，可以不考虑标记错误的标签。如果数据量很小或者人工修改数据变成正确数据对于模型的识别正确率影响很大，可以考虑人工重新标签。

二、多多人工观察是否存在错误标签，以及正确的标签是否也需要改进。人工的检查有时候对模型的训练很有帮助。

三、快速搭建训练模型。只有动手确定训练的数据集合并且着手训练，才能更好更快的发现错误并且根据经验进行改正。

2.3 迁移学习

迁移学习：指在原本具有某一功能的基础上，将该模型的输入，输出进行修改并直接应用于其他模型。

适用场景：待解决的问题提供的数据很少。有类似的大量数据模型已经训练出很好的模型。

优点：新模型可以在旧模型的基础上直接应用或者稍微改进，便可以很好的应用。可以获得旧模型的大量数据提供的特征。

例子：计算机视觉的图像识别模型已经很成熟，可以很好的适用于放射性图像检查（放射性图像检查的数据一般很难获得或者说很少）。

2.4 多任务学习

在自动驾驶识别车辆的问题中，我们很常见的是在车辆照片中还会出现行人、红绿灯等特征。我们可以尝试选择一种方法对三种或者四种特征同时进行学习。

2.5 端到端深度学习的概念

在深度学习中我们往往有许多的层级，例如识别人脸有图片获取、特征提取、人脸定位等多个步骤。端到端学习的概念提出：是否可以省去这些步骤，让机器自己去理解图片。

优点：为机器自主学习提供了更全新的概念。可以让机器自己去理解数据的信息而不是学人类。例如音标是人创造出来的，或许没有音标机器也可以很好的学习各种语句。

你可能感兴趣的:(学习)

【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
Simscape入门教程微小冷机器人 Matlab simulink simscape 弹簧阻尼 multibody
文章目录物理网络连接到Simulink运行本文是官方教程构造物理模型的基本步骤的学习笔记，旨在建立一个带有控制器的质量-弹簧-阻尼系统。物理网络在命令行中输入sscnew，即可弹出Simscape模板，基于此模板即可组建其相应的物理网络。通过添加新模块、删除无关模块，连接其物理网络如下所有模块均在Simscape->FoundationLibrary->Mechanical中，具体包括需要的模块包
数据仓库技术及应用（Hive 产生背景与架构设计，存储模型与数据类型）娟恋无暇数据仓库笔记 hive
1.Hive产生背景传统Hadoop架构存在的一些问题：MapReduce编程必须掌握Java，门槛较高传统数据库开发、DBA、运维人员学习门槛高HDFS上没有Schema的概念，仅仅是一个纯文本文件Hive的产生：为了让用户从一个现有数据基础架构转移到Hadoop上现有数据基础架构大多基于关系型数据库和SQL查询Facebook诞生了Hive2.Hive是什么官网：https://hive.ap
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
大模型RLHF强化学习笔记（二）：强化学习基础梳理Part2 Gravity! 大模型笔记大模型 LLM 强化学习人工智能
【如果笔记对你有帮助，欢迎关注&点赞&收藏，收到正反馈会加快更新！谢谢支持！】一、强化学习基础1.4强化学习分类根据数据来源划分Online：智能体与环境实时交互，如Q-Learning、SARSA、Actor-CriticOffline：智能体使用预先收集的数据集进行学习根据策略更新划分On-Policy：学习和行为策略是相同的，数据是按照当前策略生成的，如SARSAOff-Policy：学习策
这是gpt o1给出的物联网工程专业的大学规划，有人看看这个合理吗？王倚山 gpt 物联网学习开发语言
下面是一份更为详细、覆盖全年（包括寒暑假）的四阶段学习规划，旨在帮助你在大学剩余时间里持续学习、循序渐进地掌握物联网（IoT）核心技能，打造深厚的技术壁垒。每个阶段都有明确的学习目标与自学内容细节，并在寒暑假安排了“强化期”任务，让你全年不停歇，不断提升。总体思路稳扎稳打：从嵌入式基础到RTOS、传感器驱动、通信协议，再到边缘计算、云平台、工业协议、安全攻防，层层深入。项目驱动：每个阶段至少完成1
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
xml文件笔记
今天学习了一下xml下面是总结的一些笔记Xml可以用来配置文件xml特点：Xml可以从HTYML中分离数据可以利用xml文件在不兼容的系统之间交换数据Xml数据以纯文本格式存储Xml与其他软硬件的耦合度更低，数据可以被更多的设备利用，还可以将XML文件当作数据源来处理，就像操作数据库一样Xml的格式在xml文件头部要有声明在XML中字母的大小写是敏感的Xml文件中有且只有一个根元素，所有的其他元素
PyTorch 的 torch.nn 模块学习
torch.nn是PyTorch中专门用于构建和训练神经网络的模块。它的整体架构分为几个主要部分，每部分的原理、要点和使用场景如下：1.nn.Module原理和要点：nn.Module是所有神经网络组件的基类。任何神经网络模型都应该继承nn.Module，并实现其forward方法。使用场景：用于定义和管理神经网络模型，包括层、损失函数和自定义的前向传播逻辑。主要API和使用场景：__init__
Kafka的消费消息是如何传递的？ java1234_小锋 java kafka 分布式
大家好，我是锋哥。今天分享关于【Kafka的消费消息是如何传递的？】面试题。希望对大家有帮助；Kafka的消费消息是如何传递的？超硬核AI学习资料，现在永久免费了！在Kafka中，消息的消费传递是通过**消费者（Consumer）和消费者组（ConsumerGroup）**的机制来实现的。以下是Kafka消息消费传递的详细过程：1.Kafka的基本结构Kafka由生产者（Producer）、消费者
Angular6 学习笔记——路由详解男人要霸气 Angular6
angular6.x系列的学习笔记记录,仍在不断完善中,学习地址:https://www.angular.cn/guide/template-syntaxhttp://www.ngfans.net/topic/12/post/2系列目录(1)组件详解之模板语法(2)组件详解之组件通讯(3)内容投影,ViewChild和ContentChild(4)指令(5)路由路由存在的意义一般而言,浏览器具有下
前端开发核心：HTML、CSS与JavaScript学习指南 Randy Rhoads
本文还有配套的精品资源，点击获取简介：HTML、CSS和JavaScript是前端开发的基础，分别负责网页的结构、样式和动态行为。学习这三种技术需要理解它们之间的关系及其协同工作的机制。本笔记提供了一个全面的复习资料，包括标签使用、CSS布局技巧、JavaScript基础语法和DOM操作，旨在帮助巩固知识点和发现潜在的学习盲点。同时，介绍了响应式设计、Web组件、ServiceWorker等现代前
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
vue+typeScript 中 webpack.ProvidePlugin的使用随便放个文字在这里 vue.js webpack typescript
用vue+ts写新项目，想偷懒，少写一些代码，研究了一下providePlugin，之前写js的有用到，但是在ts里面用还是有些区别的，特意在这里记录一下。有疑问的朋友可以留言，共同学习进步。webpack.providePlugin官方文档介绍vue.config.js文件配置项constwebpack=require('webpack')constpath=require('path')mod
常见构建工具使用与原理浅析
1.初版构建工具1.1.GruntGrunt是前端第一个正式的构建工具，它基于Node.js开发。Grunt同样是基于插件实现功能拓展增强，但对于像Webpack上很多能力，如HMR、ScopeHoisting等都是不支持的，可以作为学习Webpack前的了解。Grunt更像是一种自动化的配置工具集，就如官方所说，Grunt是TheJavaScriptTaskRunner，每个Grunt任务通常必
TypeScript-webpack 難釋懷 typescript webpack javascript
一、前言随着前端工程化的不断演进，使用TypeScript编写更加健壮、可维护的代码已成为主流趋势。而Webpack则是目前最流行的模块打包工具之一，它可以帮助我们将多个模块、资源文件进行打包压缩，适用于大型项目开发。本文将带你一步步搭建一个基于TypeScript+Webpack的开发环境，涵盖基础配置、编译流程、开发服务器设置等内容，适合初学者和中级开发者学习参考。二、什么是TypeScrip
ModusToolbox 实战入门 - PSOC C3 Smart IO 与 GPIO 应用篇 WPG大大通 Infineon产线大大通软件 GPIO CPU 开发工具
摘要本文将带您了解PSOC™ControlC3MCU的架构与开发工具，并示范如何使用EclipseIDEforModusToolbox™创建项目。通过本次使用smartI/O外设的实作示例，您将学习如何将按钮输入引脚通过smartI/O连接至输出引脚，以驱动外部LED，在无需CPU参与的情况下完成初始化后自动运行，进一步体验PSOC™ControlC3的低功耗与高集成特性。软件下载与安装软件版本M
【小米App】Blocky语言编程入门指南 Botiway 移动APP windows kotlin android studio linux python
Blocky语言编程入门指南Blocky是一种基于可视化积木块拼接的编程语言，特别适合编程初学者和儿童学习编程概念。以下是Blocky语言的入门指南：什么是Blocky语言Blocky是由Google开发的基于Web的可视化编程工具，它通过将不同功能的代码块像拼图一样连接起来进行编程，无需记忆语法规则。开始使用Blocky访问Blocky官方网站(https://blockly-demo.apps
爆改RAG！用强化学习让你的检索增强生成系统“开挂”——从小白到王者的实战指南许泽宇的技术分享人工智能
“RAG不准？RL来救场！”——一位被RAG气哭的AI工程师前言：RAG的烦恼与AI炼丹师的自我修养在AI圈混久了，大家都知道RAG（Retrieval-AugmentedGeneration，检索增强生成）是大模型落地的“万金油”方案。无论是企业知识库、智能问答，还是搜索引擎升级，RAG都能插上一脚。但你用过RAG就知道，理想很丰满，现实很骨感。明明知识库里啥都有，问个“量子比特的数学表达式”，
李宏毅2025《机器学习》第四讲-Transformer架构的演进
Transformer架构的演进与替代方案：从RNN到Mamba的技术思辨Transformer作为当前AI领域的标准架构，其设计并非凭空而来，也并非没有缺点。本次讨论的核心便是：新兴的架构，如MAMA，是如何针对Transformer的弱点进行改进，并试图提供一个更优的解决方案的。要理解架构的演进，我们必须首先明确一个核心原则：每一种神经网络架构，都有其存在的技术理由。CNN（卷积神经网络）：为
荷兰赌悖论：概率哲学中的理性陷阱与信念度之谜大千AI助手人工智能 Python #OTHER 人工智能数据挖掘机器学习算法概率论荷兰赌悖论悖论
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！1.概念起源与核心定义荷兰赌（DutchBook）源于赌博策略中的一种风险设计：若参与者的信念度（主观概率）不满足概率公理，则存在一组赌注组合，无论事件结果如何，参与者必然亏损。该理论由弗兰克·拉姆齐（FrankRamsey）和布鲁诺·德·菲内蒂（Br
马尔可夫链：随机过程的记忆法则与演化密码大千AI助手人工智能 Python #OTHER python 人工智能马尔科夫链 MC 算法随机过程
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义：无记忆的随机演化马尔可夫链（MarkovChain）是一种具有马尔可夫性质的离散随机过程，其核心特征是：未来状态仅取决于当前状态，与历史路径无关数学表述：[P(Xt+1=xt+1∣Xt=xt,Xt−1=xt−1,…,X0=x0)=P(Xt
条件概率：不确定性决策的基石大千AI助手人工智能 Python #OTHER 决策树算法机器学习人工智能条件概率概率论
条件概率是概率论中的核心概念，用于描述在已知某一事件发生的条件下，另一事件发生的概率。它量化了事件之间的关联性，是贝叶斯推理、统计建模和机器学习的基础。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、定义与公式设(A)和(B)是两个随机事件，且(P(B)>0)：条件概率(P(A\midB))表示
先验与后验：贝叶斯框架下的认知进化论大千AI助手 Python #OTHER 人工智能机器学习人工智能贝叶斯概率先验概率后验概率条件概率
在贝叶斯概率框架中，“先验概率”（PriorProbability）和**“后验概率”（PosteriorProbability）的命名直接体现了认知更新的时序逻辑**。这两个概念的核心区别在于：是否已利用新证据（B）进行信念修正。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、命名的本质：认知
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他