大师鲁

XGBoost和Boosted Trees

树模型简介

树模型是工业界用得非常多的一个模型，它的representation类似于下图。其实基于树的模型都是通过一个个平行于坐标轴的平面去拟合训练集的实际分界面，理论上足够多的平行于坐标轴的平面能够拟合任意分界面。

Boosted Trees

XGBoost是“Extreme Gradient Boosting”的缩写，其中“Gradient Boosting”一词由Friedman在论文《Greedy Function Approximation: A Gradient Boosting Machine》中提出。XGBoost基于这个原始模型。本文是一个gradient boosted trees（梯度提升树）的教程，大部分内容是基于xgboost的作者的slides。

监督学习的要素

模型和参数

监督学习中的model通常是指给定输入 $x_i$ 如何去预测输出 $y_i$ 的数学结构。例如，一个常见的模型是 linear model，其预测是由 $\hat{y}_i = \sum_j \theta_j x_{ij}$ 给出的，这是输入特征的线性加权组合。其实这里的预测 $y$ 可以有不同的解释，取决于做的任务，如回归或分类。例如，可以通过 logistic 转换得到 logistic regression 中正类别的概率，当我们想要对输出结果排序的时候，也可以被用作排序得分。
parameters 是我们需要从数据中学习的未确定部分。在线性回归问题中，参数是系数 $w$ 。通常我们使用 $\Theta$ 来表示参数。

目标函数：训练损失 + 正则

基于对 $y_i$ 的不同理解，我们可以得到不同的问题，比如回归，分类，排序等。我们需要找到一种方法来找到训练数据的最佳参数。为了做到这一点，我们需要定义一个所谓的 objective function 来衡量给定一组参数的模型的性能。
关于目标函数的一个非常重要的事实是，它们 must always 包含两个部分：training loss 和 regularization。
$Obj(\Theta) = L(\Theta) + \Omega(\Theta)$
其中 $L$ 是训练损失函数， $\Omega$ 是正则化项。 training loss 衡量我们的模型在训练数据上的预测性。例如，常用的训练损失是 mean squared error（均方误差，MSE）。
$L(\theta) = \sum_i (y_i-\hat{y}_i)^2$
另一个常用的损失函数是 logistic 回归的 logistic 损失。
$L(\theta) = \sum_i[ y_i\ln (1+e^{-\hat{y}_i}) + (1-y_i)\ln (1+e^{\hat{y}_i})]$
regularization term（正则化项） 是人们通常忘记添加的内容。正则化项控制模型的复杂度，有助于避免过拟合。这听起来有些抽象，那么我们在下面的图片中考虑下面的问题。在图像左上角给出输入数据点的情况下，要求您在视觉上拟合一个 step function（阶梯函数）。您认为三种中的哪一种解决方案是最拟合效果最好的？

![](https://raw.githubusercontent.com/dmlc/web-data/master/xgboost/model/step_fit.png) 正确答案已经标注红了。请思考一下这个是否在你的视觉上较为合理？总的原则是我们想要一个 simple（简单）和 predictive（可预测）的模型。两者之间的权衡也被称为机器学习中的 bias-variance tradeoff（偏差-方差权衡）。对于线性模型常见的正则化项有 L2 正则和 L1 正则。这样的目标函数的设计来自于统计学习中的一个重要概念，也是我们刚才说的， bias-variance tradeoff（偏差-方差权衡）。比较感性的理解， Bias 可以理解为假设我们有无限多数据的时候，可以训练出最好的模型所拿到的误差。而 Variance 是因为我们只有有限数据，其中随机性带来的误差。目标中误差函数鼓励我们的模型尽可能去拟合训练数据，这样相对来说最后的模型会有比较小的 bias 。而正则化项则鼓励更加简单的模型。因为当模型简单之后，有限数据拟合出来结果的随机性比较小，不容易过拟合，使得最后模型的预测更加稳定。

为什么要介绍一般原则

上面介绍的要素构成了监督学习的基本要素，它们是机器学习工具包的基石。例如，你应该能够描述boosted trees和random forests之间的差异和共同点。以正式的方式理解这个过程也有助于我们理解我们正在学习的目标以及启发式算法背后的原因，例如pruning和smoothing。

Tree ensembles

我们已经介绍了监督学习的要素，接下来开始真正的trees吧。首先，让我们先来了解一下 xgboost 的模型：集成树。集成树模型是一组分类和回归树（CART）。这里有一个 CART 的简单的示例，它可以分类某人是否会喜欢电脑游戏。

我们把一个家庭的成员分类到不同的叶子，并在相应的叶子节点上给他们分配分数。 CART与 decision trees有一些不同，decision trees叶子只包含决策值。在 CART 中，每个叶子都有一个真实的分数，这给了我们除了分类外更丰富的解释。这也使统一的优化步骤更加容易，我们将在本教程的后面部分看到。
通常情况下，单棵树由于过于简单而不够强大到可以在实践中使用。实际中使用的是集成树模型，它将多棵树的预测加到一起。

上图是两棵树的树集成的例子。将每棵树的预测分数加起来得到最终分数。如果你看一下这个例子，一个重要的事实就是两棵树试图相互补充。数学上，我们可以把模型写成
$\hat{y}_i = \sum_{k=1}^K f_k(x_i), f_k \in \mathcal{F}$
其中 $K$ 是树的数量， $f$ 是函数空间 $\mathcal{F}$ 中的一个函数， $\mathcal{F}$ 是所有可能的CARTs的集合。因此我们优化的目标可以写成
$\text{obj}(\theta) = \sum_i^n l(y_i, \hat{y}_i) + \sum_{k=1}^K \Omega(f_k)$
那么问题来了，随机森林的模型是什么？就是树集成！所以 random forests 和 boosted trees 在模型上并没有什么不同，不同之处在于我们如何训练它们。这意味着如果你写一个 tree ensembles 的预测服务，你只需要编写它们中的一个，它们应该对random forests和 boosted trees都支持。这也是监督学习基石元素的一个例子。

Tree Boosting

在介绍完模型之后，我们从真正的训练部分开始。我们应该怎么学习trees呢？答案是，像所有的监督学习模型一样：定义一个目标函数，然后优化它！
假设我们有以下目标函数（记住它总是需要包含训练损失和正则化）
$\text{obj} = \sum_{i=1}^n l(y_i, \hat{y}_i^{(t)}) + \sum_{i=1}^t\Omega(f_i)$
Boosting的思想可以看成一种参数更新的思路，只不过这个参数是一个子树。通过生成一颗子树叠加到之前的子树上来减小损失函数。

Additive Training

我们要学习的是 $f_i$ 函数，每个函数都包含树的结构和叶子分数。这比传统的最优化问题要难得多。一次性训练所有的树并不容易，我们使用加法训练：固定好已经训练完的树，然后一次添加一棵新的树。运用加法训练，目标不再是直接优化整个目标函数，这已经被我们证明是行不通的。而是分步骤优化目标函数，首先优化第一棵树，完了之后再优化第二棵树，直至优化完K棵树。我们把在 $t$ 步的预测值写做 $\hat y_i^{(t)}$ ，所以有
$\begin{aligned}\hat{y}_i^{(0)} &= 0\\ \hat{y}_i^{(1)} &= f_1(x_i) = \hat{y}_i^{(0)} + f_1(x_i)\\ \hat{y}_i^{(2)} &= f_1(x_i) + f_2(x_i)= \hat{y}_i^{(1)} + f_2(x_i)\\ &\dots\\ \hat{y}_i^{(t)} &= \sum_{k=1}^t f_k(x_i)= \hat{y}_i^{(t-1)} + f_t(x_i)\end{aligned}$
另外还有一个问题，每一步我们想要哪棵tree呢？一个自然而然的事情就是添加一个优化我们目标的方法。
$\begin{aligned}\text{obj}^{(t)} & = \sum_{i=1}^n l(y_i, \hat{y}_i^{(t)}) + \sum_{i=1}^t\Omega(f_i) \\ & = \sum_{i=1}^n l(y_i, \hat{y}_i^{(t-1)} + f_t(x_i)) + \Omega(f_t) + constant \end{aligned}$
如果我们考虑使用 MSE 作为损失函数，它将是下面的形式。
$\begin{aligned}\text{obj}^{(t)} & = \sum_{i=1}^n (y_i - (\hat{y}_i^{(t-1)} + f_t(x_i)))^2 + \sum_{i=1}^t\Omega(f_i) \\ & = \sum_{i=1}^n [2(\hat{y}_i^{(t-1)} - y_i)f_t(x_i) + f_t(x_i)^2] + \Omega(f_t) + constant \end{aligned}$
MSE 的形式比较友好，具有一阶项（通常被称为残差）和二次项。对于其他形式的损失（例如，logistic loss），获得这么好的形式并不是那么容易。所以在一般情况下，我们把损失函数泰勒展开到二阶
$Obj^{(t)} = \sum_{i=1}^n [l(y_i, \hat{y}_i^{(t-1)}) + g_i f_t(x_i) + \frac{1}{2} h_i f_t^2(x_i)] + \Omega(f_t) + constant$
其中 $g_i$ 和 $h_i$ 被定义为
$\begin{aligned}g_i &= \partial_{\hat{y}_i^{(t-1)}} l(y_i, \hat{y}_i^{(t-1)})\\ h_i &= \partial_{\hat{y}_i^{(t-1)}}^2 l(y_i, \hat{y}_i^{(t-1)}) \end{aligned}$
我们删除了所有的常量之后，t步中的具体目标就变成了
$\sum_{i=1}^n [g_i f_t(x_i) + \frac{1}{2} h_i f_t^2(x_i)] + \Omega(f_t)$
这成为了这棵新树的优化目标。这个定义的一个重要优点是它只依赖于 $g_i$ 和 $h_i$ 。这就是 xgboost 如何支持自定义损失函数。我们可以使用完全相同的使用 $g_i$ 和 $h_i$ 作为输入的 solver（求解器）来优化每个损失函数进，包括 logistic regression 和 weighted logistic regression。

模型复杂度

我们已经介绍了训练步骤，但是等等，还有一个重要的事情，regularization（正则化）！我们需要定义树的复杂度 $\Omega(f)$ 。为了做到这一点，让我们首先改进一棵树的定义 $f (x)$ 如下
$f_t(x) = w_{q(x)}, w \in R^T, q:R^d\rightarrow \{1,2,\cdots,T\} .$
这里 $w$ 是叶子上的分数向量， $q$ 是将每个数据点分配给对应叶子的函数， $T$ 是叶子的数量。在 XGBoost 中，我们将复杂度定义为
$\Omega(f) = \gamma T + \frac{1}{2}\lambda \sum_{j=1}^T w_j^2$
当然有不止一种方法来定义复杂度，但是这个具体的方法在实践中运行良好。正则化是大多数树的包不那么谨慎或简单忽略的一部分。这是因为对传统的树学习算法的对待只强调提高 impurity（不纯性），而复杂度控制则是启发式的。通过正式定义，我们可以更好地了解我们正在学习什么，它在实践中也运行良好。

结构分数

这是 derivation（派生）的神奇部分。在对树模型进行重新格式化之后，我们可以用第 $t$ 棵树来编写目标值:
$\begin{aligned}Obj^{(t)} &\approx \sum_{i=1}^n [g_i w_{q(x_i)} + \frac{1}{2} h_i w_{q(x_i)}^2] + \gamma T + \frac{1}{2}\lambda \sum_{j=1}^T w_j^2\\ &= \sum^T_{j=1} [(\sum_{i\in I_j} g_i) w_j + \frac{1}{2} (\sum_{i\in I_j} h_i + \lambda) w_j^2 ] + \gamma T \end{aligned}$
………………
$\text{obj}^{(t)} = \sum^T_{j=1} [G_jw_j + \frac{1}{2} (H_j+\lambda) w_j^2] +\gamma T$
$\begin{aligned}w_j^\ast &= -\frac{G_j}{H_j+\lambda}\\ \text{obj}^\ast &= -\frac{1}{2} \sum_{j=1}^T \frac{G_j^2}{H_j+\lambda} + \gamma T\end{aligned}$

如果所有这些听起来有点复杂，让我们看看图片，看看如何计算得分。简单的说，对于给定的树结构，我们将统计信息 $g_i$ 和 $h_i$ 推送到它们所属的叶子，将统计数据加在一起，并使用公式计算树的好坏。这个分数就像决策树中的不纯度，不过它还考虑了模型的复杂度。

学习树结构

既然我们有了一个方法来衡量一棵树有多好，理想情况下我们会列举所有可能的树并挑选出最好的树。在实践中，这种方法是比较棘手的，所以我们会尽量一次优化树的一层。具体来说，我们试图将一片叶子分成两片，得到增加的分数
$\frac{1}{2} \left[\frac{G_L^2}{H_L+\lambda}+\frac{G_R^2}{H_R+\lambda}-\frac{(G_L+G_R)^2}{H_L+H_R+\lambda}\right] - \gamma$
这个公式可以分解为 1) 新左叶上的得分 2) 新右叶上的得分 3) 原始叶子上的得分 4) 附加叶子上的正则化。我们可以在这里看到一个重要的事实：如果增益小于 $\lambda$ ，我们最好不要添加那个分支。这正是基于树模型的 pruning（剪枝）技术！通过使用监督学习的原则，我们自然会想到这些技术有效的原因 ?
对于真正有价值的数据，我们通常要寻找一个最佳的分割。为了有效地做到这一点，我们把所有的实例按照排序顺序排列，如下图所示。

然后从左到右的扫描就足以计算所有可能的拆分解决方案的结构得分，我们可以有效地找到最佳的拆分。

XGBoost 最后的话

既然你明白了什么是 boosted trees 了，你可能会问这在 XGBoost 中的介绍在哪里？ XGBoost 恰好是本教程中引入的正式原则驱动的工具！更重要的是，它在 systems optimization（系统优化）和 principles in machine learning（机器学习原理） 方面都有深入的研究。这个库的目标是推动机器计算限制的极限，以提供一个 scalable（可扩展）, portable（可移植）和 accurate（精确的） 库。确保你尝试了它，最重要的是，向社区贡献你的智慧（代码，例子，教程）！

##参考：
Introduction to Boosted Trees
https://homes.cs.washington.edu/~tqchen/pdf/BoostedTree.pdf

【PCL】vs2022配置PCL环境 IT小学僧点云 python 数据结构算法
vs2022配置PCL环境前言一、安装教程二、路径python脚本前言vs2022配置PCL环境和路径Python脚本一、安装教程看这位兄弟写的就行二、路径python脚本因为我和他的版本并不一样，一个一个改太麻烦了，所以特此写了个python脚本。请注意要脚本中OpenNI2位置，修改成你的位置即可。importos#查找给定路径中的PCL依赖库defdependency(paths):#将输入
Python入门教程丨3.5 正则表达式凌小添 Python教程 python 正则表达式 mysql
今天我们来学习Python里超实用的字符串匹配和正则表达式。这是处理文本数据的神器，无论是爬虫、数据清洗还是文本分析，都离不开它，我们从基础语法讲起，再到实战场景，深入体会正则的妙用。1.re库正则表达式（RegularExpression，简称regex或regexp）是一种用来匹配字符串的强大工具。它由一串字符和特殊符号组成，用于描述或匹配一系列符合某种模式的字符串。正则表达式广泛应用于文本搜
DeepSeek高能AI：低成本高效应用突破智能计算研究中心其他
内容概要DeepSeek高能AI系统通过混合专家架构（Mixture-of-Experts）实现了技术范式的突破，其670亿参数的模型规模在保证计算效率的同时，构建了多模态处理能力的技术护城河。该系统整合自然语言处理与视觉语言理解的双通道架构，使文本生成、图像解析和跨模态推理形成协同效应。在应用层面，该模型通过动态路由机制实现功能模块的精准调度，为学术研究、商业运营和技术开发提供多场景解决方案。核
A10高效配置实战技巧智能计算研究中心其他
内容概要在复杂的企业网络环境中，A10设备的配置效率直接影响业务系统的稳定性和响应能力。本文围绕A10Thunder系列设备的全流程调优展开，系统梳理从基础参数校准到高级功能部署的关键步骤，重点解析负载均衡算法与业务场景的适配逻辑、会话保持机制的性能平衡点以及SSL加速优化的硬件资源分配策略。建议在实施配置前，通过A10的AXAPI接口提取现有系统日志，结合业务流量特征制定差异化的调优方案。文中提
人工智能的崛起与未来发展趋势分析智能计算研究中心其他
内容概要人工智能作为一项颠覆性技术，近年来发展迅猛，正逐渐渗透到我们生活的每个角落。它不仅改变了人类的工作方式，还在医疗、金融、教育、交通等多个领域展现了巨大的应用潜力。通过理解人工智能的现状，我们可以更清晰地识别当前技术进展和市场需求，以及面临的挑战。领域应用实例发展现状医疗智能诊断、药物研发提高诊断准确率，缩短研发周期金融风险评估、智能投顾实现个性化服务与高效决策教育自适应学习系统提供个性化学
Java:常用正则表达式 0cfjg0 JAVA基础正则表达式
常用正则表达式元字符.匹配换行符外任意字符\w匹配字母或数字或下划线或汉字\s匹配任意空白符号\d匹配数字\b匹配单词的开始或结束^匹配字符串的开始$字符串的结束eg:^\d\d\d$代表三位都是数字的字符串^\d{8}$代表8位数字的号码反义字符\W匹配不是数字字母下划线和汉字的字符\S匹配不是空白符的字符\D匹配任意非数字的字符\B匹配不是单词开头或结束的位置[^x]匹配除了x以外的任意字符e
Mybatisplus的学习 Agnoni 学习笔记学习 java tomcat idea mybatis
一、条件查询部分在引入mybatisplus的依赖以后，我们不需要再引入mybatis的依赖，因为mybatisplus中已经包含mybatis的依赖。1自动映射规则变量名称：privateStringname属性名：publicStringgetName(){returnname;}这个getName中的name就是属性名称表名和实体类名的映射：表名user实体类名User字段名和实体类属性名映
【python库】Pydantic 陆·柒 python pydantic
什么是PydanticPydantic是一个Python库，主要用于数据验证和设置管理。它使用Python的类型提示（typehints）来定义数据的结构，并在运行时验证数据是否符合定义的结构。简单来说，它可以确保数据的准确性和完整性，帮助开发人员在早期发现数据相关的问题。例如，在处理用户输入、API响应或者配置文件时，Pydantic可以验证数据的格式、类型和取值范围等是否正确用法总结数据定义和
Python数据处理掌握Pandas.to_datetime函数时间序列（参数解析与实战）步入烟尘 Python超入门指南全册 python pandas 开发语言时间函数参数解析
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
SpringBoot 监控 SQL 运行情况（实战教程） 153_m0_67912929 spring boot sql 后端
1基本概念2添加依赖3配置相关属性4sql监控5慢sql记录6spring监控7去Ad（广告）8获取Druid的监控数据1基本概念Druid是Java语言中最好的数据库连接池。虽然HikariCP的速度稍快，但是，Druid能够提供强大的监控和扩展功能，也是阿里巴巴的开源项目。Druid是阿里巴巴开发的号称为监控而生的数据库连接池，在功能、性能、扩展性方面，都超过其他数据库连接池，包括DBCP、C
MySQL日志数据库mysql
本次介绍，MySQL三个重要的日志，binlog、redolog和undolog。binlog日志binlog也称二进制日志，记录了对MySQL数据库执行更改的所有操作，但是不包括select和show这类操作。1.1基本概念binlog是MySQL的Server层实现的，所有引擎都可以使用。binlog是逻辑日志，记录的是这个语句的原始逻辑，比如“给ID=2这一行的c字段加1”binlog是可以
Ascend Extension for PyTorch是个what？机器学习人工智能深度学习
1AscendExtensionforPyTorchAscendExtensionforPyTorch插件是基于昇腾的深度学习适配框架，使昇腾NPU可以支持PyTorch框架，为PyTorch框架的使用者提供昇腾AI处理器的超强算力。项目源码地址请参见Ascend/Pytorch。昇腾为基于昇腾处理器和软件的行业应用及服务提供全栈AI计算基础设施。您可以通过访问昇腾社区，了解关于昇腾的更多信息。2
如何用解决大模型时效性和准确性问题？RAG技术核心原理人工智能
在当今信息爆炸的时代，我们面临着海量数据的挑战。对于人们来说，从这些数据中检索到有用的信息变得越来越困难。为了解决这一问题，研究人员提出了一种新颖的技术，即RAG（Retrieval-AugmentedGeneration，检索增强生成）。RAG结合了检索和生成的方法，使得从大规模数据中提取信息变得更加高效和准确。本文将介绍RAG的定义、工作原理以及它所解决的问题。RAG是什么？RAG是一种基于预
芯麦GC8418：高性能数字音频信号接收与转换电路青牛科技实业01 GLOBALCHIP 单片机嵌入式硬件音频处理器笔记本电脑科技
在数字音频领域，随着技术的不断进步，音频设备对信号接收和转换的要求越来越高。芯麦GC8418作为一款高性能的数字音频信号接收与转换电路，凭借其强大的功能和广泛的接口支持，成为音频设备设计中的理想选择。1.芯片概述GC8418是一款数字音频信号的CMOS单片接收与转换电路，具有八选一输入功能，支持多种主流音频接口标准，包括IEC60958、S/PDIF、EIAJCP1201和AES3。此外，该芯片集
芯谷D1308：低成本、高性能的便携式音频解决方案青牛科技实业01 芯谷音视频音频限幅科技智能家居便携式音频
在便携式音频设备快速发展的今天，消费者对音质的要求不断提高，而设备制造商则面临着如何在有限空间内实现高性能音频输出的挑战。芯谷推出的D1308双通道立体声耳机驱动电路，正是为解决这一矛盾而设计的创新产品。D1308采用先进的CMOS工艺制造，在1.8V至5.5V的宽电压范围内工作，能够提供高达80mW的输出功率，总谐波失真（THD+N）低至0.01%。该芯片集成了过温保护和短路保护功能，确保设备在
MyBatis 和 MyBatis-Plus 入门指南：新手必读 Mr_Paizong Java java mybatis
MyBatis和MyBatis-Plus入门指南：新手必读在Java开发中，持久层的设计和实现是非常重要的一环。MyBatis和MyBatis-Plus是两个广泛使用的数据库访问框架，它们可以帮助我们更高效地与数据库进行交互。本篇博客将详细介绍这两个框架的基本使用方法，并附有代码注释，帮助新手更好地理解和实践。一、什么是MyBatis和MyBatis-Plus？1.1MyBatisMyBatis是
采用DDNS-GO与cloudflare实现双域名同时访问NAS 骑牛找马服务器网络运维
这个标题其实解释的还不够清楚，本人是小白，但是买了群晖的NAS后自己瞎折腾了一下，遇到了如下的问题：1、家里是移动宽带，没有公网IP，因此Ipv4无法使用，IPV6可以正常使用。2、办公室场地采用的是纯IPV4网络，因此想存取资料无法实现。在网上看了很多文章，有介绍采用cloudflare代理来访问，但是一直找不出来介绍DDNS-GO实现同时运行2个域名的文章，于是突发奇想试了一下，思路和实践如下
如何通过指标平台，最大化地提升数据分析的效率和质量？ Aloudata 大数据数据分析 NoETL 指标平台指标体系
通常来说，指标能够准确反映业务的核心绩效和潜在问题等。通过指标平台，有助于企业更有针对性地收集和分析数据。例如，通过动态分析，企业可以观察数据随时间的变化趋势，发现数据中的模式和规律，为业务决策提供依据；通过实时监控更新的数据并进行分析，帮助企业及时发现潜在问题，采取相应的措施；以及快速生成包含关键绩效（KPI）和分析结果的报告，帮助企业管理者实现对各部门、各组织的关键绩效达成和存在问题的全面洞察
芯谷D2761：为扬声器保护而生的音频限幅器深圳市青牛科技实业有限公司小芋圆芯谷音视频机器人单片机嵌入式硬件人工智能科技
在音频设备中，扬声器的安全与音质表现一直是工程师们关注的重点。随着技术的发展，音频设备的应用场景越来越广泛，从个人电脑到便携式音响，都需要一种可靠的解决方案来保护扬声器免受过载信号的损害。芯谷的D2761音频限幅器正是为这一需求而设计。一、D2761简介D2761是一款专为保护扬声器设计的音频限幅器。它通过外接电阻调节限幅值，能够灵活适应不同的应用场景和扬声器特性。该芯片采用SSOP10、MSOP
Neovim 集成 DeepSeek & Copilot 双 AI 编程神器
目前Neovim中的AI插件，比较火的就属avante.nvim和codecompanion.nvim了，经过简单的测试我选择了后者。因为avante.nvim相对来说有些复杂，依赖组件过多，侵略性较强,光readme中列出的KeyBindings就有好多。还用到了Leader键，我不是很喜欢被强制快捷键，如果与我的习惯键冲突就麻烦了，让我改我一时又不知道改成什么，心理负担较重。加上他的界面与我的
Ollama Open WebUI alden_ygq #大模型运维基础工具人工智能
OpenWebUI用户友好的AI界面（支持Ollama、OpenAIAPI等）。OpenWebUI支持多种语言模型运行器（如Ollama和OpenAI兼容API），并内置了用于检索增强生成（RAG）的推理引擎，使其成为强大的AI部署解决方案。OpenWebUI可自定义OpenAIAPIURL，连接LMStudio、GroqCloud、Mistral、OpenRouter等。OpenWebUI管理员
【YashanDB 知识库】如何处理报错"UDT column batch insert" 数据库运维
问题现象YashanDB中的ST_GEOMETRY类型是数据库内置的一种自定义类型，用于存储和访问符合开放地理空间信息联盟（OpenGeospatialConsortium，简称OGC）制定的SFASQL标准的几何对象。在批量插入（例如insertintoselect或使用yasldr导入数据）的时候，如果表有ST_GEOMETRY类型的字段，则会报错YAS-00004feature"UDTcol
Python poetry 虚拟环境 IT小学僧 Python 1024程序员节 python
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、Poetry是什么？二、使用步骤1.安装poetry2、初始化poetry3、创建虚拟环境启动和退出虚拟环境poetry常用指令总结一、Poetry是什么？Poetry是一个Python依赖管理和打包工具，它简化了项目的创建、依赖管理和发布流程。它的核心理念是将所有的依赖关系和项目配置集中在一个文件中，使得项目管理变得更加
芯谷D2038：高集成度六通道电子音量控制电路的音频解决方案青牛科技实业01 芯谷音视频单片机嵌入式硬件智能插头科技安防
在多通道音频系统中，音量控制的便捷性和精准性是提升用户体验的关键。芯谷科技推出的D2038是一款专为六通道音频功放设计的电子音量控制电路，凭借其高集成度和简单易用的特性，成为音频设备设计中的理想选择。一、D2038的核心特性1.高集成度与简洁设计D2038集成了六通道音量控制功能，外围元件极少，极大地简化了电路设计。这种设计不仅降低了布线复杂度，还减少了电路板占用空间，非常适合空间受限的音频设备。
项目上传github步骤虾饺爱下棋 github gitee git
上传到GitHub的步骤大致是这样的：1.添加文件到暂存区首先，你需要将你修改的文件添加到Git的暂存区。使用gitadd.可以将当前目录下的所有文件（包括新增文件和修改过的文件）添加到暂存区：gitadd.2.提交文件到本地仓库接下来，使用gitcommit提交你的更改。你可以为提交写一个简短的说明，描述此次提交的内容。例如：gitcommit-m"添加了新的训练模型"3.推送更改到远程仓库然后
2024-2025最新软考系统架构设计师的复习资料教材，解决如何快速高效通过该考试，试题的重点和难点在哪里？案例分析题和论文题的要点和踩坑点分析九张算数数字工匠系统架构学习方法职场和发展运维开发 pat考试考研面试
目录引言考试概述考试结构考试内容复习策略制定复习计划学习资源知识点详解系统架构基础设计原则与模式系统分析与设计软件开发过程项目管理系统集成性能与优化安全性设计新兴技术试题解析选择题案例分析题论文题重点与难点分析模拟试题与答案参考资料总结引言系统架构设计师考试是软考高级资格考试之一，旨在考察考生在系统架构设计领域的综合能力和专业知识。通过该考试可以获得系统架构设计师资格认证，对职业发展有重要意义。本
[Android开发] 工具篇--Docker使用 z4a1c2 Android开发实战 docker
Docker介绍Docker是一种容器工具，是一种轻量化的虚拟技术，可以支持高效便捷地创建和使用Linux容器，同时可以让开发者以便捷方式打包应用到一个可移植的容器中，然后安装至任何运行Linux或Windows等系统的服务器上。官网：https://www.docker.com/Docker基本概念Docker中有非常重要的三个基本概念：镜像（Image）、容器（Container）和仓库（Re
10天进阶webpack---（1）为什么要有webpack 青茶绿梅*2 webpack 前端 node.js
首先就是我们的代码是运行在浏览器上的，但是我们开发大多都是利用node进行开发的，在浏览器中并没有node提供的那些环境。这就造成了运行和开发上的不同步问题。-----引言浏览器模块化的问题：效率问题：精细的模块划分带来了更多的JS文件，更多的JS文件带来了更多的请求，降低了页面访问效率兼容性问题：浏览器目前仅支持ES6的模块化标准（不支持COMJS），存在兼容问题，当然目前其实只要不是特别老的浏
Oracle:这些查询结果不可更新，请包括 ROWID 或使用 SELECT ... FOR UPDATE 获得可更新结果。 TTc_ oracle 数据库
1、报错场景SELECTID,KWBM,KWMC,CJID,SJID,BMNBBH,0ASJB,''ASCKLXFROMYK_KWXXWHERE1=1andbmnbbh='2202'很多只使用过MySQL的朋友们，应该都使用过SQLYog和Navicat直接查询数据后修改。但是这在Oracle数据库的PLSQL中有所差别2.修改后可直接查询修改数据SELECTYK_KWXX.rowid，ID,KW
Acwing798. 差分矩阵理工大猪猪算法基础课算法矩阵算法 c++二维差分
输入一个n行m列的整数矩阵，再输入q个操作，每个操作包含五个整数x1,y1,x2,y2,c，其中(x1,y1)和(x2,y2)表示一个子矩阵的左上角坐标和右下角坐标。每个操作都要将选中的子矩阵中的每个元素的值加上c。请你将进行完所有操作后的矩阵输出。输入格式第一行包含整数n,m,q。接下来n行，每行包含m个整数，表示整数矩阵。接下来q行，每行包含5个整数x1,y1,x2,y2,c，表示一个操作。输
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS