happiless

基于XGBoost的分类预测

一. 学习知识点概要

1.1 XGBoost的介绍

优点

1. 简单易用。相对其他机器学习库，用户可以轻松使用XGBoost并获得相当不错的效果。
2. 高效可扩展。在处理大规模数据集时速度快效果好，对内存等硬件资源要求不高。
3. 鲁棒性强。相对于深度学习模型不需要精细调参便能取得接近的效果。
4. XGBoost内部实现提升树模型，可以自动处理缺失值。

缺点：

1. 相对于深度学习模型无法对时空位置建模，不能很好地捕获图像、语音、文本等高维数据。
2. 在拥有海量训练数据，并能找到合适的深度学习模型时，深度学习的精度可以遥遥领先XGBoost。

1.2 XGboost的应用

例如商店销售额预测、高能物理事件分类、web文本分类;用户行为预测、运动检测、广告点击率预测、恶意软件分类、灾害风险预测、在线课程退学率预测

1.3 学习目标

1. 了解 XGBoost 的参数与相关知识
2. 掌握 XGBoost 的Python调用并将其运用到天气数据集预测

1.4 代码流程

Step1: 库函数导入
Step2: 数据读取/载入
Step3: 数据信息简单查看
Step4: 可视化描述
Step5: 对离散变量进行编码
Step6: 利用 XGBoost 进行训练与预测
Step7: 利用 XGBoost 进行特征选择
Step8: 通过调整参数获得更好的效果

二. 学习内容

Step1库函数导入

import numpy as np 
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

数据的各个特征描述如下：

特征名称	意义	取值范围
Date	日期	字符串
Location	气象站的地址	字符串
MinTemp	最低温度	实数
MaxTemp	最高温度	实数
Rainfall	降雨量	实数
Evaporation	蒸发量	实数
Sunshine	光照时间	实数
WindGustDir	最强的风的方向	字符串
WindGustSpeed	最强的风的速度	实数
WindDir9am	早上9点的风向	字符串
WindDir3pm	下午3点的风向	字符串
WindSpeed9am	早上9点的风速	实数
WindSpeed3pm	下午3点的风速	实数
Humidity9am	早上9点的湿度	实数
Humidity3pm	下午3点的湿度	实数
Pressure9am	早上9点的大气压	实数
Pressure3pm	早上3点的大气压	实数
Cloud9am	早上9点的云指数	实数
Cloud3pm	早上3点的云指数	实数
Temp9am	早上9点的温度	实数
Temp3pm	早上3点的温度	实数
RainToday	今天是否下雨	No，Yes
RainTomorrow	明天是否下雨	No，Yes

Step2：数据读取/载入

data = pd.read_csv('./data/train.zip', compression='zip')

Step3：数据信息简单查看

data.head()
data.info()
data['RainTomorrow'].value_counts()
data.describe()

Step4:可视化描述

# 数字特征
numerical_features = [x for x in train_data.columns if data[x].dtype == np.float]
# 类别特征
category_features = [x for x in data.columns if data[x].dtype != np.float and x != 'RainTomorrow']

# 选取三个特征与标签组合的散点可视化
# 在2D情况下不同的特征组合对于第二天下雨与不下雨的散点分布，以及大概的区分能力。相对的Sunshine与其他特征的组合更具有区分能力
sns.pairplot(data=data[['Rainfall', 'Evaporation', 'Sunshine'] + ['RainTomorrow']], diag_kind='hist', hue= 'RainTomorrow')
plt.show()

# 利用箱型图我们也可以得到不同类别在不同特征上的分布差异情况。我们可以发现Sunshine,Humidity3pm,Cloud9am,Cloud3pm的区分能力较强
for col in data[numerical_features].columns:
    if col != 'RainTomorrow':
        sns.boxplot(x='RainTomorrow', y=col, saturation=0.5, palette='pastel', data=data)
        plt.title(col)
        plt.show()

# 可以发现不同地区降雨情况差别很大，有些地方明显更容易降雨
tlog = {}
for i in category_features:
    tlog[i] = data[data['RainTomorrow'] == 'Yes'][i].value_counts()
flog = {}
for i in category_features:
    flog[i] = data[data['RainTomorrow'] == 'No'][i].value_counts()

plt.figure(figsize=(10,10))
plt.subplot(1,2,1)
plt.title('RainTomorrow')
sns.barplot(x = pd.DataFrame(tlog['Location']).sort_index()['Location'], y = pd.DataFrame(tlog['Location']).sort_index().index, color = "red")
plt.subplot(1,2,2)
plt.title('Not RainTomorrow')
sns.barplot(x = pd.DataFrame(flog['Location']).sort_index()['Location'], y = pd.DataFrame(flog['Location']).sort_index().index, color = "blue")
plt.show()

# 可以发现，今天下雨明天不一定下雨，但今天不下雨，第二天大概率也不下雨
plt.figure(figsize=(10,2))
plt.subplot(1,2,1)
plt.title('RainTomorrow')
sns.barplot(x = pd.DataFrame(tlog['RainToday'][:2]).sort_index()['RainToday'], y = pd.DataFrame(tlog['RainToday'][:2]).sort_index().index, color = "red")
plt.subplot(1,2,2)
plt.title('Not RainTomorrow')
sns.barplot(x = pd.DataFrame(flog['RainToday'][:2]).sort_index()['RainToday'], y = pd.DataFrame(flog['RainToday'][:2]).sort_index().index, color = "blue")
plt.show()

Step5:对离散变量进行编码

由于XGBoost无法处理字符串类型的数据，我们需要一些方法讲字符串数据转化为数据。一种最简单的方法是把所有的相同类别的特征编码成同一个值，例如女=0，男=1，狗狗=2，所以最后编码的特征值是在 $[0, 特征数量 - 1]$ 之间的整数。除此之外，还有独热编码、求和编码、留一法编码等等方法可以获得更好的效果。

## 把所有的相同类别的特征编码为同一个值
def get_mapfunction(x):
    mapp = dict(zip(x.unique().tolist(),
         range(len(x.unique().tolist()))))
    def mapfunction(y):
        if y in mapp:
            return mapp[y]
        else:
            return -1
    return mapfunction
for i in category_features:
    data[i] = data[i].apply(get_mapfunction(data[i]))

Step6：利用 XGBoost 进行训练与预测

# 为了正确评估模型性能，将数据划分为训练集和测试集，并在训练集上训练模型，在测试集上验证模型性能。
from sklearn.model_selection import train_test_split

# 选择其类别为0和1的样本 （不包括类别为2的样本）
data_target_part = data['RainTomorrow']
data_features_part = data[[x for x in data.columns if x != 'RainTomorrow']]

# 测试集大小为20%， 80%/20%分
x_train, x_test, y_train, y_test = train_test_split(data_features_part, data_target_part, test_size = 0.2, random_state = 2020)

# 导入XGBoost模型
from xgboost.sklearn import XGBClassifier
# 定义 XGBoost模型 
clf = XGBClassifier()
# 在训练集上训练XGBoost模型
clf.fit(x_train, y_train)

# 在训练集和测试集上分布利用训练好的模型进行预测
train_predict = clf.predict(x_train)
test_predict = clf.predict(x_test)
from sklearn import metrics

# 利用accuracy（准确度）【预测正确的样本数目占总预测样本数目的比例】评估模型效果
print('The accuracy of the Logistic Regression is:',metrics.accuracy_score(y_train,train_predict))
print('The accuracy of the Logistic Regression is:',metrics.accuracy_score(y_test,test_predict))

# 查看混淆矩阵 (预测值和真实值的各类情况统计矩阵)
confusion_matrix_result = metrics.confusion_matrix(test_predict,y_test)
print('The confusion matrix result:\n',confusion_matrix_result)

# 利用热力图对于结果进行可视化
plt.figure(figsize=(8, 6))
sns.heatmap(confusion_matrix_result, annot=True, cmap='Blues')
plt.xlabel('Predicted labels')
plt.ylabel('True labels')
plt.show()

Step7: 利用 XGBoost 进行特征选择

XGBoost的特征选择属于特征选择中的嵌入式方法，在XGboost中可以用属性feature_importances_去查看特征的重要度。
我们还可以使用XGBoost中的下列重要属性来评估特征的重要性。
- weight:是以特征用到的次数来评价
- gain:当利用特征做划分的时候的评价基尼指数
- cover:利用一个覆盖样本的指标二阶导数（具体原理不清楚有待探究）平均值来划分。
- total_gain:总基尼指数
- total_cover:总覆盖

from sklearn.metrics import accuracy_score
from xgboost import plot_importance

def estimate(model,data):

    #sns.barplot(data.columns,model.feature_importances_)
    ax1=plot_importance(model,importance_type="gain")
    ax1.set_title('gain')
    ax2=plot_importance(model, importance_type="weight")
    ax2.set_title('weight')
    ax3 = plot_importance(model, importance_type="cover")
    ax3.set_title('cover')
    plt.show()
def classes(data,label,test):
    model=XGBClassifier()
    model.fit(data,label)
    ans=model.predict(test)
    estimate(model, data)
    return ans
 
ans=classes(x_train,y_train,x_test)
pre=accuracy_score(y_test, ans)
print('acc=',accuracy_score(y_test,ans))

Step8: 通过调整参数获得更好的效果

XGBoost中包括但不限于下列对模型影响较大的参数：
- 1.learning_rate: 有时也叫作eta，系统默认值为0.3。每一步迭代的步长，很重要。太大了运行准确率不高，太小了运行速度慢。
- 2.subsample：系统默认为1。这个参数控制对于每棵树，随机采样的比例。减小这个参数的值，算法会更加保守，避免过拟合, 取值范围零到一。
- 3.colsample_bytree：系统默认值为1。我们一般设置成0.8左右。用来控制每棵随机采样的列数的占比(每一列是一个特征)。
- 4.max_depth：系统默认值为6，我们常用3-10之间的数字。这个值为树的最大深度。这个值是用来控制过拟合的。max_depth越大，模型学习的更加具体。
调节模型参数的方法有贪心算法、网格调参、贝叶斯调参等。这里我们采用网格调参，它的基本思想是穷举搜索：在所有候选的参数选择中，通过循环遍历，尝试每一种可能性，表现最好的参数就是最终的结果

# 从sklearn库中导入网格调参函数
from sklearn.model_selection import GridSearchCV

# 定义参数取值范围
learning_rate = [0.1, 0.3, 0.6]
subsample = [0.8, 0.9]
colsample_bytree = [0.6, 0.8]
max_depth = [3,5,8]

parameters = { 'learning_rate': learning_rate,
              'subsample': subsample,
              'colsample_bytree':colsample_bytree,
              'max_depth': max_depth}
model = XGBClassifier(n_estimators = 50)

# 进行网格搜索
clf = GridSearchCV(model, parameters, cv=3, scoring='accuracy',verbose=1,n_jobs=-1)
clf = clf.fit(x_train, y_train)

# 网格搜索后的最好参数为
clf.best_params_

# 在训练集和测试集上分布利用最好的模型参数进行预测

# 定义带参数的 XGBoost模型 
clf = XGBClassifier(colsample_bytree = 0.6, learning_rate = 0.3, max_depth= 8, subsample = 0.9)
# 在训练集上训练XGBoost模型
clf.fit(x_train, y_train)

train_predict = clf.predict(x_train)
test_predict = clf.predict(x_test)

# 利用accuracy（准确度）【预测正确的样本数目占总预测样本数目的比例】评估模型效果
print('The accuracy of the Logistic Regression is:',metrics.accuracy_score(y_train,train_predict))
print('The accuracy of the Logistic Regression is:',metrics.accuracy_score(y_test,test_predict))

# 查看混淆矩阵 (预测值和真实值的各类情况统计矩阵)
confusion_matrix_result = metrics.confusion_matrix(test_predict,y_test)
print('The confusion matrix result:\n',confusion_matrix_result)

# 利用热力图对于结果进行可视化
plt.figure(figsize=(8, 6))
sns.heatmap(confusion_matrix_result, annot=True, cmap='Blues')
plt.xlabel('Predicted labels')
plt.ylabel('True labels')
plt.show()

三、XGBoost 原理粗略讲解

XGBoost底层实现了GBDT算法，并对GBDT算法做了一系列优化：
- 1.对目标函数进行了泰勒展示的二阶展开，可以更加高效拟合误差。
- 2.提出了一种估计分裂点的算法加速CART树的构建过程，同时可以处理稀疏数据。
- 3.提出了一种树的并行策略加速迭代。
- 4.为模型的分布式算法进行了底层优化。
XGBoost是基于CART树的集成模型，它的思想是串联多个决策树模型共同进行决策。
那么如何串联呢？XGBoost采用迭代预测误差的方法串联。举个通俗的例子，我们现在需要预测一辆车价值3000元。我们构建决策树1训练后预测为2600元，我们发现有400元的误差，那么决策树2的训练目标为400元，但决策树2的预测结果为350元，还存在50元的误差就交给第三棵树……以此类推，每一颗树用来估计之前所有树的误差，最后所有树预测结果的求和就是最终预测结果！
XGBoost的基模型是CART回归树，它有两个特点：
- （1）CART树，是一颗二叉树。
- （2）回归树，最后拟合结果是连续值。
XGBoost模型可以表示为以下形式，我们约定 $f_t(x)$ 表示前 $t$ 颗树的和， $h_t(x)$ 表示第 $t$ 颗决策树，模型定义如下：

$f_{t}(x)=\sum_{t=1}^{T} h_{t}(x)$

由于模型递归生成，第 $t$ 步的模型由第 $t - 1$ 步的模型形成，可以写成：

$f_{t}(x)=f_{t-1}(x)+h_{t}(x)$

每次需要加上的树 $h_t(x)$ 是之前树求和的误差：

$r_{t, i}=y_{i}-f_{m-1}\left(x_{i}\right)$

我们每一步只要拟合一颗输出为 $r_{t,i}$ 的CART树加到 $f_{t-1}(x)$ 就可以了。

四、模型常用参数

1. eta [默认0.3]    
通过为每一颗树增加权重，提高模型的鲁棒性。   
典型值为0.01-0.2。   

2. min_child_weight [默认1]    
决定最小叶子节点样本权重和。    
这个参数可以避免过拟合。当它的值较大时，可以避免模型学习到局部的特殊样本。    
但是如果这个值过高，则会导致模型拟合不充分。  

3. max_depth [默认6]     
这个值也是用来避免过拟合的。max_depth越大，模型会学到更具体更局部的样本。        
典型值：3-10     

4. max_leaf_nodes      
树上最大的节点或叶子的数量。   
可以替代max_depth的作用。 
这个参数的定义会导致忽略max_depth参数。    

5. gamma [默认0]      
在节点分裂时，只有分裂后损失函数的值下降了，才会分裂这个节点。Gamma指定了节点分裂所需的最小损失函数下降值。
这个参数的值越大，算法越保守。这个参数的值和损失函数息息相关。   

6. max_delta_step [默认0]    
这参数限制每棵树权重改变的最大步长。如果这个参数的值为0，那就意味着没有约束。如果它被赋予了某个正值，那么它会让这个算法更加保守。   
但是当各类别的样本十分不平衡时，它对分类问题是很有帮助的。   

7. subsample [默认1]     
这个参数控制对于每棵树，随机采样的比例。   
减小这个参数的值，算法会更加保守，避免过拟合。但是，如果这个值设置得过小，它可能会导致欠拟合。    
典型值：0.5-1   
  
8. colsample_bytree [默认1]    
用来控制每棵随机采样的列数的占比(每一列是一个特征)。   
典型值：0.5-1   

9. colsample_bylevel [默认1]   
用来控制树的每一级的每一次分裂，对列数的采样的占比。   
subsample参数和colsample_bytree参数可以起到相同的作用，一般用不到。

10. lambda [默认1]    
权重的L2正则化项。(和Ridge regression类似)。    
这个参数是用来控制XGBoost的正则化部分的。虽然大部分数据科学家很少用到这个参数，但是这个参数在减少过拟合上还是可以挖掘出更多用处的。    

11. alpha [默认1]    
权重的L1正则化项。(和Lasso regression类似)。  
可以应用在很高维度的情况下，使得算法的速度更快。     

12. scale_pos_weight [默认1]    
在各类别样本十分不平衡时，把这个参数设定为一个正值，可以使算法更快收敛。

Eigen知识点1：数组、向量初始化星辰和大海都需要门票 Eigen c++矩阵开发语言
1知识点总结：（1）数组初始化Eigen::MatrixXdm(2,2);m(0,0)=1;m#includeusingnamespaceEigen;usingnamespacestd;intmain(intargc,char*argv[]){ros::init(argc,argv,"eigen01");ros::NodeHandlenh;//Eigen提供的初始化方法——逗号初始化法//知识点1
kafka 生产者发送流程 jxj_cd mysql 数据库
Kafka是由Apache软件基金会开发的一个开源流处理平台，由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者在网站中的所有动作流数据。kafka的基础架构：Kafka生产者发送流程详解:拦截器序列化器分区器生产者端由两个线程协调完成，分别是main线程和Sender线程。main线程在将消息通过拦截器、序列化器和分区器处理后缓存到消息累加器（Reco
Qt调用ffmpeg库录屏并进行UDP组播推流 daqinzl 流媒体 qt ffmpeg qt ffmpeg UDP组播推流
基于以下参考链接，采用其界面和程序框架，实现实时推送UDP组播视频流，替换原拉流功能https://blog.csdn.net/u012532263/article/details/102736700源码在windows（qt-opensource-windows-x86-5.12.9.exe）、ubuntu20.04.6(x64)(qt-opensource-linux-x64-5.12.12.
学习GO语言第三天--指针、标识符和关键字 ?????????????! Go开发学习 go 开发语言安全网络网络安全 web安全
学习永无止境！！！目录一、指针的基本使用1.基本数据类型和内存2.指针变量和内存3.总结二、标识符的使用1.标识符的定义2.标识符定义规则3.起名规则三、关键字和预定义标识符1.关键字2.预定义标识符总结前言本文详细介绍了Go语言中的指针的基本使用、标识符的使用，以及记录了Go语言中的关键字和预定义标识符。一、指针的基本使用1.基本数据类型和内存代码示例packagemainimport"fmt"
ubuntu中PHP xdebug 断点调试 knight11112
1.php.ini添加xdebug模块1.1安装xdebugsudoapt-getinstallphp5.6-xdebug1.2.查询扩展路径find/etc/-name"xdebug.ini"一开始不带*精确查找不到，结果如下：/etc/php/5.6/cli/conf.d/20-xdebug.ini/etc/php/5.6/mods-available/xdebug.ini/etc/php/5
xgboost在spark集群使用指南一颗小草333 算法 mapreduce spark 数据挖掘
简介XGBoost是一个优化的分布式梯度增强库，具有高效、灵活和可移植性。在梯度增强框架下实现了机器学习算法。XGBoost提供了一种并行树增强(也称为GBDT、GBM)，可以快速、准确地解决许多数据科学问题。相同的代码在主要的分布式环境(Hadoop、SGE、MPI)上运行，可以解决数十亿个示例的训练问题。xgb相对于gbt所做的改进：1.2.3.XGBoost可以使用R、python、java
6-scala特质 qwy715229258163 scala scala 开发语言后端
特质(Traits)用于在类(Class)之间共享程序接口(Interface)和字段(Fields)。它们类似于Java8的接口。类和对象(Objects)可以扩展特质，但是特质不能被实例化，因此特质没有参数。定义一个特质最简化的特质就是关键字trait+标识符：traitHairColor特征作为泛型类型和抽象方法非常有用。traitIterator[A]{defhasNext:Boolean
JAVA中contains函数的用法(字符) 艾诺_Aynor 学习笔记 JAVA JAVA JAVA基础 contains
booleancontains(CharSequences):判断指定内容中是否包含括号中的内容;一般推荐把常量字符串写在前面,变量写在后面.
Python 3 中使用 SMTP 发送邮件：高级技巧与应用三带俩王 python 网络服务器
在现代的软件开发和自动化流程中，发送电子邮件是一项常见的任务。Python3提供了强大的工具来实现这一功能，特别是通过使用SMTP（SimpleMailTransferProtocol）协议。本文将深入探讨Python3中使用SMTP发送邮件的高级用法，展示其在不同场景下的灵活性和强大功能。一、SMTP简介SMTP是一种用于发送电子邮件的协议。它允许客户端（如Python程序）与邮件服务器进行通信
Python 在股票分析中的高级应用：挖掘金融数据的深度洞察三带俩王 python 金融开发语言
在当今的金融世界中，股票分析是投资者和金融从业者必备的技能。Python作为一种强大且灵活的编程语言，为股票分析提供了丰富的工具和技术。本文将深入探讨使用Python进行股票分析的高级用法，涵盖从数据获取与清洗、高级分析指标计算到机器学习和深度学习在股票分析中的应用等多个方面。一、数据获取与预处理：构建坚实的分析基础1.数据来源与获取直接从证券交易所获取数据：许多证券交易所提供了数据接口，例如，上
如何在 Ubuntu 18.04 上升级 gcc 到 9.4：一步步详细指南草莓奶忻 #Linux ubuntu linux 运维 c++
文章目录问题描述问题解决1.添加Toolchain测试PPA2.安装GCC和G++3.更新替代版本4.验证安装5.出现报错在执行sudoaptinstallgcc-9g++-9时，出现以下报错。解决方案更换默认的Ubuntu软件源问题描述在尝试编译PyTorch时遇到的报错提示需要GCC版本9.3或更高，但系统中安装的是版本7.5.0。因此，需要升级GCC到至少9.3版本。damon@damon-
【AI非常道】二零二五年一月，AI非常道 bylander AI非常道人工智能
经常在社区看到一些非常有启发或者有收获的话语，但是，往往看过就成为过眼云烟，有时再想去找又找不到。索性，今年开始，看到好的言语，就记录下来，一月一发布，亦供大家参考。有关AI非常之言语，即AI非常道！《思考，快与慢》视觉笔记byDanielKahneman来自微博@爱可可-爱生活大脑的两种思维模式：快与慢，就像一对默契的搭档，却各自有着截然不同的个性。快思维（系统1）是我们的“本能反应手”：它感性
【AI工具】夸克AI试用：分析DeepSeek-V3技术报告 bylander AI工具 AI学习 AI论文阅读人工智能学习 gpt
安装了夸克AI，试用了一下AI总结功能，导入了DeepSeekV3的技术报告，使用了文章总结、问题提问、脑图、大纲等功能还不错，尤其是几个问题提问，回答的都不错，而且数学公司都是标准的markdown格式，不乱码，这一点就比其他的AI工具强。下面是分析的具体内容》AI文件总结DeepSeek-V3技术报告分析报告引言DeepSeek-V3是一个拥有6710亿参数的专家混合（MoE）语言模型，每次生
AI驱动内容跨媒体转换新机遇 XianxinMao 人工智能
标题：AI驱动内容跨媒体转换新机遇文章信息摘要：文章深入探讨了AI工具在内容跨媒体转换中的应用价值。这类工具能将文本快速转换为音频和视频内容，显著降低了制作门槛和成本，月费用仅需10-50美元。通过多模态内容分发，创作者可以满足不同用户的内容消费偏好，提升内容可访问性，增加曝光机会。AI工具的自动化特性不仅节省了创作者的时间和精力，还能保证较高的输出质量，为内容创作行业带来新的机遇和可能性。===
数据结构与算法之哈希表: LeetCode 217. 存在重复元素 (Ts版) Wang's Blog Data Structure and Algorithms leetcode 算法
存在重复元素https://leetcode.cn/problems/contains-duplicate/description/描述给你一个整数数组nums。如果任一值在数组中出现至少两次，返回true；如果数组中每个元素互不相同，返回false示例1输入：nums=[1,2,3,1]输出：true解释：元素1在下标0和3出现示例2输入：nums=[1,2,3,4]输出：false解释：所有元
智能电动汽车 --- 人工智能（AI）入门车载诊断技术思考汽车行业人工智能智能电动汽车的三智和三电开发语言数据结构架构智能电动汽车人工智能（AI）入门
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
AI大模型书籍推荐丨这本书必看：大语言模型基础与前沿（附PDF） LLM教程人工智能大模型 LLM 程序员自然语言处理 AI大模型编程
哈喽大家好！很久都没有更新大模型这块的书了，今天给大家说一下这本：《大语言模型：基础与前沿》，本书深入阐述了大语言模型的基本概念和算法、研究前沿以及应用，涵盖大语言模型的广泛主题，从基础到前沿，从方法到应用，涉及从方法论到应用场景方方面面的内容。作者简介熊涛，美国明尼苏达大学双城分校电子与计算机工程博士。曾在多家中美知名高科技公司担任高级管理职位和首席科学家，在人工智能的多个领域，包括大语言模型、
Java基础——函数（方法） AYANGIJ java 开发语言 intellij-idea
函数的出现在目前为止的开发实现中，我们的代码都在main方法中，从上到下进行编写。在此模式下，程序结构会随着功能复杂度的增加而越来越复杂。在代码中会有不连续的出现重复性代码，无法用循环解决。为了简化代码以及程序的结构，把这些不连续的重复性代码提取出来，封装为一个方法（函数），并且为之取名。在需要用到该方法（函数）代码的位置去调用该方法（函数）。方法（函数）初步出现，函数出现之后，有一些显而易见的好
2024年AI发展的感知回顾八角Z 人工智能机器学习计算机视觉大数据
2024年，人工智能（AI）的发展呈现出诸多引人注目的关键词，深刻地塑造着技术格局、经济模式以及人类社会的方方面面。混合无疑成为这一年AI创新历程中最为显著的特征之一。多模态生成技术在这一年里取得了令人瞩目的不断进步，使得AI能够巧妙地将文本、图像、音频、视频等多种模态的信息进行深度融合与再创造。例如：AI内容创作：AI可以将作者的文字描述转换为生动的图像、视频和配乐，为创作提供更多可能性，让创意
Apache Airflow 2.1.2：开源工作流管理系统的全面指南銀河鐵道的企鵝
本文还有配套的精品资源，点击获取简介：ApacheAirflow2.1.2是一个开源的工作流管理系统，用于编排、调度和监控复杂的业务逻辑。它基于DAG（有向无环图）概念，通过Python代码定义任务的Operator，定义任务的执行顺序和条件。该版本提供了任务调度、监控、错误处理、插件扩展和多环境管理等核心功能。解压后包含许可证文件、文档和源代码目录等，且介绍了安装和运行步骤。Airflow适用于
AI 智能体：探索自主智能的世界后端人工智能
AI智能体：探索自主智能的世界想象一下，在这样一个世界里，软件自身可以自主地与环境交互，根据收集的数据做出决策，并以最少的人工干预来执行任务。这些AI智能体正在彻底改变行业并改变我们的生活方式。但究竟什么是AI智能体，它们是如何工作的？在这篇文章中，我们将探讨AI智能体的世界、它们的类型、功能、优势、挑战和现实生活中的应用。一了解AI智能体关键要点AI智能体是与环境交互并做出决策以实现目标的自主系
AI赋能生成式低代码开启研发平台智能化新篇章——原华为AI专家朱鹏喜先生加入飞速创软共铸低代码智能化蓝图数据库前端后端服务器
2023年7月，飞速创软任命原华为AI专家朱鹏喜先生为公司高级副总裁兼技术研发总经理，全面负责【飞速低代码平台】产品规划、技术、研发中心的管理等。朱鹏喜先生毕业于武汉大学计算机科学与技术系，是武汉大学深圳计算机分会理事，拥有6项发明专利。曾在华为历任CRM/IPCC/终端全场景AI等产品负责人，深耕产品0-1规划及全生命周期管理、AI技术及应用等领域；而后任奥哲首席产品官CPO时，在国内首次提出领
SpringAI 搭建智能体（二）：搭建客服系统智能体 drebander AI 编程 springAI Agent
在现代人工智能应用中，智能体（Agent）是一个重要的概念，它的核心能力是自主性与灵活性。一个智能体不仅能够理解用户的需求，还能拆解任务、调用工具完成具体操作，并在复杂场景中高效运行。在本篇博客中，我们将围绕一个基于SpringAI的智能体实现，深入探讨智能体的概念、构建流程以及实际应用场景。1.什么是智能体？智能体是一种能够根据目标自主执行任务的系统。与传统的AI模型生成内容的模式不同，智能体通
支持生成式 AI：聊天与文档检索的结合 drebander AI 编程人工智能 springAI
生成式AI已成为现代应用的重要组成部分，从实时聊天到文档检索，再到智能问答系统，其核心是能够理解上下文并生成有用的回答。在生成式AI中，聊天会话内存（ChatConversationMemory）和检索增强生成（RAG,RetrievalAugmentedGeneration）是两个关键功能，分别解决了上下文管理和大规模文档检索问题。本文将介绍SpringAI如何支持这两个功能，并通过实际应用场景
Evaluation of OpenAI o1: Opportunities and Challenges of AGI UnknownBody LLM Daily LLM Evaluation agi 人工智能大数据语言模型
本文是LLM系列文章，针对《EvaluationofOpenAIo1:OpportunitiesandChallengesofAGI》的翻译。OpenAIo1评估：AGI的机遇和挑战摘要1引言1.1背景：o1的新功能2研究范围和使用的公共数据集3相关工作4实验和观察5讨论5.1LLMAgents和o1：推进科学与工程中的问题解决6结论摘要这项全面的研究评估了OpenAI的o1-preview大型语
【Wordpress网站制作】无法安装插件/主题等权限问题 TUTO_TUTO wordpress 有用没用小功能 apache apache 服务器 linux
前言自学笔记，解决问题为主，亲测有效，欢迎补充。本文重点：解决无法安装插件/主题问题问题描述：OS系统，XAMPP+Wordpress，在安装【插件】和下载【主题/模版】的时候，遇到以下问题。Installationfailed:Couldnotcreatedirectory./Applications/XAMPP/xamppfiles/htdocs/mactestwp/wp-content/up
大语言模型应用指南：OpenAI大语言模型简介 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型应用指南：OpenAI大语言模型简介1.背景介绍1.1问题的由来在过去几年中,自然语言处理(NLP)领域取得了长足的进步,这主要归功于大型语言模型(LargeLanguageModels,LLMs)的出现和发展。LLMs是一种基于深度学习的人工智能模型,能够从大量文本数据中学习语言模式和语义关系,从而生成看似人类写作的自然语言输出。随着计算能力和数据可用性的不断提高,LLMs的规模也在不
飞牛NAS新增虚拟机功能，如果使用虚拟机网卡直通安装ikuai软路由（如何解决OVS网桥绑定失败以及打开ovs后无法访问飞牛nas等问题） xiaoqiangclub 随记·2025✍️ikuai 飞牛nas fnos 虚拟机网卡直通软路由
文章目录介绍演示环境飞牛NAS虚拟机安装爱快教程️前期准备网络要求下载爱快镜像开始安装开启IOMMU直通配置网络解决OVS网桥绑定失败以及打开ovs后无法访问飞牛nas等问题➕创建虚拟机安装ikuai进入VNC⚙️配置ikuai登录ikuai后台⚓️相关链接⚓️介绍各位飞牛NAS的用户们，你们是不是也和我一样，对最近飞牛NAS新推出的虚拟机功能激动不已？千呼万唤始出来，飞牛终于加入了虚拟机的大军，
算法竞赛入门经典（第二版）第二章循环结构程序设计注解与习题下土豆呀土豆算法竞赛入门经典算法竞赛 ACM
2-4子序列的和输入两个正整数nintmain(){intn,m;doublea;while(scanf("%d%d",&n,&m)!=EOF&&n&&m){a=0.0;for(longlongi=n;i<=m;i++)//若变为int类型则，会有乘法溢出的问题{doubleb=i*i;a+=1/b;}printf("%.5f\n",a);}}2.5分数化小数输入正整数a,b,c，输出a/b的小数
Redis service failed to start的解决方法关关钧 redis 数据库 python
当进入cmd后，运行命令启动redis服务：redis-server.exe--service-start--service-nameredisserver1然而却报错了：Redisservicefailedtostart.解决方法：1、在解压的目录下找到redis.windows-service.conf2、打开redis.windows-service.conf，搜索logfile3、根据lo
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23