ClintLong

机械学习与R语言---决策树算法的实现与优化（Decision tree algorithm）

本篇需要使用的数据集为credit.csv,下载好并保存于R目录。

1.理解决策树算法

简而言之，决策树是一个分类器（classifier）。它利用树状结构，来对于特征以及潜在的结果之间的关系建立模型。如下图（来源网络）：

在决定是见于不见的时候，决策树给出了一些节点（node）来作为判断依据，至于这些节点是如何被找到的，内在的算法是什么，这个很难在这里讲清楚（而且严格地讲，我们每个人都可以不依赖R中已有的function而自己去编写决策树函数（并不会很难，如果你的逻辑简单的话）），但是决策树算法合适停下来却很容易理解：

a. 没有剩余的特征来分辨案例之间的区别

b.决策树已经达到预先定义的大小限制

2.此次的目的

credit.csv file里包含着的是1000个关于贷款的案例，我们的目的是希望建立模型来预测影响违约风险的因素。数据里面的变量很多，最关键的是最后一个default变量，Yes便是违约了，No便是没有违约。

正如很多在R中的函数一样，决策树函数在R中也不仅仅是一个表达式，这里介绍一个较为常见的包和function，C5.0算法。

这个算法的内在逻辑可以自行上网查阅（切记，没有任何一种算法是绝对好的，我们并不需要找出什么时候哪个算法更好，也没必要，只需要这个算法拟合度高便行）

install.packages( 'C50' )

library( C50 )  #安装c50包

读取我们已经下载好的csv文件：

credit <- read.csv("credit.csv"）

往往我们需要设置stringAsFactors= F 来使字符型数据不被设为因子（factor），我们可以先设置，然后再更具自己的需要一个个调整，但是这里我并没有设置，因为我需要将他们设置为factor。

3.准备工作-data clean

如果你多次尝试过自己完完整整的处理一个项目（数据由别人提供），你会发现，data cleaning将会占用你整个项目8成以上的时间，你需要不断地去清洗数据以达到你需要的最终结果，甚至很多时候结果不好仅仅是因为数据的清洗不到位。

dim(credit)  
head(credit)
tail(credit)
str(credit)
summary(credit)
which(!complete.cases(credit))

有一些步骤我们经常都要做，比如了解数据整体结构，看一看有没有缺失值，即使C5.0 的decision tree算法可以帮助我们处理缺失值，但是你仍然得去看看有没有缺失值，这有助于你了解数据的整体性。

> table(credit$default)  

 no yes 
700 300

整体而言，违约的人数是30%，所以在之后我们随机分类training data 和testing data的时候，这个大概的比例我们也应该记在心中，如果比例差距很大，建议再做一次随机分类。

进行数据分类：

set.seed(123)   #这一步是为了使你的结果和我的一样
train_sample <- sample(1000, 900)  

str(train_sample)

# split the data frames
credit_train <- credit[train_sample, ]  #训练组
credit_test  <- credit[-train_sample, ]  #测试组

prop.table(table(credit_train$default))  

       no       yes 
0.7033333 0.2966667 
prop.table(table(credit_test$default))

  no  yes 
0.67 0.33

我使用了set.seed（123）来建立伪随机，因为如果没有这个codes的话，你跑出来的结果肯定和我的不一样，因为下一步的sample是完全随机的。尽管的伪随机，但是和真正的随机机制没有什么区别。

可以看见，No的比例在70%左右， yes的比例也在30%左右，总体符合我们数据特点。

4.使用C5.0函数建立模型

之前我们已经安装了C50包，而里面的决策树模型函数是C5.0

credit_model <- C5.0(x= credit_train[-17], y= credit_train$default) #x为training data，去除
#17th column因为那是 我们需要的结果， y为class，必须是一个levels大于2的因子变量

> credit_model

Call:
C5.0.default(x = credit_train[-17], y = credit_train$default)

Classification Tree
Number of samples: 900   #900个samples
Number of predictors: 16 #使用了16个预测量（我们数据里面一共有17列，除去被我们去除的17列，就是说
#这里使用了全部变量，过拟合！！！）

Tree size: 57    #树的node有57个，也就是说57个分叉口

Non-standard options: attempt to group attributes

值得注意的是，这里使用了数据里面全部的列（16个）作为predictors，这也是决策树缺点之一：过拟合。后续的博客会提到的随机森林理论可以很好的解决这一点。

> summary(credit_model)

Call:
C5.0.default(x = credit_train[-17], y = credit_train$default)


C5.0 [Release 2.07 GPL Edition]  	Tue Jul 17 17:15:45 2018
-------------------------------

Class specified by attribute `outcome'

Read 900 cases (17 attributes) from undefined.data

Decision tree:

checking_balance in {> 200 DM,unknown}: no (412/50)
checking_balance in {< 0 DM,1 - 200 DM}:
:...credit_history in {perfect,very good}: yes (59/18)
    credit_history in {critical,good,poor}:
    :...months_loan_duration <= 22:
        :...credit_history = critical: no (72/14)
        :   credit_history = poor:
        :   :...dependents > 1: no (5)
        :   :   dependents <= 1:
        :   :   :...years_at_residence <= 3: yes (4/1)
        :   :       years_at_residence > 3: no (5/1)

这是决策树结果的一部分，告诉了我们nodes是如何被分类的。如第一行：checking_balance in {> 200 DM,unknown}: no (412/50)，告诉我们支票账户如果大于200 DM 或者unknown的时候，那么我们判断为不大可能违约，（412/50）表示412个案例符合这个判断， 50个案例违背了判断。你会发现这个判断似乎没有逻辑可言，>200可以理解为有存款，违约当然概率低。但是unknown却让人难以理解，这有可能是因为异常值导致的，又或者是这便是真实情况（也许unknown的人存款都很大，或者是某个地区统计的时候漏掉了，但是该地区属于富裕地区）。

5.评估模型

> # create a factor vector of predictions on test data
> credit_pred <- predict(credit_model, credit_test)
> # cross tabulation of predicted versus actual classes
> library(gmodels)
> CrossTable(credit_test$default, credit_pred,
+            prop.chisq = FALSE,  prop.c = FALSE,
+            dnn = c('actual default', 'predicted default'))

 
   Cell Contents
|-------------------------|
|                       N |
|           N / Row Total |
|         N / Table Total |
|-------------------------|

 
Total Observations in Table:  100 

 
               | predicted default 
actual default |        no |       yes | Row Total | 
---------------|-----------|-----------|-----------|
            no |        59 |         8 |        67 | 
               |     0.881 |     0.119 |     0.670 | 
               |     0.590 |     0.080 |           | 
---------------|-----------|-----------|-----------|
           yes |        19 |        14 |        33 | 
               |     0.576 |     0.424 |     0.330 | 
               |     0.190 |     0.140 |           | 
---------------|-----------|-----------|-----------|
  Column Total |        78 |        22 |       100 | 
---------------|-----------|-----------|-----------|

从结果而言，我们成功预测了100个测试案例中的73个，错误的预测中有8个守信案例（NO）被归为违约（YES），这是False possitive，有19个 False negative的案例。我们的结果看似有73%的正确率（不算糟糕），但是你如果把每一个结果都预测为NO的话，你也会有67%的正确率（和我们的就差7%），对比于我们的工作量而言，我们的预测可谓是毫无意义。更糟糕的是，我们的False negative预测有19个，占整体违约数量（33个）的 58%，这是非常糟糕的，是不能接受的。试想错误地高估了一个人的守信度会给银行带来多大的损失。

6. 提升模型性能

这里就可以提到C5.0 函数中的另一个argument：trails（an integer specifying the number of boosting iterations. A value of one indicates that a single model is used.）这是一个基于boosting的算法，正如R里面的描述，这是一种算法的集合，迭代。默认值为1，意味着我们只使用一种算法。通常我们将trails设为10，这已经通过实践检验可以提高精确度大概25%。

> credit_boost10 <- C5.0(credit_train[-17], credit_train$default,
+                        trials = 10)
> credit_boost10

Call:
C5.0.default(x = credit_train[-17], y = credit_train$default, trials
 = 10)

Classification Tree
Number of samples: 900 
Number of predictors: 16 

Number of boosting iterations: 10 
Average tree size: 47.5 

Non-standard options: attempt to group attributes

可以看见 average tree size变成了47.5，我们之前是57.而运行：

summary(credit_boost10)

Evaluation on training data (900 cases):

Trial	    Decision Tree   
-----	  ----------------  
	  Size      Errors  

   0	    56  133(14.8%)
   1	    34  211(23.4%)
   2	    39  201(22.3%)
   3	    47  179(19.9%)
   4	    46  174(19.3%)
   5	    50  197(21.9%)
   6	    55  187(20.8%)
   7	    50  190(21.1%)
   8	    51  192(21.3%)
   9	    47  169(18.8%)
boost	         34( 3.8%)   <<


	   (a)   (b)    <-classified as
	  ----  ----
	   629     4    (a): class no
	    30   237    (b): class yes

> credit_boost_pred10 <- predict(credit_boost10, credit_test)
> CrossTable(credit_test$default, credit_boost_pred10,
+            prop.chisq = FALSE, prop.c = FALSE, prop.r = FALSE,
+            dnn = c('actual default', 'predicted default'))

 
   Cell Contents
|-------------------------|
|                       N |
|         N / Table Total |
|-------------------------|

 
Total Observations in Table:  100 

 
               | predicted default 
actual default |        no |       yes | Row Total | 
---------------|-----------|-----------|-----------|
            no |        62 |         5 |        67 | 
               |     0.620 |     0.050 |           | 
---------------|-----------|-----------|-----------|
           yes |        13 |        20 |        33 | 
               |     0.130 |     0.200 |           | 
---------------|-----------|-----------|-----------|
  Column Total |        75 |        25 |       100 | 
---------------|-----------|-----------|-----------|

可以发现错误率变成了 18%， False Negative 和false possitive 的预测都降低了。

但是这就足够了吗？

尽管在预测不会违约的案例上表现的很好，但是也将本来会违约的人预测为了不会违约（13/33）39%的错误率，这里表现的并不满意。幸运的是，如果我们认为False negative是不能接受的，因为这很可能会导致银行大量的损失，那么我们有办法在C5.0上增加一个argument来达到这一个目的：

> # create dimensions for a cost matrix
> matrix_dimensions <- list(c("no", "yes"), c("no", "yes"))
> names(matrix_dimensions) <- c("predicted", "actual")
> matrix_dimensions
$`predicted`
[1] "no"  "yes"

$actual
[1] "no"  "yes"

> # build the matrix
> error_cost <- matrix(c(0, 1, 4, 0), nrow = 2, dimnames = matrix_dimensions)
> error_cost
         actual
predicted no yes
      no   0   4
      yes  1   0

以上建立了一个matrix，这是因为C5.0里面的参数costs必须等于一个matrix（a matrix of costs associated with the possible errors. The matrix should have C columns and rows where C is the number of class levels.），这里将false negative的代价设为了4， false possitive设为1（值可以根据需求来调整）

> # apply the cost matrix to the tree
> credit_cost <- C5.0(credit_train[-17], credit_train$default,
+                     costs = error_cost)
> credit_cost_pred <- predict(credit_cost, credit_test)
> CrossTable(credit_test$default, credit_cost_pred,
+            prop.chisq = FALSE, prop.c = FALSE, prop.r = FALSE,
+            dnn = c('actual default', 'predicted default'))

 
   Cell Contents
|-------------------------|
|                       N |
|         N / Table Total |
|-------------------------|

 
Total Observations in Table:  100 

 
               | predicted default 
actual default |        no |       yes | Row Total | 
---------------|-----------|-----------|-----------|
            no |        37 |        30 |        67 | 
               |     0.370 |     0.300 |           | 
---------------|-----------|-----------|-----------|
           yes |         7 |        26 |        33 | 
               |     0.070 |     0.260 |           | 
---------------|-----------|-----------|-----------|
  Column Total |        44 |        56 |       100 | 
---------------|-----------|-----------|-----------|

看见整体错误率在 37%，并没有提高（反而下降了），但是false negative的预测却降到了7个（你可以尝试不断改变代价值来达到你想要的结果），如果你觉得这个错误率是可以接受的，那么这个模型本身便可以被接受了。

ALL IN ALL

我们最终的预测存在一些不尽如人意的地方，如错误率仍然偏高， false negative的值还是太多等等，这真的印证了人心不可预测，或者是贷款人的一些其他重要信息没有被搜集（如借款的目的）。没有完美的模型，也没有百分百的预测，但是总体上讲，决策树模型只要满足了我们的需求，那么就是可以接受的（也许false negative的值足够低就行，因为银行不希望亏本）

本地AAA配置 23zhgjx-LSS 网络
实验拓扑图实验步骤（1）配置R1sys进入系统视图[Huawei]undoinfo-centerenable关闭路由器输出信息[Huawei]sysnameR1修改设备命名[R1]interfaceg0/0/0进入接口[R1-GigabitEthernet0/0/0]ipaddress192.168.1.124配置IP地址[R1-GigabitEthernet0/0/0]undoshutdown打
快速绘制数据库E-R图：教你一键绘制! ! ! ! 来自星星的坤数据库
引言在日常开发或设计数据库时，E-R图（实体-关系图）是必不可少的工具。然而，当面对十几个表的复杂数据库结构时，手工绘制E-R图不仅费时费力，还容易出错。今天，在时间紧迫的情况下，我意外发现了一个神器——MermaidLiveEditor，它可以通过代码的方式快速生成数据库E-R图，大幅提高效率。在这篇博客中，我将分享如何利用Mermaid语法来生成E-R图，并在MermaidLiveEditor
自动驾驶中控制模块状态机的作用与设计方法程序员龙一自动驾驶自动驾驶状态机 control
问题解答：一、车辆状态机在自动驾驶控制模块中的核心作用在自动驾驶系统中，状态机（StateMachine）是控制模块的核心逻辑框架，用于管理车辆在不同运行阶段的行为和状态切换。其核心优势体现在以下几个方面：1.系统行为的模块化与可维护性模块化分层管理：状态机将复杂的车辆行为（如启动、停车、紧急避障、车道保持等）分解为独立的状态模块。每个状态专注于单一功能（例如“车道保持”状态仅处理横向控制），降低
AI学习第二天--监督学习半监督学习无监督学习 iisugar 机器学习支持向量机人工智能
目录1.监督学习（SupervisedLearning）比喻：技术细节：形象例子：2.无监督学习（UnsupervisedLearning）比喻：技术细节：形象例子：3.半监督学习（Semi-SupervisedLearning）比喻：技术细节：形象例子：4.三者的对比与选择表格总结：5.实际案例对比案例：电商平台用户分群6.关键逻辑总结1.监督学习（SupervisedLearning）比喻：老
从FFmpeg命令行到Rust：多场景实战指南 Yeauty ffmpeg rust video-codec
FFmpeg作为功能强大的多媒体处理工具，被广泛应用于视频编辑、格式转换等领域。然而，直接使用FFmpeg的命令行界面（CLI）可能会遇到以下挑战：命令复杂度高：FFmpeg的命令行参数众多且复杂，初学者可能难以掌握，配置错误时调试困难。集成困难：在Rust等现代编程语言中，直接调用FFmpeg的C语言API需要处理复杂的内存管理和安全性问题，可能引发内存泄漏、非法访问等问题。为了解决这些问题，R
鸿蒙dialog、AlertDialog jian11058 harmonyos 鸿蒙华为
showHintDialog(){AlertDialog.show({message:$r('app.string.read_write_request_hint'),autoCancel:true,alignment:DialogAlignment.Center,gridCount:3,width:'92%',buttonDirection:DialogButtonDirection.HORIZ
CCF-CSP第30次认证第2题 --《重复局面》 RichardK. CSP c++学习矩阵
5081.重复局面-AcWing题库国际象棋在对局时，同一局面连续或间断出现3次或3次以上，可由任意一方提出和棋。国际象棋每一个局面可以用大小为8×8的字符数组来表示，其中每一位对应棋盘上的一个格子。六种棋子王、后、车、象、马、兵分别用字母k、q、r、b、n、p表示，其中大写字母对应白方、小写字母对应黑方。棋盘上无棋子处用字符*表示。两个字符数组的每一位均相同则说明对应同一局面。现已按上述方式整理
修剪二叉搜索树将有序数组转化为二叉搜索树把二叉搜索树转换为累加树默默修炼的小趴菜 c++算法开发语言
1.给定一个二叉搜索树，同时给定最小边界L和最大边界R。通过修剪二叉搜索树，使得所有节点的值在[L,R]中(R>=L)。你可能需要改变树的根节点，所以结果应当返回修剪好的二叉搜索树的新的根节点。#includeusingnamespacestd;structTreeNode{intval;TreeNode*left;TreeNode*right;TreeNode(intx){val=x;left=
程序员必看！DeepSeek全栈开发实战指南：从代码生成到性能优化 AI创享派后端
一、DeepSeek技术新突破：程序员效率革命（开篇结合最新技术动态）2025年2月25日，DeepSeek接连放出两大技术王牌：全球首个面向MoE模型的全栈通信库DeepEP开源，以及深度思考R1模型的全面升级。这两项技术突破对程序员群体意义重大：通信效率飞跃：DeepEP通过NVLink优化实现GPU间158GB/s传输速度，后端开发者训练大模型时可节省60%集群资源推理性能突破：R1模型在H
AIGC带来数据革命：R语言如何成为数据科学家的秘密武器？程序边界 AIGC r语言开发语言
文章目录一、R语言的基础特性1.1R语言的起源与发展1.2R语言的核心优势二、R语言在AIGC中的应用场景2.1数据预处理与清洗2.2文本分析与生成2.3机器学习与模型构建2.4数据可视化与报告生成三、R语言在AIGC中的具体案例3.1金融数据分析与预测3.2医疗数据分析与建模3.3社交媒体数据分析与情感分析四、R语言在AIGC中的未来展望4.1与深度学习框架的集成4.2与云计算平台的集成4.3与
【玩转正则表达式】Python、Go、Java正则表达式解释器的差异解析（附示例） ThisIsClark 玩转正则表达式正则表达式 java python golang
正则表达式作为文本处理的利器，在不同编程语言中的实现却暗藏玄机。Python、Go和Java作为主流开发语言，其正则引擎在语法支持、功能完整性和性能表现上存在显著差异。本文通过具体示例，揭示这些差异及应对策略。一、原始字符串与转义差异Python使用r""定义原始字符串，避免转义：importrere.findall(r'\d+','123a456')#输出['123','456']Go和Java
edger多组差异性分析_R语言统计分析微生物组数据 weixin_39961636 edger多组差异性分析
我在学习这本书记了一些笔记，如果你有学习，欢迎分享你的笔记或者教程。我的已有笔记汇总如下：宏基因组学习笔记宏基因组学习笔记2宏基因组笔记(第二章)R语言宏基因组学统计分析学习笔记(第三章-1)R语言宏基因组学统计分析学习笔记(第三章-2)https://link.springer.com/book/10.1007/978-981-13-1534-3下载方法，sci-hub大法啦。出版日期：2018
DeepSeek + 飞书多维表格：批量生成爆款文案 meisongqing 飞书人工智能 DeepSeek
一、操作步骤创建飞书多维表格登录飞书，新建多维表格，建议简化表格结构，保留核心列（如“链接”“关键词”“提示词”等）。设计智能字段：通过“字段类型”添加AI功能列，例如“标题生成”“金句提炼”“概要输出”等，调用DeepSeekR1处理数据。配置DeepSeekR1模型在表格中新增列，选择“DeepSeek-R1”作为字段类型，设置全局提示词（如“生成七言绝句”或“提炼文章核心亮点”）。通过公式引
(LeetCode 热题 100) 34. 在排序数组中查找元素的第一个和最后一个位置（二分查找）岁忧 java版刷题 LeetCode 热题 100 LeetCode leetcode 算法职场和发展 c++java
题目：34.在排序数组中查找元素的第一个和最后一个位置思路：二分查找，但需注意数组为空的情况。C++版本：classSolution{public:vectorsearchRange(vector&nums,inttarget){vectorv={-1,-1};intn=nums.size();if(n==0)returnv;intl=0,r=n-1;while(l
注意力机制+多尺度卷积一只小小的土拨鼠解构前沿：文献精读深度学习 python 人工智能 YOLO 深度学习
多尺度卷积先提供丰富的特征信息，注意力机制再从中筛选出关键信息，这样结合起来，不仅可以进一步提高模型的识别精度和效率，显著提升模型性能，还可以增强模型的可解释性。MPARN:multi-scalepathattentionresidualnetworkforfaultdiagnosisofrotatingmachines方法：论文介绍了一种用于旋转机械故障诊断的多尺度卷积神经网络结构，称为多尺度路
23章12节：抽样的蒙特卡洛方法 DAT｜R科学与人工智能用R探索医药数据科学 r-4.2.1 开发语言数据库人工智能 r
蒙特卡洛方法作为一种基于随机抽样的数值计算技术，在工程、金融、统计、物理等众多领域中得到了广泛应用。该方法通过对大量随机数的模拟，来解决那些难以解析求解的问题。在实际问题中，常常需要从一个复杂分布中抽取样本，而传统的直接抽样方法可能难以实现。为了解决这一问题，接受‐拒绝抽样方法应运而生。本文旨在介绍如何利用R语言实现蒙特卡洛方法，特别是如何通过接受‐拒绝抽样从已知分布中抽取样本。文章以参数为(3,
Python计算DEM(tif格式)坡度和坡向见贤思齐547 Python地理数据处理 python
本文根据山东省DEM图获取坡度、坡向图，使用了三种方式：PythonGDAL工具自带的函数处理、Python中自己编写函数实现和arcgis中实现。一.Python中实现（针对TIF格式的DEM数据）1.利用gdal工具处理（1）代码fromosgeoimportgdal,osr#获取影像信息infoDEM=gdal.Info(r"D:\ProfessionalProfile\DEMdata\2_
python 判断两个矩形是否重叠(Find if two rectangles overlap) csdn_aspnet Python python
给定两个矩形，判断这两个矩形是否重叠。注意，一个矩形可以用两个坐标表示，左上角和右下角。所以我们主要给出以下四个坐标。l1：第一个矩形的左上角坐标。r1：第一个矩形的右下角坐标。l2：第二个矩形的左上角坐标。r2：第二个矩形的右下角坐标。我们需要编写一个函数booldoOverlap(l1,r1,l2,r2)，如果两个给定的矩形重叠，则返回true。注意：可以假设矩形与坐标轴平行。一种解决方案是逐
数据结构-单链表基本操作的实现 Xiao_Ya__ 数据结构考研 c语言数据结构算法链表
CreateList_R(LinkList&L,intn)：后插法创建单链表——时间复杂度O(n)GetElem(LinkListL,inti,ElemType&e)：单链表的取值——时间复杂度O(n)LocateElem(LinkListL,ElemTypee)：单链表的按值查找——时间复杂度O(n)ListInsert(LinkList&L,inti,ElemTypee)：单链表的插入——时间
Android Studio里TextView设置可滚动 ziyuluoyao_Meg Android Studio
1.找到视图中的TextView对象，2.使用该对象调用setMovementMethod(ScrollingMovementMethod.getInstance)如：TextViewtv_message;tv_message=findViewById(R.id.tv_message);tv_message.setMovementMethod(ScrollingMovementMethod.get
KVM 内核优化全攻略：全方位释放服务器性能 TechStack 创行者 KVM Linux 服务器运维 KVM
KVM内核优化全攻略：全方位释放服务器性能在云计算、大数据、人工智能等前沿技术蓬勃发展的当下，服务器性能面临着前所未有的挑战。KVM（Kernel-basedVirtualMachine）作为开源虚拟化解决方案，凭借高效稳定的特性，广泛应用于企业数据中心。要充分发挥KVM性能优势，对其内核进行全面优化势在必行。本文将为你详细介绍一套涵盖通用优化及其他关键优化点的完整KVM内核优化方案，并结合实际案
单目3d重建DUSt3R 笔记 AI算法网奇 3D视觉人工智能
目录DUSt3R三维重建报错RecursionError:maximumrecursiondepthexceededincomparison报错numpy.core.multiarrayfailedtoimport报错Numpyisnotavailable解决升级版mast3r速度变慢修改了参数设置脚本：测试效果操作技巧DUSt3R三维重建git地址：GitHub-naver/dust3r:DUS
QT：文件读取 Yanjun2i qt 开发语言
问题：在文件读取，判断md5值时，遇到py文件读取转String后，再转byte，md5前后不一致问题。解决方法：python文件读取要使用QTextStream，避免\t、\r、\n的换行符跨平台问题（window系统换行符和linux换行符不一致）。QTextStream默认帮你处理了换行符跨平台问题。\r：回到开头\n：换行一般读取文件的方式是：boolxxxxClass::readFile
C++（初阶）（七）——模板 win水 c++
模版模版函数模板概念原理实例化隐式实例化：显式实例化模板参数的匹配原则类模板实例化模版分为函数模板，类模板经过推演实例化出对应函数函数模板概念函数模板代表了一个函数家族，该函数模板与类型无关，在使用时被参数化，根据实参类型产生函数的特定类型版本。template返回值类型函数名(参数列表){}例如，实现简单的交换函数：templateTAdd(constT&left,constT&right){r
在LORA训练中，LORA模型的矩阵的行列是多少 ZhangJiQun&MXP 教学 2021 AI python 2024大模型以及算力矩阵人工智能深度学习学习机器学习算法
在LORA训练中，LORA模型的矩阵的行列是多少:Wnew=W+αrBAW_{new}=W+\frac{\alpha}{r}BA
惊人的贵！DeepSeek-R1 本地部署成本不同方案大对比，成本优化建议也一并奉上！你能部署的起吗？涛涛讲AI 大模型大模型
关于DeepSeek-R1本地部署的成本信息，费用范围因部署方案和硬件配置差异较大，具体可分为以下三类情况：一、企业级满血版部署（671B参数）硬件采购成本服务器集群：含8张NVIDIAA100/H100显卡的服务器，市场价格约80-120万元配套设备：液冷系统、冗余电源等附加成本约15-25万元运维成本电费：满载功耗约6000W，年电费约5-8万元（按工业电价1.2元/度计算）维护：专业工程师团
手撕力扣之排序：排序数组、数组中的逆序对、排序链表、最小的k个数、数组中的第K个最大元素、前 K 个高频元素、根据身高重建队列、最大数、下一个排列、下一个更大元素 III、最大交换、字典序的第K小数字 weixin_39770712 数据结构与算法数据结构排序算法算法
力扣912.排序数组给你一个整数数组nums，请你将该数组升序排列。方法一：归并排序classSolution{public:vectortmp;voidmergeSort(vector&nums,intl,intr){if(l>=r)return;intmid=(l+r)>>1;mergeSort(nums,l,mid);mergeSort(nums,mid+1,r);inti=l,j=mid+
单端口和双单口RAM的实现 wangn1633 Verilog verilog
单端口和双单口RAM的verilog实现概念：1单端口：读写数据共用一个地址线，一个时钟沿只能进行读或者写；2伪双端口：写数据和读数据有自己的地址、时钟、读写使能信号；也就是一组端口只能写，一组端口只能读。（读写数据也可共用一个clk，为同步伪双端口ram）3真双端口：一组端口可读可写，另一组端口也可读可写。（若这两组端口共用一个clk，为同步真双端口ram。若每组有每组的clk，为异步真双端口r
数字接龙第十五届蓝桥杯大赛软件赛省赛C/C++ 大学 B 组 Geometry Fu 蓝桥杯蓝桥杯 c语言 c++
数字接龙题目来源第十五届蓝桥杯大赛软件赛省赛C/C++大学B组原题链接蓝桥杯数字接龙https://www.lanqiao.cn/problems/19712/learning/问题描述题目描述小蓝最近迷上了一款名为《数字接龙》的迷宫游戏，游戏在一个大小为n×nn\timesnn×n的格子棋盘上展开，其中每一个格子处都有着一个0⋯k−10\cdotsk-10⋯k−1之间的整数。游戏规则如下：从左上
Java语言前言始终奔跑在路上软件开发 Java java 开发语言
字节计算机中存储数据最小计量单位，用byte或者B表示计算机最小的存储单元是二进制，因为计算机上能看到的任何东西都是CPU通过二进制转换而来的，二进制用bit表示1byte=8bit取值范围：-128-127存储数据的计量单位换算8bit=1B1024B=1KB1024KB=1MB1024MB=1GB1024GB=1TB常用DOS命令打开dos窗口win+R输入cmd切换磁D:查看目录dir创建目
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本