jiabiao1602

R在银行财务数据分析中的应用

原文地址：http://supstat.com.cn/blog/2015/01/07/use-r-in-banking-industry/

研究方法

搜集银行业上市公司的财务数据分析股票价格的财务影响因素，观测流动比率、净资产负债比率、资产固定资产比率、每股收益、净利润、增长率、股价和公布时间等数据。首先描述性分析对银行业上市公司的财务数据进行基础性描述，以便对整个行业形成直观的印象，然后利用因子分析提取对银行业上市公司股价影响较为明显的因素，分析银行业上市公司股价的决定因素，最后利用回归分析方法确定这些因素对股票价格的影响方向和强弱。

统计方法

描述性分析
因子分析
回归分析

具体分析

本案例为了研究的准确性和普遍性，一共搜集了23家上市的金融银行类股票一定是可的股票价格。同时为了准确反映上市公司财务报表呈现的财务信息与股票价格的关系，我们搜集了流动比率、净资产负债比率、资产固定资产比率、每股收益、净利润、增长率等财务指标。可以点击这里下载数据。

dataf <- read.csv("bank.csv") # 导入数据
dataf

##    流动比率 净资产负债比率 资产固定资产比率 每股收益 净利润 增长率  股价
## 1    1.0716       0.020515            27.04   0.1925  17.77 -3.942 18.56
## 2    1.0181       0.009379           113.22   0.1300  14.77 46.914 18.86
## 3    1.0469       0.013588            85.34   0.2230  14.30 25.433 13.65
## 4    1.0398       0.013137            93.34   0.2752  14.72 30.732 15.21
## 5    1.0216       0.013970            88.40   0.1197  14.10 30.578 13.73
## 6    0.9607       0.013284            93.59   0.1850  16.60 14.550 12.43
## 7    0.9256       0.011708           102.88   0.2365  14.98 13.879 13.89
## 8    0.9424       0.011860           103.24   0.3040  13.52 21.894 11.10
## 9    0.9164       0.011641           103.53   0.0915  14.45 27.488 11.42
## 10   0.8754       0.010129           112.47   0.1720  13.29 19.168 12.14
## 11   0.9008       0.009532           127.28   0.2605  12.81 21.915 10.43
## 12   0.8814       0.009450           133.40   0.3240  11.51 23.687  8.56
## 13   0.8907       0.008080           128.08   0.1116  12.96 44.718 10.24
## 14   0.8629       0.009338           236.14   0.1902  11.82 37.542  9.02
## 15   0.8634       0.009430           117.57   0.2846  11.62 35.189  7.55
## 16   0.8494       0.010992           107.08   0.3470  10.31 21.157  6.65
## 17   0.8637       0.010824           105.04   0.1119  12.08 14.875  6.49
## 18   0.8577       0.011688           110.31   0.1849  10.91 10.622  6.14
## 19   0.8743       0.009964            98.12   0.3066  11.58 22.350  6.12
## 20   0.8848       0.010763           116.04   0.3744  10.42 26.894  5.67
## 21   0.8962       0.009194            97.98   0.1158  11.39 28.249  6.98
## 22   0.7740       0.009581           105.11   0.2456  11.51 64.610  6.68
## 23       NA       0.006989           156.92   0.3900  11.79 52.344  6.39

summary(dataf)

##     流动比率     净资产负债比率    资产固定资产比率    每股收益     
##  Min.   :0.774   Min.   :0.00699   Min.   : 27      Min.   :0.0915  
##  1st Qu.:0.866   1st Qu.:0.00944   1st Qu.: 98      1st Qu.:0.1510  
##  Median :0.893   Median :0.01076   Median :105      Median :0.2230  
##  Mean   :0.919   Mean   :0.01109   Mean   :111      Mean   :0.2251  
##  3rd Qu.:0.956   3rd Qu.:0.01178   3rd Qu.:117      3rd Qu.:0.2943  
##  Max.   :1.072   Max.   :0.02051   Max.   :236      Max.   :0.3900  
##  NA's   :1                                                          
##      净利润         增长率           股价      
##  Min.   :10.3   Min.   :-3.94   Min.   : 5.67  
##  1st Qu.:11.5   1st Qu.:20.16   1st Qu.: 6.66  
##  Median :12.8   Median :25.43   Median :10.24  
##  Mean   :13.0   Mean   :27.43   Mean   :10.34  
##  3rd Qu.:14.4   3rd Qu.:32.96   3rd Qu.:13.04  
##  Max.   :17.8   Max.   :64.61   Max.   :18.86  
##

样本描述

由R语言自带的summary我们能知道数据的最小值、25%分位数、中位数、均值、75%分位数、最大值以及缺失值数目。但是我们知道，仅仅通过这7个统计值我们不能很好的了解到数据的概貌，因此本章通过利用R语言的其他函数，制作一个样本描述表。

d1 = c(dataf[, 1])
d2 = c(dataf[, 2])
d3 = c(dataf[, 3])
d4 = c(dataf[, 4])
d5 = c(dataf[, 5])
d6 = c(dataf[, 6])
d7 = c(dataf[, 7])
#包括7个项目,分别为最小值,25%分位数,中位数,均值,75%分位数,最大值以及缺失值数目
sum1 = summary(d1)
sum2 = summary(d2)
sum3 = summary(d3)
sum4 = summary(d4)
sum5 = summary(d5)
sum6 = summary(d6)
sum7 = summary(d7)
#样本数
N1 = length(d1)-sum1[7]
N2 = length(d2)
N3 = length(d3)
N4 = length(d4)
N5 = length(d5)
N6 = length(d6)
N7 = length(d7)

head = c("变量名","流动比率","净资产负债比率","资产固定资产比率","每股收益","净利润","增长率","股价")
row1 = c("样本数",N1,N2,N3,N4,N5,N6,N7)
row2 = c("全距",sum1[6]-sum1[1],sum2[6]-sum2[1],sum3[6]-sum3[1],sum4[6]-sum4[1],sum5[6]-sum5[1],sum6[6]-sum6[1],sum7[6]-sum7[1])
row3 = c("最小值",sum1[1],sum2[1],sum3[1],sum4[1],sum5[1],sum6[1],sum7[1])
row4 = c("最大值",sum1[6],sum2[6],sum3[6],sum4[6],sum5[6],sum6[6],sum7[6])
row5 = c("均值",sum1[4],sum2[4],sum3[4],sum4[4],sum5[4],sum6[4],sum7[4])
row6 = c("中位数",sum1[3],sum2[3],sum3[3],sum4[3],sum5[3],sum6[3],sum7[3])
row7 = c("标准差",sd(d1,na.rm=T),sd(d2),sd(d3),sd(d4),sd(d5),sd(d6),sd(d7))

result = matrix(c(head, row1, row2, row3, row4, row5, row6, row7),ncol=8,byrow = T)
print(t(result))

##      [,1]               [,2]     [,3]      [,4]      [,5]     [,6]    
## [1,] "变量名"           "样本数" "全距"    "最小值"  "最大值" "均值"  
## [2,] "流动比率"         "22"     "0.296"   "0.774"   "1.07"   "0.919" 
## [3,] "净资产负债比率"   "23"     "0.01351" "0.00699" "0.0205" "0.0111"
## [4,] "资产固定资产比率" "23"     "209"     "27"      "236"    "111"   
## [5,] "每股收益"         "23"     "0.2985"  "0.0915"  "0.39"   "0.225" 
## [6,] "净利润"           "23"     "7.5"     "10.3"    "17.8"   "13"    
## [7,] "增长率"           "23"     "68.54"   "-3.94"   "64.6"   "27.4"  
## [8,] "股价"             "23"     "13.23"   "5.67"    "18.9"   "10.3"  
##      [,7]     [,8]                 
## [1,] "中位数" "标准差"             
## [2,] "0.893"  "0.0768336436285581" 
## [3,] "0.0108" "0.00271362995517017"
## [4,] "105"    "35.8888061503178"   
## [5,] "0.223"  "0.0901580500060493" 
## [6,] "12.8"   "1.9540104480683"    
## [7,] "25.4"   "14.8509587755514"   
## [8,] "10.2"   "3.97134479070255"

由上表可知，在从2001到2008年各个季度中，我国银行业上市公司的平均值为10.3439，最大值与最小值之间的全距为13.19元，标准差为3.97元，可见我国银行业上市公司的股价在样本期间波动幅度较大。另外，就净利润指标看，我国银行业公司净利润均值为13亿元，可见在样本期间我国银行业经营状况良好。

因子分析

由于因子分析对缺失值非常的敏感，在进行因子分析之前我们先对数据进行缺失值的检查。

is.na(dataf)

##       流动比率 净资产负债比率 资产固定资产比率 每股收益 净利润 增长率
##  [1,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
##  [2,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
##  [3,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
##  [4,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
##  [5,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
##  [6,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
##  [7,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
##  [8,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
##  [9,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
## [10,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
## [11,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
## [12,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
## [13,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
## [14,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
## [15,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
## [16,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
## [17,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
## [18,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
## [19,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
## [20,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
## [21,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
## [22,]    FALSE          FALSE            FALSE    FALSE  FALSE  FALSE
## [23,]     TRUE          FALSE            FALSE    FALSE  FALSE  FALSE
##        股价
##  [1,] FALSE
##  [2,] FALSE
##  [3,] FALSE
##  [4,] FALSE
##  [5,] FALSE
##  [6,] FALSE
##  [7,] FALSE
##  [8,] FALSE
##  [9,] FALSE
## [10,] FALSE
## [11,] FALSE
## [12,] FALSE
## [13,] FALSE
## [14,] FALSE
## [15,] FALSE
## [16,] FALSE
## [17,] FALSE
## [18,] FALSE
## [19,] FALSE
## [20,] FALSE
## [21,] FALSE
## [22,] FALSE
## [23,] FALSE

这时我们发现流动比率变量第23个数据缺失,因此在进行因子分析的时候，我们对缺失值进行整行删除处理，即在因子分析时排除第23行整行的7个数据。

然后，我们对剩余的流动比率、净资产负债比率、资产固定资产比率、每股收益、净利润和增长率这些公司财务变量进行KMO检验，检验选取的财务变量是否适合进行因子分析。

library(psych)         # 导入psych程序包
KMO(dataf[-23,-7])     # 排除股价变量和第23行数据

## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = dataf[-23, -7])
## Overall MSA =  0.75
## MSA for each item = 
##         流动比率   净资产负债比率 资产固定资产比率         每股收益 
##             0.79             0.74             0.87             0.47 
##           净利润           增长率 
##             0.73             0.74

KMO检验值为0.75，这说明这些财务变量适合做因子分析。

fa.parallel(dataf[-23,-7])   # 绘制碎石图寻找合适因子个数

## Parallel analysis suggests that the number of factors =  2  and the number of components =  1

由碎石图看出，对于因子分析，合适的因子个数为2。因此我们利用psych程序包中的fa函数对所选取的变量做因子分析，利用极大似然法（ml）提取公因子，运用最大方差旋转法（varimax），找出其中2个因子。

fa(dataf[-23,-7], nfactors=2, fm="ml", rotate="varimax",score=T)

## Loading required package: GPArotation

## Factor Analysis using method =  ml
## Call: fa(r = dataf[-23, -7], nfactors = 2, rotate = "varimax", scores = T, 
##     fm = "ml")
## Standardized loadings (pattern matrix) based upon correlation matrix
##                    ML1   ML2   h2    u2 com
## 流动比率          0.60  0.56 0.67 0.331 2.0
## 净资产负债比率    0.98  0.21 1.00 0.005 1.1
## 资产固定资产比率 -0.65 -0.17 0.45 0.547 1.1
## 每股收益          0.05 -0.48 0.23 0.772 1.0
## 净利润            0.53  0.84 1.00 0.005 1.7
## 增长率           -0.63  0.02 0.39 0.609 1.0
## 
##                        ML1  ML2
## SS loadings           2.41 1.32
## Proportion Var        0.40 0.22
## Cumulative Var        0.40 0.62
## Proportion Explained  0.65 0.35
## Cumulative Proportion 0.65 1.00
## 
## Mean item complexity =  1.3
## Test of the hypothesis that 2 factors are sufficient.
## 
## The degrees of freedom for the null model are  15  and the objective function was  3.13 with Chi Square of  56.79
## The degrees of freedom for the model are 4  and the objective function was  0.02 
## 
## The root mean square of the residuals (RMSR) is  0.02 
## The df corrected root mean square of the residuals is  0.04 
## 
## The harmonic number of observations is  22 with the empirical chi square  0.22  with prob <  0.99 
## The total number of observations was  22  with MLE Chi Square =  0.38  with prob <  0.98 
## 
## Tucker Lewis Index of factoring reliability =  1.361
## RMSEA index =  0  and the 90 % confidence intervals are  NA NA
## BIC =  -11.98
## Fit based upon off diagonal values = 1
## Measures of factor score adequacy             
##                                                 ML1  ML2
## Correlation of scores with factors             1.00 0.99
## Multiple R square of scores with factors       0.99 0.99
## Minimum correlation of possible factor scores  0.99 0.98

结果说明：

从表格可知，两个因子的累计贡献方差（Cumulative Var）为62%，说明得到的两个因子能解释所有变量62%的信息。
各变量与两个因子的关系如下：

流动比率 = 0.60 × 因子A + 0.56 × 因子B
净资产负债比率 = 0.98 × 因子A + 0.21 × 因子B
资产固定资产比率 = -0.65 × 因子A - 0.17 × 因子B
每股收益 = 0.05 × 因子A - 0.48 × 因子B
净利润 = 0.53 × 因子A + 0.84 × 因子B
增长率 = -0.63 × 因子A - 0.02 × 因子B

因子A主要影响流动比率、净资产负债比率、资产固定资产比率和增长率。其中因子A对流动比率和净资产负债比率有正向影响而对资产固定资产比率和增长率有负向影响。我们将它称为资产因子。

因子B主要影响每股收益、净利润。其中因子B对净利润有正向作用而对每股收益则为负向作用。我们将它称为收益因子。

回归分析

现在利用所选取的财务变量，通过回归分析进一步发掘我国银行业股价与其主要财务指标的关系。

lm <- lm(股价~., data=dataf)
lm.aic <- step(lm, trace=FALSE)    # AIC准则
lm.bic <- step(lm, k=log(length(dataf[,1])), trace=FALSE)  # BIC准则
summary(lm.aic)

## 
## Call:
## lm(formula = 股价 ~ 流动比率 + 净利润 + 增长率, data = dataf)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -2.670 -0.890 -0.365  0.808  2.953 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -27.4868     4.4273   -6.21  7.4e-06 ***
## 流动比率     22.8340     6.7784    3.37  0.00342 ** 
## 净利润        1.1980     0.2636    4.54  0.00025 ***
## 增长率        0.0522     0.0238    2.19  0.04187 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.46 on 18 degrees of freedom
##   (1 observation deleted due to missingness)
## Multiple R-squared:  0.884,	Adjusted R-squared:  0.865 
## F-statistic: 45.8 on 3 and 18 DF,  p-value: 1.26e-08

summary(lm.bic)

## 
## Call:
## lm(formula = 股价 ~ 流动比率 + 净利润 + 增长率, data = dataf)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -2.670 -0.890 -0.365  0.808  2.953 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -27.4868     4.4273   -6.21  7.4e-06 ***
## 流动比率     22.8340     6.7784    3.37  0.00342 ** 
## 净利润        1.1980     0.2636    4.54  0.00025 ***
## 增长率        0.0522     0.0238    2.19  0.04187 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.46 on 18 degrees of freedom
##   (1 observation deleted due to missingness)
## Multiple R-squared:  0.884,	Adjusted R-squared:  0.865 
## F-statistic: 45.8 on 3 and 18 DF,  p-value: 1.26e-08

通过AIC和BIC准则的检验，我们能得到所选取的财务变量中，流动比率、净利润和增长率对股价有显著的影响。为了保证线性模型的准确率，我们还需要考察该模型中是否存在自相关关系。以下通过lmtest程序包中的dwtest函数，对模型进行Durbin-Watson检验。

#install.packages("lmtest")
#install.packages("zoo")
library(lmtest)   # 导入程序包lmtest
dwtest(lm.aic)

## 
## 	Durbin-Watson test
## 
## data:  lm.aic
## DW = 2.202, p-value = 0.5286
## alternative hypothesis: true autocorrelation is greater than 0

由检验得到，DW统计量为2,202，p值为0.5286，说明模型中不存在自相关关系。

则股价与流动比率、净利润和增长率的关系为：股价 = -27.4868 + 22.8340 × 流动比率 + 1.1980 × 净利润 + 0.0522 × 增长率

其中三个变量的系数均在0.01的显著性水平下显著。

研究结论

根据以上所做的分析，我们可以比较有把握地得出以下结论：

（1）通过银行业上市公司股价及财务指标的描述统计分析发现，一般而言，我国银行业上市公司的股价在样本期间波动幅度较大，但相对其他行业较小。另外，就净利润指标看，我国银行业上市公司净利润均值为13亿元，可见我国银行业经营状况良好。

（2）通过银行业上市的各个财务指标的因子分析发现：在银行业数据中，可以用两个主因子（收益因子、资产因子）来代替解释所有六个财务指标提供的62%的信息。

（3）通过对银行业股票价格与财务指标的回归分析发现：银行业股价高度受流动比率、净利润和增长率这三个指标影响。其中流动比率1个单位的增加会带动银行业上市公司股价21个单位的增长。

总结：

银行业股票价格总体波动性相对较小，盈利水平较高
银行业财务信息中主要的变量是流动性比率、净利润和增长率
影响银行业股价的最主要因素是银行资产的流动性水平

YashanDB yasrman恢复数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%95%B0%E6%8D%AE%...操作说明执行恢复操作的数据库版本需与生成备份集的数据库版本完全一致。恢复语法详细说明请参考工具手册yasrman。分布式部署模式下，需要保证待恢复的集群部署状态与备份前节点部署状态一致，包括节点类型、节点监听IP、节点个数、节
3.22 codeforces小结 Brokenrivers 总结随记 Codeforces 算法竞赛编译错误签到题实战经验
说来好笑，也算接触小半年算法了，这次算是第一次"正式"的打cf。之前因为一些原因比较倾向于找个空闲时间上oj上刷题，虽然知道cf对一个搞算法竞赛的人的重要性，但是一直没去蹲点打比赛（我觉得就是我们宿舍这破网上个cf要转两分钟圈圈还经常崩的原因），最多会在比赛结束找比赛题目的文档练习。这次因为组队了，希望能和队友实时交流，手机开了梯子热点打完了这次的cf。感觉就是，自己像个傻子一样，提交代码的语言选
【赵渝强老师】达梦数据库的逻辑存储结构数据库信创
达梦数据库由硬盘上的文件组成，而要读写数据需要通过达梦实例来完成。那么，达梦数据库是如何存储数据的呢？要搞清楚这个问题，就需要理解什么是达梦数据库的存储结构。达梦数据库的存储结构是由逻辑存储结构和物理存储结构组成。一般来说数据库无论是关系型数据库，还是NoSQL数据库在存储结构上，都是通过逻辑存储结构来管理物理存储结构。视频讲解如下：https://www.bilibili.com/video/B
从零开始学AI——1 人工智能
前言最近总算有想法回到学习上来，这次就拿AI开刀吧。本系列叫从零开始学AI不是骗人的，我对AI的了解几乎就是道听途说，所以起了这么一个标题，希望学完从0变1（？此外，我应该不会特别关注代码实现上的内容，因为我对python也是一窍不通。本笔记为学习周志华老师《机器学习》（西瓜书）的个人学习记录，内容基于个人理解进行整理和再阐述。由于理解可能存在偏差，欢迎指正。引用模块说明：在笔记中，我会使用引用模
C++ 支持哪些面向对象特性？ c++
C++是一种支持面向对象编程（OOP）的语言，它提供了丰富的面向对象特性，使得开发者能够以类和对象为核心来组织代码。以下是C++支持的主要面向对象特性：一、类（Class）类是C++中面向对象的核心概念，它是一种用户自定义的数据类型，用于封装数据和操作数据的函数。类可以包含成员变量（属性）和成员函数（方法），并通过构造函数和析构函数管理对象的生命周期。（一）定义类cpp复制classMyClass
费控系统是做什么的费控系统
费控系统主要用于费用监控**、成本控制、风险预警。其中费用监控通过实时采集和精细数据分析，帮助企业实时掌握资金流向和支出情况，从而确保预算执行与资金使用的准确性。企业借助该系统可以提前预警异常支出、降低运营风险，并借助数据反馈不断优化管理策略，从而提升整体财务透明度和管理效率。一、费控系统的概念与基本功能费控系统是企业在财务管理中的重要工具，主要用于对企业各项费用进行实时监控和管理。它通过对各部门
蓝桥杯算法实战：技巧、策略与进阶之路竣雄蓝桥杯算法职场和发展
摘要蓝桥杯作为国内颇具影响力的程序设计竞赛，对提升大学生算法思维与编程能力意义重大。本文深入剖析蓝桥杯算法竞赛，结合历年真题总结核心考点与典型题型，分享实用解题技巧与备考策略，并探讨算法优化与进阶方向。通过系统学习与实践，助力参赛者提升算法水平，在竞赛中取得优异成绩。关键词蓝桥杯；算法竞赛；解题技巧；备考策略；算法优化一、引言蓝桥杯全国软件和信息技术专业人才大赛旨在选拔优秀的软件和信息技术人才，推
前端框架入门：Vue 基础风亦辰739 前后端开发全栈指南 vue.js 前端框架前端
Vue.js是一款流行的前端框架，专注于构建用户界面。它采用响应式数据绑定和组件化开发，易于上手且功能强大。Vue3版本引入了CompositionAPI，提升了开发效率。一、Vue.js基础1.Vue介绍Vue是一个渐进式JavaScript框架，可用于：构建单页应用（SPA）。组件化开发，提高代码复用性。结合Vuex（状态管理）和VueRouter（路由）开发大型应用。2.Vue模板语法Vue
算法小分队-刷题2 「已注销」 c++
注：代码周日刷完一块交3.20小鱼的游泳时间(1425)模拟竖式运算，注意借位问题3.21小鱼比可爱(1428)简单的循环比较大小3.22小玉在游泳(1420)注意数据的处理，浮点还是整数3.23手机(1765)只会简单的条件循环判断然后累加3.24轰炸III(1830)调错：轰炸的次序处理
残疾人员检测数据集VOC+YOLO格式3168张5类别 FL1623863129 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：3168标注数量(xml文件个数)：3168标注数量(txt文件个数)：3168标注类别数：5标注类别名称(注意yolo格式类别顺序不和这个对应，而以labels文件夹classes.txt为准):["person-ba
电商精准营销—数据预处理概述 Ssaty. python
第1关：数据预处理-数据清洗任务描述本关任务：对指定样本数据进行预处理，掌握数据预处理的技巧。相关知识为了完成本关任务，你需要掌握：1.数据样本抽取的方法；2、数据清洗的技巧。数据分析的基本流程：在数据分析中，通常着眼于需求，围绕着分析的目的进行数据分析工作。在大数据时代，数据量众多，数据信息质量不同，只有围绕这分析目的才能快速选择出有用的数据。原因很简单，从错误的数据里，肯定找不出正确的分析结论
DFS深搜 Darling02zjh 算法学习深度优先算法
排列数字题目：给定一个整数n，将数字1∼n排成一排，将会有很多种排列方法。现在，请你按照字典序将所有的排列方法输出输入格式共一行，包含一个整数n。输出格式按字典序输出所有排列方案，每个方案占一行。数据范围1≤n≤7输入样例3输出样例：123132213231312321对于DFS深度搜索就像是一条路走到黑在这里假如n=3，需要看一共有几种组合方法红色的就是深搜的路线；对于这道题把思路转化成代码就是
鸿蒙harmonyOS：笔记正则表达式一只小风华~ 笔记前端华为 harmonyos 正则表达式
从给出的文本中，按照既定的相关规则，匹配出符合的数据，其中的规则就是正则表达式，使用正则表达式，可以使得我们用简洁的代码就能实现一定复杂的逻辑，比如判断一个邮箱账号是否符合正常的邮箱账号，再比如判断一个手机号是否正常的手机号，等等，正因为有了正则，得以让文本处理起来更加的简单。日常开发中主要用来做三件事:匹配、替换、提取。手机号表单要求用户只能输入11位的数字(匹配)过滤掉页面内容中的一些敏感词(
蓝桥杯备赛（7）：ST表神里流~霜灭蓝桥备赛蓝桥杯贪心算法 c++c语言数据结构动态规划
RMQ问题RMQ问题是针对于数组，每次给一个区间[l,r]，要求返回区间内的最大值或最小值（的下标），也就是说，RMQ问题就是求区间最值的问题。对于RMQ问题，容易想到一种O(n)的方法，就是用i直接遍历[l,r]区间，不断比较a[i]与max的大小关系，然后不断更新max，最后得出的就是最大值。但是，我们可以利用倍增和动态规划的思想，利用“ST表”这个数据结构来帮助解决。ST表ST表是一种可以“
Python 正则表达式超详细解析：从基础到精通 2201_75491841 python 正则表达式开发语言
Python正则表达式超详细解析：从基础到精通一、引言在Python编程的广阔领域中，文本处理占据着极为重要的地位。而正则表达式，作为Python处理文本的强大工具，能够帮助开发者高效地完成诸如查找、替换、提取特定模式字符串等复杂任务。无论是在数据清洗、网页爬虫，还是日志分析、自然语言处理等应用场景中，正则表达式都展现出了无可比拟的优势。本文将深入且全面地剖析Python正则表达式，从最基础的概念
YashanDB巡检数据库
巡检在YashanDB中为一个单独的后台线程，该线程类似于巡逻小队，不断地监控数据库的运行状况。当发生严重错误时，收集诊断数据存储在自动诊断存储库中，并且触发相应的修复手段或者限制损坏及中断。巡检主要包含如下内容：监控数据库文件发生严重错误时触发健康检查监控同步备库（最大保护模式）文件监控YashanDB的后台文件都存储着重要的信息，部分文件丢失可能导致数据库无法正常使用。此外，用户不可以手动改动
YashanDB健康检查数据库
YashanDB提供健康检查框架，用于数据库运行诊断检查。健康检查也称为检查器，检查数据库的各个组件，如检测文件损坏、数据块损坏、redo日志损坏等，并生成一份报告，记录发现的错误以及错误带来的影响。可以通过如下两种方式运行健康检查：反应式——故障诊断架构自动运行健康检查以响应严重错误。手动——使用内置高级包手动运行健康检查。如有需要，可以通过定义JOB定期运行健康检查。健康检查执行的结果将存储在
常见的数据库操作语言DDL、DML、DQL和DCL 失败尽是常态Z MySQL基础学习数据库 sql mysql
DDL、DML、DQL和DCL是常见的数据库操作语言，分别代表数据定义语言、数据操纵语言、数据查询语言和数据控制语言。1、数据定义语言（DDL）用于在数据库中创建、修改或删除表、视图、索引、序列等对象。常见的DDL命令有CREATE、ALTER和DROP等。2、数据操纵语言（DML）用于在数据库中对表进行插入、更新、删除等操作。常见的DML命令有INSERT、UPDATE和DELETE等。3、数据
一篇文章，彻底理解数据库操作语言：DDL、DML、DCL、TCL Java布道者 oracle 数据库 sql
最近与开发和运维讨论数据库账号及赋权问题时，发现大家对DDL和DML两个概念并不了解。于是写一篇文章，系统的整理一下在数据库领域中的DDL、DML、DQL、DCL的使用及区别。通常，数据库SQL语言共分为四大类：数据定义语言DDL，数据操作语言DML，数据查询语言DQL，数据控制语言DCL。再加上事务控制语言TCL，一个共5个。下面，我们就详细了解一下它们。数据定义语言DDLDDL（DataDef
MySQL中处理JSON数据小村学长毕业设计 mysql json 数据库
MySQL中处理JSON数据已成为大数据分析领域的一个新方向，这一功能自MySQL5.7版本引入以来，为数据库管理系统在处理非结构化数据方面提供了强大的支持。以下是对MySQL中处理JSON数据的详细探讨，包括其引入的背景、特性、函数与操作符、性能优化以及在大数据分析中的应用等方面。一、JSON数据类型引入的背景随着大数据技术的迅猛发展和普及，数据量的爆炸性增长对数据处理能力提出了前所未有的挑战。
Git更改暂存 : Git Pull 错误的快速解决方法 robot_learner git
你是否遇到过在运行gitpull时出现如下错误？error:cannotpullwithrebase:Youhaveunstagedchanges.error:pleasecommitorstashthem.该消息表明Git检测到你的工作目录中存在尚未暂存或提交的修改。为了防止在执行pull操作时产生冲突或潜在的数据丢失，Git提示你需要先提交或暂存这些更改。今天，我将向你展示如何使用stash命
【html5期末大作业】基于HTML仿QQ音乐官网网站 IT-司马青衫 html html5 课程设计
精彩专栏推荐文末获取联系✍️作者简介:一个热爱把逻辑思维转变为代码的技术博主作者主页:【主页——获取更多优质源码】web前端期末大作业：【毕设项目精品实战案例(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】超炫酷的Echarts大屏可视化源码：【Echarts大屏展示大数据平台可视化(150套)】HTML+CSS+JS实例代码：【️HTML+CSS+JS实例代码
基于人工智能的扫阅卷和数据分析服务需求文档 YiWait 人工智能人工智能数据分析数据挖掘
基于人工智能的扫阅卷和数据分析服务需求文档一、项目背景在教育领域，传统的人工阅卷方式效率低下、主观性强且易出错，难以满足大规模考试及频繁测评的需求。随着人工智能技术的飞速发展，基于人工智能的扫阅卷和数据分析服务应运而生。该服务利用先进的图像识别、自然语言处理等技术，实现试卷扫描、自动阅卷、成绩统计以及深度数据分析，为教育机构、学校提供高效、准确、全面的测评解决方案，助力教学质量提升和教育决策优化。
Java实现生日悖论的算法，计算至少有两个人生日相同的概率 YiWait java 算法
importjava.util.Random;publicclassBirthdayParadox{publicstaticvoidmain(String[]args){intn=23;//邀请的人数inttrials=1000000;//实验次数intcount=0;//至少有两个人生日相同的实验次数Randomrand=newRandom();for(inti=0;i
SQLServer : DDL,DML,DQL,DCL的区别 SJ15630070060 Sql Server sqlserver 数据库
01、DDL（DataDefinitionLanguages）语句：即数据库定义语句，用来创建数据库中的表、索引、视图、存储过程、触发器等对象。SQLServerDLL语法是指SQLServer数据库定义域发的语法规则集合，主要包括创建、修改和删除数据库对象的语句。常用的语句关键字有：【createtable创建表】、【altertable修改表】、【droptable删除表】、【truncate
算法竞赛备赛——【数论】高精度 Aurora_wmroy 算法竞赛备赛算法 c++数据结构蓝桥杯
高精度高精度计算，也被称作大整数计算，运用了一些算法结构来支持更大整数间的运算（数字大小超过语言内建整型）。加法P1601A+BProblem（高精）-洛谷#includeusingnamespacestd;constintN=10100;inta[N],b[N],c[N];intinit(intx[]){//读入数返回位数strings;cin>>s;intl=s.size();for(inti
算法竞赛备赛——【数据结构】链表 Aurora_wmroy 算法竞赛备赛数据结构算法链表 c++蓝桥杯
链表原地逆置206.反转链表-力扣（LeetCode）classSolution{public:ListNode*reverseList(ListNode*head){//链表无头节点原地逆置ListNode*pre=head;ListNode*cur=NULL;ListNode*t=NULL;//t=head->next若head指向空链表会报错非法访问其他空间while(pre!=NULL){
MySQL数据库中DDL 、DML 、DQL 、DCL 分别是什么超爱西西鸭 MySQL数据库数据库 mysql sql 运维
目录：一、DDL语句二、DML语句三、DQL语句四、DCL语句在MySQL数据库中，DDL、DML、DQL、DCL分别代表不同的语言类别，用于执行不同的数据库操作。一、DDL语句DDL（DataDefinitionLanguage）语句：数据定义语言，主要是进行定义/改变表的结构、数据类型、表之间的链接等操作。如创建、修改或删除表、视图、索引等。常用的语句关键字CREATE、DROP、ALTER、
JSON数据修改的实现一个程序员(●—●) json
JSON数据的修改示例代码如下:usingSystem.Collections;usingSystem.Collections.Generic;usingUnityEngine;//C#命名空间（以System开头）usingSystem.IO;usingLitJson;publicclassJsonChange:MonoBehaviour{//Startiscalledbeforethefirs
数据库开发必备：深入理解DDL、DML、DQL和DCL 平凡程序猿~ 数据库数据库开发 oracle 数据库
文章目录一、数据库操作分类概述1.DDL（数据定义语言）2.DML（数据操作语言）3.DQL（数据查询语言）4.DCL（数据控制语言）二、DDL：数据定义语言1.DDL-数据库操作2.DDL-表操作三、DML：数据操作语言1.DML-添加数据2.DML-修改数据3.DML-删除数据四、DQL：数据查询语言1.DQL-基本查询2.DQL-条件查询3.DQL-聚合函数4.DQL-分组查询5.DQL-排
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end