一个语文不好的NLPer

基于负荷曲线的聚类分析与预测

- 数据预处理
- 时间序列初步分析
- 季节ARIMA模型(划分测试集训练集)
- 聚类分析部分

数据预处理

# 安装库专用

# 通过如下命令设定镜像
options(repos = 'http://mirrors.ustc.edu.cn/CRAN/')
# 查看镜像是否修改
getOption('repos')
# 尝试下载R包
#若有需要，进行安装
#install.packages('forecast')

‘http://mirrors.ustc.edu.cn/CRAN/’

#设置工作路径
setwd("D:/LengPY")

#导入数据
library(readxl)
data<-read_excel("电力.xlsx")

head(data)

A tibble: 6 × 32
时间	东城站10kV广源线F10有功值	东城站10kV工业园甲线F09有功值	东城站10kV两报线F08有功值	东城站10kV中惠甲线F07有功值	东城站10kV奕垌线F06有功值	东城站10kV东城线F05有功值	东城站10kV碧桂园甲线F04有功值	东城站10kV县府线F03有功值	东城站10kV工业园乙线F11有功值	...	东城站10kV中惠乙线F22有功值	东城站10kV佰利线F30有功值	东城站10kV东轩线F29有功值	东城站10kV大道线F28有功值	东城站10kV华科乙线F27有功值	东城站10kV华科甲线F26有功值	东城站10kV金桂线F25有功值	东城站10kV福兴线F24有功值	东城站10kV龙塘线F23有功值	汇总
										...
2021-03-01	0	0.812	1.383	1.015	0.250	1.222	0.622	1.467	0.364	...	0.828	0.381	1.127	0.789	0.061	0	0.822	1.596	0	19.089
2021-03-01T00:14:59.99999979045242400	0	0.736	1.307	0.909	0.254	1.184	0.575	1.358	0.351	...	0.783	0.338	1.099	0.795	0.076	0	0.722	1.532	0	18.389
2021-03-01T00:30:00.00000020954757600	0	0.753	1.197	0.854	0.228	1.087	0.571	1.328	0.326	...	0.749	0.365	1.041	0.676	0.064	0	0.682	1.462	0	18.181
2021-03-01T00:45:00.000	0	0.436	1.138	0.723	0.211	1.002	0.524	1.277	0.321	...	0.713	0.359	1.020	0.679	0.000	0	0.658	1.410	0	17.341
2021-03-01T00:59:59.99999979045242400	0	0.431	1.070	0.782	0.178	0.930	0.592	1.218	0.148	...	0.673	0.362	0.987	0.621	0.067	0	0.603	1.349	0	16.424
2021-03-01T01:15:00.00000020954757600	0	0.423	0.981	0.727	0.165	0.926	0.575	1.197	0.144	...	0.621	0.365	0.968	0.606	0.000	0	0.569	1.282	0	15.888

时间序列初步分析

白噪声检验
如果时间序列数据没有通过白噪声检验，则说明该序列为随机数序列，则没有建立时间序列模型进行分析的必要。

单位根检验用来判断时间序列是否为平稳序列

协整检验和Granger因果检验

library(dplyr)
library(tidyr)
library(zoo)
library(tseries)

library(ggfortify)library(gridExtra)library(forecast)

Warning message:"package 'ggfortify' was built under R version 4.0.4"Loading required package: ggplot2Warning message:"package 'ggplot2' was built under R version 4.0.4"Warning message:"package 'gridExtra' was built under R version 4.0.4"Attaching package: 'gridExtra'

The following object is masked from 'package:dplyr':    combine

Warning message:"package 'forecast' was built under R version 4.0.4"Registered S3 methods overwritten by 'forecast':  method                 from       autoplot.Arima         ggfortify  autoplot.acf           ggfortify  autoplot.ar            ggfortify  autoplot.bats          ggfortify  autoplot.decomposed.ts ggfortify  autoplot.ets           ggfortify  autoplot.forecast      ggfortify  autoplot.stl           ggfortify  autoplot.ts            ggfortify  fitted.ar              ggfortify  fortify.ts             ggfortify  residuals.ar           ggfortify

#将汇总数据转换为时间ts格式ARMAdata <- ts(data$汇总)#绘制时序图plot.ts(ARMAdata)

可发现，存在明显的周期性，同时也有一定的趋势性，可能和气候转暖，导致电器使用率提高导致用电较多

## 白噪声检验Box.test(ARMAdata,type ="Ljung-Box")

	Box-Ljung testdata:  ARMAdataX-squared = 2927.2, df = 1, p-value < 2.2e-16

p-value < 2.2e-16 说明该序列为非随机数据,可以进行预测分析

## 平稳性检验，单位根检验adf.test(ARMAdata)

Warning message in adf.test(ARMAdata):"p-value smaller than printed p-value"




	Augmented Dickey-Fuller Test

data:  ARMAdata
Dickey-Fuller = -8.9703, Lag order = 14, p-value = 0.01
alternative hypothesis: stationary

p-value = 0.01,说明数据是平稳的

## 分析序列的自相关系数和偏自相关系数确定参数p和q
p1 <- autoplot(acf(ARMAdata,lag.max =300,plot = F))+
  ggtitle("序列自相关图")
p2 <- autoplot(pacf(ARMAdata,lag.max = 50,plot = F))+
  ggtitle("序列偏自相关图")
gridExtra::grid.arrange(p1,p2,nrow=2)

可发现，存在一定周期性，其中周期大概为96（即每天有多少记录），定阶不太熟，可用autoarima确定模型

## 偏自相关图3阶后截尾，可以认为p的取值为5左右，


## 通过观察自相关系数和偏自相关系数虽然可以确定p和q，但是这不是最好的方法，
## R提供了自动寻找序列合适的参数的函数

#利用函数自动定阶,确定合适的参数
auto.arima(ARMAdata)

Series: ARMAdata 
ARIMA(1,1,2) 

Coefficients:
         ar1      ma1     ma2
      0.5867  -0.0739  0.2721
s.e.  0.0285   0.0309  0.0218

sigma^2 estimated as 1.034:  log likelihood=-4270.49
AIC=8548.98   AICc=8548.99   BIC=8572.97

## 可以发现较好的ARMA模型为ARIMA(1,1,2)

## 对数据建立ARIMA(1,1,2)模型，并预测后面的数据
ARMAmod <- arima(ARMAdata,order = c(1,1,2))
summary(ARMAmod)

Call:
arima(x = ARMAdata, order = c(1, 1, 2))

Coefficients:
         ar1      ma1     ma2
      0.5867  -0.0739  0.2721
s.e.  0.0285   0.0309  0.0218

sigma^2 estimated as 1.033:  log likelihood = -4270.49,  aic = 8548.98

Training set error measures:
                      ME    RMSE       MAE        MPE     MAPE      MASE
Training set 0.001126811 1.01637 0.7583642 0.04113165 2.411178 0.7871583
                     ACF1
Training set -0.003829314

## 对拟合残差进行白噪声检验
Box.test(ARMAmod$residuals,type ="Ljung-Box")

	Box-Ljung testdata:  ARMAmod$residualsX-squared = 0.043683, df = 1, p-value = 0.8344

## p-value = 0.8344,说明是白噪声 信息提取完成，模型残差检验通过

## 可视化模型未来的预测值par(family = "STKaiti")plot(forecast(ARMAmod,h=500))

Warning message in title(main = main, xlab = xlab, ylab = ylab, ...):"Windows字体数据库里没有这样的字体系列"Warning message in axis(1, ...):"Windows字体数据库里没有这样的字体系列"Warning message in axis(2, ...):"Windows字体数据库里没有这样的字体系列"Warning message in axis(2, ...):"Windows字体数据库里没有这样的字体系列"Warning message in axis(2, ...):"Windows字体数据库里没有这样的字体系列"Warning message in axis(2, ...):"Windows字体数据库里没有这样的字体系列"Warning message in axis(2, ...):"Windows字体数据库里没有这样的字体系列"Warning message in axis(2, ...):"Windows字体数据库里没有这样的字体系列"Warning message in axis(2, ...):"Windows字体数据库里没有这样的字体系列"Warning message in axis(2, ...):"Windows字体数据库里没有这样的字体系列"Warning message in axis(2, ...):"Windows字体数据库里没有这样的字体系列"Warning message in axis(2, ...):"Windows字体数据库里没有这样的字体系列"Warning message in axis(2, ...):"Windows字体数据库里没有这样的字体系列"

效果不好，体现不出季节性，故不选取推荐的模型，采取季节性ARIMA模型

季节ARIMA模型(划分测试集训练集)

## 可视化序列
autoplot(ARMAdata)+ggtitle("电力负荷趋势")

length(ARMAdata)

2976

## 将数据即切分位两个部分,一部分用于训练模型，一部分用于查看预测效果
AirPas_train <- ARMAdata[1:2400]
AirPas_test <- ARMAdata[2401:2976]
adf.test(AirPas_train)

	Augmented Dickey-Fuller Test

data:  AirPas_train
Dickey-Fuller = -9.0554, Lag order = 13, p-value = 0.01
alternative hypothesis: stationary

## p-value = 0.01,说明数据是平稳的

## 分析序列的自相关系数和偏自相关系数分析参数p和q
p1 <- autoplot(acf(AirPas_train,lag.max = 400,plot = F))+
  ggtitle("序列自相关图")
p2 <- autoplot(pacf(AirPas_train,lag.max = 40,plot = F))+
  ggtitle("序列偏自相关图")
gridExtra::grid.arrange(p1,p2,nrow=2)

## 从自相关图和偏自相关图可以很明显的发现数据可能具有周期性，## 不能很好的确定参数p和q的取值,根据图可知，序列可能具有年周期性,周期为96## 使用auto.arima()函数确定模型的参数auto.arima(AirPas_train)#仅供参考，最后没用推荐的模型

Series: AirPas_train ARIMA(1,1,3) Coefficients:         ar1      ma1     ma2      ma3      0.6696  -0.1713  0.2363  -0.0821s.e.  0.0507   0.0561  0.0296   0.0378sigma^2 estimated as 0.9471:  log likelihood=-3337.17AIC=6684.35   AICc=6684.37   BIC=6713.26

#选取ARIMA(1,1,3)(0,1,0)[96] 模型ARIMA <- arima(AirPas_train, c(1, 1, 3),              seasonal = list(order = c(0, 1, 0),period =96))summary(ARIMA)

Call:arima(x = AirPas_train, order = c(1, 1, 3), seasonal = list(order = c(0, 1,     0), period = 96))Coefficients:         ar1      ma1      ma2      ma3      -0.350  -0.0117  -0.0333  -0.0587s.e.   0.158   0.1571   0.0608   0.0267sigma^2 estimated as 0.518:  log likelihood = -2510.54,  aic = 5031.07Training set error measures:                       ME      RMSE       MAE         MPE     MAPE      MASETraining set -0.001661054 0.7050728 0.5206022 -0.01890399 1.760693 0.5634299                     ACF1Training set -0.001149915

Box.test(ARIMA$residuals,type ="Ljung-Box")

	Box-Ljung testdata:  ARIMA$residualsX-squared = 0.00054543, df = 1, p-value = 0.9814

## p-value = 0.9814,此时，模型的残差已经是白噪声数据，数据中的信息已经充分的提取出来了

## 可视化模型的预测值和这是值之间的差距
par(family = "STKaiti")
plot(forecast(ARIMA,h=576),shadecols="oldstyle")
points(AirPas_train,col = "red")
lines(AirPas_train,col = "red")

#输出未来预测值,与测试集相比较，可得预测精度情况。
forecast(ARIMA,h=576)

     Point Forecast        Lo 80     Hi 80       Lo 95     Hi 95
2401       26.53587  25.61347540  27.45826  25.1251900  27.94655
2402       26.68160  25.58732655  27.77588  25.0080522  28.35515
2403       25.93017  24.64455145  27.21578  23.9639871  27.89635
2404       24.79712  23.38237500  26.21187  22.6334537  26.96079

2972       36.23935 -20.60310520  93.08181 -50.6936851 123.17239
2973       34.63735 -22.32372708  91.59843 -52.4771016 121.75181
2974       32.88335 -24.19610245  89.96281 -54.4121411 120.17885
2975       31.09935 -26.09823282  88.29694 -56.3768060 118.57551
2976       30.55535 -26.76011973  87.87083 -57.1010984 118.21181

#将预测结果转换为dataframe格式，便于提取fore<-as.data.frame(forecast(ARIMA,h=576))

#修改列名colnames(fore)<-c('fore','L80','H80','L95','H95')

#对测试集进行验证#测试集是最后6天的数据，训练集是前25天数据

library(e1071)library(caret)library(Metrics)library(readr)test_mape <- mape(fore$fore,AirPas_test)sprintf("测试集上的绝对值误差: %f",test_mape)

Warning message:"package 'e1071' was built under R version 4.0.4"Warning message:"package 'caret' was built under R version 4.0.4"Loading required package: latticeWarning message:"package 'Metrics' was built under R version 4.0.4"Attaching package: 'Metrics'

The following objects are masked from 'package:caret':    precision, recall

The following object is masked from 'package:forecast':

    accuracy

Warning message:
"package 'readr' was built under R version 4.0.4"

‘测试集上的绝对值误差: 0.046793’

测试集误差为4.67%，模型效果良好，故可选取该模型进行预测

#再预测未来一天，即4/1的情况如下(1天有96步)
forecast(ARIMA,h=672)

     Point Forecast        Lo 80     Hi 80       Lo 95     Hi 95
2401       26.53587  25.61347540  27.45826  25.1251900  27.94655
2402       26.68160  25.58732655  27.77588  25.0080522  28.35515
2403       25.93017  24.64455145  27.21578  23.9639871  27.89635
2404       24.79712  23.38237500  26.21187  22.6334537  26.96079

3069       34.94508 -35.74324936 105.63341 -73.1633900 143.05355
3070       33.19108 -37.62709810 104.00926 -75.1159765 141.49813
3071       31.40708 -39.54070920 102.35487 -77.0981996 139.91236
3072       30.86308 -40.21408394 101.94024 -77.8400612 139.56622

### 将预测结果转换为dataframe格式，便于提取
fore<-as.data.frame(forecast(ARIMA,h=672))
#修改列名
colnames(fore)<-c('fore','L80','H80','L95','H95')
#提取出最后的4/1的数据
data4_1<-fore[577:672,]

data4_1

306639.91908-30.37826110.2164-67.59143147.4296
306738.46808-31.95983108.8960-69.24212146.1783
306836.54708-34.01116107.1053-71.36244144.4566
306934.94508-35.74325105.6334-73.16339143.0535
307033.19108-37.62710104.0093-75.11598141.4981
307131.40708-39.54071102.3549-77.09820139.9124
307230.86308-40.21408101.9402-77.84006139.5662

A data.frame: 96 × 5
	fore	L80	H80	L95	H95

2977	28.38222	-29.11727	85.88172	-59.55567	116.3201
2978	28.52796	-29.12935	86.18526	-59.65128	116.7072

聚类分析部分

指标数据在EXCEL中计算可得：

#导入数据
library(readxl)
dataclus<-read_excel("电力.xlsx",sheet=3)
#指标用EXCEL处理得到

dataclus<-as.data.frame(dataclus)rownames(dataclus)<-dataclus$时间

head(dataclus)

A data.frame: 6 × 8
	时间	PAVE	PMIN	PMAX	K1	K2	K3	TOTAL

东城站10kV广源线F10有功值	东城站10kV广源线F10有功值	1.2967500	0.000	5.130	0.2527778	1.0000000	188.0667	3859.128
东城站10kV工业园甲线F09有功值	东城站10kV工业园甲线F09有功值	1.4396468	0.304	3.032	0.4748176	0.8997361	353.2643	4284.389
东城站10kV两报线F08有功值	东城站10kV两报线F08有功值	1.4852127	0.685	2.783	0.5336733	0.7538627	397.0529	4419.993
东城站10kV中惠甲线F07有功值	东城站10kV中惠甲线F07有功值	1.4884728	0.541	2.719	0.5474339	0.8010298	407.2908	4429.695
东城站10kV奕垌线F06有功值	东城站10kV奕垌线F06有功值	0.9472083	0.144	2.326	0.4072263	0.9380911	302.9764	2818.892
东城站10kV东城线F05有功值	东城站10kV东城线F05有功值	1.4619106	0.639	2.580	0.5666320	0.7523256	421.5742	4350.646

cludata<-dataclus[,c(5:7)]

library(RSNNS)## 数据max-min归一化到0-1之间cludata[,1:3] <- normalizeData(cludata[,1:3],"0_1")

Warning message:"package 'RSNNS' was built under R version 4.0.5"Loading required package: Rcpp

## 计算组内平方和  组间平方和
tot_withinss <- vector()
betweenss <- vector()
for(ii in 1:8){
  k1 <- kmeans(cludata[,c(1:3)],ii)
  tot_withinss[ii] <- k1$tot.withinss
  betweenss[ii] <- k1$betweenss
}

kmeanvalue <- data.frame(kk = 1:8,
                         tot_withinss = tot_withinss,
                         betweenss = betweenss)

library(ggplot2)
library(gridExtra)
library(ggdendro)
library(cluster)
library(ggfortify)
p1 <- ggplot(kmeanvalue,aes(x = kk,y = tot_withinss))+
  theme_bw()+
  geom_point() + geom_line() +labs(y = "value") +
  ggtitle("Total within-cluster sum of squares")+
  theme(plot.title = element_text(hjust = 0.5))+
  scale_x_continuous("kmean 聚类个数",kmeanvalue$kk)

p2 <- ggplot(kmeanvalue,aes(x = kk,y = betweenss))+
  theme_bw()+
  geom_point() +geom_line() +labs(y = "value") +
  ggtitle("The between-cluster sum of squares") +
  theme(plot.title = element_text(hjust = 0.5))+
  scale_x_continuous("kmean 聚类个数",kmeanvalue$kk)

grid.arrange(p1,p2,nrow=2)

Warning message:"package 'ggplot2' was built under R version 4.0.4"Warning message:"package 'gridExtra' was built under R version 4.0.4"Warning message:"package 'ggdendro' was built under R version 4.0.4"Warning message:"package 'ggfortify' was built under R version 4.0.4"

set.seed(245)k3 <- kmeans(cludata[,c(1:3)],3)summary(k3)

             Length Class  Mode   cluster      30     -none- numericcenters       9     -none- numerictotss         1     -none- numericwithinss      3     -none- numerictot.withinss  1     -none- numericbetweenss     1     -none- numericsize          3     -none- numericiter          1     -none- numericifault        1     -none- numeric

## 对聚类结果可视化clusplot(cludata[,c(1:3)],k3$cluster,main = "kmean cluster number=3")

## 可视化轮廓图，表示聚类效果sis1 <- silhouette(k3$cluster,dist(cludata[,c(1:3)],method = "euclidean"))plot(sis1,main = " kmean silhouette",     col = c("red", "green", "blue"))

#将标签写入
cludata$bzcluster<-k3$cluster

#标准化数据版本
cludata

A data.frame: 30 × 4
	K1	K2	K3	bzcluster

东城站10kV广源线F10有功值	0.3986848	1.0000000	0.3986848	2
东城站10kV工业园甲线F09有功值	0.7488892	0.8997361	0.7488892	1
东城站10kV两报线F08有功值	0.8417172	0.7538627	0.8417172	1
东城站10kV中惠甲线F07有功值	0.8634207	0.8010298	0.8634207	1
东城站10kV奕垌线F06有功值	0.6422832	0.9380911	0.6422832	2
东城站10kV东城线F05有功值	0.8937003	0.7523256	0.8937003	1
东城站10kV碧桂园甲线F04有功值	0.9282365	0.6783961	0.9282365	1
东城站10kV县府线F03有功值	0.8807823	0.7262639	0.8807823	1
东城站10kV工业园乙线F11有功值	0.7496690	0.9485219	0.7496690	1
东城站10kV工业南线F12有功值	0.6354980	0.9377328	0.6354980	2
东城站10kV喜之郎甲线F13有功值	0.8147030	0.9619663	0.8147030	1
东城站10kV喜之郎乙线F14有功值	1.0000000	0.9737654	1.0000000	1
东城站10kV丹载线F15有功值	0.0000000	0.0000000	0.0000000	3
东城站10kV永民线F16有功值	0.6166640	0.8958105	0.6166640	2
东城站10kV兴中线F17有功值	0.7362025	0.8496281	0.7362025	1
东城站10KV龙日线F18有功值	0.5142506	0.8512881	0.5142506	2
东城站10kV碧桂园乙线F19有功值	0.9850771	0.6629902	0.9850771	1
东城站10kV石仑线F20有功值	0.8110076	0.8084220	0.8110076	1
东城站10KV东泰线F32有功值	0.8136237	0.7685460	0.8136237	1
东城站10kV环山线F31有功值	0.7980173	0.8675737	0.7980173	1
东城站10kV东供线F21有功值	0.5690338	1.0000000	0.5690338	2
东城站10kV中惠乙线F22有功值	0.8914599	0.6840640	0.8914599	1
东城站10kV佰利线F30有功值	0.8843735	0.7326007	0.8843735	1
东城站10kV东轩线F29有功值	0.8633316	0.7284010	0.8633316	1
东城站10kV大道线F28有功值	0.9083081	1.0000000	0.9083081	1
东城站10kV华科乙线F27有功值	0.5140382	1.0000000	0.5140382	2
东城站10kV华科甲线F26有功值	0.3354361	1.0000000	0.3354361	2
东城站10kV金桂线F25有功值	0.7886029	0.7896907	0.7886029	1
东城站10kV福兴线F24有功值	0.6894732	1.0000000	0.6894732	2
东城站10kV龙塘线F23有功值	0.0000000	0.0000000	0.0000000	3

aggregate(cludata[,c(1:3)],list(cludata$bzcluster),mean)

A data.frame: 3 × 4
Group.1	K1	K2	K3

1	0.8526907	0.8098834	0.8526907
2	0.5461513	0.9581025	0.5461513
3	0.0000000	0.0000000	0.0000000

#将标签写入（原始数据版本）dataclus$bzcluster<-k3$cluster

dataclus

东城站10kV碧桂园甲线F04有功值东城站10kV碧桂园甲线F04有功值0.71918250.3931.2220.58852900.6783961437.86562140.2871
东城站10kV县府线F03有功值东城站10kV县府线F03有功值    1.81158470.8883.2440.55844160.7262639415.48065391.2761
东城站10kV工业园乙线F11有功值东城站10kV工业园乙线F11有功值0.93256220.1011.9620.47531200.9485219353.63212775.3051
东城站10kV工业南线F12有功值东城站10kV工业南线F12有功值  2.27128390.3515.6370.40292420.9377328299.77566759.3412
东城站10kV喜之郎甲线F13有功值东城站10kV喜之郎甲线F13有功值1.43961220.1062.7870.51654550.9619663384.30984284.2861

东城站10kV福兴线F24有功值东城站10kV福兴线F24有功值    1.34859580.0003.0850.43714611.0000000325.23674013.4212
东城站10kV龙塘线F23有功值东城站10kV龙塘线F23有功值    0.00000000.0000.0000.00000000.0000000  0.0000   0.0003

A data.frame: 30 × 9
	时间	PAVE	PMIN	PMAX	K1	K2	K3	TOTAL	bzcluster

东城站10kV广源线F10有功值	东城站10kV广源线F10有功值	1.2967500	0.000	5.130	0.2527778	1.0000000	188.0667	3859.128	2
东城站10kV工业园甲线F09有功值	东城站10kV工业园甲线F09有功值	1.4396468	0.304	3.032	0.4748176	0.8997361	353.2643	4284.389	1
东城站10kV两报线F08有功值	东城站10kV两报线F08有功值	1.4852127	0.685	2.783	0.5336733	0.7538627	397.0529	4419.993	1

#各类比分类统计平均值，得到不同类别之间的差异
aggregate(dataclus[,c(5:8)],list(dataclus$bzcluster),mean)

A data.frame: 3 × 5
Group.1	K1	K2	K3	TOTAL

1	0.5406307	0.8098834	402.2293	3361.270
2	0.3462759	0.9581025	257.6292	3786.549
3	0.0000000	0.0000000	0.0000	0.000

你可能感兴趣的:(R语言数据分析与挖掘,电力行业,预测,时间序列,数据分析,聚类分析)

Boltz-2：革命性生物分子模型，加速药物发现的新引擎花生糖@ AIGC学习资料库 Boltz-2 生物模型 AI
在药物研发领域，预测蛋白质与其他分子间的结合强度（BindingAffinity）始终是核心挑战之一。传统方法如自由能微扰法（FEP）虽然精确，但计算成本极高，难以大规模应用。如今，Boltz-2的诞生打破了这一瓶颈——这是首个开源的深度学习模型，其结合强度预测准确度接近FEP方法，却将速度提升了1000倍，成为药物早期筛选的“加速器”。项目简介Boltz-2是由jwohlwend团队开发的生物分
6款专业漏斗图工具，提升你的分析效率 Designseek满血版信息可视化人工智能
漏斗图，这一以漏斗形状展示数据逐步减少情况的可视化工具，在日常数据分析中扮演着重要角色。它通过直观的宽度变化，展现了从一阶段到另一阶段数据的流失率，从而清晰地揭示了不同阶段的数据转换效果。通常，漏斗图自上而下排列，顶部代表初始数据，而随着向下的进展，数据逐渐减少，体现了各阶段的流转情况。在数据分析和商业汇报中，漏斗图因其直观展示流程转化率的特性，成为数据可视化的核心工具之一。无论是销售漏斗、用户行
2025最新盘点：9款高效韦恩图工具推荐 Designseek满血版人工智能图论
在数据分析、逻辑推理以及众多学术研究领域，韦恩图都扮演着极为关键的角色。它以直观的圆形或椭圆形重叠区域，清晰地展现出不同集合之间的关系，无论是集合间的交集、并集还是补集，都能一目了然地呈现出来。无论是学生在学习数学、逻辑学课程时梳理知识点，还是专业人士在进行市场调研、项目规划时分析数据，亦或是科研人员在撰写论文、展示研究成果时阐述理论框架，一款好用的韦恩图绘制工具都显得至关重要。今天，就让我为大家
【机器学习笔记 Ⅱ】4 神经网络中的推理
推理（Inference）是神经网络在训练完成后利用学到的参数对新数据进行预测的过程。与训练阶段不同，推理阶段不计算梯度也不更新权重，仅执行前向传播。以下是其实现原理和代码示例的完整解析：1.推理的核心步骤加载训练好的模型参数（权重和偏置）。前向传播：输入数据逐层计算，得到输出。后处理：根据任务类型解析输出（如分类取概率最大值，回归直接输出）。2.代码实现（Python+NumPy）(1)定义模型
OpenCV 人脸分析------面部关键点检测类cv::face::FacemarkLBF 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述使用LocalBinaryFeatures(LBF)算法进行面部关键点检测（faciallandmarkdetection）。该算法通过级联回归树预测人脸的68个关键点，具有较高的精度和速度。公共成员函数staticPtrcreate(constParams&pa
AI+Web3：从自动化工具到自主经济体的范式革命 Loving_enjoy 计算机学科论文创新点迁移学习人工智能机器学习
>想象你的AI助手不仅能回答问题，还能自主管理你的加密资产、参与DAO治理、在预测市场博弈，甚至为你创造持续收益——欢迎来到AI与Web3融合的新世界。传统互联网（Web2）的AI困在中心化的牢笼中：数据被垄断在科技巨头手中，算法决策如同黑箱，用户沦为被动的数据奶牛。**Web3与AI的碰撞正在打破这一枷锁**，催生出去中心化的自主智能体（AIAgent），它们拥有数字身份、加密钱包和经济决策权，
【机器学习笔记 Ⅲ】3 异常检测算法巴伦是只猫机器学习机器学习笔记算法
异常检测算法（AnomalyDetection）详解异常检测是识别数据中显著偏离正常模式的样本（离群点）的技术，广泛应用于欺诈检测、故障诊断、网络安全等领域。以下是系统化的解析：1.异常类型类型描述示例点异常单个样本明显异常信用卡交易中的天价消费上下文异常在特定上下文中异常（如时间序列）夏季气温突降至零下集体异常一组相关样本联合表现为异常网络流量中突然的DDOS攻击流量2.常用算法(1)基于统计的
【机器学习笔记 Ⅲ】4 特征选择巴伦是只猫机器学习机器学习笔记人工智能
特征选择（FeatureSelection）系统指南特征选择是机器学习中优化模型性能的关键步骤，通过筛选最相关、信息量最大的特征，提高模型精度、降低过拟合风险并加速训练。以下是完整的特征选择方法论：1.特征选择的核心目标提升模型性能：去除噪声和冗余特征，增强泛化能力。降低计算成本：减少训练和预测时间。增强可解释性：简化模型，便于业务理解。2.特征选择方法分类(1)过滤法（FilterMethods
机器学习笔记二-回归
回归是统计学和机器学习中的一种基本方法，用于建模变量之间的关系，特别是用一个或多个自变量（输入变量）来预测一个因变量（输出变量）的值。回归分析广泛应用于预测、趋势分析和关联研究中。根据目标和数据的性质，可以使用不同类型的回归方法。1.回归的基本概念：自变量（IndependentVariable）:也称为预测变量、解释变量，是模型中的输入变量，用于预测或解释因变量的变化。因变量（Dependent
量化开发（系列第3篇）： C++在高性能量化交易中的核心应用与技术栈深度解析 Natsume1710 c++开发语言性能优化 python
本文为《量化开发》系列第3篇参考GitHub项目：Awesome-QuantDev-Learn前言在量化交易领域，Python以其开发效率高、生态系统丰富等优势，成为策略研究、数据分析及中低频交易的首选语言。在本系列前两篇文章中，我们详细探讨了Python在量化入门与策略回测中的实践。然而，当进入对延迟要求极为严苛的高频交易（High-FrequencyTrading,HFT）领域时，Python
Python量化策略与回测框架实战：从“纸上谈兵”到“真金白银”的第一步（系列第2篇） Natsume1710 python 开发语言 github
作者：GitHub项目地址Awesome-QuantDev-Learn本文为量化开发学习路线系列第2篇，欢迎收藏与关注。引言：为什么选择Python作为量化入门的起点？在上一篇文章中，我们详细讲解了量化开发的基本框架与开发者思维的转变路径。那么，具体要如何开始第一步实践呢？答案是：从Python入门。Python以其快速原型开发能力、丰富的数据分析工具包，以及良好的社区生态，已经成为全球范围内量化
FPS射击游戏状态同步架构方案你一身傲骨怎能输游戏开发技术专栏游戏架构
文章摘要本文提出了一种FPS射击游戏的状态同步架构方案，旨在实现低延迟、高一致性和抗作弊。采用服务器权威架构，客户端仅提供输入和预测渲染，服务器验证并广播状态。通过客户端预测、服务器校正和增量同步机制优化延迟与带宽，同时利用事件驱动同步确保关键事件一致。网络优化包括数据压缩、差异编码和优先级排序。方案还包含输入验证、反作弊措施和容错机制，并通过示例数据包设计和流程说明具体实现。优势包括低延迟、状态
如何在YashanDB中实现数据趋势预测数据库
数据趋势预测已成为数据驱动决策中的一个重要方面。在面临海量数据时，如何精确而高效地提取潜在趋势，对于企业的战略规划具有重要意义。YashanDB作为一款高性能的数据库产品，提供多种存储和查询优化功能，使得实现数据趋势预测成为可能。特别是在数据存储结构和多版本并发控制（MVCC）等特性下，趋势预测的场景应用可以得到有效支持。数据分析基础在进行数据趋势预测之前，首先必须了解基础的数据分析过程。Yash
Python编程电子书：从基础到实践王奥雷
本文还有配套的精品资源，点击获取简介：Python电子书汇集了基础语法、面向对象编程、标准及第三方库使用、文件操作、网络编程、并发编程、单元测试与调试、Python2与Python3的区别等核心知识点。通过实例和项目案例，帮助读者在Web开发、数据分析、人工智能等应用领域提升编程技能，跟上Python的技术进步。1.Python基础语法介绍Python作为一种高级编程语言，其易读性和简洁的语法使其
Python爬虫实战：研究chardet库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 chardet
1.引言1.1研究背景与意义在互联网信息爆炸的时代，网络数据采集技术已成为信息获取、数据分析和知识发现的重要手段。Python作为一种高效的编程语言，凭借其丰富的第三方库和简洁的语法，成为爬虫开发的首选语言之一。然而，在网络数据采集中，文本编码的多样性和不确定性一直是困扰开发者的主要问题之一。不同网站可能采用不同的编码方式（如UTF-8、GBK、GB2312等），甚至同一网站的不同页面也可能使用不
蛋白质结构预测/功能注释/交互识别/按需设计，中国海洋大学张树刚团队直击蛋白质智能计算核心任务 hyperai
蛋白质作为生命活动的主要承担者，在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设计效率低下等挑战。近年来，生命科学对蛋白质复杂特性解析的需求日益迫切，大数据、深度学习、多模态计算等技术的突破性发展，为构建蛋白质智能计算体系提供了全新的发展契机。蛋白质智能计算体系的构建，使得蛋白质在大规模功能注释、交互预测及三维结构建模等领域取得显著成果，为药物发现与生
【Statsmodels和SciPy介绍与常用方法】机器学习司猫白 scipy statsmodels 统计
Statsmodels库介绍与常用方法Statsmodels是一个强大的Python库，专注于统计建模和数据分析，广泛应用于经济学、金融、生物统计等领域。它提供了丰富的统计模型、假设检验和数据探索工具，适合进行回归分析、时间序列分析等任务。本文将介绍Statsmodels的核心功能，并通过代码示例展示其常用方法。Statsmodels简介Statsmodels建立在NumPy和SciPy的基础上，
如何自定义R语言函数？参数中的省略号`...`有什么用？「已注销」 python 编程语言 java 人工智能 c++
学习R未必要学习很多工具包，有时候根据自己的理解去自定义函数也是一个不错的选择。本篇推文主要介绍两方面的内容：在R语言中自定义函数的一般方法；函数参数中...的作用。在看函数的帮助文档时会发现许多函数的参数中都有...符号，它是表示被省略的参数吗？如果是，作者为什么会省略它？如果不是，那又表示什么含义呢？不久前，学堂君分享了自己编写的计算空间可达性的函数，详见推文：两步移动搜索法（2SFCA）计算
使用AutoKeras2.0的AutoModel进行结构化数据回归预测
1、FirstofAll:ReadTheFuckingSourceCodeimportautokerasasakimportnumpyasnpfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportmean_squared_error#生成数据集np.random.seed(42)x=np.random.r
Logistic回归预测模型2：R语言实现模型的内部和外部验证
前面我们讲了logistic回归预测模型的建立，今天介绍的是模型的验证，可以在训练集和验证集中通过ROC曲线、校准曲线和决策曲线分别进行验证。1、原始数据原始数据分为训练集和验证集，其中训练集用于模型的构建和内部验证，验证集用于外部验证。两个数据集都包含5列，且列名相同。组别Group为因变量，1代表阳性结局，0代表阴性结局。自变量1和4为连续性变量，自变量2和3为二分类变量。2、安装所需要的R包
R 列表：深入解析与高效应用沐知全栈开发开发语言
R列表：深入解析与高效应用引言在R语言中，列表（List）是一种非常重要的数据结构，它允许我们将不同类型的数据组合在一起。列表在数据分析和统计建模中扮演着至关重要的角色。本文将深入探讨R列表的概念、创建方法、操作技巧以及在实际应用中的高效使用。R列表概述定义R列表是一种可以包含多种数据类型的数据结构，如数值、字符、逻辑值、其他列表等。列表可以看作是一个容器，可以存储任意数量的元素。类型R列表分为两
机器人动力学模型及其线性化阻抗控制模型
机器人动力学模型机器人动力学模型描述了机器人的运动与所受力和力矩之间的关系。这个模型考虑了机器人的质量、惯性、关节摩擦、重力等多种因素，用于预测和解释机器人在给定输入下的动态行为。动力学模型是设计机器人控制器的基础，它可以帮助我们理解机器人如何响应控制指令，并优化机器人的运动性能。具体来说，机器人动力学模型通常由一组微分方程组成，这些方程描述了机器人各关节的加速度、速度和位置与施加在关节上的力和力
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
Python 数据分析实践：车辆行驶数据处理心得 lzzy-lt-0415 python 数据分析开发语言
在数据驱动决策的大趋势下，Python凭借其丰富的数据分析库，成为处理各类数据的得力工具。近期我围绕车辆行驶数据展开分析，过程中收获诸多实战经验，在此分享用Python进行数据处理与分析的心得，也结合代码讲讲实际运用思路。一、数据导入与初步探索：开启分析第一步importpandasaspd#导入数据df=pd.read_excel(r'../../数据层/数据集合/车辆行驶记录表单2.xlsx'
DTW 动态时间规整：时间序列的柔性桥梁
在时间的长河中，数据如浪花般不断涌现，而时间序列数据更是其中璀璨的存在。当我们试图比较两段时间序列时，常常会遇到一个棘手的问题：就像两位舞者，他们演绎着相同的舞蹈，却有着不同的节奏与速度，直接对比难以判断二者的相似度。而DTW（DynamicTimeWarping，动态时间规整）算法，就像一座神奇的柔性桥梁，能够跨越时间节奏的差异，精准度量时间序列间的相似性，在众多领域发挥着不可或缺的作用。一、D
使用 Bank Churn 数据集进行二元分类
一、前言分类任务：预测客户是继续使用其帐户还是关闭帐户（例如，流失）项目地址：https://www.kaggle.com/competitions/playground-series-s4e1二、具体步骤（一）数据导入与预览importpandasaspdimportnumpyasnpimportmatplotlib.pylabaspltimportseabornassnsfromsklearn
Python 数据分析与可视化 Day 14 - 建模复盘 + 多模型评估对比（逻辑回归 vs 决策树）蓝婷儿 python python 数据分析逻辑回归
✅今日目标回顾整个本周数据分析&建模流程学会训练第二种模型：决策树（DecisionTree）掌握多模型对比评估的方法与实践输出综合对比报告：准确率、精确率、召回率、F1等指标为后续模型调优与扩展打下基础一、本周流程快速回顾步骤内容第1天高级数据操作（索引、透视、变形）第2天缺失值和异常值处理第3天多表合并与连接第4天特征工程（编码、归一化、时间）第5天数据集拆分（训练集/测试集）第6天逻辑回归模
用mysql作excel数据分析_怎样用 Excel 做数据分析？一只帅鸟
基本Excel快捷键【最好用的复制命令】Ctrl+R向右复制Ctrl+D向下复制【选择格式粘贴】Ctrl+Alt+V【求和功能】Alt+=然后按回车键【格式调整】Ctrl+Shift+7加上外边框Ctrl+Shift+-去掉边框Ctrl+Shift+5改成%数值格式【视图调整及编辑】Ctrl+Shift+=插入行Ctrl+-删除【终极】开始工具栏所有的命令都可以通过Alt-H-调用(如下图键入相应
Spring Boot 牵手EasyExcel：解锁高效数据处理姿势灵犀学长 Spring Boot 全栈开发 spring boot java 架构微服务后端
引言在日常的Java开发中，处理Excel文件是一个极为常见的需求。无论是数据的导入导出，还是报表的生成，Excel都扮演着重要的角色。例如，在企业的财务管理系统中，需要将每月的财务数据导出为Excel报表，方便财务人员进行数据分析和审计；在人力资源管理系统中，可能需要导入员工的基本信息、考勤记录等数据到系统中。然而，传统的Excel处理方式，如使用POI等工具，虽然功能强大，但在面对复杂的业务场
Linux: perf: debug问题一例，cpu使用率上升大约2%；多线程如何细化cpu及perf数据分析 mzhan017 kernel 系统性能 linux 服务器网络
文章目录前提面临的问题内核级别函数的差别继续debug总结根据pid前提一个进程安置在一个CPU上，新功能上线之后，固定量的业务打起来，占用的CPU是42%。之前没有新功能的情况下，CPU占用是40%。差了大约2%。而且这个进程里的线程数非常多，有50多个线程。从差距看变化不大，没有别的办法，只能使用perf来抓取数据来看。但是使用perf也要面临很多的问题。面临的问题面临的问题有一堆：两次per
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号