拓端研究室

R语言Fama-French三因子模型实际应用：优化投资组合|附代码数据

全文下载链接：http://tecdat.cn/?p=20360

本文将说明金融数学中的R 语言优化投资组合，Fama-French三因子（因素）模型的实现和使用。

具有单一市场因素的宏观经济因素模型

我们将从一个包含单个已知因子（即市场指数）的简单示例开始。该模型为

其中显式因子ft为S＆P 500指数。我们将做一个简单的最小二乘（LS）回归来估计截距α和加载β：

大多数代码行用于准备数据，而不是执行因子建模。让我们开始准备数据：

 # 设置开始结束日期和股票名称列表
begin_date <- "2016-01-01"
end_date <- "2017-12-31"


# 从YahooFinance下载数据
data_set <- xts()
for (stock_index in 1:length(stock_namelist))
  data_set <- cbind(data_set, Ad(getSymbols(stock_namelist[stock_index], 
                                            from = begin_date, to = end_date, 
head(data_set)
#>                AAPL  AMD      ADI     ABBV AEZS        A       APD       AA       CF
#> 2016-01-04 98.74225 2.77 49.99239 49.46063 4.40 39.35598 107.89010 23.00764 35.13227
#> 2016-01-05 96.26781 2.75 49.62508 49.25457 4.21 39.22057 105.96097 21.96506 34.03059
#> 2016-01-06 94.38389 2.51 47.51298 49.26315 3.64 39.39467 103.38042 20.40121 31.08988
#> 2016-01-07 90.40047 2.28 46.30082 49.11721 3.29 37.72138  99.91463 19.59558 29.61520
#> 2016-01-08 90.87848 2.14 45.89677 47.77789 3.29 37.32482  99.39687 19.12169 29.33761
#> 2016-01-11 92.35001 2.34 46.98954 46.25827 3.13 36.69613  99.78938 18.95583 28.14919

head(SP500_index)
#>              index
#> 2016-01-04 2012.66
#> 2016-01-05 2016.71
#> 2016-01-06 1990.26
#> 2016-01-07 1943.09
#> 2016-01-08 1922.03
#> 2016-01-11 1923.67
plot(SP500_index)

 # 计算股票和SP500指数的对数收益率作为显式因子
X <- diff(log(data_set), na.pad = FALSE)
N <- ncol(X)  # 股票数量
T <- nrow(X)  # 天数

现在我们准备进行因子模型拟合。LS拟合很容易在R中实现，如下所示：

 beta <- cov(X,f)/as.numeric(var(f))
alpha <- colMeans(X) - beta*colMeans(f)
sigma2 <- rep(NA, N)

print(alpha)
#>              index
#> AAPL  0.0003999086
#> AMD   0.0013825599
#> ADI   0.0003609968
#> ABBV  0.0006684632
#> AEZS -0.0022091301
#> A     0.0002810616
#> APD   0.0001786375
#> AA    0.0006429140
#> CF   -0.0006029705
print(beta)
#>          index
#> AAPL 1.0957919
#> AMD  2.1738304
#> ADI  1.2683047
#> ABBV 0.9022748
#> AEZS 1.7115761
#> A    1.3277212
#> APD  1.0239453
#> AA   1.8593524
#> CF   1.5702493

或者，我们可以使用矩阵表示法进行拟合

，我们定义和扩展因子。然后最小化

 t(X) %*% F_ %*% solve(t(F_) %*% F_)  

#>              alpha      beta
#> AAPL  0.0003999086 1.0957919
#> AMD   0.0013825599 2.1738304
#> ADI   0.0003609968 1.2683047
#> ABBV  0.0006684632 0.9022748
#> AEZS -0.0022091301 1.7115761
#> A     0.0002810616 1.3277212
#> APD   0.0001786375 1.0239453
#> AA    0.0006429140 1.8593524
#> CF   -0.0006029705 1.5702493
E <- xts(t(t(X) - Gamma %*% t(F_)), index(X))  # 残差

另外，我们可以简单地使用R为我们完成工作：

 cbind(alpha = factor_model$alpha, beta = factor_model$beta)
#>              alpha     index
#> AAPL  0.0003999086 1.0957919
#> AMD   0.0013825599 2.1738304
#> ADI   0.0003609968 1.2683047
#> ABBV  0.0006684632 0.9022748
#> AEZS -0.0022091301 1.7115761
#> A     0.0002810616 1.3277212
#> APD   0.0001786375 1.0239453
#> AA    0.0006429140 1.8593524
#> CF   -0.0006029705 1.5702493

可视化协方差矩阵

有趣的是，可视化对数收益率[算术处理误差]

以及残差Ψ的估计协方差矩阵。让我们从对数收益率的协方差矩阵开始：

main = "单因子模型对数收益的协方差矩阵")

点击标题查阅往期内容

Python基于粒子群优化的投资组合优化研究

左右滑动查看更多

我们可以观察到所有股票都是高度相关的，这是市场因素的影响。为了检查股票相关关系，我们绘制相关图：

plot(cov2cor(Psi),
         main = "残差协方差矩阵")

 cbind(stock_namelist, sector_namelist)  # 股票的行业
#>       stock_namelist sector_namelist         
#>  [1,] "AAPL"         "Information Technology"
#>  [2,] "AMD"          "Information Technology"
#>  [3,] "ADI"          "Information Technology"
#>  [4,] "ABBV"         "Health Care"           
#>  [5,] "AEZS"         "Health Care"           
#>  [6,] "A"            "Health Care"           
#>  [7,] "APD"          "Materials"             
#>  [8,] "AA"           "Materials"             
#>  [9,] "CF"           "Materials"

有趣的是，我们可以观察到对Ψ执行的自动聚类可以正确识别股票的行业。

评估投资资金

在此示例中，我们将基于因子模型评估几种投资基金的绩效。我们将标准普尔500指数作为明确的市场因素，并假设无风险收益为零 rf = 0。特别是，我们考虑六种交易所买卖基金（ETF）：

我们首先加载数据：

 # 设置开始结束日期和股票名称列表
begin_date <- "2016-10-01"
end_date <- "2017-06-30"

# 从YahooFinance下载数据
data_set <- xts()
for (stock_index in 1:length(stock_namelist))
  data_set <- cbind(data_set, Ad(getSymbols(stock_namelist[stock_index], 

head(data_set)
#>                 SPY   XIVH     SPHB     SPLV     USMV      JKD
#> 2016-10-03 203.6610 29.400 31.38322 38.55683 42.88382 119.8765
#> 2016-10-04 202.6228 30.160 31.29729 38.10687 42.46553 119.4081
#> 2016-10-05 203.5195 30.160 31.89880 38.02249 42.37048 119.9421
#> 2016-10-06 203.6610 30.160 31.83196 38.08813 42.39899 120.0826
#> 2016-10-07 202.9626 30.670 31.58372 37.98500 42.35146 119.8296
#> 2016-10-10 204.0197 31.394 31.87970 38.18187 42.56060 120.5978

head(SP500_index)
#>              index
#> 2016-10-03 2161.20
#> 2016-10-04 2150.49
#> 2016-10-05 2159.73
#> 2016-10-06 2160.77
#> 2016-10-07 2153.74
#> 2016-10-10 2163.66

# 计算股票和SP500指数的对数收益率作为显式因子
X <- diff(log(data_set), na.pad = FALSE)
N <- ncol(X)  # 股票数量
T <- nrow(X)  # 天数

现在我们可以计算所有ETF的alpha和beta：

 #>              alpha      beta
#> SPY   7.142225e-05 1.0071424
#> XIVH  1.810392e-03 2.4971086
#> SPHB -2.422107e-04 1.5613533
#> SPLV  1.070918e-04 0.6777149
#> USMV  1.166177e-04 0.6511667
#> JKD   2.569578e-04 0.8883843

现在可以进行一些观察：

SPY是S＆P 500的ETF，如预期的那样，其alpha值几乎为零，beta值几乎为1：α= 7.142211×10-5和 β= 1.0071423。
XIVH是具有高alpha值的ETF，计算出的alpha值是ETF中最高的（高1-2个数量级）：α= 1.810392×10-3。
SPHB是一种ETF，据推测具有很高的beta，而计算出的beta却是最高的，但不是最高的：β= 1.5613531。有趣的是，计算出的alpha为负，因此，该ETF应谨慎。
SPLV是降低波动性的ETF，实际上，计算得出的beta偏低：β= 0.6777072。
USMV还是降低波动性的ETF，实际上，计算出的beta是最低的：β= 0.6511671。
JKD显示出很好的折衷。

我们可以使用一些可视化：

barplot(rev(alpha), horiz = TRUE, main = "alph

我们还可以使用例如Sharpe比率，以更系统的比较不同的ETF。回顾一种资产和一个因素的因子模型

我们获得

夏普比率如下：

假设。因此，基于Sharpe比率对不同资产进行排名的一种方法是根据α/β比率对它们进行排名：

 print(ranking)
#>         alpha/beta         SR         alpha      beta
#> XIVH  7.249952e-04 0.13919483  1.810392e-03 2.4971086
#> JKD   2.892417e-04 0.17682677  2.569578e-04 0.8883843
#> USMV  1.790904e-04 0.12280053  1.166177e-04 0.6511667
#> SPLV  1.580189e-04 0.10887903  1.070918e-04 0.6777149
#> SPY   7.091574e-05 0.14170591  7.142225e-05 1.0071424
#> SPHB -1.551287e-04 0.07401566 -2.422107e-04 1.5613533

可以看到：

就α/β而言，XIVH最佳（α最大），而SPHB最差（α负）。
就夏普比率（更确切地说，是信息比率，因为我们忽略了无风险利率）而言，JDK是最好的，其次是SPY。这证实了大多数投资基金的表现不超过市场的观点。
显然，无论以哪种衡量标准，SPHB都是最差的：负α，负β比率和Sharpe比率。
JDK之所以能够取得最佳性能，是因为它的alpha值很好（尽管不是最好的），而同时具有0.88的中等beta值。
XIVH和SPHB有大量不同的beta，因此在市场上具有极端敞口。
USMV在市场上的曝光率最小，有可接受的alpha值，并且其Sharpe比率接近第二和第三高的位置。

Fama-French三因子模型

该示例将说明使用标准普尔500指数中的九种股票的Fama-French三因子模型。让我们从加载数据开始：

 # 设置开始结束日期和股票名称列表
begin_date <- "2013-01-01"
end_date <- "2017-08-31"

# 从YahooFinance下载数据
data_set <- xts()
for (stock_index in 1:length(stock_namelist))
  data_set <- cbind(data_set, Ad(getSymbols(stock_namelist[stock_index], 

# 下载Fama-French因子


head(fama_lib)
#>            Mkt.RF   SMB   HML
#> 1926-07-01   0.10 -0.24 -0.28
#> 1926-07-02   0.45 -0.32 -0.08
#> 1926-07-06   0.17  0.27 -0.35
#> 1926-07-07   0.09 -0.59  0.03
#> 1926-07-08   0.21 -0.36  0.15
#> 1926-07-09  -0.71  0.44  0.56
tail(fama_lib)
#>            Mkt.RF   SMB   HML
#> 2017-11-22  -0.05  0.10 -0.04
#> 2017-11-24   0.21  0.02 -0.44
#> 2017-11-27  -0.06 -0.36  0.03
#> 2017-11-28   1.06  0.38  0.84
#> 2017-11-29   0.02  0.04  1.45
#> 2017-11-30   0.82 -0.56 -0.50

# 计算股票的对数收益率和Fama-French因子
X <- diff(log(data_set), na.pad = FALSE)
N <- ncol(X)  #股票数量

现在我们在矩阵F中具有三个因子，并希望拟合模型，其中现在的载荷是一个beta矩阵：。我们可以做最小二乘拟合，最小化。更方便地，我们定义和扩展因子。然后可以将LS公式写为最小化

print(Gamma)
#>              alpha        b1          b2          b3
#> AAPL  1.437845e-04 0.9657612 -0.23339130 -0.49806858
#> AMD   6.181760e-04 1.4062105  0.80738336 -0.07240117
#> ADI  -2.285017e-05 1.2124008  0.09025928 -0.20739271
#> ABBV  1.621380e-04 1.0582340  0.02833584 -0.72152627
#> AEZS -4.513235e-03 0.6989534  1.31318108 -0.25160182
#> A     1.146100e-05 1.2181429  0.10370898 -0.20487290
#> APD   6.281504e-05 1.0222936 -0.04394061  0.11060938
#> AA   -4.587722e-05 1.3391852  0.62590136  0.99858692
#> CF   -5.777426e-04 1.0387867  0.48430007  0.82014523

另外，我们可以使用R完成：

#>              alpha    Mkt.RF         SMB         HML
#> AAPL  1.437845e-04 0.9657612 -0.23339130 -0.49806858
#> AMD   6.181760e-04 1.4062105  0.80738336 -0.07240117
#> ADI  -2.285017e-05 1.2124008  0.09025928 -0.20739271
#> ABBV  1.621380e-04 1.0582340  0.02833584 -0.72152627
#> AEZS -4.513235e-03 0.6989534  1.31318108 -0.25160182
#> A     1.146100e-05 1.2181429  0.10370898 -0.20487290
#> APD   6.281504e-05 1.0222936 -0.04394061  0.11060938
#> AA   -4.587722e-05 1.3391852  0.62590136  0.99858692
#> CF   -5.777426e-04 1.0387867  0.48430007  0.82014523

统计因子模型

现在让我们考虑统计因子模型或隐式因子模型，其中因子和载荷均不可用。调用具有 K因子的模型 XT =α1T+ BFT + ET的主成分方法：

PCA：
- 样本均值：
- 矩阵：
- 样本协方差矩阵：
- 特征分解：
估计：
更新特征分解：
重复步骤2-3，直到收敛为止。

#>              alpha                                        
#> AAPL  0.0007074564 0.0002732114 -0.004631647 -0.0044814226
#> AMD   0.0013722468 0.0045782146 -0.035202146  0.0114549515
#> ADI   0.0006533116 0.0004151904 -0.007379066 -0.0053058139
#> ABBV  0.0007787929 0.0017513359 -0.003967816 -0.0056000810
#> AEZS -0.0041576357 0.0769496344  0.002935950  0.0006249473
#> A     0.0006902482 0.0012690079 -0.005680162 -0.0061507654
#> APD   0.0006236565 0.0005442926 -0.004229364 -0.0057976394
#> AA    0.0006277163 0.0027405024 -0.009796620 -0.0149177957
#> CF   -0.0000573028 0.0023108605 -0.007409061 -0.0153425661

同样，我们可以使用R完成工作：

#>              alpha      factor1      factor2       factor3
#> AAPL  0.0007074564 0.0002732114 -0.004631647 -0.0044814226
#> AMD   0.0013722468 0.0045782146 -0.035202146  0.0114549515
#> ADI   0.0006533116 0.0004151904 -0.007379066 -0.0053058139
#> ABBV  0.0007787929 0.0017513359 -0.003967816 -0.0056000810
#> AEZS -0.0041576357 0.0769496344  0.002935950  0.0006249473
#> A     0.0006902482 0.0012690079 -0.005680162 -0.0061507654
#> APD   0.0006236565 0.0005442926 -0.004229364 -0.0057976394
#> AA    0.0006277163 0.0027405024 -0.009796620 -0.0149177957
#> CF   -0.0000573028 0.0023108605 -0.007409061 -0.0153425661

通过不同因子模型进行协方差矩阵估计的最终比较

我们最终将比较以下不同的因子模型：

样本协方差矩阵
宏观经济一因素模型
基本的三因素Fama-French模型
统计因素模型

我们在训练阶段估计模型，然后将估计的协方差矩阵与测试阶段的样本协方差矩阵进行比较。估计误差将根据PRIAL（平均损失提高百分比）进行评估：

加载训练和测试集：

# 设置开始结束日期和股票名称列表
begin_date <- "2013-01-01"
end_date <- "2015-12-31"

# 准备股票数据
data_set <- xts()
for (stock_index in 1:length(stock_namelist))
  data_set <- cbind(data_set, Ad(getSymbols(stock_namelist[stock_index], 


#   Fama-French 因子
mydata <- mydata[-nrow(mydata), 


# 准备指数
f_SP500 <- diff(log(SP500_index), na.pad = FALSE)

# 将数据拆分为训练数据和测试数据
T_trn <- round(0.45*T)
X_trn <- X[1:T_trn, ]
X_tst <- X[(T_trn+1):T, ]

现在让我们用训练数据估算不同的因子模型：

 # 样本协方差矩阵
Sigma_SCM <- cov(X_trn)

# 单因素模型
Gamma <- t(solve(t(F_) %*% F_, t(F_) %*% X_trn))

E <- xts(t(t(X_trn) - Gamma %*% t(F_)), index(X_trn))

# Fama-French三因子模型

Sigma_FamaFrench <- B %*% cov(F_FamaFrench_trn) %*% t(B) + diag(diag(Psi))

# 统计单因子模型

while (norm(Sigma - Sigma_prev, "F")/norm(Sigma, "F") > 1e-3) {
  B <- eigSigma$vectors[, 1:K, drop = FALSE] %*% diag(sqrt(eigSigma$values[1:K]), K, K)



# 统计三因子模型
K <- 3

while (norm(Sigma - Sigma_prev, "F")/norm(Sigma, "F") > 1e-3) {
  B <- eigSigma$vectors[, 1:K] %*% diag(sqrt(eigSigma$values[1:K]), K, K)
  Psi <- diag(diag(Sigma - B %*% t(B)))

Sigma_PCA3 <- Sigma

# 统计五因子模型
K <- 5

eigSigma <- eigen(Sigma)
while (norm(Sigma - Sigma_prev, "F")/norm(Sigma, "F") > 1e-3) {
  B <- eigSigma$vectors[, 1:K] %*% diag(sqrt(eigSigma$values[1:K]), K, K)
  Psi <- diag(diag(Sigma - B %*% t(B)))

最后，让我们比较测试数据中的不同估计：

 Sigma_true <- cov(X_tst)

barplot(error, main = "协方差矩阵估计误差",

 PRIAL <- 100*(ref - error^2)/ref

barplot(PRIAL, main = "协方差矩阵估计的先验方法",

最终可以看到使用因子模型进行协方差矩阵估计会有所帮助。

点击文末“阅读原文”

获取全文完整资料。

本文选自《R语言Fama-French三因子模型实际应用：优化投资组合》。

点击标题查阅往期内容

Copula估计边缘分布模拟收益率计算投资组合风险价值VaR与期望损失ES

Python用Markowitz马克维兹有效边界构建最优投资组合可视化分析四只股票

R语言动量和马科维茨Markowitz投资组合(Portfolio)模型实现

Python计算股票投资组合的风险价值（VaR）

R语言Markowitz马克维茨投资组合理论分析和可视化

R语言中的广义线性模型（GLM）和广义相加模型（GAM）：多元（平滑）回归分析保险资金投资组合信用风险敞口

Python基于粒子群优化的投资组合优化研究

多均线趋势策略玩转股票投资

主成分分析(PCA)原理及R语言实现及分析实例

偏最小二乘回归（PLSR）和主成分回归（PCR）

R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告

使用Python和Keras进行主成分分析、神经网络构建图像重建

R语言中的岭回归、套索回归、主成分回归：线性模型选择和正则化

华为认证二选一：物联网 VS 人工智能，你的赛道在哪里？博睿谷IT99_ 物联网人工智能华为华为认证
一篇不讲情怀只讲干货的科普指南一、华为物联网&人工智能到底在搞什么？华为物联网（IoT）的核心是“万物互联”。通过传感器、通信技术（如NB-IoT/5G）、云计算平台（如OceanConnect），将物理设备（车、路灯、工厂机器）连入网络，实现数据采集、远程控制和智能决策。大白话就是：它让哑巴设备学会“说话”。华为人工智能（AI）的核心是“让机器学会思考”。聚焦大模型训练、部署与应用（如昇腾AI解
SQL SELECT INTO语句 Lu鹿夫人 sql 数据库 sqlserver
SQLSELECTINTO语句通过SQL，您可以从一个表复制信息到另一个表。SELECTINTO语句从一个表复制数据，然后把数据插入到另一个新表中。SQLSELECTINTO语句注意：MYSQL数据库不支持SELECT…INTO语句，但支持INSERTINTO…SELECT。可以使用以下语句来拷贝表结构及数据：CREATETABLE新表ASSELECT*FROM旧表SQLSELECTINTO语法1
现代Unity架构指南：以ECS为核心的应用程序中构建OOP抽象层 NocturnalSky Unity unity 架构游戏引擎
文章目录现代Unity架构指南：以ECS为核心的应用程序中构建OOP抽象层为什么需要混合架构抽象层设计原则性能关键优化技术典型应用场景实现混合架构性能分析（Unity2023.2实测）关键陷阱与解决方案架构演进策略Unity2023新特性整合现代Unity架构指南：以ECS为核心的应用程序中构建OOP抽象层为什么需要混合架构ECS的核心优势：数据局部性、缓存友好性、高效的并行处理能力，特别适合高性
YUV420格式详解 lianghu666 嵌入式 Linux C/C++linux
以下从原理到实现逐步详解YUV420格式，结合Mermaid图表与C++代码，为音视频开发者提供系统指南。1.YUV420核心原理1.1采样结构与数据量原始像素Y分量全采样UV分量2x2降采样Y（亮度）：全分辨率存储（每个像素独立）U/V（色度）：每2x2像素共享一组UV值，水平和垂直分辨率减半数据量计算（8位深度）：//计算YUV420图像字节数inty_size=width*height;//
小红书笔记详情API接口实战：内容数据获取与分析的利器
在数字化时代，数据成为了一种无形的财富，其背后的价值越来越被重视。小红书，作为国内知名的社区分享平台，聚集了大量优质的内容和用户数据。对于企业、个人或者研究机构而言，获取并分析小红书上的笔记详情数据，不仅可以了解用户的行为和兴趣，还可以为决策提供有力的数据支持。本文将介绍如何通过小红书的API接口获取笔记详情数据，并对其进行深入分析，同时附上实战代码，帮助读者更好地理解和应用。二、小红书API接口
js代码后续翻滚吧键盘 vue javascript 开发语言 ecmascript
这是一个非常棒的问题，也是每个学完一个系统课程的人都会问的问题。答案是：不，你没有学完“所有”的JavaScript知识，但你已经出色地完成了成为一名合格JavaScript开发者的所有“必修课”。让我用一个比喻来解释：你已经学完了建造一栋坚固房屋所需的所有核心蓝图和关键技能。你知道如何打地基（基础语法）、如何搭建承重墙（函数与数据结构）、如何布线通电（异步编程）、如何装修得更漂亮高效（ES6+语
小红书笔记详情API接口概述及JSON数据返回参考 Json_18179014480 API json 大数据数据库大数据 json
前言一、接口概述小红书笔记详情API接口是小红书开放平台提供的一项服务，允许开发者通过编程方式获取小红书上特定笔记的详细信息。该接口的核心功能包括：获取笔记内容：标题、正文、图片、视频等多媒体信息。用户互动数据：点赞数、评论数、收藏数、分享数等。作者信息：作者昵称、头像、粉丝数等。发布信息：发布时间、标签列表等。通过该接口，开发者可以构建内容分析工具、笔记推荐系统、数据爬虫等应用，帮助企业或个人进
SQL SELECT语句的基本用法 Mnioc 学习 SQL
SQLSELECT语句的基本用法表S有三个字段:学生学号Sno，课程号Cno，成绩score。求每个学生的总分。这是一个很简单的问题，这篇博客就是源于这个问题，博主是一个大三即将入坑的菜鸟，进入公司实习的第一天，就被几个SQL查询问题难倒了。通过这篇文章复习一下数据库基本的SELECT语句，仅供参考，如有错误或不当之处还望大神们告知。这里使用的是SQLFiddle，一款在线的SQL语句练习网站链接
网络延迟诊断与优化：从路由到应用层的全链路分析 Clownseven 网络智能路由器
更多云服务器知识，尽在hostol.com你有没有在日常工作中体验过网络延迟带来的焦虑？浏览器页面加载缓慢，API请求几秒钟不返回，甚至服务器上的某个微服务迟迟无法响应。每次点击刷新页面，你的心里是否已经准备好迎接各种负面反馈？网络延迟，简而言之，就是数据从源头传输到目的地所花的时间。你可能认为延迟只是一个小问题，可当延迟问题累积，可能就会变成让整个系统瘫痪的大隐患。我们每一个运维人员都清楚，任何
1688按关键词获取商品列表API接口详解蓝倾976 python 开发语言电商开放平台开放API 1688开放平台
一、接口功能概述1688商品列表API是阿里巴巴开放平台提供的核心接口之一，主要用于通过关键词、价格区间、销量范围、类目ID等条件筛选商品，并返回商品标题、价格、销量、图片等基本信息。该接口广泛应用于电商数据分析、竞品调研、商品监控、价格比对等场景，助力开发者高效获取1688平台商品数据。二、接口调用流程1.注册与认证注册账号：在1688开放平台/万邦开放平台注册开发者账号，完成企业或个人资质审核
C#与MR的量子级交互：用代码构建会呼吸的混合现实界面，让UI消失在空气中！墨夶 C#学习资料 c#mr 交互
一、混合现实革命：MR界面设计的三大颠覆性原则1.1传统UI的终结与MR的崛起空间即界面：物理空间成为交互载体，告别屏幕束缚手势即语言：自然手势取代鼠标键盘，交互效率提升300%数据可视化革命：3D全息投影让抽象数据具象化案例：某汽车厂商用MR界面将发动机数据投影在真实引擎上，维修效率提升65%1.2C#在MR开发中的核心优势特性C#实现其他语言对比空间计算Unity+ARFoundation提供
大数据未来发展的趋势与挑战倒霉男孩大数据
随着信息技术的飞速发展，大数据已经成为推动社会进步和产业变革的重要力量。从商业决策到医疗健康，从智慧城市到人工智能，大数据技术的应用无处不在。未来，随着5G、物联网（IoT）、人工智能（AI）等技术的深度融合，大数据的发展将迎来更广阔的空间，同时也面临诸多挑战。本文将探讨大数据未来的发展趋势、应用前景以及可能面临的问题。一、大数据未来的发展趋势数据量持续爆发式增长随着5G网络的普及和物联网设备的广
JS声明变量码哥DFS javascript
1.声明变量优先使用const,若发现变量以后要修改，再改为let2.建议数组和对象使用const来声明（因为对象是引用类型，里面存续的是地址，只要地址不变就不会报错）3.若基本数据类型的值或者引用类型的地址发生变化的时候，需要用let
Python爬取与可视化-豆瓣电影数据木子空间Pro 项目集锦 #课程设计 python 信息可视化开发语言
引言在数据科学的学习过程中，数据获取与数据可视化是两项重要的技能。本文将展示如何通过Python爬取豆瓣电影Top250的电影数据，并将这些数据存储到数据库中，随后进行数据分析和可视化展示。这个项目涵盖了从数据抓取、存储到数据可视化的整个过程，帮助大家理解数据科学项目的全流程。环境配置与准备工作在开始之前，我们需要确保安装了一些必要的库：urllib：用于发送HTTP请求和获取网页数据Beauti
Java中ThreadPoolExecutor源码深度解析振华少爷 java 开发语言前端
Java中ThreadPoolExecutor源码深度解析目录引言ThreadPoolExecutor的数据结构核心方法分析构造方法execute方法shutdown方法shutdownNow方法性能分析使用注意事项总结引言ThreadPoolExecutor是Java并发包中的一个线程池实现类，它提供了灵活的线程池管理功能，可以根据需要创建、管理和销毁线程。ThreadPoolExecutor通
突破反爬防线：Python3反爬虫原理与绕过策略深度解析程序员威哥爬虫网络 scrapy python 开发语言
在信息化时代，数据已成为互联网的重要资产。为了保护数据的安全和防止恶意抓取，越来越多的网站开始采用反爬虫技术。然而，随着反爬虫技术的不断演化，爬虫开发者面临的挑战也在日益增大。如何理解反爬虫原理并有效绕过这些防护措施，是每个爬虫开发者必须掌握的技能。本文将全面解析Python3在爬虫开发中的应用，深入探讨常见的反爬虫原理，并提供绕过反爬策略的实战经验。通过结合实际案例，帮助开发者掌握应对复杂反爬措
基于Python的携程景点评价爬虫与情感评分分析程序员威哥 python 爬虫开发语言
一、项目背景携程（Ctrip）是中国最流行的旅游预订平台之一，其景点用户评论包含了大量真实的游客反馈。通过分析评论的情感倾向，可以：为用户提供更可靠的景点推荐辅助景区运营方了解用户口碑构建情感评分系统，为评分失衡提供补充二、项目目标自动化抓取携程指定景点的用户评论清洗与分词评论文本对评论进行情感分析打分分析整体情绪趋势并可视化结果三、技术栈与工具模块工具/库数据爬取requests,re,json
从0到1构建智能招聘数据引擎：基于 Python 的 BOSS直聘信息采集实战与反爬破解指南程序员威哥 python 开发语言
前言在大数据浪潮席卷的时代，招聘平台蕴藏着海量的岗位信息，揭示着行业走向、人才趋势、薪资结构等核心价值。BOSS直聘作为国内极具代表性的直招平台，其数据对职业分析、市场监测甚至智能推荐系统的构建都有着重要意义。本文将手把手带你打造一个高质量、抗封锁的Python爬虫系统，精准采集BOSS直聘网的岗位数据，并全面解析其中涉及的反爬机制识别、加密参数处理、数据提取与存储等高级技巧，助你在Web数据采集
揭秘影评数据的金矿：基于 Python 的豆瓣电影排行榜热度挖掘与数据智能分析实战程序员威哥 python 开发语言
前言：从数据出发，看见银幕之外的流行密码在内容为王的时代，影视作品既是大众娱乐的主阵地，也是数据分析的重要入口。豆瓣作为中国最具影响力的影视评分平台之一，凝聚了数千万用户对电影、剧集的真实反馈。本文将带你一步步深入，从爬取豆瓣电影排行榜数据出发，结合Python技术栈，构建一个完整的热门电影数据采集+分析+可视化系统。我们不仅要采数据，更要从中挖掘背后的价值：哪些类型影片最受欢迎？评分是否与评论数
微博热搜数据采集全攻略：利用 Python 爬虫实时捕捉社会热点与舆情风向程序员威哥 python 爬虫开发语言
微博作为国内最具影响力的社交媒体平台，其热搜榜单被广泛认为是社会热点的风向标。无论是娱乐八卦、社会事件，还是突发新闻，微博热搜往往能够迅速反映出公众关注的焦点。对于数据分析师、舆情监测专家、或者企业品牌分析师来说，如何抓取并分析这些实时热搜数据，已成为一种核心竞争力。在这篇文章中，我们将结合Python爬虫技术，深入探讨如何高效抓取微博热搜数据，如何规避反爬虫机制，如何处理与存储数据，并展示如何利
【Java实战】高并发场景下账户金额操作的解决方案 .猫的树【Java实战】系列 Java并发编程分布式锁高并发解决方案原子操作数据库事务
文章目录前言：金融系统中的并发危机一、并发问题现场还原1.1问题代码示例1.2并发测试暴露问题1.3问题根源分析二、五大解决方案深度剖析2.1synchronized同步锁2.2ReentrantLock显式锁2.3CAS无锁编程（Atomic原子类）2.4数据库乐观锁2.5分布式锁（Redis实现）三、方案选型指南四、防踩坑指南总结前言：金融系统中的并发危机在支付系统、电商平台等金融场景中，账户
Java线程池原理深度解析：从设计思想到源码实现北辰alk java java python 开发语言
文章目录一、线程池概述1.1为什么需要线程池1.2Java线程池框架二、线程池核心参数2.1关键参数详解2.2工作队列类型2.3拒绝策略三、线程池工作流程3.1流程图解3.2流程说明四、源码深度解析4.1核心数据结构4.2状态控制机制4.3Worker线程实现4.4任务执行核心方法4.5任务获取逻辑五、线程池使用实践5.1创建线程池的正确方式5.2线程池监控5.3合理配置参数六、常见问题与解决方案
物联网实战：多语言（Java、Go、Rust、C++、C#、Rust）设备接入与数据处理 KENYCHEN奉孝 Rust C++go spring java vue.js rust c++
SpringBoot物联网设备接入与数据处理实例物联网（IoT）设备接入与数据处理是SpringBoot的常见应用场景之一。以下是一个完整的实例，涵盖设备接入、数据传输、数据处理和存储等关键环节。设备接入物联网设备通常通过MQTT、HTTP或WebSocket等协议接入系统。MQTT是物联网领域最常用的轻量级协议。//MQTT配置类@ConfigurationpublicclassMqttConf
分布式 ID 生成方案对比：Snowflake、UUID、KSUID 该怎么选？田猿笔记知识集合 nodeJs 高级应用分布式 node.js
分布式ID生成方案对比：Snowflake、UUID、KSUID该怎么选？在分布式系统中，如何生成全局唯一ID是一个常见问题。不同的ID生成方案各有优缺点，本文将对比Snowflake、Sonyflake、UUIDv1/v4、XID、KSUID以及自定义ID，并给出Node.js实现示例，帮助你选择最适合的方案。1.为什么需要分布式ID？在单机系统中，可以使用数据库自增ID（如MySQL的AUTO
Python知识点：如何使用Nvidia Jetson与Python进行边缘计算杰哥在此 Python系列 python 边缘计算开发语言面试编程
开篇，先说一个好消息，截止到2025年1月1日前，翻到文末找到我，赠送定制版的开题报告和任务书，先到先得！过期不候！如何使用NvidiaJetson与Python进行边缘计算NvidiaJetson平台是专为边缘计算设计的一系列AI计算机，它们能够处理和分析来自物联网(IoT)设备和边缘节点的数据。这些设备小巧、节能且功能强大，非常适合用于执行机器学习、计算机视觉和自然语言处理等任务。Python
几个MODBUS模拟工具神一样的老师工业互联网嵌入式硬件
在网上找了几个MODBUS模拟测试工具，还没有来得及测试，先记录在这里。PeakHMISlaveSimulators，Neuron推荐的免费软件。使用方法可以参考：工业物联网数据桥接教程：Modbus桥接到MQTT-知乎(zhihu.com)。ModbusSlaveSimulation，开源软件，已经停止更新了。ModbusSlave和ModbusPoll，收费软件，用户很多。使用方法参考：【VS
本周沪铜想法落雪财神意人工智能
核心逻辑：低库存与地缘风险缓和支撑价格，但淡季需求疲软与关税悬疑压制反弹空间，短期维持高位震荡一、成本高企与利润分化当前沪铜市场，成本端与产业链利润呈现出复杂态势。铜精矿加工费（TC）持续处于-43.56美元/吨的负值区间，冶炼厂仍处于“加工即亏损”的艰难处境。海外矿端的一系列扰动是主因：秘鲁安塔米纳铜矿因事故全面停工，智利Sentinel铜矿也因安全问题局部停产，使得短期铜精矿供应愈发紧张；市场
本周沪铝想法落雪财神意人工智能大数据期股
核心逻辑：低库存支撑与淡季需求疲软博弈，宏观情绪助推高位震荡一、成本下移VS价格韧性成本端与价格表现呈现出不同态势。成本端方面，氧化铝现货价格在本周持续下跌，山东地区均价降至3090元/吨，环比下降1.3%，河南地区也跌至3100元/吨，环比下降0.3%。这主要是因为全国氧化铝运行产能维持较高水平，开工率达到79.61%，且已连续5周复产，再加上电解铝企业氧化铝原料库存处于低位，仅为209.8万吨
CAN转Modbus TCP网关赋能食品搅拌机智能协同控制 JIANGHONGZN 工业通讯协议网关 CAN MODBUS MODBUS TCP
在食品搅拌机的自动化控制系统中，设备通信协议的多样性给系统集成带来挑战。JH-CAN-TCP疆鸿智能CAN主站转ModbusTCP从站的网关，成为连接西门子PLC与伺服系统的关键桥梁。西门子PLC常采用ModbusTCP协议，用于实现与上位机、人机界面等设备的数据交互。而伺服系统多使用CAN协议，因其具备高速、可靠、抗干扰能力强等特点，能精准控制电机运行。该网关可将西门子PLC发出的ModbusT
CAN从站转Modbus TCP主站总线协议转换网关 JIANGHONGZN 工业通讯协议网关 CAN MODBUS MODBUS TCP
同学们，今天给大家详细讲解下CAN从站转ModbusTCP主站总线协议转换网关一，设备主要功能JH-CAN-TCP疆鸿智能网关实现连接CAN设备和网络到ModbusTCP网络系统。该网关可实现双向数据交换，既允许现有的、低成本的CAN设备集成到ModbusTCP系统，也可提供来自ModbusTCP的数据给CAN设备使用。应用广泛：本产品广泛应用于CAN协议接口的仪表、变频器、电机、机械手臂等等。C
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S