阿言教编程

Python 预测股票价格，竟然这么简单

作为一种技术手段，预测在金融、证券领域的应用非常广泛，尤其是对股票价格的预测。我们介绍一下获得股票数据的方法，并基于此对数据进行预处理，接着使用数据分析方法，建立基础特征，进一步构建预测模型，且基于新数据验证模型效果。拟使用 VAR 及LSTM两种算法建立预测模型。

获取股票数据

股票数据通常可从新浪股票、雅虎股票等网页上获取，此外还有一些炒股软件，如同花顺、通达信等都提供了非常清楚的股票数据展示和图表呈现。如果要获得实时的股票数据，可以考虑使用新浪股票提供的接口获取数据。以大秦铁路（股票代码：601006）为例，如果要获取它的最新行情，只需访问新浪的股票数据接口（具体可以百度），该接口会返回一串文本，例如：

1 var hq_str_sh601006="大秦铁路,6.980,6.960,7.010,7.070,6.950,7.010,7.020,121033256,847861533.000,18900, 7.010,214867,7.000,66500,6.990,386166,6.980,336728,6.970,273750,7.020,836066,7.030,630800,7.040,936306,7.050,579400,7.060,2016-03-18,15:00:00,00";

这个字符串由许多数据拼接在一起，不同含义的数据用逗号隔开了，按照程序员的思路，顺序号从0开始。

0：，股票名字1：6.980>，今日开盘价2：6.960>，昨日收盘价3：7.010>，当前价格4：7.070>，今日最高价5：6.950>，今日最低价6：7.010>，竞买价，即“买一”报价7：7.020>，竞卖价，即“卖一”报价8：121033256>，成交的股票数，由于股票交易以一百股为基本单位，所以在使用时，通常把该值除以一百9：847861533.000>，成交金额，单位为“元”，为了一目了然，通常以“万元”为成交金额的单位，所以通常把该值除以一万10：18900>，“买一”申请4695股，即47手11：7.010>，“买一”报价12：214867>，“买二”13：7.000>，“买二”14：66500>，“买三”15：6.990>，“买三”16：386166>，“买四”17：6.980>，“买四”18：336728>，“买五”19：6.970>，“买五”20：273750>，“卖一”申报3100股，即31手21：7.020>，“卖一”报价(22,23),(24,25),(26,27),(28,29)分别为“卖二”至“卖四的情况”30：2016-03-18>，日期31：15:00:00>，时间

这个接口对于JavaScript程序非常方便，如果要查看该股票的日K线图，可访问新浪股票的K线图接口（具体可百度），便可得到日K线图。

日K线图

如果要查看该股票的分时线，可访问链接新浪股票的分时线图接口（具体可百度），便可得到分时线图。

分时线图

对于周K线和月K线的查询，可分别访问新浪股票的周K线图和月K线图的接口（具体可百度）。Python中我们可以使用pandas_datareader库来获取股票数据，默认是访问yahoofinance的数据，其中包括上证和深证的股票数据，还有港股数据，该库只能获取股票的历史交易记录信息：如最高价、最低价、开盘价、收盘价以及成交量，无法获取个股的分笔交易明细历史记录。上证代码是ss，深证代码是sz，港股代码是hk，比如茅台：6000519.ss，万科000002.sz，长江实业0001.hk。这里以贵州茅台股票为例，说明pandas_datareader库中股票数据的获取方法及简单的可视化，代码如下：

1import pandas as pd

2import pandas_datareader.data as web

3import datetime as dt

4data = web.DataReader('600519.ss','yahoo', dt.datetime(2019,8,1),dt.datetime(2019,8,31))

5data.head

6 High Low Open Close Volume Adj Close

7# Date

8# 2019-08-01 977.000000 953.020020 976.51001 959.299988 3508952 959.299988

9# 2019-08-02 957.979980 943.000000 944.00000 954.450012 3971940 954.450012

10# 2019-08-05 954.000000 940.000000 945.00000 942.429993 3677431 942.429993

11# 2019-08-06 948.000000 923.799988 931.00000 946.299988 4399116 946.299988

12# 2019-08-07 955.530029 945.000000 949.50000 945.000000 2686998 945.000000

14kldata=data.values[:,[2,3,1,0]] # 分别对应开盘价、收盘价、最低价和最高价

15from pyecharts import options as opts

16from pyecharts.charts import Kline

18kobj = Kline.add_xaxis(data.index.strftime("%Y-%m-%d").tolist).add_yaxis("贵州茅台-日K线图",kldata.tolist).set_global_opts(

19 yaxis_opts=opts.AxisOpts(is_scale=True),

20 xaxis_opts=opts.AxisOpts(is_scale=True),

21 title_opts=opts.TitleOpts(title=""))

22kobj.render

贵州茅台股票日K线图如图：

为给定时间序列的财务图表，代码中对象data包含6个属性，依次为Open（开盘价）、High（最高价）、Low（最低价）、Close（收盘价）、Volume（成交量）、Adjusted（复权收盘价）。基于收盘价的重要性，可从收盘价的历史数据中分割训练集、验证集、测试集，使用适当的特征，建立预测模型，并实施预测。

基于VAR算法的预测

向量自回归（VAR）模型就是非结构化的多方程模型，它的核心思想不考虑经济理论，而直接考虑经济变量时间时序之间的关系，避开了结构建模方法中需要对系统中每个内生变量关于所有内生变量滞后值函数建模的问题，通常用来预测相关时间序列系统和研究随机扰动项对变量系统的动态影响。VAR模型类似联立方程，将多个变量包含在一个统一的模型中，共同利用多个变量信息，比起仅使用单一时间序列的ARIMA等模型，其涵盖的信息更加丰富，能更好地模拟现实经济体，因而用于预测时能够提供更加贴近现实的预测值。此处拟基于贵州茅台股票数据，建立VAR的预测模型。使用后30天的数据作为验证集，剩余的数据用于建立预测模型。本节从VAR模型的平稳性检验出发，依次完成VAR模型的定阶及建模预测，最终通过分析验证集上的准确率来评估预测效果。

1、平稳性检验

只有平稳的时间序列才能够直接建立VAR模型，因此在建立VAR模型之前，首先要对变量进行平稳性检验。通常可利用序列的自相关分析图来判断时间序列的平稳性，如果序列的自相关系数随着滞后阶数的增加很快趋于0，即落入随机区间，则序列是平稳的；反之，序列是不平稳的。另外，也可以对序列进行ADF检验来判断平稳性。对于不平稳的序列，需要进行差分运算，直到差分后的序列平稳后，才能建立VAR模型。此处首先提取用于建立预测模型的基础数据，并对其进行单位根检验，对应的Python代码如下：

1import statsmodels.tsa.stattools as stat

4import pandas as pd

5import numpy as np

7data = web.DataReader('600519.ss','yahoo', dt.datetime(2014,1,1),dt.datetime(2019,9,30))

8subdata = data.iloc[:-30,:4]

9for i in range(4):

10 pvalue = stat.adfuller(subdata.values[:,i], 1)[1]

11 print("指标 ",data.columns[i]," 单位根检验的p值为：",pvalue)

12# 指标 High 单位根检验的p值为：0.9955202280850401

13# 指标 Low 单位根检验的p值为：0.9942509439755689

14# 指标 Open 单位根检验的p值为：0.9938548193990323

15# 指标 Close 单位根检验的p值为：0.9950049124079876

可以看到，p值都大于0.01，因此都是不平稳序列。现对subdata进行1阶差分运算，并再次进行单位根检验，对应的Python代码如下：

1subdata_diff1 = subdata.iloc[1:,:].values - subdata.iloc[:-1,:].values

2for i in range(4):

3 pvalue = stat.adfuller(subdata_diff1[:,i], 1)[1]

4 print("指标 ",data.columns[i]," 单位根检验的p值为：",pvalue)

5# 指标 High 单位根检验的p值为：0.0

6# 指标 Low 单位根检验的p值为：0.0

7# 指标 Open 单位根检验的p值为：0.0

8# 指标 Close 单位根检验的p值为：0.0

如结果所示，对这4个指标的1阶差分单独进行单位根检验，其p值都不超过0.01，因此可以认为是平稳的。

2、VAR模型定阶

接下来就是为VAR模型定阶，可以让阶数从1逐渐增加，当AIC值尽量小时，可以确定最大滞后期。我们使用最小二乘法，求解每个方程的系数，并通过逐渐增加阶数，为模型定阶，Python代码如下：

1# 模型阶数从1开始逐一增加

2rows, cols = subdata_diff1.shape

3aicList =

4lmList =

6for p in range(1,11):

7 baseData = None

8 for i in range(p,rows):

9 tmp_list = list(subdata_diff1[i,:]) + list(subdata_diff1[i-p:i].flatten)

10 if baseData is None:

11 baseData = [tmp_list]

12 else:

13 baseData = np.r_[baseData, [tmp_list]]

14 X = np.c_[[1]*baseData.shape[0],baseData[:,cols:]]

15 Y = baseData[:,0:cols]

16 coefMatrix = np.matmul(np.matmul(np.linalg.inv(np.matmul(X.T,X)),X.T),Y)

17 aic = np.log(np.linalg.det(np.cov(Y - np.matmul(X,coefMatrix),rowvar=False))) + 2*(coefMatrix.shape[0]-1)**2*p/baseData.shape[0]

18 aicList.append(aic)

19 lmList.append(coefMatrix)

21#对比查看阶数和AIC

22pd.DataFrame({"P":range(1,11),"AIC":aicList})

23# P AIC

24# 0 1 13.580156

25# 1 2 13.312225

26# 2 3 13.543633

27# 3 4 14.266087

28# 4 5 15.512437

29# 5 6 17.539047

30# 6 7 20.457337

31# 7 8 24.385459

32# 8 9 29.438091

33# 9 10 35.785909

如上述代码所示，当p=2时，AIC值最小为13.312225。因此VAR模型定阶为2，并可从对象lmList[1]中获取各指标对应的线性模型。

3、预测及效果验证

基于lmList[1]中获取各指标对应的线性模型，对未来30期的数据进行预测，并与验证数据集进行比较分析，Python代码如下：

1p = np.argmin(aicList)+1

2n = rows

3preddf = None

4for i in range(30):

5 predData = list(subdata_diff1[n+i-p:n+i].flatten)

6 predVals = np.matmul([1]+predData,lmList[p-1])

7 # 使用逆差分运算，还原预测值

8 predVals=data.iloc[n+i,:].values[:4]+predVals

9 if preddf is None:

10 preddf = [predVals]

11 else:

12 preddf = np.r_[preddf, [predVals]]

13 # 为subdata_diff1增加一条新记录

14 subdata_diff1 = np.r_[subdata_diff1, [data.iloc[n+i+1,:].values[:4] - data.iloc[n+i,:].values[:4]]]

16#分析预测残差情况

17(np.abs(preddf - data.iloc[-30:data.shape[0],:4])/data.iloc[-30:data.shape[0],:4]).describe

18# High Low Open Close

19# count 30.000000 30.000000 30.000000 30.000000

20# mean 0.010060 0.009380 0.005661 0.013739

21# std 0.008562 0.009968 0.006515 0.013674

22# min 0.001458 0.000115 0.000114 0.000130

23# 25% 0.004146 0.001950 0.001653 0.002785

24# 50% 0.007166 0.007118 0.002913 0.010414

25# 75% 0.014652 0.012999 0.006933 0.022305

26# max 0.039191 0.045802 0.024576 0.052800

从上述代码第17行可以看出这4个指标的最大百分误差率分别为3.9191%、4.5802%、2.4576%、5.28%，最小百分误差率分别为0.1458%、0.0115%、0.0114%、0.013%，进一步，绘制二维图表观察预测数据与真实数据的逼近情况，Python代码如下：

1import matplotlib.pyplot as plt

2plt.figure(figsize=(10,7))

3for i in range(4):

4 plt.subplot(2,2,i+1)

5 plt.plot(range(30),data.iloc[-30:data.shape[0],i].values,'o-',c='black')

6 plt.plot(range(30),preddf[:,i],'o--',c='gray')

7 plt.ylim(1000,1200)

8 plt.ylabel("$"+data.columns[i]+"$")

9plt.show

10v = 100*(1 - np.sum(np.abs(preddf - data.iloc[-30:data.shape[0],:4]).values)/np.sum(data.iloc[-30:data.shape[0],:4].values))

11print("Evaluation on test data: accuracy = %0.2f%% \n" % v)

12# Evaluation on test data: accuracy = 99.03%

该预测效果如下图，其中黑色实线为真实数据，灰色虚线为预测数据，使用VAR模型进行预测的效果总体还是不错的，平均准确率为99.03%。针对多元时间序列的情况，VAR模型不仅考虑了其他指标的滞后影响，计算效率还比较高，从以上代码可以看到，对于模型的拟合，直接使用的最小二乘法，这增加了该模型的适应性。

预测效果

基于LSTM算法的预测

本节主要基于LSTM算法对贵州茅台股票数据进行预测，该算法非常擅长序列数据的建模，由于引入了遗忘门等更为复杂的内部处理单元来处理上下文信息的存储与更新，这样既可以消除梯度问题的困扰，也可以对存在短期或长期依赖的数据建模，该算法在文本、语音等序列数据模型中广泛使用。本节从LSTM建模的数据要求及网络结构设计讲起，通过设置合理的参数，通过训练得到模型，并基于该模型进行预测，最后将结果与真实数据进行比较，评估预测效果。

1、数据要求

本节使用LSTM算法对贵州茅台股票数据进行预测，可基于前N条样本对当前样本进行预测，因此该模型不需要像DNN那样，将历史数据进行复杂转换，将基础数据稍加处理就能用于训练模型。对基础数据的处理即为对该数据进行重新封装，将样本前N期的集合与当前样本对应上，分别得到训练数据的输入与输出。

所示数据对应关系（具体数据为示意）

2、数据预处理

首先，需要将基础数据重构为包含历史3周特征数据的基础数据，以预测日的High（最高价）、Low（最低价）、Open（开盘价）、Close（收盘价）4个指标作为输出数据。这里我们使用2014年1月1日至2019年8月31日的贵州茅台股票数据作为训练数据，使用2019年整个9月的数据作为测试数据，来验证模型效果。用Python将对全体数据进行标准化，并将基础数据的特征进行重构，代码如下：

1SEQLEN = 21

2dim_in = 4

3dim_out = 4

4pred_len = 30

5vmean = data.iloc[:,:4].apply(lambda x:np.mean(x))

6vstd = data.iloc[:,:4].apply(lambda x:np.std(x))

7t0 = data.iloc[:,:4].apply(lambda x:(x-np.mean(x))/np.std(x)).values

8X_train = np.zeros((t0.shape[0]-SEQLEN-pred_len, SEQLEN, dim_in))

9Y_train = np.zeros((t0.shape[0]-SEQLEN-pred_len, dim_out),)

10X_test = np.zeros((pred_len, SEQLEN, dim_in))

11Y_test = np.zeros((pred_len, dim_out),)

12for i in range(SEQLEN, t0.shape[0]-pred_len):

13 Y_train[i-SEQLEN] = t0[i]

14 X_train[i-SEQLEN] = t0[(i-SEQLEN):i]

15for i in range(t0.shape[0]-pred_len,t0.shape[0]):

16 Y_test[i-t0.shape[0]+pred_len] = t0[i]

17 X_test[i-t0.shape[0]+pred_len] = t0[(i-SEQLEN):i]

如上述代码所示，SEQLEN表示使用前期数据的长度，dim_in表示输入数据的维度，dim_out表示输出数据的维度，pred_len表示预测数据的长度。第5~7行代码对数据进行zscore标准化，将数据映射到标准正态分布。第12~17行代码对基础数据进行重构，分别得到训练数据X_train、Y_train以及测试数据X_test、Y_test。

3、网络结构设计

经尝试，我们使用近3周的历史数据来训练LSTM模型，同时，设置隐含层神经元的数量为64。因此，我们可以将LSTM神经网络按下面的结构进行设计（图中N可取21，即3周对应的天数）。

LSTM神经网络结构

4、建立模型

现基于Keras搭建LSTM神经网络，并基于训练集对模型进行训练，Python代码如下：

1from keras.layers import LSTM, Dense

2from keras.models import Sequential

3model = Sequential

4model.add(LSTM(64, input_shape=(SEQLEN, dim_in),activation='relu',recurrent_dropout=0.01))

5model.add(Dense(dim_out,activation='linear'))

6model.compile(loss = 'mean_squared_error', optimizer = 'rmsprop')

7history = model.fit(X_train, Y_train, epochs=200, batch_size=10, validation_split=0)

8# Epoch 1/200

9# 1350/1350 [==============================] - 1s 1ms/step - loss: 0.0447

10# Epoch 2/200

11# 1350/1350 [==============================] - 1s 737us/step - loss: 0.0059

12# Epoch 3/200

13# 1350/1350 [==============================] - 1s 743us/step - loss: 0.0043

14# ......

15# Epoch 200/200

16# 1350/1350 [==============================] - 1s 821us/step - loss: 9.2794e-04

如上述代码所示，我们使用rmsprop算法来优化模型。由于当前的建模场景是数值预测，因此使用MSE（均方误差）来定义损失函数。算法经过200次迭代，loss从0.0447降到了9.2794e-04。我们可以基于得到的模型进行进一步预测。

5、预测实现

基于上文得到的模型，进一步编写Python代码，对X_test对应的输出数据进行预测。需要注意的是，直接得到的预测结果是处于标准化的数据空间中的，需要将其还原成原始数据空间的值，结果才有意义。对应的Python代码如下：

1preddf=model.predict(X_test)*vstd.values+vmean.values

如上述代码所示，将模型的预测结果pred_y乘以vstd再加上vmean，即可对数据进行还原。preddf即是最终得到的预测数据，可打印其值，代码如下：

1preddf

2# array([[1069.35781887, 1038.57915742, 1056.77147186, 1053.83827734],

3# [1070.65142282, 1039.58533719, 1057.34561875, 1054.85567074],

4# [1083.58529328, 1052.70457308, 1070.78824637, 1067.49741882],

6# [1186.19297789, 1161.52758381, 1172.33666591, 1170.44623263],

7# [1181.42680223, 1155.14778501, 1166.5726204 , 1165.00336968],

8# [1186.75600881, 1160.84733425, 1172.37636963, 1170.09819923]])

10preddf.shape

11# (30, 4)

如上述代码所示，preddf是一个的二维数据，包含了2019年9月整月的预测结果。

6、效果评估

对贵州茅台股票数据预测的效果评估可以采用两种方法。一种方法是对预测的结果与真实结果进行绘图比较，通过直观观察可以知道预测效果，如果预测曲线与真实曲线完全重合或相当接近，则说明预测效果较好；反之，则说明预测模型还需要改进。另一种方法是基于贵州茅台股票数据预测的误差累计值来计算一个误差率，从而得到平均精度水平，该值越大说明整体预测效果也就越好，该值越小说明预测模型还存在优化空间。编写Python代码，同时实现预测结果与真实数据的对比图，以及计算累计误差，从而全面地评估预测效果，代码如下：

10v = 100*(1 - np.sum(np.abs(preddf - data.iloc[-30:data.shape[0],:4]).values)/np.sum (data.iloc[-30:data.shape[0],: 4].values))

12# Evaluation on test data: accuracy = 99.01%

预测评估对比图如下。

我们可以看到，黑色实线为真实数据，灰色虚线为预测数据，横坐标为日期下标，纵坐标为对应的股票价格。使用LSTM模型进行预测的效果总体还是不错的，平均准确率为99.01%。对于多元时间序列数据，可尝试使用LSTM模型，该模型能够记忆历史较长的重要信息，可有效识别历史数据中存在的规律和模式，如今广泛应用于包含大量序列数据的场景中。如果大家对Python感兴趣的话，可以加一下我的薇信哦：abb436574，免费领取一套学习资料和视频课程哟~

本文节选自《Python预测之美：数据分析与算法实战》一书。《Python预测之美：数据分析与算法实战（双色）》，作者游皓麟，以Python语言为基础，体系化介绍预测技术工程实施的必备技能。基于Python 来做预测，不仅能够在业务上快速落地，还让代码维护起来更加方便。对预测原理的深度剖析和算法的细致解读，是本书的一大亮点。本书共分为预测基础、预测算法、预测案例三部分。希望读者在看完本书后，能够将本书的精要融会贯通，进一步在工作和学习实践中提炼价值。

#欢迎来留言#

你学会了吗？

对此，你怎么看？

程序人生携手【电子工业出版社-博文视点】送出

《Python预测之美：数据分析与算法实战》一本

截至7月17日12:00点

你可能感兴趣的:(编程技术,IT技术,Python技术,算法,python,机器学习,人工智能,数据分析)

基于Roboflow平台的数据集导出与YOLOv8目标检测训练实战步入烟尘 YOLO系列创新涨点超专栏 YOLO 目标检测人工智能 Roboflow YOLOv8
本专栏专为AI视觉领域的爱好者和从业者打造。涵盖分类、检测、分割、追踪等多项技术，带你从入门到精通！后续更有实战项目，助你轻松应对面试挑战！立即订阅，开启你的YOLOv8之旅！专栏订阅地址：https://blog.csdn.net/mrdeam/category_12804295.html文章目录基于Roboflow平台的数据集导出与YOLOv8目标检测训练实战1.什么是Roboflow？2.创
Matlab代编电气仿真电力电子电机控制自动化新能源微电网储能能量 matlabgoodboy matlab 自动化开发语言
将MATLAB中的电气仿真、电力电子、电机控制、自动化、新能源、微电网以及储能和能量管理系统的代码迁移到Python（或直接在Python中编写这些系统的仿真代码）是一个复杂但可行的任务。Python拥有许多库和工具，可以支持这些领域的仿真和建模。以下是一些关键步骤和库，可以帮助你在Python中进行这些领域的仿真：数值计算和矩阵操作：使用NumPy进行高效的数值计算和矩阵操作。仿真和控制：使用S
30天练完这96个爬虫项目案例，成功逆袭！靠接单月入W＋轻轻松松！小天才学习机打游戏爬虫 python 开发语言人工智能云计算
在受所有大环境的影响，大家开始一个比一个卷，所以靠固定的收入那一点点是明显不够的。现在谁还没有一点其他的收入呢？Python爬虫就成了大家学习的不二之选~相信很多学习Python的小伙伴都苦于找不到python项目练手，在我看来，基础知识学的再好，没有经历过实战就是白扯，这️️️个项目非常适合新手学习Python爬虫虽然做为python学习中较简单的一个知识点，但是它在平时生活中的运用确实非常多的
大白话深入浅出讲嵌入式C语言多线程编程大模型大数据攻城狮多线程并发编程资源竞争开源软件看门狗硬件寄存器
目录第一章线程基础与操作1.1线程的创建与启动1.2线程资源的管理与释放第二章线程同步与通信2.1互斥锁与条件变量的运用2.2线程间的消息传递与共享内存第三章锁机制与线程安全3.1锁的类型与选择3.2线程安全问题的识别与修复第四章并发算法与性能优化4.1并发算法的实现4.2多线程程序的性能调优第五章高级主题与应用实例5.1线程库的实现与线程本地存储5.2真实世界中的多线程应用5.2.1网络服务器中
【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
Python入门教程04：流程控制语句（if+for+continue等）我的Python教程 #Python入门我的Python教程 python
刚开始学习Python，要了解条件语句、循环语句以及控制流的相关内容。流程控制是编程中的基础，所以示例需要清晰易懂，覆盖常见的几种情况。我应该先考虑Python中的主要流程控制结构：条件语句（if-elif-else）、循环（for和while），还有控制循环的关键字（break、continue、pass）。然后，我需要为每个部分准备简单的例子，让读者能够理解每个结构的作用。1.以下是用Pyth
代码随想录训练营第二十三天| 39. 组合总和 40.组合总和II 131.分割回文串 chengooooooo 算法
39.组合总和题目链接/文章讲解：代码随想录视频讲解：带你学透回溯算法-组合总和（对应「leetcode」力扣题目：39.组合总和）|回溯法精讲！_哔哩哔哩_bilibili//组合问题要考虑是不是在一个集合里操作//最常见的就是递归回溯法//再考虑考虑剪枝classSolution{publicList>combinationSum(int[]candidates,inttarget){List
人工智能训练师如何做图像数据标注，从情感分析和实体分析两个个场景分析小宝哥Code 人工智能训练师人工智能
在人工智能训练中，图像情感分析和图像实体分析是两个重要的应用场景。高质量的图像数据标注对于训练情感识别模型和目标检测/语义分割模型至关重要。本指南将详细介绍：情感分析标注（EmotionAnalysis）实体分析标注（EntityRecognition）自动化标注工具Python代码示例数据格式与存储标注数据质量评估1.情感分析（EmotionAnalysis）标注1.1情感分析简介图像情感分析（
DeepSeek开源周震撼来袭！手把手教你玩转AI神器（附20个万能提问公式+清华内部资料）后端
标题：DeepSeek开源周震撼来袭！手把手教你玩转AI神器（附20个万能提问公式+清华内部资料）正文：一、DeepSeek最新动态：开源周引爆AI圈2025年2月21日，DeepSeek在社交平台宣布启动「开源周」，计划于下周起逐步开源5个核心代码库，涵盖其在线服务的基础组件和实战测试模块。这一举措标志着中国AI团队首次以完全透明的方式向全球开发者社区共享AGI（通用人工智能）研究成果。值得关注
【漫话机器学习系列】101.特征选择法之Lasso（Lasso For Feature Selection） IT古董漫话机器学习系列专辑机器学习人工智能
Lasso特征选择法详解1.Lasso回归简介Lasso（LeastAbsoluteShrinkageandSelectionOperator，最小绝对收缩和选择算子）是一种基于L1范数正则化的线性回归方法。它不仅能够提高模型的泛化能力，还可以自动进行特征选择，即将一些不重要的特征的系数收缩到0，从而减少模型的复杂度。2.Lasso回归的数学公式Lasso回归的目标函数如下：其中：是输入数据，w是
JDK活化石复苏：showDocument()抢救指南，一秒变身技术大佬！保姆级教程来啦！筱涵哥 Java java 开发语言
一、时空错乱现场：当我试图用Applet打开2024年的网页1.1来自前朝的圣旨"把这个2008年的报表系统迁移到新浏览器！"——当我听到这个需求时，显示器里的IE6图标流下了两行像素泪。1.2现代程序员的降维打击//试图在现代浏览器召唤神龙时try{URLurl=newURL("http://modern.com");getAppletContext().showDocument(url);//
从零开始学习黑客技术，看这一篇就够了网络安全-旭师兄学习 web安全 python 网络安全密码学
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包黑客，对于很多人来说，是一个神秘的代名词，加之影视作品夸张的艺术表现，使得黑客这个本来只专注于技术的群体，散发出亦正亦邪的神秘色彩。黑客源自英文hacker一词，最初曾指热心于计算机技术、水平高超的电脑高手，尤其是程序设计人员，逐渐区分为白帽、灰帽、黑帽等。其中，白帽黑客被称为道德黑客。他们不会非法入侵用户网络，而是通过一系列测试检查
AIGC：开启内容创作的新纪元顾漂亮 AIGC
目录引言AIGC是什么基于GANs的AIGC示例AIGC的发展历程AIGC在各领域的应用1.新闻媒体2.艺术创作3.广告营销4.教育领域AIGC的技术实现自然语言生成（NLG）图像生成音频生成AIGC面临的挑战与机遇挑战机遇未来展望引言在当今数字化飞速发展的时代，人工智能已经逐渐渗透到我们生活的方方面面。而AIGC（AI-GeneratedContent，人工智能生成内容）作为人工智能领域的一颗璀
人工智能：从基础到前沿顾漂亮人工智能深度学习 windows
目录目录1.引言2.人工智能基础2.1什么是人工智能？2.2人工智能的历史2.3人工智能的分类3.机器学习3.1机器学习概述3.2监督学习3.3无监督学习3.4强化学习4.深度学习4.1深度学习概述4.2神经网络基础4.3卷积神经网络（CNN）4.4循环神经网络（RNN）5.自然语言处理（NLP）5.1NLP概述5.2文本预处理5.3词嵌入5.4语言模型6.计算机视觉6.1计算机视觉概述6.2图像
2025年全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽安全-黑客4148 安全 web安全网络网络安全 CTF
目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15天）4.3、后期五、CTF学习资源5.1、CTF赛题复现平台5.
【网络协议详解】——DHCP技术（学习笔记）网络工程小王笔记网络协议学习笔记网络华为
目录DHCP简介定义受益DHCP组网DHCP租期和地址池DHCP报文类型DHCP报文中的Options字段DHCP原理描述DHCP服务器给首次接入网络的客户端分配网络参数的工作原理无中继场景时DHCP客户端首次接入网络的工作原理有中继场景时DHCP客户端首次接入网络的工作原理DHCP客户端更新租期的工作原理实验步骤：组网需求配置思路验证配置结果DHCP简介定义动态主机配置协议DHCP（Dynami
Python的那些事第二十八篇：数据分析与操作的利器Pandas 暮雨哀尘 Python的那些事信息可视化 python 开发语言 pandas 数据分析数据处理
Pandas：数据分析与操作的利器摘要Pandas是基于Python的开源数据分析库，广泛应用于数据科学、机器学习和商业智能等领域。它提供了高效的数据结构和丰富的分析工具，能够处理结构化数据、时间序列数据以及复杂的数据转换任务。本文从Pandas的基础概念入手，深入探讨其核心数据结构（Series和DataFrame），并结合实际案例，详细阐述数据导入导出、数据清洗、数据处理、分组聚合、数据可视化
2025最新Python机器视觉实战：基于OpenCV与YOLOv8的实时目标检测与跟踪（附完整代码） emmm形成中 python opencv YOLO
2025最新Python机器视觉实战：基于OpenCV与YOLOv8的实时目标检测与跟踪（附完整代码）摘要：本文基于OpenCV与YOLOv8模型，实现实时目标检测与跟踪功能，支持多类别目标识别与运动轨迹绘制。代码兼容Python3.7+，步骤清晰且经过稳定性测试，适合中高级开发者参考。所有依赖库均为最新版本，确保运行流畅。一、环境准备安装依赖库pipinstallopencv-python==4
ragflow-RAPTOR到底是什么？请通俗的解释！愚昧之山绝望之谷开悟之坡大模型笔记人工智能 python
RAPTOR有两种不同的含义，具体取决于上下文：RAPTOR作为一种信息检索技术RAPTOR是一种基于树状结构的信息检索系统，全称为“RecursiveAbstractiveProcessingforTree-OrganizedRetrieval”（递归抽象处理树组织检索）。它的核心思想是通过递归地嵌入、聚类和总结文本块，构建一个多层树状结构。通俗来说，就像把一本书的内容分成章节、小节，然后逐层总
什么是Web极简架构极道Jdon javascript reactjs
极其简单Web架构（radicallysimpleweb）是一个面向初创企业和小型企业的Web应用程序蓝图：何使用模块化单体ModularMonoliths、SSR、微前端MicroFrontends、HTMX和TailwindCSS跨多个领域团队构建Web应用程序。本文为运行或构建跨多个团队的Web应用程序的中小型公司提供了蓝图。本文的目的不是描述严格基于“照本宣科”模式的理论技术架构，也不是创
深入浅出机器学习：概念、算法与实践倔强的小石头_ AI 机器学习算法人工智能
目录引言机器学习的基本概念什么是机器学习机器学习的基本要素机器学习的主要类型监督学习（SupervisedLearning）无监督学习（UnsupervisedLearning）强化学习（ReinforcementLearning）机器学习的一般流程总结引言在当今数字化时代，数据量呈爆炸式增长。机器学习作为一门多领域交叉学科，致力于让计算机系统从数据中自动学习模式和规律，进而实现对未知数据的预测和
TensorFlow 2 来训练一个线性回归模型大数据张老师 tensorflow 线性回归人工智能
本节将通过一个简单的示例，带领大家了解如何使用TensorFlow2来训练一个线性回归模型。这个例子将帮助大家掌握如何从数据处理、模型构建、训练到评估等步骤，逐步实现一个基础的机器学习任务。下面是代码的详细讲解。importtensorflowastfimportpandasaspd首先，我们导入了TensorFlow和Pandas库。TensorFlow用于构建和训练我们的机器学习模型，Pand
[附源码]JAVA+ssm计算机毕业设计大学生体测数据管理系统（程序+Lw) 战少程序源码 java 课程设计 mybatis
项目运行环境配置：Jdk1.8+Tomcat7.0+Mysql+HBuilderX（Webstorm也行）+Eclispe（IntelliJIDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：SSM+mybatis+Maven+Vue等等组成，B/S模式+Maven管理等等。环境需要1.运行环境：最好是javajdk1.8，我们在这个平台上运行的。其他版本理论上也可以。2.ID
Vue.js 与 Ajax（Axios）的深入探索 wjs2024 开发语言
Vue.js与Ajax（Axios）的深入探索引言在当前的前端开发领域，Vue.js已经成为了最受欢迎的JavaScript框架之一。它以其简洁的语法、高效的性能和强大的生态系统获得了广泛的应用。而在与后端服务交互时，Ajax技术是不可或缺的。本文将深入探讨Vue.js与Ajax（Axios）的结合，帮助读者更好地理解这两种技术的协同工作。Vue.js简介Vue.js是一个渐进式JavaScrip
蓝禾，oppo，游卡，汤臣倍健，康冠科技，作业帮，高途教育25届春招内推 weixin_53585422 求职招聘算法嵌入式硬件 java 前端
蓝禾，oppo，游卡，汤臣倍健，康冠科技，作业帮，高途教育25届春招内推①康冠科技【职位】算法、软件、硬件、技术，结构设计，供应链，产品，职能，商务【一键内推】https://sourl.cn/2Mm9Lk【内推码】EVBM88②蓝禾（秋招投过还可投）【岗位】国内/国际电商运营，设计，营销，职能，工作地：深圳【请选择“校园大使推荐码”】71T3HES【一键内推】https://sourl.cn/6
边缘计算与联邦学习驱动医疗影像特征工程优化智能计算研究中心其他
内容概要随着医疗影像数据规模的指数级增长与多模态成像技术的普及，传统集中式特征工程方法面临数据孤岛、隐私泄露及计算效率等多重挑战。本研究针对医疗影像分析场景中跨机构数据共享的复杂性，提出基于边缘计算与联邦学习的协同优化框架，通过分布式特征工程重构医学图像的解析范式。该框架以卷积神经网络为核心，结合多阶段数据预处理流程（包括噪声抑制、模态对齐及标准化处理），实现跨设备医疗影像的特征表示统一化。在模型
深度学习框架与边缘计算融合驱动医疗金融模型优化新路径智能计算研究中心其他
内容概要随着边缘计算与深度学习框架的深度融合，医疗与金融领域的模型优化正在突破传统算力与隐私保护的瓶颈。当前，TensorFlow、PyTorch等主流框架通过轻量化改造（如TensorFlowLite与PyTorchMobile）逐步适应边缘设备的资源限制，同时结合联邦学习技术构建分布式训练网络。这种技术协同不仅降低了医疗影像诊断中的数据传输延迟，还通过动态模型压缩策略（如量化与剪枝）将金融预测
边缘计算与联邦学习驱动医疗金融预测及模型可解释性技术突破智能计算研究中心其他
内容概要当前人工智能技术正经历多维度融合与迭代升级，边缘计算与联邦学习的协同创新成为突破性方向。通过将计算资源下沉至终端设备，边缘计算有效缓解了传统中心化架构的延迟与带宽压力，而联邦学习则在保障数据隐私的前提下，实现了跨机构模型的分布式训练。这种技术组合在医疗诊断与金融预测领域展现出显著优势，例如通过部署轻量化模型实现实时病理分析，或构建跨银行风险预测系统，同时满足监管合规需求。在模型优化层面，自
DeepSeek助力科研工作 CodeJourney. 数据库算法架构
在科研领域，传统工作模式面临诸多挑战。科研人员往往需要耗费大量时间和精力在文献综述、技术报告生成和数据分析等基础工作上。据统计，科研人员约三分之一的工作时间都花在查阅和梳理文献上，这不仅效率低下，还容易遗漏重要信息，尤其在信息爆炸的今天，海量的文献资料让科研人员不堪重负。而数据分析的复杂性也使得研究进展缓慢，难以快速从数据中挖掘出有价值的信息。但随着人工智能技术的发展，这些问题迎来了转机，Deep
MySQL索引、视图与范式：高效数据库设计与优化秘籍 rain雨雨编程 Java编程数据库 mysql 索引视图范式
‍♂️个人主页：@rain雨雨编程微信公众号：rain雨雨编程✍作者简介：持续分享机器学习，爬虫，数据分析希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录mysqlday04课堂笔记1、索引（index）1.1、什么是索引？1.2、索引的实现原理？1.3、添加索引的注意事项1.4、索引怎么创建？删除？语法是什么？1.5、如何查看某select中是否使用了索引1.
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end