Python大本营

收藏 | 大神教你用Python预测未来：一文看懂时间序列

（由Python大本营付费下载自视觉中国）

作者 | Leandro Rabelo

译者 | 李洁

整理 | Lemonbit

出品 | Python数据之道

本文内容较长，较为详细的阐述了进行时间序列预测的步骤，有些内容可能暂时用不到或者看不懂，但不要紧，知道有这么一个概念，后续碰到的时候，继续深入学习以及使用就可以。

一文弄懂时间序列预测的基本原理

我们被随处可见的模式所包围，人们可以注意到四季与天气的关系模式，以交通量计算的交通高峰期的模式，你的心跳或者是股票市场和某些产品的销售周期。

分析时间序列数据对于发现这些模式和预测未来非常有用。有几种方法可以创建这类预测，在本文中，我将介绍最基本且最传统的方法概念。

所有代码都是用 Python 编写的，并且在 GitHub 上可以看到所有的信息。

https://nbviewer.jupyter.org/github/leandrovrabelo/tsmodels/blob/master/notebooks/english/Basic Principles for Time Series Forecasting.ipynb

那么让我们开始谈谈分析时间序列的初始条件：

1 平稳序列

平稳时间序列是指统计特性，如均值、方差和自相关系数，随时间相对恒定的序列。因此，非平稳序列是统计特性随时间变化的序列。

在开始任何预测建模之前，都有必要验证这些统计属性是否是常量，我将一一解释下面的每个点：

常数均值
常数方差
自相关

常数均值

一个平稳序列在时间上具有一个相对稳定的均值，这个值没有减少或者增加的趋势。围绕常数均值的小的变化，使我们更容易推测未来。在某些情况下，相对于平均值的变量比较小，使用它可以很好地预测未来。下图显示了变量与该常数平均值相对于时间变化的关系:

在这种情况下，如果序列不是平稳的，对未来的预测将是无效的，因为平均值周围的变量会显著偏离，如下图所示:

在上图中，我们可以明显看到上升的趋势，均值正在逐渐上升。在这种情况下，如果使用均值进行未来值的预测，误差将非常大，因为预测价格会总是低于实际价格。

常数方差

当序列的方差为常数时，我们知道均值和标准差之间存在一种关系。当方差不为常数时（如下图所示），预测在某些时期可能会有较大的误差，而这些时期是不可预测的。可以预测到，随着时间的推移直到未来，方差会保持不稳定。

为了减小方差效应，可以采用对数变换。在本例中，也可以使用指数变换，如 Box-Cox 方法，或者使用膨胀率调整。

自相关序列

当两个变量在时间上的标准差有相似的变化时，你可以说这些变量是相关的。例如，体重会随着心脏疾病而增加，体重越大，心脏问题的发生率就越大。在这种情况下，相关性是正的，图形应该是这样的:

负相关的情况类似于这样：对工作安全措施的投入越多，工作相关的事故数量就越少。

下面是几个相关级别的散点图的例子:

当谈到自相关时，意思是某些先前时期与当前时期存在相关性，这种相关性是滞后的。例如，在以小时为单位的测量值序列中，今天 12:00 的温度与 24 小时前的 12:00 的温度非常相似。如果你比较 24 小时内的温度变化，就会存在自相关，在本例中，我们将与第 24 小时前的时间存在自相关关系。

自相关是使用单个变量创建预测的一种情况，因为如果没有相关性，就不能使用过去的值来预测未来；当有多个变量时，则可以验证因变量和独立变量的滞后之间是否存在相关性。

如果一个序列不存在自相关关系，那么它就是随机且不可预测的，做预测的最佳方法通常是使用前一天的值。我将在下面使用更详细的图表来解释。

从这里开始我将分析 Esalq 上的每周含水乙醇价格（这是巴西谈判含水乙醇的价格参考），数据可以在这里(https://www.cepea.esalq.usp.br/br/indicador/etanol.aspx)下载。

价格单位是巴西雷亚尔每立方米(BRL/m3)。

在开始任何分析之前，要将数据划分为训练集和测试集。

划分训练集和测试集数据

当我们要创建时序预测模型时，将数据划分为两部分至关重要：

训练集：这些数据将是定义模型系数/参数的主要依据；

测试集：这些数据将被分离且对模型不可见，用于测试模型是否有效（通常将这些值与模型结果进行比较，最后测量平均误差）。

测试集的大小通常约为总样本的20%，尽管这个百分比取决于你拥有的样本大小以及你希望提前多少时间进行预测。理想情况下，测试集应至少与所需预测的最大范围相同。

与其他如分类和回归等不受时间影响的预测方法不同，在时间序列中，不可以将训练和测试数据从数据中随机抽样取出，我们必须遵循序列的时间标准，训练数据应该始终是在测试数据之前。

在本例中，我们有Esalq 含水乙醇的 856 周的价格数据，使用前 700 周的数据作为训练集，后 156 周（3年，18%）的数据用作测试集：

从现在开始，我们只使用训练集来做研究，测试集仅用于验证我们的预测。

每一个时间序列可以分为三个部分：趋势、季节性和残差，残差是将前两部分从序列中去除后剩下的部分，使用这种分割方法之后：

显然，该序列具有上升趋势，在每一年的年底到年初之间达到峰值，在4月和9月之间达到最低值（此时在巴西中南部开始甘蔗的压榨）。

我们仍然建议使用统计测试来确认序列是否是平稳的，这里将使用两个测试：Dickey-Fuller 测试和 KPSS 测试。

首先，我们将使用 Dickey-Fuller 检验，我将使用 5% 的基础 P 值，也就是说，如果 P 值低于 5% 这意味着这个序列在统计上是平稳的。

此外，还有模型的统计检验，可以将检验值与 1%、5%、10% 的临界值进行比较，如果统计检验低于选定的某个临界值，就认为序列是平稳的:

在本例中，Dickey-Fuller 检验结果表明序列不是平稳的（ P 值 36%，临界值 5% 小于统计检验）。

现在我们要用 KPSS 检验分析序列，与 Dickey-Fuller 检验不同，KPSS 检验已经假设序列是平稳的，只有当 P 值小于 5% 或统计检验小于某个临界值时，序列才不是平稳的：

KPSS 检验证实了 Dickey-Fuller 检验的正确性，同时也表明该序列不是平稳的，因为 P 值为 1%，统计检验高于任何临界值。

接下来，我将演示如何将序列转换为平稳状态。

2 将序列转换为平稳状态

差分

差分法用来移除趋势信号，也可以用来减少方差，它只是 T 周期的值与前一个 T-1 周期值的差值。

为了更容易理解，下面我们只用一小部分的乙醇价格，以便更好地可视化，可以看到从 2005 年 5 月开始价格上涨，直到 2006 年 5 月中旬，价格每周都在上涨，这就累积了一个上升的趋势，这种情况下，属于非平稳序列。

当进行一阶微分时（如下图），我们去除了序列的累积效应，并且仅显示了整个系列中时段 T 相对于时段 T-1 的变化，因此如果 3 天前的价格为 800 BRL 且已涨到 850.00 BRL，差价将是 50.00 BRL，如果今天的价格是 860.00 BRL，那么差价将是 - 10.00 BRL。

通常只需要一阶微分就足够将序列转换为平稳状态，但如果需要，可以应用二阶微分，在这种情况下，将对一阶微分的值进行求导（几乎没有二阶以上微分的情况）。

同样的例子，要进行二次微分，我们必须取 T 时刻减去 T-1 时刻的微分：2.9 BRL -5.5 BRL = - 2.6 BRL 等等。

我们来做一下 Dickey-Fuller 测试，看看这个序列是否会在一阶微分后是平稳的：

在这种情况下，我们确定该序列是平稳的，P 值为零，并且当我们比较统计检验的值时，它远远低于临界值。

在下一个例子中，我们将尝试调整通货膨胀率将一个序列转换到平稳状态。

膨胀率调整

价格是相对于交易时间的，2002 年乙醇的价格是 680.00 BRL，如果现在产品的价格是这个价格，很多工厂肯定会倒闭，因为这个价格非常低。

为了让序列平稳，我将基于当前值使用巴西 IPCA 索引（巴西的 CPI 指数）调整整个序列，从训练区间的结尾（2016年4月）到研究的开始，数据的来源是 IBGE 网站。

现在我们来看序列如何能变平稳以及是否变平稳。

如图所示，上升趋势已经消失，只剩下季节性振荡， Dickey-Fuller 测试也证实了这个序列现在是稳定的。

如果好奇，可以参阅下面的图表，其中调整后的价格与原始系列的通货膨胀率相对应。

减小方差

对数变换

对数变换通常用于将指数增长的序列转换为具有更趋于线性增长的序列，在本例中，我们将使用自然对数（Natural Logarithm，NL），其底数为 2.718 ，这种对数类型在经济模型中被广泛使用。

转换成 NL 值的差值近似等于原始序列值的百分比变化，作为降低不同价格序列的方差的基础是很有效的，如下例:

如果我们有一个产品在 2000 年价格上涨，从 50.00 BRL 到 52.50 BRL，几年后（2019年），价格已经是 100.00 BRL，已经上涨到 105.00 BRL，价格之间的绝对差分别是 2.50 BRL 和 5.00 BRL，但两者的百分比差为 5% 。

当我们对这些价格中使用 NL 时，我们得到：NL (52.50) - NL(50.00) = 3.96 - 3.912 = 0.048 或 4.8%，同样地，在第二个价格序列中使用 LN 时，我们得到：NL (105) - NL(100) = 4.654-4.605 = 0.049 或 4.9% 。

在这个例子中，我们可以通过把几乎所有的东西都放到相同的基上来减少差异值。

下面还是同一个例子:

1price1 = np.log(52.5) - np.log(50)
2price2 = np.log(105) - np.log(100)
3printf('The percentage variation of the first example is {round(price1*100,1)} and the second is {round(price2*100,1)}')

原始序列与 NL 序列变换的对比图:

Box-Cox 变换（指数变换）

Box-Cox 转换也是一种转换序列的方法，lambda（λ）的值是用于转换序列的参数。

简而言之，这个函数是几个指数变换函数的结合，我们需要找到转换序列的 lambda 的最佳值，使其分布更接近正态高斯分布。使用此转换的一个条件是序列只有正值，公式为：

接下来我将绘制原始序列及其分布图，然后用 lambda 最佳值绘制新的转换序列及其分布图，为了找到 lambda 的值，我们将使用库 Scipy 的 boxcox 函数生成转换的序列和理想 lambda 值：

下面是一个交互式图表，在图中可以更改 lambda 值和检查更改：

此工具通常用于提高模型的性能，因为它使模型更趋于正态分布，记住在完成模型的预测后，必须根据以下公式反转转换到原始的基数：

寻找相关时滞

为了便于预测，具有单一变量的序列必须具有自相关性，即，当前时段必须是能够基于较早的时段（滞后）而解释的。

由于这个序列每周为一周期，1 年大约 52 周，我将使用 60 的滞后期的自相关函数来验证当前周期与这些滞后的相关性。

通过对上述自相关图的分析，似乎所有的滞后都可以用来为未来事件创建预测，因为它们的正相关接近 1 ，而且都在置信区间之外，但这一特征属于非平稳序列。

另一个非常重要的函数是部分自相关函数，其中消除了先前的滞后对当前区间的影响，只保留了当前区间滞后的影响来分析，例如：第四个滞后的偏自相关将消除第一、第二和第三个滞后的影响。

部分自相关图如下：

可以看到，几乎没有滞后对当前周期有影响，但是正如前面所演示的，没有微分的序列不是平稳的，我们现在用一阶微分的序列绘制这两个函数来展示原理：

自相关曲线变化显著，表明该序列仅在第一个滞后期具有显著相关，在第 26 个滞后(半年)左右具有负相关的季节效应。

为了做出预测，我们必须注意一个找到相关的滞后现象的非常重要的细节，重要的是这种关联背后的原因，因为如果没有逻辑上的原因，就有可能是偶然的，当包含更多的数据时，这种关联就会消失。

另一个重点是自相关和部分自相关图对异常值非常敏感，因此分析时间序列本身并与两个自相关图进行对比非常重要。

在这个例子中，第一个滞后与当前周期具有高度相关性，因为前一周的价格历史上没有显著变化，在相同的情况下，第 26 个滞后呈现负相关，表明与当前时期相反的趋势，可能原因是一年内不同时期供需不同。

随着膨胀率调整后的序列已经趋于平稳，我们将使用它来创建我们的预测，下图是调整后序列的自相关和部分自相关图：

我们将只使用前两个滞后作为自回归序列的预测因子。

想要了解更多信息的话，杜克大学教授 Robert Nau 的网站是与此主题相关的最佳网站之一。（http://people.duke.edu/~rnau/411home.htm)

3 模型评价指标

为了分析预测值是否接近当前值，必须对误差进行测量，此种情况下的误差（或残差）基本上是 Yreal-YpredYreal-Ypred （这个暂时不知道怎么翻译， real 真实值， pred 预测值）。

对训练数据中的错误进行评估以验证模型是否具有良好的确定性，然后通过检查测试数据中的误差（模型未“看到”的数据）来验证模型。

当将训练数据与测试数据进行对比时，检查误差对于验证你的模型是否过拟合或欠拟合非常重要。

以下是一些用于评估时间序列模型的关键指标：

平均预测误差——偏差（bias）

它只是被评估序列的平均误差，值可以是正的也可以是负的。该指标表明，模型倾向于预测实际值以上（负误差）还是实际值以下（正误差），因此也可以说平均预测误差是模型的偏差。

MAE——平均绝对误差

这个指标与上面提到的预测的平均误差非常相似，唯一的区别是将误差的负值转化为正值，然后计算平均值。

这个指标在时间序列中被广泛使用，因为在一些情况下，负误差可以抵消正误差，使人误以为模型是准确的，而在用 MAE 的情况下不会发生，因为这个指标显示预测距离实际值有多远，不管数值大还是小，示例如下：

1a = np.array([1,2,3,4,5])
2b = np.array([5,4,3,2,1])
3
4error = a - b
5
6MFE = error.mean()
7MAE = np.abs(error).mean()
8
9print(f'The error of each model value looks like this: {error}')
10print(f'The MFE error was {MFE}, the MAE error was {MAE}')

与 MAE 和 MFE 不同，MSE 值是平方单位，而不是模型单位。

RMSE——均方根误差

这个指标只是 MSE 的平方根，使误差返回到模型的度量单位（BRL/m3），因为它对时间序列在平方过程中产生的较大误差更为敏感而非常有用。

MAPE——平均绝对百分误差

这是另一个可用的有趣的指标，它通常在管理报告中使用，因为误差是以百分比度量的，所以产品 X 的错误可以与产品 Y 的误差进行比较。

该指标的计算取误差的绝对值除以当前价格，然后计算平均值：

我们来创建一个函数，用几个评估指标来评估训练数据和测试数据的误差:

1#Libraries to create the function:
2from math import sqrt
3from sklearn.metrics import mean_squared_error,mean_absolute_error, mean_absolute_error
4
5def check_error(orig, pred, name_col='', index_name=''):
6    bias = np.mean(orig - pred)
7    mse = mean_squared_error(orig, pred)
8    rmse = sqrt(mean_squared_error(orig, pred))
9    mae = mean_absolute_error(orig, pred)
10    mape = np.mean(np.abs((orig - pred) / orig)) * 100
11    error_group = [bias, mse, rmse, mae, mape]
12    serie = pd.DataFrame(error_group, index=['BIAS','MSE','RMSE','MAE', 'MAPE'], columns=[name_col])
13    serie.index.name = index_name
14    return serie

残差与预测值（散点图）

分析这个图是非常重要的，因为在这个图中我们可以检查模式，它可以告诉我们是否需要对模型进行一些修改，理想的情况是误差沿着预测序列线性分布。

残差的QQ图（散点图）

https://en.wikipedia.org/wiki/Q–Q_plot

总的来说这是一个显示了残差在理论上应该如何分布的图形，遵循高斯分布，而不是实际情况。

残差自相关（序列图）

如果没有置信区间的值，或者说模型不包含信息。

我们需要创建另一个函数来绘制这些图：

1def plot_error(data, figsize=(18,8)):
2    # Creating the column error
3    data['Error'] = data.iloc[:,0] -data.iloc[:,1]
4
5    plt.figure(figsize=figsize)
6    ax1 = plt.subplot2grid((2,2), (0,0))
7    ax2 = plt.subplot2grid((2,2), (0,1))
8    ax3 = plt.subplot2grid((2,2), (1,0))
9    ax4 = plt.subplot2grid((2,2), (1,1))
10    #Plotting actual and predicted values
11
12    ax1.plot(data.iloc[:,0:2])
13    ax1.legend(['Real','Pred'])
14    ax1.set_title('Real Value vs Prediction')
15    # Error vs Predicted value
16
17    ax2.scatter(data.iloc[:,1], data.iloc[:,2])
18    ax2.set_xlabel('Predicted Values')
19    ax2.set_ylabel('Residual')
20    ax2.set_title('Residual vs Predicted Values')
21
22    ## Residual QQ Plot
23    sm.graphics.qqplot(data.iloc[:,2], line='r', ax=ax3)
24
25    # Autocorrelation Plot of residual
26    plot_acf(data.iloc[:,2], lags=60, zero=False, ax=ax4)
27    plt.tight_layout()
28    plt.show()

与实际值相比，误差往往会增加。

许多人还使用这种方法作为基线（baseline），试图用更复杂的模型来改进。

下面我们将使用训练数据和测试数据来进行模拟：

QQ 图显示了有一些比理论上要大些（包括正负值）的残差，这些是所谓的异常值，但在第一，第六和第七个滞后中仍然存在明显的自相关，这可以用于改进模型。

同样地，我们现在将在测试数据中进行预测。预测序列的第一个值将是训练数据的最后一个值，然后这些值将按照测试的当前值逐步更新，依此类推：

RMSE 和 MAE 的误差与训练数据相似，QQ 图与残差更符合理论值，可能是由于与训练数据相比样本值较少。

在对比残差与预测值的图表中，我们注意到当价格上涨时，误差绝对值有增加的趋势，可能用对数调整会减少误差的扩大并完成残差相关图，表明由于第一个滞后有很强的相关性，因此仍有改进的空间，可能添加基于第一个滞后的回归来改进预测。下一个模型是简单平均值：

简单平均

另一种预测方法是使用序列平均值，通常当数值在平均值附近振荡时，具有常数的方差，没有上升或下降趋势时，这种预测形式是好的，但是也能使用更好的方法，其中可以使用季节模式进行预测。

此模型使用数据首端直到分析的前一个时期的平均值，并且按天扩展到数据结束，最后，趋势是一条直线，我们现在将此模型与第一个模型的误差进行比较：

在测试数据中，我将继续使用训练数据一开始的均值，并展开添加到测试数据上：

简单均值模型无法捕获序列的相关信息，如真实值和预测值图中所示，也可以在相关性和残差和预测图中看到。

简单滑动平均：

滑动平均是针对给定周期（例如 5 天）计算的平均值，它是滑动的并始终使用此特定时段进行计算，在这种情况下，我们将始终使用过去 5 天的平均值来预测下一天的值。

误差低于简单平均，但仍高于简单模型，以下是测试模型:

与训练数据相似，滑动平均模型优于简单平均模型，但尚未比简单模型基础有所增益。

预测具有 2 个时滞的自相关性，并且相对于预测值有很大的方差误差。

指数滑动平均:

上述简单滑动平均模型具有同等地处理最后 X 个观测值并完全忽略所有先前观测值的特性。直观地说，过去的数据应该逐渐打折，例如，理论上最近的观测结果应该比第二近的更重要，而第二近的观测应该比第三近的数据更重要，等等，指数滑动平均（Exponential Moving Average，EMM）模型就是这样做的。

由于 α（alpha）是一个常数，其值介于 0 和 1 之间，因此我们将使用以下公式计算预测值：

如果预测的第一个值是相应的当前值，其他值将更新为实际值与前一个时段的预测之差的 α 倍。当α为零时，我们根据第一个预测值得到一个常数，当 α 为 1 时，我们有一个简单方法的模型，因为结果是前一个实际周期的值。

下面是几个 α 值的图表：

EMM 预测中的平均数据周期为 1 /α。例如，当 α= 0.5 时，滞后相当于 2 个周期; 当 α= 0.2 时，滞后是 5 个周期; 当 α= 0.1 时，滞后是 10 个周期，依此类推。

在这个模型中，我们将任意选用 α 值为 0.5 ，而你可以通过网格搜索算法查找在训练集和验证集中都中减少了错误的 α，数据大概应是这样：

这个模型的误差与滑动平均的误差相似，但是我们需要在测试集对模型进行验证：

在验证数据中，目前为止的误差在我们已经训练过的模型中排名第二，而残差图的特征与 5 天滑动平均模型的特征非常相似。

自回归

自回归模型基本上是一个具有显著相关滞后的线性回归，首先要绘制自相关图和部分自相关图来验证是否存在相关关系。

下面是训练序列的自相关图和部分自相关图，显示了自回归模型的特征为具有 2 个时滞的显著相关性:

接下来我们将根据训练数据创建模型，得到模型的系数后，将其乘以测试数据将要执行的值:

这个模型与我们所训练的其他模型相比，误差最小，现在我们用它的系数对训练数据进行逐步预测:

注意，在测试数据中，误差不会保持稳定，甚至会比简单模型更差，可以看到图中的预测值几乎总是低于当前值，偏差测量显示实际值比预测值高 50.19 BRL，也许在训练模型中调整一些参数，这种差异会减小。

要改进这些模型，你可以应用多个转换，例如本文中介绍的转换，也可以添加外部变量作为预测源，但是，这已然超出本文内容了。

4 结束语

每个时间序列模型都有自己的特点，应该分别单独分析，这样我们就可以提取尽可能多的信息来做出好的预测，减少未来的不确定性。

检验平稳度、转换数据、在训练数据中建立模型、验证测试数据、检验残差是建立良好时间序列预测的关键步骤。

也可以看看本文原作者的有关ARIMA模型的文章。

https://www.kaggle.com/leandrovrabelo/climate-change-forecast-sarima-model

原文来源：

https://towardsdatascience.com/basic-principles-to-create-a-time-series-forecast-6ae002d177a4

译者简介:：李洁，北京师范大学香港浸会大学联合学院数据科学系助教，香港科技大学电信学硕士。

（*本文为Python大本营转载文章，转载请联系原作者。原标题：不会时间序列预测？不要紧，大神来教你）

◆

精彩推荐

◆

【结果提交倒计时】PV,UV流量预测算法大赛，结果提交截止时间为 9月20日 ，还没有提交的小伙伴抓紧时间了~~9月25日公布初赛成绩。最新排行榜请点击 阅读原文 查看。

推荐阅读

5大必知的图算法，附Python代码实现
如何用爬虫技术帮助孩子秒到心仪的幼儿园（基础篇）
2019年最新华为、BAT、美团、头条、滴滴面试题目及答案汇总
阿里巴巴杨群：高并发场景下Python的性能挑战

你点的每个“在看”，我都认真当成了喜欢

你可能感兴趣的:(收藏 | 大神教你用Python预测未来：一文看懂时间序列)

python:数据类构建器愚戏师 python基础与机器学习 python windows 开发语言
在Python中，数据类（DataClasses）用于快速创建主要目的是存储数据的类，自动生成__init__,__repr__,__eq__等方法。“Python提供了几种构建简单类的方式，这些类只是字段的容器，几乎没有额外功能。这种模式称为“数据类”（dataclass），dataclasses包就支持该模式。”引用自《流畅的python（第二版）》1.基础数据类使用@dataclass装饰器
还不会构建MindIE镜像？一篇文章搞定 Zain Lau vim 编辑器 linux MindIE 昇腾
MindIE镜像构建工程项目简介用于构建多平台/架构的MindiE镜像的脚本。用户可以根据需要准备好所需的软件包，修改相关配置并构建镜像。前提条件网络连接在整个构建过程中，必须保持稳定的网络连接。此构建工程依赖于在线下载多个资源，包括但不限于Python源码、编译工具以及各种依赖，无法离线构建。Docker推荐版本：Docker20.10.x及以上最低版本要求：Docker19.03.x安装方式：
使用 certbot 在centos7 搭建ssl证书自动并且续约 TwoSs110 ssl https
第一步，确定服务器适合安装的certbot版本sudoyuminstallpython27如果上述方法不起作用，你可以尝试编译安装。首先，你需要安装编译Python所需的依赖包。sudoyuminstallgccmakeopenssl-develsqlite-develreadline-develzlib-develbzip2-devel接下来，下载Python2.7.5的源代码，并进行编译安装。
Assembly语言的自然语言处理花韵婷包罗万象 golang 开发语言后端
Assembly语言在自然语言处理中的应用引言自然语言处理（NaturalLanguageProcessing,NLP）作为人工智能的一个重要分支，致力于实现计算机与人类语言之间的互动。随着计算能力的提升以及大数据的蓬勃发展，NLP在各个领域的应用如火如荼。从语音识别、机器翻译到情感分析等，NLP正在改变我们与信息之间的互动方式。不过，当前主流的NLP研究通常是用高级编程语言（如Python、Ja
Groovy语言的漏洞扫描花韵婷包罗万象 golang 开发语言后端
Groovy语言漏洞扫描：深入分析与实践引言Groovy是一种基于Java虚拟机（JVM）的动态编程语言，它结合了Python、Ruby和Smalltalk等语言的特性，提供了简洁的语法和强大的功能。Groovy广泛应用于脚本编写、自动化测试、构建工具（如Gradle）以及Web开发等领域。然而，随着Groovy的广泛应用，其安全性问题也逐渐显现出来。本文将深入探讨Groovy语言中的常见漏洞类型
大模型的webui Zain Lau 人工智能 python 昇腾 Ascend 天数
exportXXX_LLM_C=~/xcore-llm/build/ReleaseexportCUDA_VISIBLE_DEVICES=2,3exportCUDACXX=/usr/local/cuda-12.3/bin/nvccnohup/usr/bin/python3/home/src/api_server/api_server.py--modelLLama2:7b-chat-hf_A800--
PCDN 与边缘计算的结合：未来内容分发的新趋势 yczykjyxgs pcdn 智能路由器
在数字化浪潮中，内容分发面临着前所未有的挑战与机遇。PCDN（P2P内容分发网络）与边缘计算的结合，正逐渐崭露头角，成为未来内容分发的新趋势。PCDN通过P2P技术，利用用户节点的闲置资源进行内容分发，有效减轻了中心服务器的压力，降低了传输成本。然而，在面对实时性要求极高的业务场景时，PCDN仍存在一定局限。边缘计算的出现，为解决这一问题提供了新思路。边缘计算将计算和存储能力下沉到网络边缘，靠近用
Tornado 初识 Wu_Candy Web服务器
一、什么是tornadoTornado是使用Python编写的一个强大的、可扩展的Web服务器。它在处理严峻的网络流量时表现得足够强健，但却在创建和编写时有着足够的轻量级，并能够被用在大量的应用和工具中。二、tornado有什么优势Tornado和现在的主流baiduWeb服务器框架（包括大多数Python的框架）有着明显的区别：它是非阻塞式服务器，而且速度相当快，得利于其非阻塞的方式和对epol
庖丁解java(一篇文章学java) 庖丁解java java 开发语言
(大家不用收藏这篇文章,因为这篇文章会经常更新,也就是删除后重发)一篇文章学java,这是我滴一个执念...当然,真一篇文章就写完java基础,java架构,java业务实现,java业务扩展,根本不可能.所以,这篇文章,就是一个索引,索什么呢?请看下文...关于决定开始写博文的介绍(一切故事的起点源于这一次反省)中小技术公司的软扩展(微服务扩展是否有必要?)-CSDN博客SpringCloud(
python高并发访问mysql_Python访问MySQL 阿廖林诺
Python访问数据库作为Python开发工程师，选择哪个数据库呢？当然是MySQL。因为MySQL不仅免费，普及率最高，出了错，可以很容易找到解决方法。而且，围绕MySQL有一大堆监控和运维的工具，安装和使用很方便。使用MySQLMySQL是Web世界中使用最广泛的数据库服务器。SQLite的特点是轻量级、可嵌入，但不能承受高并发访问，适合桌面和移动应用。而MySQL是为服务器端设计的数据库，能
点亮绿色未来：走进综合能源服务认证 AEMC马广川能源 java 前端服务器大数据人工智能
能源，是城市运转的血液，也是社会发展的动力。然而，传统的能源利用方式正面临着资源紧张、环境污染等挑战。如何破解能源困局，构建清洁低碳、安全高效的能源体系？综合能源服务认证，为我们提供了一把开启绿色未来的钥匙。一、认证的意义：为绿色未来保驾护航想象一下，未来的城市，高楼大厦不再是被冰冷的钢筋水泥包裹，而是披上了一层“绿色外衣”。这层“外衣”不仅能遮风挡雨，还能吸收太阳能、风能，为建筑提供清洁能源。而
Python 爬取大量数据如何并发抓取与性能优化 chusheng1840 Python 教程 python 性能优化开发语言
Python并发抓取与性能优化在进行网络爬虫开发时，爬取大量数据可能非常耗时。尤其是在处理许多网页或API请求时，逐个请求速度会非常慢。为了解决这个问题，我们可以通过并发抓取提高爬取效率。同时，通过性能优化来进一步减少耗时和资源占用，使爬虫更高效。本篇文章将带大家了解Python中常用的并发抓取方法，并介绍如何进行性能优化。1.并发抓取的基本概念并发抓取指的是同时发出多个请求的技术，而不是顺序地等
开源应用驱动企业新质生产力：Websoft9以EPP+AI+知识库助您领跑未来. 人工智能
开源应用驱动企业新质生产力：Websoft9以EPP+AI+知识库助您领跑未来在数字化转型加速的今天，企业新质生产力的核心已从传统资源投入转向技术驱动的效率革命。开源应用凭借其灵活性、成本优势和技术创新力，成为企业实现这一目标的关键引擎。作为开源技术与行业场景化落地的领航者，Websoft9通过企业应用平台（EPP）、AI智能引擎与知识库系统三位一体的解决方案，助力企业快速构建新一代生产力工具，实
【机器学习】基于t-SNE数据可视化工程无水先生 AI原理和python实现人工智能综合人工智能算法
一、说明t-SNE(t-DistributedStochasticNeighborEmbedding)是一种常用的非线性降维技术。它可以将高维数据映射到一个低维空间（通常是2D或3D）来便于可视化。Scikit-learnAPI提供TSNE类，以使用T-SNE方法可视化数据。在本教程中，我们将简要学习如何在Python中使用TSNE拟合和可视化数据。二、t-SNE是个什么？2.1什么是t-SNE？
Conda报错解决：ProxyError: Conda cannot proceed due to an error in your proxy configuration. 三采 Linux Conda 代理
目录原因一：源配置有误原因二：代理配置有误原因三：路由配置有误在需要使用代理的服务器下，创建新conda环境时报错：condacreate-nopencompasspython=3.8/usr/lib/python3/dist-packages/requests/__init__.py:89:RequestsDependencyWarning:urllib3(1.26.9)orchardet(3.
基于asp.NET的病历管理系统 (源码+net+vue+部署文档+讲解等) qq_1406299528 计算机毕业设计 asp asp.net vue.js 后端
收藏关注不迷路！！文末获取源码+数据库感兴趣的可以先收藏起来，还有大家在毕设选题（免费咨询指导选题），项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章目录前言程序资料获取一、项目技术二、项目内容和功能介绍三、核心代码数据库参考四、效果图五、资料获取前言博主介绍：✨全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师，专注于Java/Python/小程序app/深度学
爬取电影标题、评论、评分（21-11-4）穆桥 Python爬虫 XPath解析 MySQL数据库电影信息疾病数据
功能描述：1、爬取网页1中的电影名称、评分、简介到mysql数据库中。2、爬取网页2中的标题、时间、正文、采集时间到mysql数据库中。使用的技术:requests请求、xpath解析、mysqlxpath解析语法//子孙节点/直接子节点.选取当前节点…选取当前节点的父节点@选取属性通过Python的lxml库，利用XPath进行HTML的解析。scrapy封装了lxml也可以导入scrapy任务
Python 爬虫实战：电影评论数据抓取与自然语言处理西攻城狮北 python 爬虫开发语言
引言作为一名对电影数据和自然语言处理感兴趣的内容创作者，我决定利用Python爬虫技术抓取IMDb上的电影评论数据，并进行自然语言处理分析。这不仅可以帮助我们了解观众对电影的反馈，还能为电影制作方提供有价值的参考。一、项目背景IMDb（互联网电影数据库）是全球最大的电影数据库，用户可以在上面查看电影信息和用户评论。本项目旨在爬取IMDb上的电影评论，并对评论进行自然语言处理（NLP），以提取情感、
linux（ubuntu）中Conda、CUDA安装Xinference报错ERROR: Failed to build (llama-cpp-python) 小胡说技书杂谈/设计模式/报错 Data/Python/大模型 linux ubuntu conda 大模型 python Xinference
文章目录一、常规办法二、继续三、继续四、缺少libgomp库（最终解决）在Conda环境中安装libgomp如果符合标题情况执行的：pipinstall"xinference[all]"大概率是最终解决的情况。一、常规办法llama-cpp-python依赖CMake、Make和g++来编译，所以可能是缺少依赖或者环境配置不对。按照以下步骤排查问题并解决：1.确保Python版本符合要求llama
基于Asp.net的汽车租赁管理系统计算机学姐 Asp精选实战项目源码 asp.net 汽车后端 mysql sqlserver vue.js c#
作者：计算机学姐开发技术：SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等，“文末源码”。专栏推荐：前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码精品专栏：Java精选实战项目源码、Python精选实战项目源码、大数据精选实战项目源码系统展示【2025最新】基于Asp.net的汽车租赁管理系统开发
使用yolo训练自己的模型数据遇到的问题次次皮 YOLO 深度学习人工智能
1、报错：NolabelsfoundinD:\xxx\valid\labels.cache查找网上的文章大多都是说文件目录没按规定创建，但我检查了我的目录没问题，后来发现是labels文件夹里的txt文件和images文件夹的图片没有一一对应，对应好之后问题解决2、解决完上个问题之后还是不报上面的错了但还是FatalPythonerror:Aborted；Restartingkernel...检查
Python——文件读取一颗小松松 python 开发语言
Python可以读取不同格式的文件，下面简单来介绍一下：1、使用read_excel或read_csv读取文件，若在路径前加r，使用“\”importpandasaspd#在路径前加r,使用“\”df=pd.read_excel(r'C:\Users\merit\Desktop\测试.xlsx')#导入.csv文件，以“，”为分隔符data=pd.read_csv(r'C:\Users\merit
给接口自动化测试框架增色，实现企业微信测试报告编程简单学软件测试 python python 单元测试压力测试 postman 功能测试
作者在新项目中搭建了python+requests+unittest+HTMLTestRunner接口自动化测试框架，通过修改配置文件实现环境隔离，一份脚本即可在不同的环境执行接口测试用例。但是没有实现任何形式的消息通知，也没有集成到jenkins，原因很简单，因为还没做到很大，而且用户活跃不够，问题也相对较少，只在上线前后执行一次uat和prod环境。那这几天想完善一下消息通知功能，让它具备发送
Qt 子窗体无法设置透明度的问题--来自StackOverflow FourFatCats qt 开发语言
一个弹窗，为了让跟随父窗体移动并且置顶，给设置了parent，但是一旦设置了parent，关闭的消失效果动画就出不来了。即问题是：当一个QWidget设置了parent，用QPropertyAnimation，设置"windowOpacity"就失败。解决办法看了很多博客都乱写一通没人能看懂，解决问题还得StackOverflow。。。我搬运过来Mark一下：提问：I'veusedQPropert
【奇点时刻】通义千问开源QwQ-32B技术洞察报告（扫盲帖）碣石潇湘无限路开源人工智能
以下报告将基于今天各大社区对Qwen/QwQ-32B（下文简称「QwQ-32B」）模型的讨论、测评与实测体验进行综合性分析与洞察。本报告将从模型背景与定位、核心技术、性能表现与对比、部署与使用方式，以及未来潜力与可能的影响五个维度，帮助读者更好地了解这一新兴且备受瞩目的开源推理模型。一、模型背景与定位1.发布方与家族概览QwQ-32B模型由阿里巴巴（Alibaba）旗下的Qwen团队推出，属于Qw
轻松管理CSV数据，Python csv库全解析嘎啦AGI实验室 Python python android 数据库 Python csv
文章目录轻松管理CSV数据，Pythoncsv库全解析背景介绍csv库是什么？如何安装csv库？五个简单的库函数使用方法1.读取CSV文件2.写入CSV文件3.使用DictReader读取CSV4.使用DictWriter写入CSV5.指定分隔符五个场景使用代码说明场景1：读取CSV并统计数据场景2：将查询结果写入CSV场景3：读取CSV并过滤数据场景4：读取CSV并排序数据场景5：读取CSV并合
#PyCharm 2024.1新增功能 Dingdangr pycharm ide python
PyCharm2024.1作为JetBrains专为Python开发者设计的集成开发环境（IDE）的最新版本，带来了众多令人兴奋的新增功能，旨在提升开发者的编程效率和体验。以下是对这些新增功能的详细解析：一、智能编码辅助HuggingFace模型和数据集文档预览PyCharm2024.1引入了HuggingFace模型和数据集的快速文档预览功能。开发者可以直接在PyCharm内部快速获取Huggi
2025年Python生态全景：从AI霸主到量子计算，揭秘其不可替代的技术魅力南玖yy python 人工智能量子计算
在2025年的技术浪潮中，Python凭借其极简的语法、庞大的生态系统以及跨领域融合能力，依然稳坐编程语言界的“头把交椅”。尽管Java等语言在AI领域发起挑战，但Python通过持续的技术革新和生态扩展，展现出不可撼动的生命力。本文将从技术趋势、行业应用与未来挑战三个维度，解析Python的“常青”密码。一、AI领域的持续主导：生态优势与工具革新Python在AI领域的统治地位仍未动摇。尽管有观
使用Python爬取豆瓣用户信息：从入门到实战 Python爬虫项目 2025年爬虫实战项目 python 开发语言人工智能爬虫大数据
引言豆瓣作为一个知名的社交平台，拥有丰富的用户信息。对于数据分析师、研究人员或普通用户来说，获取豆瓣用户信息具有重要的价值。本文将详细介绍如何使用Python及其相关库来爬取豆瓣用户信息，并展示如何利用最新的技术手段来实现这一目标。1.准备工作在开始编写爬虫之前，我们需要准备一些工具和环境：Python3.x：确保你已经安装了Python3.x版本。Requests库：用于发送HTTP请求。Bea
深入 Python 网络爬虫开发：从入门到实战南玖yy python python爬虫
一、为什么需要爬虫？在数据驱动的时代，网络爬虫是获取公开数据的重要工具。它可以帮助我们：监控电商价格变化抓取学术文献构建数据分析样本自动化信息收集二、基础环境搭建1.核心库安装pipinstallrequestsbeautifulsoup4lxmlseleniumscrapy2.开发工具推荐PyCharm（专业版）VSCode+Python扩展JupyterNotebook（适合调试）三、爬虫开发
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默