SOMBAM

【时间序列分析基础系列之一】随机性时间序列模型

文章目录

前言
1 随机性时间序列模型
- 1.1 基本概念
- - 1.1.1 随机过程概念
  - 1.1.2 几个重要的平稳随机过程
  - - 白噪声（纯随机过程）
    - 独立增量随机过程
    - 二阶矩过程与宽平稳过程
    - 严平稳随机过程
    - 正态过程
  - 1.1.3 动态性
2 算子
- 2.1 差分算子
- 2.2 格林函数
- 2.3 后移算子
3 分解
- 3.1 Wold分解
4 参数估计
- 4.1 直接估计法
- - 4.1.1 矩估计
  - 4.1.2 极大似然估计
  - 4.1.3 条件最小二乘估计
- 4.2 数值法
- - 4.2.1 线性迭代法
  - 4.2.2 牛顿-拉普森(Newton-Raphson)算法

前言

1 随机性时间序列模型

时间序列分析方法是通过对样本观测值的观察分析，将时间序列的趋势项、周期项和随机项分解出来。
其中，对于趋势性或周期性变化，常用确定性时序分析，而对于余下的随机项，可用随机时序模型拟合，属于随机时序分析。确定和随机两部分组合起来共同描述一个时间序列。
随机性时间序列模型最早由G.E.P.Box和G.M.Jenkins提出。

1.1 基本概念

1.1.1 随机过程概念

设 $T$ 是负无穷到正无穷的子集，如果 $\forall t\in T$ ，都有一个随机变量与之对应，就称为随机变量的集合为随机过程。
当 $T$ 是全体整数或全体非负整数时，称相应的随机过程为离散随机过程。把随机序列的指标集合 $T$ 看成时间指标时，这个随机序列就是离散时间序列。
当 $T$ 是全体实数或全体非负实数时，称相应的随机过程为连续随机过程。把随机序列的指标集合 $T$ 看成时间指标时，这个随机序列就是连续时间序列。

1.1.2 几个重要的平稳随机过程

白噪声（纯随机过程）

设 ${a_t}$ 为平稳序列，对于 $\forall t\in N$ ，都有

$E(a_t)=\mu$
$COV(a_t,a_s) = \left\{ \begin{aligned} \ \sigma^2_a, (t=s) \\ \ 0, t\neq s \end{aligned} \right.$

独立增量随机过程

对于 $\forall n,t_i \in T(i=1,2,...,n; t_1∀n,ti∈T(i=1,2,...,n;t1<t2<...<tn)$

二阶矩过程与宽平稳过程

对于 $\forall t \in T，X_t$ 的均值和方差存在，则称此过程为二阶矩过程。
若随机过程 $\{X_t, t \in T\}$ 是一个二阶矩过程，且满足：
$EX_t=\mu, \forall t\in T \\ \ \\ E[X_{t+\tau}][X_t-\mu]=\gamma_\tau, \forall t,t+\tau \in T$
则称 $\{X_t,t\in T \}$ 为宽平稳随机过程。

注意：白噪声为宽平稳随机过程，平稳时间序列中讨论的都为宽平稳随机序列。

严平稳随机过程

对于 $\forall t_i(i=1,2,...,n)$ 和任意实数 $s$ ，随机过程 ${X_t\}$ 的 $n$ 维分布函数满足关系式，即为严平稳随机过程：
$F_n(X_1,X_2,...,X_n;t_1,t_2,...,t_n)=F_n(X_1,X_2,...,X_n;t_1+s,t_2+s,...,t_n+s)$
二阶矩存在的严平稳随机过程一定是宽平稳随机过程，反之不成立。

正态过程

若 $\{X_t, t\in T\}$ 的有限维分布都是正态分布，则称 $\{X_t, t \in T\}$ 为正态随机过程。

1.1.3 动态性

动态性：系统现在的行为与其历史行为的相关性，也就是系统的记忆性，具体地，就是在某一时刻进入系统的输入对系统后续行为的影响，如果该输入只影响系统下一时刻的行为，而对下一时刻以后的行为不发生作用，那么系统就有一阶动态或一期记忆性。
那么以此类推，如果该输入对系统之后的 $n$ 个时刻的行为都有影响，那么就说系统具有 $n$ 阶动态性。例如， $n$ 阶自回归模型（ $A R (n)$ ）为：
$X_t = \phi_1 X_{t-1}+\phi_2 X_{t-2}+...+\phi_n X_{t-n}+a_t$
与 $A R (n)$ 模型对比来看， $M A (m)$ 模型描述的是系统对过去时刻进入系统的噪声的记忆：
$X_t = a_t-\theta_1 a_{t-1}-\theta_2 a_{t-2}-...-\theta_m a_{t-m}$
综合来看， $A R M A (n, m)$ 描述的是系统对过去自身状态以及各时刻进入的噪声的记忆。
$X_t-\phi_1 X_{t-1}-\phi_2 X_{t-2}-...-\phi_n X_{t-n} \\=a_t-\theta_1 a_{t-1}-\theta_2 a_{t-2}-...-\theta_m a_{t-m}$

2 算子

2.1 差分算子

以 $A R (1)$ 模型为例：
$X_t = X_{t-1}+a_t$
即有下式，其中 $\nabla$ 表示差分算子：
$\nabla X_t = a_t$
除此之外，我们称 $Y_t=X_t - X_{t-1}$ 叫做关于 $X_t$ 的一阶差分，记为：
$Y_t = \nabla X_t$
由此递归，则称 $Z_t=Y_t - Y_{t-1}$ 叫做关于 $Y_t$ 的一阶差分，也是关于 $X_t$ 的二阶差分，记为：
$Z_t = \nabla Y_t=X_t - X_{t-1}-X_{t-1} + X_{t-2}=\nabla^2X_t$
类似地，设 $X_t$ 地第 $k - 1$ 次差分为 $W_t$ ，则称 $W_t-W_{t-1}$ 为 $X_t$ 的 $k$ 阶差分。

注意：k阶差分不是简单的$X_t - X_{t-k}$，而是叠加差分。

2.2 格林函数

同样以 $A R (1)$ 模型为例：
$X_t = X_{t-1}+a_t$
对应的齐次差分方程的解为：
$X_t = c\varphi_1^t+a_t, t\in Z$
由 $A R (1)$ 右边的形式可知，模型的特解可能是 ${a_t\}$ 序列的线性组合：

$\begin{aligned} X_t &= \varphi_1X_{t-1}+a_t \\ &= \varphi_1(\varphi_2X_{t-2}+a_{t-1})+a_t \\ &=\varphi_1^2X_{t-2}+\varphi_1a_{t-1}+a_t \\ &=\varphi_1^2(\varphi X_{t-3}+a_{t-2})+\varphi_1a_{t-1}+a_t \\ &=\varphi^3X_{t-3}+\varphi^2a_{t-2}+\varphi_1a_{t-1}+a_{t} \\ &... \\ &=\sum^{\infty}_{j=0}\varphi_1^{j}a_{t-j} \end{aligned}$
则 $A R (1)$ 的通解为：
$X_t=\sum^{\infty}_{j=0}\varphi_1^{j}a_{t-j}+c\varphi_1^t$
而其中系数函数 $\varphi_1^j$ 客观地描述了该系数地动态性，故称此系数为格林函数，用 $G_j$ 表示：
$G_j = \varphi_1^j$
$A R (1)$ 的特解也可以改写为：
$X_t=\sum^{\infty}_{j=0}G_1^{j}a_{t-j}$

2.3 后移算子

后移算子 $B$ 表示后移的期数，如： $B^jX_t=X_{t-j}$
具有如下性质：

对和 $t$ 无关的随机变量 $Y$ 有： $B Y = Y$
对整数 $n$ ，常数 $a$ 有： $B^n(aX_t)=aB^nX_t=aX_{t-n}$
对整数 $n, m$ 有： $B^{n+m}(X_t)=B^nB^mX_t=X_{t-n-m}$
对多项式 $\psi(z)=\sum^p_{j=0}c_jz^j$ ，有： $\psi(B)X_t=\sum^p_{j=0}c_jX_{t-j}$
对多项式 $\psi(z)=\sum^p_{j=0}c_jz^j$ 和 $\varphi(z)=\sum^q_{j=0}d_jz^j$ 的乘积 $f(z)=\psi(z)\varphi(z)$ ，有：
$f(B)X_t=\psi(B)[\varphi(B)X_t]=\varphi(B)[\psi(B)X_t]$
对时间序列 $X_t,Y_t$ 而言，多项式 $\psi(z)=\sum^p_{j=0}c_jz^j$ 和随机变量U，V，W，有： $\psi(B)(UX_t+VY_t+W)=U\psi(B)X_t+V\psi(B)Y_t+W\psi(1)$

3 分解

3.1 Wold分解

回顾 $A R (1)$ 模型的特解为下式，下式也被成为Wold分解式， $G_j$ 也叫Wold系数：
$X_t = \sum^\infty_{j=0} =G_ja_{t-j}$
由于 $a_{t-j}$ 为相互独立的（模型假设），所以可以看作线性空间的基， $X_t$ 可由 $a_{t-j}$ 进行线性表示。其系数 $G_j$ 是 $X_t$ 对于 $a_{t-j}$ 的坐标投影， $X_t$ 是 $G_ja_{t-j}$ 的正交向量和。
也就是说，用线性空间来审视上式，即为wold分解。

4 参数估计

4.1 直接估计法

常用的参数估计方法：

4.1.1 矩估计

4.1.2 极大似然估计

4.1.3 条件最小二乘估计

条件最小二乘估计是实际中最常用的参数估计方法，假设条件为：
$a_{t-1}=a_{t-2}=...=a_{t-q}=0$
残差平方和方程为：
$Q(\hat\beta)=\sum^n_{t=p+1}a_t^2=\sum^n_{t=p+1}[X_t-\sum^p_{i=1}\varphi_iX_{t-i}+\sum^q_{j=1}\theta_ja_{t-j}]^2$
解法：迭代法
优缺点：

OLS估计充分应用每一个观察值提供的信息，因而估计精度高
条件OLS估计使用率较高
但是需要假定总体分布（缺点）

4.2 数值法

都是用迭代

4.2.1 线性迭代法

给出初始值，根据式子进行迭代计算，直至相邻两次迭代值相差不大时停止迭代，最后迭代结果作为近似解

4.2.2 牛顿-拉普森(Newton-Raphson)算法

你可能感兴趣的:(时间序列分析,回归)

主成分回归（PCR）与特征值因子筛选：从理论到MATLAB实战青橘MATLAB学习多元分析回归 matlab 线性代数数学建模算法
内容摘要：本文深入解析主成分回归（PCR）的原理与MATLAB实现，结合Hald水泥数据案例对比PCR与普通回归的性能差异。详细讲解特征值筛选策略（累积贡献率、交叉验证），并提供单参数估计优化方法。通过完整代码与可视化结果，助力读者掌握高维数据建模与多重共线性处理技巧。关键词：主成分回归特征值筛选多重共线性MATLAB实现交叉验证—1.主成分回归（PCR）概述主成分回归（PrincipalComp
使用Python或R语言重新拟合模型 pk_xz123456 python 算法 python r语言开发语言
以下分别给出使用Python和R语言完成该任务的示例代码，假设我们有一个包含被试编号、实验条件和反应时的数据，并且要拟合一个线性回归模型。Python实现importpandasaspdimportnumpyasnpimportstatsmodels.apiassm#生成示例数据data={'subject':np.repeat(range(1,11),5),'condition':np.tile
AI探索笔记：浅谈人工智能算法分类安意诚Matrix 机器学习笔记人工智能笔记
人工智能算法分类这是一张经典的图片，基本概况了人工智能算法的现状。这张图片通过三个同心圆展示了人工智能、机器学习和深度学习之间的包含关系，其中人工智能是最广泛的范畴，机器学习是其子集，专注于数据驱动的算法改进，而深度学习则是机器学习中利用多层神经网络进行学习的特定方法。但是随着时代的发展，这张图片表达得也不是太全面了。我更喜欢把人工智能算法做如下的分类：传统机器学习算法-线性回归、逻辑回归、支持向
AI探索笔记：线性回归安意诚Matrix 机器学习笔记人工智能笔记线性回归
前言写这篇博客，主要是自己来练练手。网络上教程已经是数不胜数，也都讲得非常清楚了。但自己不动手，知识和能力还是别人的。下面分别用传统方法（sklearn）和神经网络（pytorch）来解决线性回归问题。内容什么是线性回归线性回归（LinearRegression）是统计学和机器学习中最基础且广泛使用的预测模型，用于建立**自变量（输入特征）与因变量（输出目标）**之间的线性关系模型。其核心思想是通
在数据分析工作中运用因果推断模型的实践指南 theskylife #因果分析数据分析大数据人工智能 AI 因果分析
目录1.写在开头2.因果推断模型的基础2.1因果关系vs.相关关系2.2基本概念和术语3.常见的因果推断方法3.1随机对照试验（RCTs）3.2工具变量法（IV）3.3回归不连续设计（RDD）4.因果推断的实际应用4.1案例研究1：使用RCTs分析营销活动的效果4.1.1背景和问题描述4.1.2实验设计和数据收集4.1.3数据分析和结果解释4.2案例研究2：应用工具变量法解决价格对销量的影响问题4
DeepSeek 高阶应用技术详解（4） Evaporator Core #DeepSeek快速入门 DeepSeek进阶开发与应用 deepseek
1.引言在前三篇中，我们探讨了DeepSeek的基础功能、分布式训练、模型优化、模型解释性、超参数优化以及AutoML的应用。本篇将深入探讨DeepSeek在时间序列分析、图神经网络（GNN）和推荐系统中的应用。这些领域是深度学习的前沿方向，具有广泛的实际应用价值。2.DeepSeek在时间序列分析中的应用2.1时间序列分析简介时间序列分析是处理时间相关数据的重要技术，广泛应用于金融、气象、医疗等
【Transforme-SVM多特征分类预测】基于Transforme-支持向量机多特征分类预测。(可做分类/回归/时序预测，具体私聊)，可直接运行。matlab代码，2023b及其以上。1.运行智能算法及其模型预测支持向量机分类回归
【Transforme-SVM多特征分类预测】基于Transforme-支持向量机多特征分类预测。(可做分类/回归/时序预测，具体私聊)，可直接运行。matlab代码，2023b及其以上。1.运行环境要求MATLAB版本为2023b，多特征输入单输出的二分类及多分类模型。程序内注释详细，直接替换数据就可以用。2.程序语言为matlab，程序可出分类效果图，迭代优化图，混淆矩阵图。3.多边形面积PA
【漫话机器学习系列】106.线性激活函数（Linear Activation Function） IT古董漫话机器学习系列专辑机器学习人工智能激活函数
1.什么是线性激活函数？线性激活函数是一种最简单的激活函数，数学表达式为：即输出与输入保持完全线性关系。这意味着对于任何输入值x，其输出将等于输入值本身，函数图像为一条通过原点的直线。在神经网络中，激活函数的作用是将网络的线性组合映射到某种非线性输出。传统的线性激活函数常用于一些特定场景，比如回归问题，其中预测的目标值与输入特征之间可能存在线性关系。2.线性激活函数的特点线性关系：与其他常见的激活
JS宏进阶：浅谈曲线回归 jackispy JS宏进阶回归数据挖掘人工智能 javascript
曲线回归是一种统计学方法，用于研究两个或多个变量之间的非线性关系，并找到最能拟合数据点的曲线函数形式。与线性回归不同，曲线回归适用于描述那些不是直线性的变量关系。通过曲线回归，可以建立变量之间的非线性数学模型，用于预测和解释各种实际现象。一、基本概念定义：曲线回归是指对于非线性关系的变量进行回归分析的方法。曲线回归方程一般是以自变量的多项式或其他非线性函数形式表达因变量。目的：曲线回归的主要目的是
python曲线回归小案例教程 jackispy python 回归开发语言
一、曲线回归的定义曲线回归是一种统计方法，用于建立自变量（独立变量）和因变量（依赖变量）之间的非线性关系模型。与线性回归不同，线性回归假设自变量和因变量之间的关系是线性的，即可以通过一条直线来描述数据点的趋势；而曲线回归则允许这种关系是非线性的，可能表现为曲线、抛物线、指数、对数或其他复杂的数学形式。其主要特征如下：非线性关系：曲线回归适用于那些不能用直线来充分描述的数据关系。它允许模型以曲线形式
基于 RAG（检索增强生成）、KAG（知识感知生成）和 CoT（链式思维）的生成式语言模型驱动推荐系统路人与大师语言模型人工智能自然语言处理
一、系统架构详解1.输入层a.用户行为数据数据来源：网站浏览历史、购物车内容、购买记录、收藏夹、搜索记录等。处理方式：数据清洗、去重、时间序列分析，提取用户的长期和短期兴趣。特征工程：行为序列：用户行为的时间顺序，如最近浏览的商品类别。频率与时长：浏览某类商品的频率和时长。转化率：从浏览到购买的转化情况。b.商品数据数据来源：商品数据库，包括价格、品牌、类别、库存、评价、销量等。处理方式：标准化处
KNN 算法优化实战分享轻口味算法与实践算法
KNN算法优化实战分享KNN算法优化实战分享一、引言1.KNN算法的核心思想与特点KNN（K-NearestNeighbors）算法是一种基于距离的相似性分类与回归算法。其核心原理是：对于一个待预测样本，计算其与训练集中所有样本的距离，选取距离最近的K个样本，根据这K个样本的标签进行投票（分类）或均值计算（回归），从而得到待预测样本的标签。KNN算法具有以下核心优势：无需训练：与其他需要通过大量数
KNN 算法性能跃升秘籍：优化实战，打造高效分类利器！清水白石008 开发语言学习笔记人工智能算法分类机器学习
KNN算法性能跃升秘籍：优化实战，打造高效分类利器！今天，我想和大家深入探讨一种经典而实用的机器学习算法——K近邻(K-NearestNeighbors,KNN)。KNN算法以其原理简单、易于实现、无需显式训练等特点，在模式识别、分类、回归等领域得到了广泛应用。然而，正如任何算法一样，基础的KNN算法也存在着性能瓶颈，尤其是在处理大规模数据集和高维度特征时，其计算效率和预测精度都可能受到挑战。你是
支持向量机（SVM）简介与应用 Jason_Orton 支持向量机算法机器学习
目录1.什么是支持向量机？2.SVM的基本原理3.核函数与SVM的扩展4.SVM的优势与挑战5.SVM的应用场景6.总结1.什么是支持向量机？支持向量机（SupportVectorMachine，简称SVM）是一种监督学习模型，广泛应用于分类、回归等问题。SVM的核心思想是通过在高维空间中寻找一个超平面（或决策边界），使得不同类别的样本数据能够被该超平面尽可能地分开，同时最大化分类间隔（Margi
论文笔记：Enhancing Sentence Embeddings in Generative Language Models UQI-LIUWJ 论文阅读语言模型人工智能
2024ICIC1INTRO对于文本嵌入，过去几年的相关研究主要集中在像BERT和RoBERTa这样的判别模型上。这些模型固有的语义空间各向异性，往往需要通过大量数据集进行微调，才能生成高质量的句子嵌入。——>需要较大的训练批次，这会消耗大量的计算资源一些前沿的工作将焦点转向了最近开发的生成模型，期望利用其先进的文本理解能力，直接对输入句子进行编码，而无需额外的反向传播由于句子表示和自回归语言建模
深度、机器学习算法 yzx991013 机器学习算法人工智能
机器学习典型算法SVM（支持向量机）：它通过寻找一个最优超平面来对数据进行分类。在二分类问题中，能找到一个平面（低维）或超平面（高维），使不同类别的数据点尽可能远地分布在超平面两侧。在小样本、非线性数据处理上有优势，常用于文本分类、图像识别等领域。决策树：以树形结构展示决策过程，从根节点开始，依据特征值逐步向下划分，直到叶子节点得出分类或回归结果。它易于理解和解释，可处理数值型和分类型数据，但容易
DeepSeek + Higress AI 网关/Spring AI Alibaba 案例征集云原生
诚挚地感谢每一位持续关注并使用Higress和SpringAIAlibaba的朋友。我们会持续投入，力图把Higress变得更好，把Higress和SpringAIAlibaba社区和生态变得更加繁荣。关于Higress：Higress除了作为云原生网关支持Web应用的部署，也支持作为AI网关支持大模型应用的部署。我们在下方文章中展现了AI网关的需求和场景，以及HigressAI网关的能力。《回归
GrandientBoostingClassifier函数介绍浊酒南街 #机器学习算法 GBDT
目录前言用法示例前言GradientBoostingClassifier是Scikit-learn库中的一个分类器，用于实现梯度提升决策树（GradientBoostingDecisionTrees，GBDT）算法。GBDT是一种强大的集成学习方法，能够通过逐步构建一系列简单的决策树（通常是浅树）来提高模型的预测性能。它在多个机器学习竞赛中表现出色，是用于分类和回归任务的流行选择。用法fromsk
软件测试用例设计总结程序员三藏测试用例 python 软件测试测试工具自动化测试功能测试职场和发展
1.测试用例的概念软件测试人员向被测试系统提供的一组数据的集合，包括测试环境、测试步骤、测试数据、预期结果2.为什么在测试前要设计测试用例测试用例是执行测试的依据在回归测试的时候可以进行复用是自动化测试编写测试脚本的依据衡量需求的覆盖率后续的测试人员可以借鉴前人写的东西3.基于需求进行测试用例的设计需求是测试人员进行测试的依据测试人员首先要分析需求，验证需求的正确性、合理性，无二义性并且逻辑自洽在
零基础学习机器学习分类模型可喜~可乐机器学习机器学习学习分类人工智能数据挖掘
下面将带你通过一个简单的机器学习项目，使用Python实现一个常见的分类问题。我们将使用著名的Iris数据集，来构建一个机器学习模型，进行花卉品种的分类。整个过程会包含：原理介绍：机器学习的基本概念。数据加载和预处理：如何加载数据并进行必要的处理。模型训练和评估：使用经典的分类算法——逻辑回归。代码解释：逐步分析代码实现。拓展内容：如何优化和扩展该项目。1.原理介绍1.1机器学习基本概念机器学习（
AI人工智能机器学习之监督线性模型 rockfeng0 人工智能机器学习 sklearn
1、概要本篇学习AI人工智能机器监督学习框架下的线性模型，以LinearRegression线性回归和LogisticRegression逻辑回归为示例，从代码层面测试和讲述监督学习中的线性模型。2、监督学习之线性模型-简介监督学习和线性模型是的两个重要概念。监督学习是一种机器学习任务，其中模型在已标记的数据集上进行训练。线性模型是一类通过线性组合输入特征来进行预测的模型。线性模型的基本形式可
人工智能深度学习系列—深入探索KL散度：度量概率分布差异的关键工具学步_技术自动驾驶人工智能人工智能深度学习自动驾驶机器学习
人工智能深度学习系列—深度解析：交叉熵损失（Cross-EntropyLoss）在分类问题中的应用人工智能深度学习系列—深入解析：均方误差损失（MSELoss）在深度学习中的应用与实践人工智能深度学习系列—深入探索KL散度：度量概率分布差异的关键工具人工智能深度学习系列—探索余弦相似度损失：深度学习中的相似性度量神器人工智能深度学习系列—深度学习中的边界框回归新贵：GHM（GeneralizedH
数据采集技术：selenium/正则匹配/xpath/beautifulsoup爬虫实例写代码的中青年 3天入门机器学习 selenium beautifulsoup 爬虫 python xpath 正则表达式
专栏介绍1.专栏面向零基础或基础较差的机器学习入门的读者朋友，旨在利用实际代码案例和通俗化文字说明，使读者朋友快速上手机器学习及其相关知识体系。2.专栏内容上包括数据采集、数据读写、数据预处理、分类\回归\聚类算法、可视化等技术。3.需要强调的是，专栏仅介绍主流、初阶知识，每一技术模块都是AI研究的细分领域，同更多技术有所交叠，此处不进行讨论和分享。数据采集技术：selenium/正则匹配/xpa
从零开始玩转TensorFlow：小明的机器学习故事 4 山海青风机器学习 tensorflow 人工智能
探索深度学习1场景故事：小明的灵感前不久，小明一直在用传统的机器学习方法（如线性回归、逻辑回归）来预测学校篮球比赛的胜负。虽然在朋友们看来已经很不错了，但小明发现一个问题：当比赛数据越来越多、球队的特征越来越复杂时，模型的准确率提升得很慢。有一天，小明在学校图书馆翻看杂志时，看到这样一句话：“就像人的大脑有上百亿神经元，神经网络能够学习复杂的信息映射，从而取得卓越的表现。”他瞬间来了灵感：“或许我
python正态检验_Python检验数据是否正态分布 weixin_39748858 python正态检验
在对数据进行处理前，有事需要判断数据是否呈正态分布，比如线性回归，比如使用3-sigma判断数据是否异常。常用的正态分布检测方法：Shapiro-WilktestShapiro-Wilktest是一种在频率上统计检验中检验正态性的方法。该检验的零检验是样本$x_1,\cdots,x_n$来自于一个正态分布的母体。这个检验的统计量是：$$W=\frac{(\sum_{i=1}^{n}a_{i}x_{
支持向量机（Support Vector Machine，SVM）不易撞的网名支持向量机算法机器学习
支持向量机（SupportVectorMachine，简称SVM）是一种监督学习模型，主要用于分类和回归分析。SVM的基本思想是寻找一个决策边界或超平面，使得两类样本之间的间隔最大化。这个间隔被定义为支持向量到超平面的最短距离，而支持向量就是那些恰好位于间隔边缘上的训练样本点。线性可分情况下的SVM假设我们有一组训练数据(x1,y1),(x2,y2),…,(xn,yn)(x_1,y_1),(x_2
从零开始玩转TensorFlow：小明的机器学习故事 3 山海青风 #机器学习机器学习 tensorflow 人工智能
下面是一篇以小明为主角，尝试用TensorFlow预测校园活动参与率的学习故事。我们会在故事情境中穿插对线性回归和逻辑回归的原理介绍，并附带必要的代码示例，帮助你从零基础理解并动手实践。文章结尾还有简要的分析总结。小明的第一次机器学习实验场景：预测校园活动的参与率小明最近加入了学生会，负责策划校园活动。每次活动都需要准备场地、宣传物料和餐饮，但经常会出现场地过小或准备物资不足等问题。为了让活动准备
揭秘波士顿房价密码：从经典数据集到线性回归实战珠峰日记线性回归算法回归机器学习深度学习
引言波士顿房价预测是一个经典的机器学习任务，类似于程序员世界的“HelloWorld”。和大家对房价的普遍认知相同，波士顿地区的房价受诸多因素影响。该数据集统计了13种可能影响房价的因素和该类型房屋的均价，期望构建一个基于13个因素进行房价预测的模型。在机器学习领域，预测问题是一个核心研究方向，而房价预测作为其中的经典回归问题备受关注。波士顿房价数据集包含了与波士顿地区房屋相关的多种特征信息，通过
支持向量机 (Support Vector Machine, SVM) 数维学长986 支持向量机算法机器学习
支持向量机(SupportVectorMachine,SVM)支持向量机（SVM）是一种广泛应用于分类、回归分析以及异常检测的监督学习算法。它基于结构风险最小化（StructuralRiskMinimization，SRM）原则，通过寻找一个最优超平面来实现数据的分类。SVM不仅可以处理线性可分问题，也能够通过核技巧（KernelTrick）处理非线性可分问题。1.基本概念超平面：在特征空间中，S
困惑度的估计转码的小石语言模型
固定长度模型的困惑度（Perplexity，PPL）困惑度（PPL）是评估语言模型性能的常用指标。需要注意的是，这个指标专门适用于经典的语言模型（有时称为自回归模型或因果语言模型），而对于像BERT这样的掩码语言模型，则定义不太清楚（请参考模型总结）。经典语言模型：经典语言模型的目标是计算给定一段文本的概率，具体来说，就是计算一个序列中每个token的条件概率，n-gram模型是最基础的经典语言模
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他