lvla_juan

scipy.stats 用法

-- coding: utf-8 --

from scipy import stats
from numpy import random

Distributions

常用分布可参考本文档结尾处

分布可以使用的方法见下列清单

data=random.normal(size=1000)
stats.norm.rvs(loc=0,scale=1,size=10,random_state=None) # 生成随机数
stats.norm.pdf(-1.96,loc=0,scale=1) # 密度分布函数，画密度分布图时使用
stats.norm.cdf(-1.96,loc=0,scale=1) # 累计分布函数，-1.96对应2.5%
stats.norm.sf(-1.96,loc=0,scale=1) # 残存函数(=1-cdf)，-1.96对应97.5%
stats.norm.ppf(0.025,loc=0,scale=1) # 累计分布函数反过来
stats.norm.isf(0.975,loc=0,scale=1) # 残存函数反过来
stats.norm.interval(0.95,loc=0,scale=1) # 置信度为95%的置信区间
stats.norm.moment(n=2,loc=0,scale=1) # n阶非中心距，n=2时是方差
stats.norm.median(loc=0,scale=1) # Median of the distribution.
stats.norm.mean(loc=0,scale=1) # Mean of the distribution.
stats.norm.var(loc=0,scale=1) # Variance of the distribution.
stats.norm.std(loc=0,scale=1) # Standard deviation of the distribution.
stats.norm.fit(data) # fit 估计潜在分布的参数

Statistical functions

stats.describe([1,2,3]) # 返回多个统计量
stats.gmean([1,2,4]) # 几何平均数 n-th root of (x1 * x2 * … * xn)
stats.hmean([2,2,2]) # 调和平均数 n / (1/x1 + 1/x2 + … + 1/xn)
stats.trim_mean([1,2,3,5],0.25) # 砍头去尾均值，按比例砍
stats.sem(data) # Calculates the standard error of the mean
stats.mode([1,1,2]) # 众数
stats.skew(data) # 偏度
stats.kurtosis(data) # 峰度
stats.moment(data,moment=3) # n阶中心矩，3阶就是偏度，4阶就是峰度
stats.skewtest(data) # 检验偏度是否符合正态分布的偏度
stats.kurtosistest(data) # 检验峰度是否符合正态分布的峰度
stats.normaltest(data) # 检验是否符合正态分布
stats.variation([1,2,3]) # 变异系数(=std/mean*100%)
stats.find_repeats([1,1,2,2,3]) # 重复值查找

stats.itemfreq([1,1,2,2,3]) # 频次统计
stats.percentileofscore([1,2,3,4,5],2) # 返回数值的分位数
stats.scoreatpercentile([1,2,3,4,5],80,interpolation_method=“lower”) # 返回分位数对应的数值

stats.bayes_mvs(data) # 返回均值/方差/标准差的贝叶斯置信区间

stats.iqr([1,2,3,4,5],rng=(25,75)) # 计算 IQR
stats.zscore(data) # 计算 zscore
stats.f_oneway(data,data+data,data+data+data) # 单因素方差分析，参数是(样本组1,样本组2,样本组3)
stats.pearsonr(data,data+data) # 皮尔森相关系数
stats.spearmanr(data,data+data) # 斯皮尔曼秩相关系数
stats.kendalltau(data,data+data) # 肯德尔相关系数
stats.pointbiserialr([1,1,1,0,0,0],[1,2,3,4,5,6]) # 点二系列相关，第一个变量需要是二分类变量
stats.linregress(data,data+data) # 线性最小二乘回归

stats.ttest_1samp(data,popmean=0) # 单样本 t-检验: 检验总体平均数的值
stats.ttest_ind(data,data+data) # 双样本 t-检验: 检验不同总体的差异
stats.ttest_rel(data,data+data) # 配对样本 t-检验
stats.ttest_ind_from_stats(mean1=0,std1=1,nobs1=100,mean2=10,std2=1,nobs2=150,equal_var=True) # 根据统计量做 t-检验
stats.wilcoxon(data,data+data) # 一种非参数的配对样本检验。t-检验假定高斯误差。可以使用威尔科克森符号秩检验, 放松了这个假设
stats.kstest(data,‘norm’) # Kolmogorov–Smirnov检验: 检验单一样本是否服从某一预先假设的特定分布
stats.ks_2samp(data,data+data) # 检测两样本分布是否相同
stats.ranksums(data,data+data) # Wilcoxon rank-sum statistic 检测两样本分布是否相同
stats.chisquare(data,data) # 卡方检验，第一个参数是样本分布，第二个参数是期望分布

Circular statistical functions

适用于环形数据，如时间(60分钟一圈)，角度(360度一圈)

例如 0度与 360度的均值应该是 0度

stats.circmean([0,360],high=0,low=360) # 均值
stats.circvar([0,360],high=0,low=360) # 方差
stats.circstd([0,360],high=0,low=360) # 标准差

Contingency table functions

列联表

stats.chi2_contingency([[10,10,20],[20,20,20]],lambda_=“log-likelihood”) # 卡方检验，nm的列联表，每个格子样本数要大于5，lambda_默认皮尔森
stats.fisher_exact([[8,2],[1,5]],alternative=“two-sided”) # 费舍尔精确检验，22的列联表，alternative:two-sided,less,greater
stats.contingency.expected_freq([[10,10,20],[20,20,20]]) # 返回列联表的期望频次(各变量独立时的预期频次)
import numpy as np; stats.contingency.margins(np.array([[10,10,20],[20,20,20]]))# 返回列联表的行列和

Plot-tests

图检验：probplot与Q-Q图的差异：P-P图是用分布的累计比，而Q-Q图用的是分布的分位数来做检验

import matplotlib.pyplot as plt
data=random.normal(loc=0,scale=1,size=500)
stats.probplot(data,dist=stats.norm,sparams=(0,1),plot=plt) # P-P图(probability plot)，参数sparams传的是均值与标准差
stats.boxcox_normplot(abs(data),-3,3,plot=plt) # 不知干啥用，Compute parameters for a Box-Cox normality plot
stats.ppcc_plot(data,-3,3,dist=stats.norm,plot=plt) # 不知干啥用，Calculate and optionally plot probability plot correlation coefficient.
stats.ppcc_max(data,dist=stats.norm) # 不知干啥用，返回 PPCC 取最大时对应的位置

Univariate and multivariate kernel density estimation

核密度估计用于估计未知的密度函数，属於非参数检验方法之一

stats.gaussian_kde([data,data+random.normal(size=500)]) # 不知干啥用，Representation of a kernel-density estimate using Gaussian kernels.

“”" ---------------------------------------------------------------------------------------------------------
所有分布都是 rv_continuous(连续型分布) 与 rv_discrete(离散型分布) 的实例
rv_continuous([momtype, a, b, xtol, …]) A generic continuous random variable class meant for subclassing.
rv_discrete([a, b, name, badvalue, …]) A generic discrete random variable class meant for subclassing.
rv_histogram(histogram, *args, **kwargs) Generates a distribution given by a histogram.

Continuous distributions 连续型分布
alpha An alpha continuous random variable.
beta A beta continuous random variable.
chi2 A chi-squared continuous random variable.
f An F continuous random variable.
gamma A gamma continuous random variable.
lognorm A lognormal continuous random variable.
ncx2 A non-central chi-squared continuous random variable.
ncf A non-central F distribution continuous random variable.
nct A non-central Student’s T continuous random variable.
norm A normal continuous random variable.
pareto A Pareto continuous random variable.
t A Student’s T continuous random variable.
uniform A uniform continuous random variable.
wald A Wald continuous random variable.
……

Multivariate distributions 多元分布
multivariate_normal A multivariate normal random variable.
matrix_normal A matrix normal random variable.
multinomial A multinomial random variable.
random_correlation A random correlation matrix.
……

Discrete distributions 离散型分布
binom A binomial discrete random variable.
hypergeom A hypergeometric discrete random variable.
nbinom A negative binomial discrete random variable.
poisson A Poisson discrete random variable.
randint A uniform discrete random variable.

你可能感兴趣的:(统计学)

【量化金融自学笔记】--开篇.基本术语及学习路径建议花花 Show Python 量化金融自学笔记金融笔记学习
在当今这个信息爆炸的时代，金融领域正经历着一场前所未有的变革。传统的金融分析方法逐渐被更加科学、精准的量化技术所取代。量化金融，这个曾经高不可攀的领域，如今正逐渐走进大众的视野。它将数学、统计学、计算机科学与金融学深度融合，为我们提供了一种全新的视角去理解和探索金融市场的奥秘。作为一名对量化金融充满热情的自学者，我深知在这个领域中，每一步都充满了挑战与机遇。从最初对复杂数学公式的困惑，到逐渐掌握编
【机器学习】平均绝对误差（MAE：Mean Absolute Error） IT古董机器学习人工智能机器学习人工智能 python
平均绝对误差(MeanAbsoluteError,MAE)是一种衡量预测值与实际值之间平均差异的统计指标。它在机器学习、统计学等领域中广泛应用，用于评估模型的预测精度。与均方误差(MSE)或均方误差根(RMSE)不同，MAE使用误差的绝对值，因此它在处理异常值时更加稳定。1.MAE的定义和公式给定预测值和真实值，MAE的公式为：其中：n是样本总数。是模型的预测值。是对应的真实值。MAE表示了预测值
AI探索笔记：线性回归安意诚Matrix 机器学习笔记人工智能笔记线性回归
前言写这篇博客，主要是自己来练练手。网络上教程已经是数不胜数，也都讲得非常清楚了。但自己不动手，知识和能力还是别人的。下面分别用传统方法（sklearn）和神经网络（pytorch）来解决线性回归问题。内容什么是线性回归线性回归（LinearRegression）是统计学和机器学习中最基础且广泛使用的预测模型，用于建立**自变量（输入特征）与因变量（输出目标）**之间的线性关系模型。其核心思想是通
PCA主成分分析降维算法及其可视化（附完整版代码） Jason_Orton 算法机器学习数据挖掘人工智能 matlab
一.PCA的介绍PCA（PrincipalComponentAnalysis）是一种数据降维技术，旨在将多维指标转换为少数几个综合指标。在统计学中，PCA是简化数据集的一种方法，通过线性变换将数据映射到新的坐标系中。在新的坐标系中，第一主成分捕获数据投影的最大方差，第二主成分捕获第二大方差，依此类推。主成分分析常用于减少数据集的维度，同时保留对方差贡献最大的特征。这是通过保留低阶主成分、忽略高阶主
JS宏进阶：浅谈曲线回归 jackispy JS宏进阶回归数据挖掘人工智能 javascript
曲线回归是一种统计学方法，用于研究两个或多个变量之间的非线性关系，并找到最能拟合数据点的曲线函数形式。与线性回归不同，曲线回归适用于描述那些不是直线性的变量关系。通过曲线回归，可以建立变量之间的非线性数学模型，用于预测和解释各种实际现象。一、基本概念定义：曲线回归是指对于非线性关系的变量进行回归分析的方法。曲线回归方程一般是以自变量的多项式或其他非线性函数形式表达因变量。目的：曲线回归的主要目的是
《李航统计学习方法》学习笔记——第五章决策树 eveiiii 统计学习决策树算法剪枝 python 机器学习
决策树5.1决策树模型与学习5.2特征选择5.2.1信息增益5.2.2信息增益比python代码实现例题：信息增益与信息增益比5.3决策树的生成5.3.1ID3算法（python实现）5.3.2C4.5生成算法（python实现）5.4决策树的剪枝5.5CART算法5.5.1CART生成5.5.2CART剪枝习题5.1(python实现）习题5.2(python实现）习题5.3习题5.4参考5.1
《李航统计学习方法》学习笔记——第八章提升方法 eveiiii 统计学习 python 机器学习人工智能算法
提升方法8.1提升方法AdaBoost8.1.1提升方法的基本思路8.1.2AdaBoost算法8.1.3AdaBoost的例子（代码实现）8.2AdaBoost算法的训练误差分析定理8.1AdaBoost训练误差界定理8.2二分类问题AdaBoost训练误差界8.3AdaBoost算法的解释8.3.1前向分步算法8.3.2前向分步算法与AdaBoost8.4提升树8.4.1提升树模型8.4.2提
深入理解SAP HANA Cloud Vector Engine与自查询 VYSAHF java
学习目标：提示：这里可以添加学习目标例如：一周掌握Java入门知识学习内容：提示：这里可以添加要学的内容例如：搭建Java开发环境掌握Java基本语法掌握条件语句掌握循环语句学习时间：提示：这里可以添加计划学习的时间例如：周一至周五晚上7点—晚上9点周六上午9点-上午11点周日下午3点-下午6点学习产出：提示：这里统计学习计划的总量例如：技术笔记2遍CSDN技术博客3篇习的vlog视频1个
数据挖掘中特征发现与特征提取的数学原理调皮的芋头数据挖掘人工智能 AIGC 计算机视觉
好的，我将深入研究数据挖掘中特征发现与特征提取的数学原理，涵盖统计学基础、特征工程的数学方法、以及在机器学习和深度学习中的应用。我会整理相关数学公式和理论，包括主成分分析（PCA）、独立成分分析（ICA）、线性判别分析（LDA）、信息增益、互信息、方差分析等统计方法，并结合金融量化交易的实际应用，确保内容既有理论深度，又能落地实践。完成后，我会通知您！1.统计学基础：描述性统计、方差分析、相关性与
大模型学习路线与资源推荐数字化转型2025 AI投资人工智能
以下是基于多篇参考资料整理的大模型学习路线，涵盖从基础到进阶的完整学习路径，帮助您系统掌握大模型核心技术并应用于实际场景：一、基础阶段：构建核心知识体系编程与数学基础编程语言：优先学习Python，掌握其语法、数据结构及常用库（如NumPy、Pandas、PyTorch）37。数学基础：线性代数、概率论与统计学、微积分是理解模型原理的基石，需重点掌握矩阵运算、概率分布等概念39。深度学习入门神经网
统计学基础知识点刷题（task2） sm376624607 统计学
参考视频：可汗学院《统计学》参考书籍：《深入浅出统计学》文章目录概念1:中心极限定理概念2:置信区间概念3:伯努利分布概念4:误差范围概念5:小样本容量置信区间概念1:中心极限定理核心内容：随着抽样次数趋于∞\infty∞,样本均值的抽样分布趋近于正态分布，且该正态分布的均值为总体均值。X‾服从N(μ,σ/n)\overline{X}服从N(\mu,\sigma/\sqrt{n})X服从N(μ,σ
机器学习数学基础：36.φ相关系数分析 @心都机器学习人工智能
用φ相关系数分析性别与心理测验态度关系的教程一、学习目标学会使用φ相关系数分析两个二分变量（如性别男/女、对心理测验态度肯定/否定）之间的关系，并通过卡方检验判断结果是否具有统计学意义。二、数据准备假设我们想研究青年大学生的性别和对心理测验的态度之间的关系，收集到如下2×22×22×2列联表数据（调查了170170170人）：肯定否定合计男生222222888888110110110女生18181
读书究竟有什么用？不同的书分别有什么作用？不同的书对人生分别有什么样的影响和意义？... Lucky小黄人
不同类型的文学作品对人生的作用和意义是不一样的，按照我的阅读经验和理解，对常见文学作品类别和他们对我们的意义做个简单总结：1、统计学、经济学作品这类作品往往可以帮助我们提升对经济现象、宏观政策的敏感度，洞察财富增长的逻辑，说白了就是有助于找到赚钱的路子。比如《权利结构、政治激励和经济增长》、《八次危机》。2、哲学与社会学作品这类作品有助于拓展思想深度，有助于培养大局观，也让我们意识到个体的渺小与社
【A/B测试】深度解析：从理论到实践Python实现详解（含源码）絆人心 python 前端开发语言数据分析信息可视化数据挖掘机器学习
目录前言一、什么是A/B测试？A/B测试的常见应用场景二、A/B测试的基本流程三、假设检验：零假设与备择假设Python代码示例：A/B测试的实践四、A/B测试中的统计学方法五、总结附录：完整代码前言A/B测试（也称分流测试）在数据分析和产品优化中扮演重要角色。无论是在网站优化、营销活动还是产品改进中，A/B测试都帮助通过数据驱动决策、测试和验证论文提出了实际操作的基本概念，详细讲解了如何实施A/
什么是机器学习? CM莫问机器学习模型机器学习人工智能算法
一、概念（维基百科）机器学习是人工智能的一个分支。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与推断统计学联系尤为密切，也被称为统计学习理论。二、主要特点机器学习的主要特点包括：1、数据驱动：机器学习模型的性能主要依赖于输入的数据。数据的质量和数量直接影响模型的准确性和泛化能力，所谓“Garbagein,garbag
基于动态规划与0-1整数规划模型的多阶段生产决策问题研究 NovakG_ 数据挖掘动态规划数学建模算法
摘要随着市场竞争的日益激烈，企业将以产品质量作为其发展战略重心，以适应激烈的市场竞争与不断变化的用户需求。本文针对某畅销电子产品生产过程中的决策问题，应用统计学中单边检验、二项分布与正态分布的方法，以最小化产品生产成本为目标，建立了动态规划与0-1整数规划模型。通过数学建模与模拟，为企业的生产提供了科学有效的生产决策依据，降低生产成本并优化资源配置。针对问题一，主要解决两个问题：一是需要设计一个最
机器学习(一) 本文(3万字) | 机器学习概述 | 小酒馆燃着灯机器学习人工智能深度学习目标检测 vscode pytorch python
推荐阅读，点击查看文章目录1.统计学习(机器学习）1.1特点1.2对象1.3目的1.4方法1.5步骤2.基本分类2.1监督学习2.1.1输入空间、特征空间和输出空间2.1.2概率分布2.1.3假设空间2.1.4问题的形式化2.2无监督学习2.3强化学习2.4半监督学习与主动学习3.基于模型分类4.基于技巧分类4.1贝叶斯学习4.2核方法5.统计学习三要素5.1模型5.2策略5.2.1损失函数与风险
DeepSeek-R1 技术全景解析：从原理到实践的“炼金术配方” ——附多阶段训练流程图与核心误区澄清... 雪停时偶遇一叶春流程图
合集-人工智能(5)1.如何改进AI模型在特定环境中的知识检索2024-09-242.深度学习与统计学中的时间序列预测2024-10-033.《使用coze搭建一个会搜索、写ppt、思维导图的Agent》2024-10-294.深入浅出：Agent如何调用工具——从OpenAIFunctionCall到CrewAI框架01-145.DeepSeek-R1技术全景解析：从原理到实践的“炼金术配方”—
鸢尾花分类项目 GUI 编织幻境的妖分类数据挖掘人工智能
1.机器学习的定义机器学习是一门人工智能的分支，专注于开发算法和统计模型，使计算机能够在没有明确编程的情况下从数据中自动学习和改进。通过识别数据中的模式和规律，机器学习系统可以做出预测或决策。常见的应用包括图像识别、语音识别、推荐系统等。2.为什么使用鸢尾花数据集（Irisdataset）鸢尾花数据集是一个经典的多类分类问题数据集，由英国统计学家和遗传学家RonaldFisher在1936年引入。
正则化（Regularization）和正则表达式（Regular Expression）区别 Dontla 正则表达式
文章目录1.**正则化（Regularization）**2.**正则表达式（RegularExpression）**关键区别为什么名字相近？正则化（Regularization）和正则表达式（RegularExpression）不是同一个概念，它们是两个完全不同的术语，应用于不同的领域。1.正则化（Regularization）领域：机器学习/统计学。定义：正则化是一种用于防止模型过拟合（Ove
时间序列分析之AR、MA、ARMA、ARIMA详解（5）白马负金羁机器学习之术协整 cointegration ARIMA 时间序列分析
在时间序列分析中最常使用的一系列模型：AR、MR、ARMA，一直到ARIMA，都源于乔治·博克斯和格威利姆·詹金斯等人的一系列工作（他们的有关成果后汇集成该领域的权威经典著作【1】）。乔治·博克斯被认为是二十世纪的一代统计学大师，他有一句广为人知的名言：所有的模型都是错误的，但有一些是有用的（“Allmodelsarewrong,butsomeareuseful”）。为了让统计模型发挥作用，深入理
学习AI大模型用这十种方法，轻松入门大模型玩家学习人工智能 transformer 深度学习 langchain agi 大模型
AI大模型学习在当前技术环境下，AI大模型学习不仅要求研究者具备深厚的数学基础和编程能力，还需要对特定领域的业务场景有深入的了解。通过不断优化模型结构和算法，AI大模型学习能够不断提升模型的准确性和效率，为人类生活和工作带来更多便利。系统化理论知识建构：对于AI大模型的学习，首要任务是对基础理论进行全面而深入的理解。这意味着需要投入大量的时间去研读经典的机器学习和深度学习教材，包括但不限于《统计学
用大模型学大模型03-数学基础概率论 wyg_031113 概率论人工智能
https://metaso.cn/s/Jp0OU9w提示词:我正在学习深度学习相关的数学知识，学到了概率论与统计学部分，给我一个入门级的完整教程和实例。好的，我现在需要回答用户关于深度学习所需的概率论与统计学入门教程和实例的问题。用户希望得到一个完整的教程和实例，所以我要从我搜索到的资料中整理出相关的知识点和学习路径，并结合实例说明。首先，查看证据中的相关内容。提到花书学习笔记，涵盖了概率论、信
一周掌握 Java 入门知识 bavDHAUO java
学习目标：提示：这里可以添加学习目标例如：一周掌握Java入门知识学习内容：提示：这里可以添加要学的内容例如：搭建Java开发环境掌握Java基本语法掌握条件语句掌握循环语句学习时间：提示：这里可以添加计划学习的时间例如：周一至周五晚上7点—晚上9点周六上午9点-上午11点周日下午3点-下午6点学习产出：提示：这里统计学习计划的总量例如：技术笔记2遍CSDN技术博客3篇习的vlog视频1个
一周掌握 Java 入门知识 scaFHIO java
学习目标：提示：这里可以添加学习目标例如：一周掌握Java入门知识学习内容：提示：这里可以添加要学的内容例如：搭建Java开发环境掌握Java基本语法掌握条件语句掌握循环语句学习时间：提示：这里可以添加计划学习的时间例如：周一至周五晚上7点—晚上9点周六上午9点-上午11点周日下午3点-下午6点学习产出：提示：这里统计学习计划的总量例如：技术笔记2遍CSDN技术博客3篇习的vlog视频1个
一周掌握 Java 入门知识 eahba java
学习目标：提示：这里可以添加学习目标例如：一周掌握Java入门知识学习内容：提示：这里可以添加要学的内容例如：搭建Java开发环境掌握Java基本语法掌握条件语句掌握循环语句学习时间：提示：这里可以添加计划学习的时间例如：周一至周五晚上7点—晚上9点周六上午9点-上午11点周日下午3点-下午6点学习产出：提示：这里统计学习计划的总量例如：技术笔记2遍CSDN技术博客3篇习的vlog视频1个
书籍-《机器学习数学基础》机器学习深度学习数学
书籍：MathematicsforMachineLearning作者：MarcPeterDeisenroth，A.AldoFaisal，ChengSoonOng出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《机器学习数学基础》01书籍介绍理解机器学习所需的基本数学工具包括线性代数、解析几何、矩阵分解、向量微积分、最优化、概率论和统计学。这
R 语言必备十大资源后端
引言R是进行统计计算和数据分析的热门编程语言之一，广泛应用于数据科学家、研究者和统计学家之间，用于处理大数据、执行复杂分析和结果可视化。如果你是R的新手或希望提升你的R技能，这里有一些核心资源可以助你一臂之力，无论是从基础学起还是提高现有水平，包括官方站点、知名学府和互动式学习平台。1.R项目官网(r-project.org)R项目的官方网站是开启R学习之旅的首选，它提供免费的R软件、文档、教程和
Python 量化 ONE_PUNCH_Ge python 开发语言
Python量化是指利用Python编程语言以及相关的库和工具来进行金融市场数据分析、策略开发和交易执行的过程。Python由于其简洁、易学、强大的生态系统和丰富的金融库而成为量化交易的首选编程语言之一。量化交易在金融领域得到广泛应用，它允许交易者通过系统性的方法来制定和执行交易策略，提高交易效率和决策的科学性。量化主要是通过数学和统计学的方法，利用计算机技术对金融市场进行量化分析，从而制定和执行
Python statistics 模块 ONE_PUNCH_Ge python
在数据分析和科学计算中，统计学是一个非常重要的工具。Python提供了一个内置的statistics模块，专门用于处理基本的统计计算。本文将详细介绍statistics模块的功能和使用方法，帮助初学者快速掌握如何使用这个模块进行基本的统计分析。statistics模块提供了许多常用的统计函数，如均值、中位数、方差、标准差等。要使用statistics函数必须先导入：importstatistics
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他