爱学习的段哥哥

数学期望 Expectation

数学期望 Expectation

序言

机器学习中涉及到的很多概念都和 Expectation 相关联，例如：

任何分布，我们都关心其均值 mean、方差 variance、峰度 kurtosis、偏度 skewness；实际上都和数据期望相关；这些内容还和中心距以及泰勒级数相关联
机器学习中，针对模型的泛化能力 Generalization，常见对泛化误差 decompose 为 Bias（偏差，欠拟合）和 Variance（方差，过拟合）。这一过程就是利用 Expectation 推导的
最大期望算反 EM，明显地和 Expectation 有关联，其是利用了 Expectation 进行推导

所以本文特此明确一下这个基础概念。

期望的定义

The average value of some function f(x) under a probability distribution p(x) is called the expectation of f(x) .

如果 p(x) 是均匀分布的话，我们其实就是求一个函数 f(x) 的平均值而已；如果函数不同的值出现概率不同，我们当然要考虑 p(x) ，来求解真正期望出现的值。标准公式如下（discrete or continuous）：

E [f] = \sum x p (x) f (x) o r E [f] = \int p (x) f (x) d x

期望的操作符号特意用了 E 和一般的 error E 区分开。
期望的核心在于函数值分布 p(x) 。其实根据不同的分布我们还能拓展期望的概念，例如 p(x|y) 的条件分布，可以产出条件期望 conditional expectation；本文不予展开。
另外，统计中的期望，在几何也有对应的重心，是一个对质量函数的加权积分。

采样 sample

我们不一定能精确地用公式求解出 E[f] ，但我们可以直接对 f(x) 采样，采样得到的值直接求均值 sample mean 来近似出 E[f] （函数期望约为函数采样均值）：

E [f] \approx 1 N \sum i = 1 N f (x i)

当

N 趋向无穷大，约等于变为等于。

运算规则

期望 Expectation 作为一个运算符，有着如下4条运算规则：

（假设 c 为一个常量）

E(c)=c
E(cX)=cE(X)
E(X+Y)=E(X)+E(Y)
当 X 、 Y 独立时， E(XY)=E(X)E(Y)

方差与期望

方差本身也可以看作是一个期望，我们依据方差的运算规则，可以等价标准的方差公式如下：

V A R [f (x)] = E [(f (x) - E [f (x)]) 2] = E [f (x) 2 - 2 f (x) E [f (x)] + E [f (x)] 2] ， 平 方 展 开 = E [f (x) 2] - E [2 f (x) E [f (x)]] + E [E [f (x)] 2] ， 加 法 分 解 = E [f (x) 2] - E [2 f (x)] E [f (x)] + E [f (x)] 2 ， 常 数 提 取 = E [f (x) 2] - E [f (x)] 2

方差 variance E[(f(x)−E[f(x)])2] 也被称为二阶中心距（减去期望 normalize 后对其二次方求期望）；其他统计量偏度 skewness 称为三阶中心距，峰度 kurtosis 四阶中心距。
另外，这里还可以导出一个常用的等价变换公式： E[f(x)2]=VAR[f(x)]+E[f(x)]2

机器学中的偏差-方差，Bias-Variance

定义

从统计的角度来看，机器学习中模型的泛化误差 generalization error 可以分解 decomposition 为 Bias-Variance 来解释；这里面包含了 Bias-Variance Tradeoff，或者说 Underfitting-Overfitting Tradeoff。
首先再回顾一下俩者概念：

A bias due to the model being too simple

The bias is error from erroneous assumptions in the learning algorithm. High bias can cause an algorithm to miss the relevant relations between features and target outputs (underfitting).

A variance due to the model sensitivity to the data

The variance is error from sensitivity to small fluctuations in the training set. High variance can cause overfitting: modeling the random noise in the training data, rather than the intended outputs.

泛化误差分解

下面的 Figure 1. 中给出了模型泛化时，产生俩种 Errors（Bias，Variance）；注意，泛化指的是在测试集上的误差测量，就是衡量模型在之前没有见过的数据上的表现。

数学期望 Expectation_第1张图片

Figure 1. Explanation about Bias-Variance for our models

我们下面通过期望对泛化误差进行描述；首先来明确一些本小节相关的符号定义：

f(x) 表示 true function，表示事物之间真正的规律，这是我们想要逼近的目标
f(x|w) 表示我们的训练的一个 machine（依据某一个 Dataset）
Ex 表示我们对整个测试集求期望
ED 表示我们对不同数据集 Dataset 训练出来的 machine 求期望
Eg 表示泛化误差 generalization error，注意不要和期望弄混了

泛化误差 generalization error 定义如下：

E g = E x [(f (x | w) - f (x)) 2] = \int (f (x | w) - f (x)) 2 p (x) d x

上式需要我们在了解 f(x) 和 p(x) 来求解，显然不可能。现实中，我们会构造一个 test set 或者 validation set 来近似泛化误差的评估。其实这也就是通过采样来近似估计期望：

E g \approx 1 T \sum (x k, y k \in T) (f (x k | w) - y k) 2

接下来，最重要的一点是：使用不同的训练集 Dataset 我们会得到不同的模型参数 w ；所有模型整合到一块的 average response 就是 ED[f(x|w)] ，也就是 Figure 1. 中的绿点；由此引出 bias 和 variance 的精确描述：

bias =Ex[(f(x)−ED[f(x|w)])2] ，反映了宏观上模型对 true function 的逼近能力
variance =ED,x[(f(x|w)−ED[f(x|w)])2]=VAR[f(x|w)−ED[f(x|w)]] ，这就是所有模型对 average response（绿点）的方差；这直接反映的模型的稳定程度。overfitting 相关的 ill-conditioned problem 的结果就是模型对数据变化敏感；如果我们不同训练集得到的不同模型对于 unseen test data 的评判差异极大，那 variance 就会极大

bias 和 variance 在实践中无法精确估计，常见通过 cross-validation 的方法例如 k-fold 作近似计算。
最后，我们其实可以基于泛化误差，直接分解为 bias-variance：

E D [E g] = E D, x [(f (x | w) - f (x)) 2] = E D, x [(f (x | w) - E D [f (x | w)] + E D [f (x | w)] - f (x)) 2] = E x [(f (x) - E D [f (x | w)]) 2] + E D, x [(f (x | w) - E D [f (x | w)]) 2] + 2 E D, x [(f (x | w) - E D [f (x | w)]) (E D [f (x | w)] - f (x))] = b i a s + v a r i a n c e + 0

上述的 cross term 通过 ED 带入第一项后， ED[(f(x|w)−ED[f(x|w)]]=0 所以直接消除整项。
还有其他的 decomposition 解释方法，例如 wiki 上的版本为 true function f(x) 加入了一个 zero mean and variance σ2 的误差项 ϵ ，也就是说我们的观测本身就包含 unseen noise，这种 noise 是无法被消除的；所以其分解结果是：bias+variance+ σ2 ，本文不展开讨论。

你可能感兴趣的:(统计理论)

手机屏像素缺陷修复及相关液晶线路激光修复原理 syncon12 科技制造 3d
摘要手机屏像素缺陷严重影响显示效果，而液晶线路异常是导致像素缺陷的关键因素之一。激光修复技术凭借高精度与非接触特性，能够有效修复液晶线路，进而改善像素显示。本文分析手机屏像素缺陷类型，探究液晶线路激光修复原理、工艺及参数优化，为提升手机屏显示质量提供理论支撑。引言随着手机屏向高分辨率、高刷新率方向发展，像素密度不断提升，像素缺陷问题愈发凸显。液晶线路作为控制像素显示的核心结构，其断路、短路、信号传
什么是 QueryGPT？智能查询工具如何重塑信息检索的未来？镜舟科技 StarRocks QueryGPT 数据查询数据分析多模态交互
从客户行为数据到供应链信息，从市场趋势到内部运营指标，这些数据蕴含着巨大的商业价值。然而，数据量的激增也带来了前所未有的检索挑战：如何在海量信息中快速定位所需数据？如何确保查询结果的准确性和时效性？据统计，75%的企业正受困于低效的查询工具，这已成为阻碍企业数字化转型的关键痛点。传统的数据查询方式主要依赖SQL语句或特定的查询语言，这要求用户具备专业的编程知识和对数据结构的深入理解。即使对于数据分
MySQL表达式之公用表表达式(CTE)的使用示例 @Corgi 后端开发 mysql 数据库 CTE
示例一数据表中有每个企业每年每月并且每月的产值是累加的数据的数据记录需求：统计企业产值能力，找出所有家企业中产值最高的企业，其产值记为P。对于第i家企业，其产值为Pi则该企业的产值能力评分=Pi/P×100。SQL：--使用ROW_NUMBER()为每个企业每年每个月的产值排名，筛选出每个企业每年最大月份的产值。WITHMaxMonthlyOutputAS(SELECTcompany_id,dec
Linux netstat 指令 halugin Linux指令 linux 运维
Linuxnetstat指令netstat（NetworkStatistics）是Linux系统中用于查看网络状态、连接、路由表和接口统计信息的经典命令行工具。它为系统管理员和开发人员提供了强大的网络诊断功能，帮助分析网络连接、监控流量以及排查网络问题。尽管在现代Linux系统中，netstat正在被更新的工具（如ss）部分取代，但其简单性和广泛适用性使其仍然是许多场景下的首选工具。什么是nets
Linux ss 指令 halugin Linux指令 linux 运维
Linuxss指令ss（SocketStatistics）是Linux系统中用于显示网络套接字（socket）信息的现代命令行工具，是netstat的继任者，性能更高、输出更简洁。它提供详细的网络连接、监听端口和协议统计信息，广泛用于网络监控、故障排查和性能分析。相比传统的netstat，ss直接从内核获取数据显示更快，功能更强大，适合现代Linux系统。什么是ss指令？ss是Linux系统中的一
ZYNQ无DMA的四路HP总线极限性能探索芯作者 D1：ZYNQ设计 fpga开发硬件工程智能硬件
深入挖掘AXIHP总线的直接传输潜力，突破传统DMA的性能瓶颈一、HP总线：ZYNQ系统的"高速公路"在XilinxZYNQ架构中，HP（HighPerformance）总线是连接PS（处理器系统）和PL（可编程逻辑）的关键通道。传统方案依赖DMA控制器进行数据传输，但当我们需要超低延迟或确定性响应时，无DMA的直接CPU控制成为更优选择。本文将揭示如何通过四路HP总线实现惊人的24GB/s理论带
基于灰色马尔科夫模型预测人口数量，是一种结合灰色系统理论（处理少数据、不确定性）与马尔科夫链（描述随机波动）的融合预测方法
利用灰色模型捕捉人口变化的总体趋势，再通过马尔科夫链修正因随机因素导致的预测偏差，从而提高预测精度。一、模型理论基础灰色系统理论原理（核心：处理少数据、部分信息未知的系统）差异信息原理：系统内外的差异是信息源，人口数据的时间序列差异蕴含变化规律。解的非唯一性原理：信息不完全时，预测结果存在多个可能区间（与马尔科夫状态划分契合）。最小信息原理：仅需少量历史数据（通常≥4个）即可建模，适合人口统计资料
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
误差的回响：反向传播算法与神经网络的惊天逆转田园Coder 人工智能科普人工智能科普
当专家系统在20世纪80年代初期大放异彩，成为人工智能实用化的耀眼明星时，另一股曾经被宣判“死刑”的力量——连接主义（神经网络）——正在寒冬的冻土下悄然涌动，孕育着一场惊天动地的复苏。马文·明斯基和西摩·帕尔特在1969年《感知机》专著中那精准而冷酷的理论批判，如同沉重的封印，将多层神经网络的研究禁锢了近二十年。他们指出的核心死结——缺乏有效算法来训练具有隐藏层的网络——仿佛一道无法逾越的天堑。单
支持java8的kafka版本兮动人 kafka 分布式支持java8的kafka版本
文章目录1.Kafka支持Java8的版本范围2.官方建议与兼容性3.版本迁移建议4.关键时间点5.注意事项6.总结1.Kafka支持Java8的版本范围Kafka2.x和3.x版本：Kafka2.x和3.x版本（如2.8.0、3.0.0等）理论上支持Java8，但官方已逐步弃用对Java8的支持。Kafka3.0：官方在3.0版本中弃用Java8（但仍允许使用），并强烈建议升级到Java11或更
相机-IMU联合标定：IMU更新频率吃水果不削皮视觉组合导航 ROS VIO kalibr
文章目录简介⚠️IMU频率参数错误设置的影响❌相机-IMU联合标定失败：Optimizationfailed!确定IMU更新频率直接通过rostopichz检查实际频率检查IMU驱动或数据手册从bag文件统计频率在这里插入图片描述修改`update_rate`的注意事项**最终建议****常见问题**简介IMU更新频率参数在Kalibr标定中直接影响标定精度和系统性能。高频率的IMU数据能提供更密
2024年BCSP-X小高组基础知识题目（模拟题）天秀信奥编程培训 #BCXP-X模拟题北京BCSP-X试题讲解专栏 BCSP-X c++算法数据结构
一、单项选择计算机的核心部件是什么（）？A.显示器B.键盘C.中央处理器（CPU)D.鼠标将十进制小数9.375转换为二进制小数，其正确的二进制表示是（）。A.1001.11B.1011.11C.1001.011D.1011.011假设有一个内存显示为96MB的文件夹，里面存储的都是分辨率为1024×2048的24位图像，请问理论上存储了（）张图像？(不考虑图像技术压缩对内存的优化)A.16张B.
量化交易编程-持仓天数,SQL学习-ACCESS子查询的技巧专注VB编程开发20年 sql 学习 java ACCESS 数据库
在股票投资中，停牌期间通常不算交易日3。同花顺手机APP中的收益分析持仓天数一般是按照交易日来计算的。具体而言，它会从买入股票的日期开始，到卖出股票的日期为止，只统计证券交易所正常开放交易的日子，周末和法定节假日以及股票停牌日都不会计算在内3。例如，若你持有某股票2年，其中停牌2年，实际交易日只有20天，那么同花顺计算的持仓天数就是20天，而不会算出几百个交易日。其实持仓天数关我屁事是吧?我只考虑
python接收_MT5 与 PYTHON 的集成：接收和发送数据 James Swineson python接收
为什么要把MQL5与Python集成？全方位的数据处理需要大量工具，并且经常超出单一应用程序的功能沙箱。专用编程语言正在用于处理和分析数据，统计和机器学习。Python是数据处理的主要编程语言之一。一个非常有效的解决方案是利用语言的力量并包含函数库来开发交易系统。在两个或更多个程序之间实现交互存在众多不同的解决方案。套接字是最快速、最灵活的解决方案之一。网络套接字是计算机网络上进程间通信的端点。M
Maven 多模块项目调试与问题排查总结
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
学习AI机器学习所需的数学基础 frostmelody 机器学习小知识点人工智能学习机器学习
一、机器学习岗位的数学需求矩阵机器学习岗位研究型职位工业界职位DeepMind/Meta/Google研究部门研究科学家/研究工程师普通科技公司机器学习工程师/数据科学家需硕士/博士数学水平本科数学基础二、数学需求深度解析1.研究型职位（需深度数学）学历要求：数学/物理/计算机/统计/工程本科基础硕士/博士优先（Kaggle调查显示博士占比高）薪资关联：学历与收入呈正相关2.工业界职位（基础数学）
网络工程师知识点精讲与例题解析：网络管理软考和人工智能学堂网络工程师网络规划设计师信息系统项目管理师提高班网络智能路由器
网络工程师知识点精讲与例题解析：网络管理一、网络管理概述网络管理是网络工程师的核心职责之一，主要目标是保障网络稳定、安全和高效运行。根据ISO定义的网络管理五大功能域（FCAPS）：故障管理（Fault）：检测、隔离和修复网络故障配置管理（Configuration）：管理设备配置和版本计费管理（Accounting）：统计资源使用情况（如流量计费）性能管理（Performance）：监控和分析网
21个MySQL索引优化实战技巧
MySQL索引优化是提升数据库性能的关键手段，一个合理的索引设计和使用策略，往往能将查询速度提升几十倍甚至上百倍。然而，索引优化并不简单，既需要扎实的理论基础，也需要丰富的实战经验。本文总结了21个MySQL索引优化的实战技巧，从索引选择、设计到维护、监控的全生命周期，帮助你解决日常开发中的索引性能问题。基础知识回顾在具体介绍前，让我们先简单回顾索引的基础知识：MySQL常用的索引类型包括：主键索
蔡高厅老师 - 高等数学-阅读笔记 - 01 - 前言、函数【视频第01、02、03、】 Franklin 数学线性代数
高等数学前言；196学时，每周6课主要内容：上册一元、多元函数数，微分学、积分学、矢量代数、空间解析几何无穷级数、微分方程，多元函数微分学和积分学目的：高等数学3基：1高等数学的基本知识2高度数学的基本理论3高等数学的基本计算方法提高数学素养培养：抽象思维、逻辑推理、辩证的思想方法、空间想象能力、分析问题、解决问题的能力为进一步学习打下必要的学习基础和初等数学不同，研究的不是常量而是变量，变量和变
212springboot基于javaweb的城乡居民基本医疗信息管理系统医院（源码+文档+运行视频+讲解视频） QQ2279239102 vue java maven Springboot html
项目技术：springboot+Maven+Vue等等组成，B/S模式+Maven管理等等。环境需要1.运行环境：最好是javajdk1.8，我们在这个平台上运行的。其他版本理论上也可以。2.IDE环境：IDEA，Eclipse,Myeclipse都可以。推荐IDEA;3.tomcat环境：Tomcat7.x,8.x,9.x版本均可4.硬件环境：windows7/8/101G内存以上；或者MacO
算法竞赛＞力扣＞周赛 | weekly-contest-455 字节幺零二四算法竞赛算法 leetcode 职场和发展
原文链接：算法竞赛>力扣>周赛|weekly-contest-4553591.检查元素频次是否为质数解题思路统计每个元素出现的次数，判断各次数是否为质数。由于次数&nums){unordered_mapmp;for(intv:nums)mp[v]++;for(auto[k,v]:mp)if(isPrime(v))returntrue;returnfalse;}时间复杂度O(n2)O(n^2)O(n
RNN笔记 sjtu_哈基坤 LLM随笔 rnn 笔记人工智能
来源见此处概述RNN(RecurrentNeuralNetwork)RNN之所以称为循环神经网络,是因为一个序列的当前的输出与前面的输出也有关.具体表现是网络会对前面的信息进行记忆并且应用于当前输出的计算中.即隐藏层之间的节点也是有连接的.并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出.理论上RNN能对任何长度的序列进行处理,但是在实践中,为了降低复杂性,往往假设当前状态只与前面几
如何设计和训练大模型（神经网络）：从入门到精通！
“学习一门技术，先找一套工具和理论研究下去；千万不要反复横跳，什么都想学”大模型作为未来重要的发展方向，很多人想学习大模型技术，但又苦于无从下手；而本公众号前前后后也写过一些怎么学习大模型技术的方法论；但大部分都是从应用的角度作为切入点。但是，有一个问题就是，如果你是一个技术从业者，想学习和设计一款属于自己的大模型，应该怎么做？设计一个自己的大模型大模型作为一门快速发展的新型技术，其理论与实现也是
剑指offer46_字符串中第一个只出现一次的字符
字符串中第一个只出现一次的字符字符串中找出第一个只出现一次的字符。如输入"abaccdeff"，则输出b。如果字符串中不存在只出现一次的字符，返回#字符。数据范围输入字符串长度[0,1000][0,1000][0,1000]。样例输入："abaccdeff"输出：'b'算法思路（哈希表计数）核心思想：使用哈希表统计每个字符的出现次数。二次遍历字符串，找到第一个计数为1的字符。关键步骤：第一次遍历：
【人工智能】微调的秘密武器：释放大模型的无限潜能蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在人工智能迅猛发展的今天，大规模语言模型（LLMs）以其强大的通用能力席卷各行各业。然而，如何让这些通用模型在特定领域或任务中发挥最大潜力？答案是微调（Fine-tuning）。本文深入探讨微调的理论基础、技术细节与实践方法，揭示其作为解锁大模型隐藏潜力
Java--程序控制结构（下）阿亮爱学代码 Java java 开发语言程序控制结构 java基础讲解循环控制
目录1.1for循环控制注意事项和细节说明：练习：打印1-100之间所有是9的倍数的整数，统计个数及总和我们进行代码优化：代码：1.2while循环控制1.3do...while循环控制1.4多重循环控制（重点）1.5break跳转控制语句细节：1.6continue跳转语句1.7return跳转语句1.1for循环控制介绍：听其名而知其意，就是让你的代码可以循环的执行语法：for（循环变量初始化
Python实现图像处理的快速傅里叶变换（FFT）或离散余弦变换（DCT）闲人编程图像处理图像处理 python 计算机视觉 FFT DCT 傅里叶离散余弦变换
目录Python实现图像处理的快速傅里叶变换（FFT）或离散余弦变换（DCT）一、引言1.1图像处理简介1.2快速傅里叶变换与离散余弦变换简介1.3本文目标与结构二、理论背景与数学原理2.1快速傅里叶变换（FFT）介绍2.2离散余弦变换（DCT）介绍2.3两者的应用领域与区别三、算法实现3.1快速傅里叶变换（FFT）实现3.1.1使用Python实现FFT3.1.2图像的频域处理3.2离散余弦变换
Git如何查看提交行数与删除行数：统计代码贡献量的完整指南
Git如何查看提交行数与删除行数：统计代码贡献量的完整指南在软件开发中，代码行数统计是衡量团队协作效率和项目进度的重要指标。通过Git的命令行工具，开发者可以轻松查看提交的代码行数、删除的代码行数以及净增行数。本文将详细介绍多种方法，并结合实际案例，帮助你快速掌握这一技能。一、为什么需要统计代码行数？评估工作量：统计个人或团队的代码贡献量，辅助绩效考核。分析代码质量：通过删除行数判断重构频率，评估
【架构专题】架构风格（上）：从理论到实践的全面解析 A.说学逗唱的Coke 架构
架构风格详解：从理论到实践的全面解析一、引言在软件系统设计中，架构风格是决定系统质量与可维护性的核心要素。根据软考高级资格考试大纲要求，系统架构设计师需掌握软件架构风格的定义、分类及选型方法。本文将结合Garlan和Shaw的经典理论，结合软考实践案例，系统阐述架构风格的理论基础与应用策略。二、架构风格的定义与核心要素2.1定义软件架构风格是描述特定应用领域中系统组织方式的惯用模式，其本质是通过构
高级 Python 测试工程师学习提升计划 code36 python 学习开发语言测试爬虫高级测试
一、测试理论与流程夯实系统梳理：每周安排3-4小时，深入研读软件测试的艺术、Google软件测试之道，重点强化功能、性能、安全性测试流程，整理流程关键节点与执行要点笔记。实践模拟：基于线上开源项目（如GitHub找小型Web应用），每月开展2次全流程测试实践，从需求分析到测试报告输出，巩固理论应用。二、Python及测试工具深化Python进阶：利用Python高级课程资料，主攻面向对象编程、装饰
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他