orion-orion

Python中的随机采样和概率分布(二)

在上一篇博文《Python中的随机采样和概率分布(一)》(链接：https://www.cnblogs.com/orion-orion/p/15647408.html)中，我们介绍了Python中最简单的随机采样函数。接下来我们更进一步，来看看如何从一个概率分布中采样，我们以几个机器学习中最常用的概率分布为例。

1. 二项（binomial）/伯努利（Bernoulli）分布

1.1 概率质量函数(pmf)

\[P(X = x;\space n, \space p)=\left(\begin{array}{c}n \\ x\end{array}\right) p^{x}(1-p)^{n-x}\\ x=0,1,2,...n; \space 0\leqslant p \leqslant 1 \]

当\(n=1\)时，则取到下列极限情况，是为参数为\(p\)的二项分布：

\[P(X = x;\space p)= p^{x}(1-p)^{1-x}\\ x=0,1; \space 0\leqslant p \leqslant 1 \]

二项分布\(P(X = x;\space n, \space p)\)可以表示进行独立重复试验\(n\)次，每次有两成功和失败可能结果（分别对应概率\(p\)和\(1-p\)），共成功\(x\)次的概率。

1.2 函数原型

random.binomial(n, p, size=None)

参数：
n: int or array_like of ints 对应分布函数中的参数 n，>=0，浮点数会被截断为整形。
p: float or array_like of floats 对应分布函数参数\(p\), >=0并且<=1。
size: int or tuple of ints, optional 如果给定形状为\((m, n, k)\)，那么\(m\times n \times k\)个随机样本会从中抽取。默认为None，即返回一个一个标量随机样本。

返回：
out: ndarray or scalar 从带参数的概率分布中采的随机样本，每个样本表示独立重复实验\(n\)次中成功的次数。

1.3 使用样例

设进行独立重复实验10次，每次成功概率为0.5，采样样本表示总共的成功次数（相当于扔10次硬币，正面朝上的次数）。总共采20个样本。

import numpy as np
n, p = 10, .5  
s = np.random.binomial(n, p, 20)
print(s) # [4 5 6 5 4 2 4 6 7 2 4 4 2 4 4 7 6 3 5 6]

可以粗略的看到，样本几乎都在5周围上下波动。
我们来看一个有趣的例子。一家公司钻了9口井，每口井成功的概率为0.1，所有井都失败了，发生这种情况的概率是多少？
我们总共采样2000次，来看下产生0结果的概率。

s = sum(np.random.binomial(9, 0.1, 20000) == 0)/20000.
print(s) # 0.3823

可见，所有井失败的概率为0.3823，这个概率还是蛮大的。

2. 多项（multinomial）分布

2.1 概率质量函数(pmf)

\[P(\bm{X} = \bm{x};\space n, \space \bm{p})=\frac{n !}{x_{1} ! \cdots x_{k} !} p_{1}^{x_{1}} \cdots p_{k}^{x_{k}}\\ \bm{x}=(x_1, x_2, ..., x_k), x_i \in \{0, ..., n\}, \space \sum_{i}{x_i}=n; \\ \bm{p}=(p_1, p_2, ..., p_k), 0\leqslant p_i \leqslant 1, \space \sum_{i}{p_i}=1 \]

当\(k=2\)时，则取到下列极限情况，是为参数为\(n\), \(p\)的二项分布：

\[P(X = x;\space n, \space p)=\frac{n !}{x !(n-x) !} p^{x}(1-p)^{n-x}\\ x=0,1,2,...n; \space 0\leqslant p \leqslant 1 \]

也就是说，多项分布式二项分布的推广：仍然是独立重复实验\(n\)次，但每次不只有成功和失败两种结果，而是\(k\)种可能的结果，每种结果的概率为\(p_i\)。多项分布是一个随机向量的分布，\(\bm{x}=(x_1, x_2, ..., x_k)\)意为第\(i\)种结果出现\(x_i\)次，\(P(\bm{X} = \bm{x};\space n, \space p)\)也就表示第\(i\)种结果出现\(x_i\)次的概率。

2.2 函数原型

random.multinomial(n, pvals, size=None)

参数：
n: int 对应分布函数中的参数 n。
pvals: sequence of floats 对应分布函数参数\(\bm{p}\), 其长度等于可能的结果数\(k\)，并且有\(0 \leqslant p_i \leqslant 1\)。
size: int or tuple of ints, optional 为输出形状大小，因为采出的每个样本是一个随机向量，默认最后一维会自动加上\(k\)，如果给定形状为\((m, n)\)，那么\(m\times n\)个维度为\(k\)的随机向量会从中抽取。默认为None，即返回一个一个\(k\)维的随机向量。

返回：
out: ndarray 从带参数的概率分布中采的随机向量，长度为可能的结果数\(k\)，如果没有给定 size，则shape为 (k,)。

2.3 使用样例

设进行独立重复实验20次，每次情况的概率为1/6，采样出的随机向量表示每种情况出现次数（相当于扔20次六面骰子，点数为0, 1, 2, ..., 5出现的次数）。总共采1个样本。

s = np.random.multinomial(20, [1/6.]*6, size=1)
print(s) # [[4 2 2 3 5 4]]

当然，如果不指定size，它直接就会返回一个一维向量了

s = np.random.multinomial(20, [1/6.]*6)
print(s) # [4 1 4 3 5 3]

如果像进行多次采样，改变 size即可：

s = np.random.multinomial(20, [1/6.]*6, size=(2, 2))
print(s)
# [[[4 3 4 2 6 1]
#   [5 2 1 6 3 3]]

#  [[5 4 1 1 6 3]
#   [2 5 2 5 4 2]]]

这个函数在论文[1]的实现代码[2]中用来设置每一个 client分得的样本数：

for cluster_id in range(n_clusters): 
    weights = np.random.dirichlet(alpha=alpha * np.ones(n_clients))
    clients_counts[cluster_id] = np.random.multinomial(clusters_sizes[cluster_id], weights)
    # 一共扔clusters_sizes[cluster_id]次筛子，该函数返回骰子落在某个client上各多少次，也就对应着该client应该分得的样本数

3.均匀（uniform）分布

3.1 概率密度函数(pdf)

\[p(x; \space a, \space b)=\frac{1}{b-a} \]

均匀分布可用于随机地从连续区间\([a, b)\)内进行采样。

3.2 函数原型

random.uniform(low=0.0, high=1.0, size=None)

参数：
low: float or array_like of floats, optional 对应分布函数中的下界参数 a，默认为0。
high: float or array_like of floats 对应分布函数中的下界参数 b，默认为1.0。
size: int or tuple of ints, optional 为输出形状大小，如果给定形状为\((m, n, k)\)，那么\(m\times n\times k\)的样本会从中抽取。默认为None，即返回一个单一标量。

返回：
out: ndarray or scalar 从带参数的均匀分布周采的随机样本

3.3 使用样例

s = np.random.uniform(-1,0,10)
print(s)
# [-0.9479594  -0.86158902 -0.63754099 -0.0883407  -0.92845644 -0.11148294
#  -0.19826197 -0.77396765 -0.26809953 -0.74734785]

4. 狄利克雷(Dirichlet)分布

4.1 概率密度函数(pdf)

\[P(\bm{x}; \bm{\alpha}) \propto \prod_{i=1}^{k} x_{i}^{\alpha_{i}-1} \\ \bm{x}=(x_1,x_2,...,x_k),\quad x_i > 0 , \quad \sum_{i=1}^k x_i = 1\\ \bm{\alpha} = (\alpha_1,\alpha_2,..., \alpha_k). \quad \alpha_i > 0 \]

4.2 函数原型

random.dirichlet(alpha, size=None)

参数：
alpha: sequence of floats, length k 对应分布函数中的参数向量 \(\alpha\)，长度为\(k\)。
size: int or tuple of ints, optional 为输出形状大小，因为采出的每个样本是一个随机向量，默认最后一维会自动加上\(k\)，如果给定形状为\((m, n)\)，那么\(m\times n\)个维度为\(k\)的随机向量会从中抽取。默认为None，即返回一个一个\(k\)维的随机向量。

返回：
out: ndarray 采出的样本，大小为\((size, k)\)。

4.3 使用样例

设\(\bm{\alpha}=(10, 5, 3)\)(意味着\(k=3\))，\(size=(2, 2)\)，则采出的样本为\(2\times 2\)个维度为\(k=3\)的随机向量。

s = np.random.dirichlet((10, 5, 3), size=(2, 2))
print(s)
# [[[0.82327647 0.09820451 0.07851902]
#   [0.50861077 0.4503409  0.04104833]]

#  [[0.31843167 0.22436547 0.45720285]
#   [0.40981943 0.40349597 0.1866846 ]]]

这个函数在论文[1]的实现代码[2]中用来生成符合狄利克雷分布的权重向量

for cluster_id in range(n_clusters): 
    # 为每个client生成一个权重向量，文章中分布参数alpha每一维都相同
    weights = np.random.dirichlet(alpha=alpha * np.ones(n_clients))
    clients_counts[cluster_id] = np.random.multinomial(clusters_sizes[cluster_id], weights)

参考文献

[1] Marfoq O, Neglia G, Bellet A, et al. Federated multi-task learning under a mixture of distributions[J]. Advances in Neural Information Processing Systems, 2021, 34.
[2] https://github.com/omarfoq/FedEM
[3] https://www.python.org/
[4] https://numpy.org/

你可能感兴趣的:(Python中的随机采样和概率分布(二))

【编辑器】.editorconfig统一代码风格七灵微基本理论编辑器
概念定义：用于统一和规范不同开发者编辑器（IDE）中的代码格式设置的配置文件。作用保证团队成员用不同编辑器（VSCode、WebStorm、SublimeText、Vim等）编辑代码时，保持统一的代码风格和格式避免因编辑器默认设置不同，导致代码风格不一致、无意义的格式差异兼容性：不是所有编辑器都“天生”支持.editorconfig，但现在主流编辑器大多数都能识别，或者通过插件支持。原理.edit
面了字节跳动的数据挖掘岗，感觉真的很难。。。大模型爱好者社区机器学习深度学习面试宝典数据挖掘人工智能数据分析算法面试
节前，我们社群组织了一场技术&面试讨论会，邀请了一些互联网大厂同学、参加社招和校招面试的同学，针对新手如何入门机器学习算法、该如何备战、面试常考点分享等热门话题进行了深入的讨论。基于社群的讨论，今天我整理了一个同学的面试题，分享给大家，希望对后续找工作的有所帮助。喜欢记得点赞、收藏、关注。更多技术交流&面经学习，可以文末加入我们交流群。一面40min【编程题】有两种数据，分别是被转发的用户和转发的
【字节跳动】数据挖掘面试题0002：从转发数据中求原视频用户以及转发的最长深度和二叉排序树指定值言析数智数据挖掘常见面试题数据挖掘面试题
文章大纲题目一：从转发数据中求原视频用户以及转发的最长深度问题分析解题思路寻找原视频用户计算转发最长深度题目二：在一棵二叉排序树中，找到比给定数值小的最大节点方法思路题目一：从转发数据中求原视频用户以及转发的最长深度在数据处理和算法面试中，常常会遇到一些基于实际业务场景的题目，比如根据用户转发数据来分析原视频用户以及转发深度。今天就来探讨一道这样的面试题：给定被转发用户和转发用户两组数据，求原视频
Spring AI 实战：第二章、Spring AI提示词之玩转AI占卜的艺术 liaokailin Spring AI 实战人工智能 spring java
目录（如果文章对您有一丢丢输入，请点赞、收藏、转发吧~）源码开篇、大模型时代：我们正站在浪潮之巅第一章、SpringAI入门之DeepSeek调用第二章、SpringAI提示词之玩转AI占卜的艺术第三章、SpringAI结构化输出之告别杂乱无章第四章、SpringAI多模态之看图说话
使用NPM安装Highcharts的完整指南祁泉望Ernestine
使用NPM安装Highcharts的完整指南highcharts项目地址:https://gitcode.com/gh_mirrors/high/highcharts前言Highcharts作为一款功能强大的数据可视化库，在现代Web开发中扮演着重要角色。本文将详细介绍如何通过NPM包管理器来安装和使用Highcharts及其相关产品（Stock、Maps和Gantt），帮助开发者快速上手这一优秀
Vue-Highcharts 使用教程柳嵘英Humphrey
Vue-Highcharts使用教程项目地址:https://gitcode.com/gh_mirrors/vu/vue-highcharts项目介绍Vue-Highcharts是一个基于Vue.js的高级图表库，它允许开发者轻松地在Vue项目中集成Highcharts。Highcharts是一个功能强大的图表库，支持多种图表类型，包括线图、柱状图、饼图、散点图等，并且具有高度的可定制性和交互性。
力扣打卡第十九天左叶子之和 ??tobenewyorker leetcode 算法 c++数据结构
404.左叶子之和给定二叉树的根节点root，返回所有左叶子之和。示例1：输入:root=[3,9,20,null,null,15,7]输出:24解释:在这个二叉树中，有两个左叶子，分别是9和15，所以返回24示例2:输入:root=[1]输出:0提示:节点数在[1,1000]范围内-1000left&&!root->right)return0;intres=0;//后序遍历//左只有根据父节点才
全流程文献计量学可视化分析技术及SCI论文高效写作方法青春不败 177-3266-0520 生态环境人工智能 python 文献可视化 SCI论文生态学环境科学遥感
文献计量学是指用数学和统计学的方法，定量地分析一切知识载体的交叉科学。它是集数学、统计学、文献学为一体，注重量化的综合性知识体系。特别是，信息可视化技术手段和方法的运用，可直观的展示主题的研究发展历程、研究现状、研究热点和发展态势。一：文献计量学方法与应用1.文献计量学方法基本2.与其他综述方法区别联系3.各学科领域应用趋势近况4.主流分析软件优缺点对比二：主题确定、检索与数据采集1.热点主题高效
Redis 单线程的“天花板”与集群的必要性未来并未来 redis 数据库缓存
虽然Redis以其单线程模型（主要是处理请求的核心逻辑）带来了极高的性能和简洁性，但这并不意味着它没有瓶颈。CPU瓶颈：当业务逻辑复杂，或者Redis执行大量计算密集型操作（比如使用Lua脚本进行复杂处理）时，单个CPU核心可能成为性能瓶颈。内存瓶颈：单个Redis实例能使用的内存是有限的。当数据量巨大，单个实例无法容纳所有数据时，就需要分片存储。网络I/O瓶颈：虽然Redis使用I/O多路复用技
【Python】edge-tts ：便捷语音合成宅男很神经 python 开发语言
第一章：初识edge-tts——开启语音合成之旅1.1文本转语音(TTS)技术概述文本转语音（Text-to-Speech,TTS），顾名思义，是一种将输入的文本信息转换成可听的语音波形的技术。它是人机语音交互的关键组成部分，使得计算机能够像人一样“说话”。1.1.1TTS的发展简史与重要性TTS技术的研究可以追溯到上世纪中叶，早期的TTS系统通常基于参数合成或拼接合成的方法，声音机械、不自然。参
SeaTunnel 社区月报（5-6 月）：全新功能上线、Bug 大扫除、Merge 之星是谁？ SeaTunnel bug SeaTunnel 开源数据集成大数据
在5月和6月，SeaTunnel社区迎来了一轮密集更新：2.3.11正式发布，新增对Databend、Elasticsearch向量、HTTP批量写入、ClickHouse多表写入等多个连接器能力，全面提升了数据同步灵活性。同时，近100个修复与优化PR合入，涵盖Spark引擎并行性修复、Paimon精度兼容性增强、Mongo-CDCExactlyOnce默认值优化、OracleDDL类型支持补全
【MV】策略模式 vs规则引擎等风来不如迎风去 AI入门与实战策略模式
策略模式是一种很实用的设计模式，让我用通俗的方式给你解释：策略模式的核心思想把"做什么"和"怎么做"分开，让同一个问题可以有多种解决方案，并且可以灵活切换。生活中的例子情景：你要去机场问题：怎么去机场？策略1：打车（快但贵）策略2：地铁（便宜但慢）策略3：开车（灵活但要停车）选择器ÿ
3步打造Java六边形帝国！解耦业务逻辑全攻略：破解5大陷阱！墨瑾轩一起学学C#【三】java 开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣**六边形架构的“3步魔法召唤术”**第一步：定义核心业务逻辑——给业务装上“女王皇冠”！定义：“就像给业务女王颁发‘独立宣言’，用纯业务类和接口定义核心逻辑！”案例①：订单服务核心逻
HTTP协议：深入理解超文本传输协议需要重新演唱 web #javaweb基础 http 网络协议网络
HTTP协议：深入理解超文本传输协议在当今的互联网时代，HTTP（HyperTextTransferProtocol，超文本传输协议）是构建Web应用的基石。无论是浏览网页、观看视频还是进行在线交易，HTTP协议都在背后默默地发挥着作用。本文将深入探讨HTTP协议的基本概念、请求和响应的结构、GET和POST请求的区别以及在实际开发中的应用。1.什么是协议？1.1协议的定义协议是一套规范或标准，由
免费学中医，这些优质资源不容错过少林659 零基础学中医免费学中医
零基础学中医，学中医如何入门免费学中医！问止精一书院链接：https://tool.nineya.com/qrcode/1iv54b4ts想入门中医却担心成本太高？其实有不少免费又优质的学习资源，问止中医的系列免费课程就是其中的佼佼者，涵盖理论与实操，满足不同学习者的需求。问止中医旗下的精一书院，是免费学中医的绝佳平台。由问止中医联合创始人林大栋博士主讲，课程聚焦中医结构分析、人工智能中医大脑技术
微软：LLM训练数据组织框架DELT 大模型任我行大模型-模型训练人工智能自然语言处理语言模型论文笔记
标题：DataEfficacyforLanguageModelTraining来源：arXiv,2506.21545摘要数据是语言模型（LM）训练的基础。最近的研究一直致力于数据效率，其目的是通过选择训练数据的最小或最优子集来最大限度地提高性能。数据过滤、采样和选择等技术在这一领域起着至关重要的作用。为了补充这一点，我们定义了数据效能，它侧重于通过优化训练数据的组织来最大限度地提高性能，目前尚未得
归并排序算法起个数先数据结构与算法排序算法算法 java
归并排序所用方法和基本原理归并排序是一种基于分治思想的排序算法。其基本原理如下：分解：将一个长度为(n)的数组不断地二分，直到每个子数组只包含一个元素（因为单个元素的数组天然是有序的）。例如，对于长度为(n)的数组，先找到中间位置(mid)，将数组分为左半部分([l,mid])和右半部分([mid+1,r])。解决：递归地对左右两个子数组进行归并排序，使得左右子数组各自有序。合并：将两个已经有序的
这可能是史上最贵的一行代码: 价值16亿！
publicfunchecked_shlw(n:u256):(u256,bool){letmask=0xfffffffffffffffmask){(0,true)}else{((nmask)检查输入值n是否大于mask如果n的任何高位(>192位)为1，则条件成立返回情况：(0,true)：溢出时返回0和true((n<<64),false)：否则返回n左移64位和false潜在问题第一行mask
学会了编程才知道店员是“AI机器人” IT-博通哥 Python python 开发语言
根据老罗点咖啡的视频中（"给我来杯中杯"、"这是大杯，中杯是我们最小的杯型"的对话）我用Python代码模拟这个场景：classStarbucks:def__init__(self):self.cup_sizes={"中杯":"Tall","大杯":"Grande","超大杯":"Venti"}deforder_coffee(self,size):ifsize=="中杯":print("店员：这是
JVM调优实战 Day 13：微服务架构中的JVM优化在未来等你 JVM调优实战 JVM Java 性能优化调优虚拟机
【JVM调优实战Day13】微服务架构中的JVM优化文章标签jvm调优,微服务架构,JVM性能优化,Java内存管理,JVM参数配置,云原生应用,Java开发,架构师成长之路文章简述在微服务架构中，JVM的调优不再只是单个应用的问题，而是涉及多个服务实例、容器化部署和动态伸缩等复杂场景。本文作为“JVM调优实战”系列的第13天，深入探讨了微服务环境下JVM优化的核心技术点，包括内存分配策略、GC调
JVM调优实战 Day 7：JVM线程分析与死锁排查在未来等你 JVM调优实战 JVM Java 性能优化调优虚拟机
【JVM调优实战Day7】JVM线程分析与死锁排查文章标签jvm调优,线程分析,死锁排查,JVM监控,Java性能优化,JVM参数配置文章简述在Java应用的高并发场景中，线程管理与死锁问题往往是性能瓶颈的根源。本文作为“JVM调优实战”系列的第7天，深入解析JVM线程模型、死锁机制及其诊断方法。文章从线程的基本概念出发，结合实际案例，详细讲解如何使用JVM内置工具进行线程状态分析和死锁检测，并提
提示词工程推荐阅读论文司南锤 LLM prompt 人工智能自然语言处理
论文目录提示工程少样本提示思维链提示自洽性生成知识提示自动提示工程多模态提示提示技巧对抗提示提示工程PromptEngineeringforText-BasedGenerativeModels论文链接:https://arxiv.org/abs/2107.13586简介:本文概述了提示工程，并讨论了它在各种基于文本的生成模型中的应用。少样本提示Few-shotLearningwithRetriev
HTTP协议详解与深入理解菜就多练少说计算机网络 http 网络协议网络
一、什么是HTTP？HTTP（HyperTextTransferProtocol，超文本传输协议）是互联网上应用最广泛的一种通信协议，它定义了客户端与服务器之间通信的标准规则，主要用于浏览器与服务器之间的数据交换。HTTP是万维网的基础，网页浏览、API调用、数据交互等都基于HTTP协议完成。二、HTTP的基本原理HTTP属于应用层协议，采用请求-响应模式（Request-Response）。基本
思维树(Tree of Thoughts): 超越链式思维的AI推理新范式司南锤 LLM 人工智能
引言在人工智能快速发展的今天，大语言模型(LLM)的推理能力一直是研究的热点。从最初的直接问答，到链式思维(ChainofThoughts,CoT)的出现，再到如今的思维树(TreeofThoughts,TOT)，AI的推理方式正在变得越来越接近人类的思维过程。思维树作为一种全新的推理框架，不仅继承了链式思维的优势，更通过树状结构的探索和回溯机制，实现了更加复杂和深入的推理过程。本文将深入探讨TO
【Linux】冯诺依曼结构体系 nanguochenchuan Linux操作系统 linux 运维服务器
冯诺依曼结构基础冯诺依曼结构是现代计算机的基础设计蓝图，包含五大核心部件：运算器：执行算术逻辑运算（现代CPU的ALU）控制器：协调各部件工作（现代CPU的控制单元）存储器：统一存储程序和数据（内存）输入设备：如键盘、鼠标输出设备：如显示器、打印机核心特点：采用二进制系统存储程序原理：程序和数据共同存储在内存中顺序执行指令（存在冯诺依曼瓶颈）现代计算机的实现主流架构（x86/ARM）仍基于冯诺依曼
【Linux】vim工具 nanguochenchuan Linux操作系统 linux vim 运维
Vim简介与应用场景Vim（ViImproved）作为一款源自Unix系统vi编辑器的增强版本，以其独特的模式化编辑和全键盘操作闻名。主要特点包括：轻量级：仅需几MB空间，适合服务器环境高度可定制：通过.vimrc和插件实现个性化配置跨平台：支持Linux、macOS、Windows等系统典型应用场景：服务器远程管理（通过SSH连接时的高效编辑）编程开发（支持300+语言的语法高亮）日志文件分析（
【数据结构】二叉树 nanguochenchuan 数据结构数据结构算法
二叉树的基本概念二叉树是每个节点最多有两个子节点的树结构，这两个子节点分别称为左子节点和右子节点。与普通树相比，二叉树具有更严格的结构限制：根节点：最顶层的节点，没有父节点叶子节点：没有子节点的末端节点子树：某个节点及其所有后代组成的树深度：从根节点到该节点的路径长度（根节点深度为0）高度：从节点到最深叶子节点的路径长度（叶子节点高度为0）与普通树的区别：普通树节点可以有任意数量的子节点二叉树严格
【C++】std::vector 全面指南 nanguochenchuan C++c++java 开发语言
引言：为什么选择vector？std::vector是C++标准模板库(STL)中最常用的动态数组容器，相比原始数组和链表具有显著优势：特性std::vector原始数组链表动态大小✅自动扩容❌固定大小✅动态增长内存局部性✅连续存储✅连续存储❌非连续随机访问✅O(1)✅O(1)❌O(n)插入/删除效率尾部O(1)，中部O(n)❌不支持✅O(1)典型应用场景：需要频繁随机访问元素不确定元素数量的情况
深入理解React的虚拟DOM与性能优化天天进步2015 前端开发 react.js 性能优化 javascript
React作为现代前端开发的主流框架，其高效的渲染能力和良好的开发体验离不开虚拟DOM（VirtualDOM）的设计理念。本文将带你深入理解React的虚拟DOM原理，并结合实际案例，探讨如何进行性能优化。一、什么是虚拟DOM？虚拟DOM（VirtualDOM，简称VDOM）是React引入的一种轻量级JavaScript对象，用于描述真实DOM的结构。它本质上是DOM的一个抽象表示，React通
路由器工作在OSI模型的哪一层？
路由器主要工作在OSI模型的第三层，即网络层。网络层的主要功能是将数据包从源地址路由到目标地址，路由器通过检查数据包中的目标IP地址，并根据路由表确定最佳路径来实现这一功能。路由器的主要功能：a、路由决策：路由器通过分析目标IP地址，决定数据包的转发路径。b、跨网络通信：负责不同网络之间的数据传输。c、网络互联：连接多个网络，实现广域网或局域网之间的通信。d、路由表维护：通过直连路由、静态路由和动
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他