西西里的小裁缝

python实现概率论与数理统计_机器学习数学基础：数理统计与描述性统计

↑↑↑关注后"星标"Datawhale

每日干货 & 每月组队学习，不错过

Datawhale干货

作者：吴忠强，Datawhale优秀学习者

所谓机器学习和深度学习，背后的逻辑都是数学，所以数学基础在这个领域非常关键，而统计学又是重中之重，机器学习从某种意义上来说就是一种统计学习。

今天是概率统计基础的第二篇文章，基于第一篇随机变量与随机事件进行整理，首先理一理这里面的逻辑，第一篇的内容蕴涵了大部分概率论的知识(除了大数定律和中心极限定理这种理论性的支持, 后期有机会会补上)。而今天的这篇内容是在概率论的基础上往前一步，属于数理统计的内容。概率论中，我们研究随机现象，随机变量，但是我们是假设它们的分布已知，比如已知某一随机变量服从什么分布，在这个基础上研究性质，特点和规律(数字特征啊，随机变量分布啊等)，而数理统计中，我们研究随机变量的分布未知或者一部分未知，要去做的就是通过从未知分布中抽取多个样本，对这些数据进行统计分析，从而研究随机变量的分布等。

大纲如下：

数理统计的基础(基础概念，统计量与抽样分布，常用统计量)
描述性统计(数据集中趋势和离散趋势，分布特征，偏度与峰度)

数理统计基础

前面已经分析了数理统计是基于是通过从未知分布中抽取多个样本，对这些数据进行统计分析进而去分析随机变量的规律和特点，所以在这里面依然会涉及到一些基本的概念。

基础概念

这里的基础概念包括总体，个体，总体容量，样本，简单随机样本，如果这些概念都知道，就可以跳过了哈哈。

在数理统计中，总体就是研究对象的全体，通常用一个随机变量表示，组成总体的每个基本单元叫个体，而总体中包含的个体总数就是总体容量。

我们研究的就是这个未知分布的总体的统计规律，所以我们需要从这里面随机抽取一部分个体进行统计，利用概率论的知识去分析推断。所以从总体中随机抽取一部分个体，称为取自的容量为的样本。来个栗子吧：

简单随机样本：满足以下两个条件的随机样本称为容量是的简单随机样本：

代表性：每个与同分布
独立性：是相互独立的随机变量。

样本是具有两重性，即当在一次具体地抽样后它是一组确定的数值。但在一般叙述中样本也是一组随机变量，因为抽样是随机的。

一般地，用，, 表示随机样本，它们取到的值记为，称为样本观测值。一般情形下，两次观测，样本值是不同的。

样本作为随机变量，有一定的概率分布，这个概率分布称为样本分布。显然，样本分布取决于总体的性质和样本的性质。

统计量与抽样分布

数理统计的任务是采集和处理带有随机影响的数据，或者说收集样本并对之进行加工，以此对所研究的问题作出一定的结论，这一过程称为统计推断。从样本中提取有用的信息来研究总体的分布及各种特征数就是构造统计量的过程，因此，统计量是样本的某种函数。

比如10个灯泡的平均寿命是统计量。

常用的统计量

1. 样本均值

设是总体 XXX 的一个简单随机样本，称为样本均值。通常用样本均值来估计总体分布的均值和对有关总体分布均值的假设作检验。均值这个numpy实现就是np.mean()

2. 样本方差

设是总体的一个简单随机样本，为样本均值，称为样本方差。通常用样本方差来估计总体分布的方差和对有关总体分布均值或方差的假设作检验。numpy的话就是np.var()

3. k阶样本原点矩

设是总体的一个简单随机样本，称

为样本的阶原点矩(可以看到时，相当于样本均值)，通常用样本的无阶原点矩来估计总体分布的阶原点矩。

4. k阶样本中心矩

设是总体的一个简单随机样本，为样本均值，称

为样本的阶中心矩，通常用样本的阶中心矩来估计总体分布的阶中心矩。

5. 顺序统计量

这个numpy的话就是np.max(), np.min()

三种重要的抽样分布

在使用统计量进行统计推断的时候常常需要知道它的分布，统计量的分布称为抽样分布，有三个非常重要的统计量的分布我们需要知道，因为在参数估计和检验假设等其实都有这三个分布的影子或者依赖于这三个分布，这三个分布就是分布、分布和分布。

1. 分布

设是来自总体的样本，则称统计量

服从自由度为的分布，记为。自由度指的独立变量的个数。概率密度函数长这样：

其中

2. 分布

设,且相互独立，则称随机变量

服从自由度为的分布。它的概率密度函数：

概率密度函数图像如下：

3. 分布

设且独立，则称随机变量

的分布，记

上面这些分布在参数估计的时候，会用到。当然分布本身可能比较复杂，尤其是概率密度函数，到时候会有表可查。

描述性统计

数据集中趋势的度量

1. 平均数

是表示一组数据集中趋势的量数，是指在一组数据中所有数据之和再除以这组数据的个数。

2. 中位数

是指在一组数据，按顺序排列后，居于中间位置的数。中位数描述数据中心位置的数字特征，对于对称分布的数据，均值与中位数比较接近；对于偏态分布的数据，均值与中位数不同。中位数不受异常值的影响，具有稳健性。

3. 频数

指同一观测值在一组数据中出现的次数(掷骰子中，一共掷了20次，出现数字5的次数)

4. 众数(mode)

就是一组数据中，出现次数最多的那个数(几个数)。下图为均值 VS 中位数 VS 众数

5. 百分位数

百分位数是中位数的推广，将数据按从小到大排列后，对于它的分位点定义为其中，表示的整数部分。所以，0.5分位数(第50百分位数)就是中位数。0.25分位数称为第一四分位数，记为， 0.75分位数称为第三四分位数，记为，这三个分位数在统计中很有用的。这个百分位数最常见的就是我们说的箱线图了：

这个箱线图可以看到数据的下面几个性质：

中心位置：中位数所在的位置是数据集的中心
散布程度：全部数据落在之内，在区间,, , 的数据个数各占1/4。区间较短时表示落在该区间的点较为集中，反之较为分散。
对称性：若中位数位于箱子的中间位置，则数据分布较为对称。若离的距离较离的距离大，则表示数据分布向左倾斜，反之数据右倾斜，且能看出分布尾部的长短。

箱线图特别适用于比价两个或者两个以上数据集的性质。当然箱线图也可以帮助我们检测是否存在异常值(不寻常的过大或者过小)，第一四分位数和第三四分位数之间的距离记为IQR，也就是四分位数间距，若数据小于IQR或者数据大于IQR,就疑似异常

好了，关于上面的这些内容，下面看一波python实现了。

首先是列表的元素求均值，中位数，众数，频数：由于众数numpy中没有直接实现的函数，所以可以调用scipy包的stats或者自己实现：

# 实现众数  但这个不能返回多个众数， 如果有多个众数的话， 需要得到一个众数的次数， 然后根据频数返回多个。def mode(lst):    if not lst:        return     return max(lst, key=lambda v: lst.count(v))a = [1,2,4,5,3,12,12,23,43,52,11,22,22,22]a_mean = np.mean(a)  #均值a_med = np.median(a)  #中位数a_mode = stats.mode(a)[0][0]   # 众数  也是只能返回一个a_mode1 = mode(a)print("a的平均数:",a_mean)print("a的中位数:",a_med)print('a的众数', a_mode, a_mode1)# 频数b = {k: a.count(k) for k in set(a)}b  # {1: 1, 2: 1, 3: 1, 4: 1, 5: 1, 43: 1, 12: 2, 11: 1, 52: 1, 22: 3, 23: 1}# 基于频数这个， 再写一个求众数的， 这个可以返回多个def mode_duo(d):    if len(d) == 0:        return     max_values = max(d.values())   # 找到了众数对应的次数    return [key for key in d if d[key]==max_values] a = [1,2,4,5,3,12,12,23,43,52,11,22,22,22, 1, 1]b = {k: a.count(k) for k in set(a)}mode_duo(b)   # 1 22## 当然还可以转成Series然后求众数， 有多个的话也可以都返回来， 这个是最简单的方式pd.Series(a).mode()

下面看看分位点的情况，把a转成Series，用describe()函数就可以看到分位点：

pd.Series(a).describe()## 结果：count    16.000000mean     14.750000std      15.316658min       1.00000025%       2.75000050%      11.50000075%      22.000000max      52.000000dtype: float64## 还可以借助plt画出箱型图import matplotlib.pyplot as pltplt.boxplot(pd.Series(a))

下面我们再看看如何根据IQR去掉异常值：异常值可以截尾，也可以直接去掉：

"""这里包装了一个异常值处理的代码，可以随便调用"""def outliers_proc(data, col_name, scale=1.5):    """        用于截尾异常值， 默认用box_plot(scale=1.5)进行清洗        param:            data：接收pandas数据格式            col_name: pandas列名            scale: 尺度    """    data_col = data[col_name]    Q1 = data_col.quantile(0.25) # 0.25分位数    Q3 = data_col.quantile(0.75)  # 0,75分位数    IQR = Q3 - Q1        data_col[data_col < Q1 - (scale * IQR)] = Q1 - (scale * IQR)    data_col[data_col > Q3 + (scale * IQR)] = Q3 + (scale * IQR)    return data[col_name] num_data['power'] = outliers_proc(num_data, 'power')

上面是截尾异常值，接收的是pandas的一列，因为有时候异常值多了的话暴力删除可能不太好。当然下面的代码直接删除掉异常值，接收的是一个DataFrame，然后判断有几列都出现异常的时候才删除这个样本。

# 检测异常值并将其舍弃，返回删除的列def detect_and_remove_outliers(df):    """这个方法按列检查异常值，并保存所在的行，如果某个行有两个以上的异常值，就删除该行"""    outliers = []    col = list(df)    #checking interquartile range IQR for all columns    for c in col:        Q1 = df[c].quantile(0.25) # 0.25分位数        Q3 = df[c].quantile(0.75)        IQR = Q3 - Q1        outliers.extend(df[(df[c] < Q1 - (1.5 * IQR)) | (df[c] > Q3 + (1.5 * IQR) )].index)    #returning keys for count of occurrences in the list outlier key value pairs    return  list(k for k,v in Counter(outliers).items() if v >2) remove_list = detect_and_remove_outliers(data)data_remove = data.drop(remove_list, axis=0)

数据离散趋势的度量

表示数据分散(离散，差异)程度的特征量有方差，标准差，极差以及变异系数等。

1. 方差

用来计算每一个变量(观察值)与总体均数之间的差异。实际工作中，总体均数难以得到时，应用样本统计量代替总体参数，经校正后，样本方差计算公式：样本方差的开平方成为样本标准差。

2. 极差

数据越分散，极差越大。 3. 变异系数 是刻画数据相对分散性的一种度量。变异系数只在平均值不为零时有定义，而且一般适用于平均值大于零的情况。变异系数也被称为标准离差率或单位风险。当需要比较两组数据离散程度大小的时候，如果两组数据的测量尺度相差太大，或者数据量纲的不同，变异系数可以消除测量尺度和量纲的影响。

4. 四分位数差

这个上面整理过了，样本上、下四分位数之差称为四分位差(或半极差)。

它也是度量样本分散性的重要数字特征，特别对于具有异常值的数据，它作为分散性具有稳健性。

下面是方差，标准差，变异系数的numpy实现。

a = [1,2,4,5,3,12,12,23,43,52,11,22,22,22]a_var = np.var(a)  #方差a_std1 = np.sqrt(a_var) #标准差a_std2 = np.std(a) #标准差a_mean = np.mean(a)  #均值a_cv =  a_std2 /a_mean #变异系数print("a的方差:",a_var)print("a的方差:",a_std1)print("a的方差:",a_std2)print("a的变异系数:",a_cv)

5. 偏度与峰度

偏度(skewness)：也称为偏态，是统计数据分布偏斜方向和程度的度量，是统计数据分布非对称程度的数字特征。直观看来就是密度函数曲线尾部的相对长度。偏度刻画的是分布函数(数据)的对称性。关于均值对称的数据其偏度系数为0，右侧更分散的数据偏度系数为正，左侧更分散的数据偏度系数为负。样本偏度系数如下：

正态分布的偏度为0，两侧尾部长度对称。
左偏
右偏

峰度(peakedness;kurtosis): 说明的是分布曲线在平均值处峰值高低的特征数。直观看来，峰度反映了峰部的尖度。样本的峰度是和正态分布相比较而言，如果峰度大于三，峰的形状比较尖，比正态分布峰要陡峭。反之亦然。峰度刻画的是分布函数的集中和分散程度。

峰度系数如下：

下面是一波python实现：

data = list(np.random.randn(10000)) #⽣生成标准正态分布的随机数(10000个)plt.hist(data, 1000, facecolor='g', alpha=0.5)   # alpha表示透明度plt.show()s = pd.Series(data) #将数组转化为序列列 print('偏度系数',s.skew())   # 0.0024936359680932723print('峰度系数',s.kurt())   # -0.05970174780792892

结果如下：

写到最后

数理统计是从抽样统计的角度去估计样本的总体分布或未知的规律，首先介绍了数理统计里面的基本概念，例如总体，个体，样本等，然后是统计量与抽样分布，介绍了常用的统计量像均值，方差，标准差，中心距，原点矩等。然后介绍了三个非常重要的抽样分布卡方， T和F。最后是描述性统计这块，介绍了数据集中趋势度量，这里面包括平均数，中位数，众数，频数，百分位数等并给出了numpy实现，然后是离散趋势度量，方差，标准差，极差，四分位点的内容，然后是峰度和偏度的介绍。

本文电子版教程 后台回复 概率统计 获取

“为数学之美点赞↓

【线上故障排查】缓存穿透攻击的识别与布隆过滤器（面试题 + 3 步追问应对 + 案例分析）程序员岳彬从项目到面试：Java 高频面试题场景化通关指南缓存 java 后端 spring boot linux redis
一、高频面试题问题1：什么是缓存穿透？它对系统的核心危害是什么？参考答案：缓存穿透指的是用户请求的数据在缓存和数据库中都不存在，导致请求直接绕过缓存打到数据库。核心危害是大量无效请求会耗尽数据库资源，比如CPU、内存或连接数，严重时可能引发数据库宕机，进而导致整个系统崩溃，影响服务可用性。第一步追问：缓存穿透和缓存雪崩有什么本质区别？参考答案：两者本质不同。缓存穿透是请求不存在的数据，攻击或逻辑漏
CMake基础：条件判断详解
目录1.简介2.核心判断类型及示例2.1.变量相关判断2.2.数值判断2.3.文件/路径判断2.4.目标/组件判断2.5.系统与编译器判断2.6.逻辑组合（与/或/非）2.7.括号分组（优先级控制）2.8.判断某个元素是否在列表中3.常见实用场景4.注意事项相关链接1.简介CMake的条件判断是通过if()/elseif()/else()/endif()结构实现流程控制的核心，常用于根据环境、配置
Coze 实战：如何用自动提示词优化功能提升 AI 应用开发效率？ charles666666 产品经理人工智能自然语言处理
在与多家企业合作开发AI应用项目中，我深感团队提示词质量不稳定的困扰。某次为电商客户打造智能客服项目，初期开发团队撰写的提示词繁杂冗长，AI生成的回答时而偏题、时而重复。由于成员对业务理解不一，提示词质量参差不齐，导致产品交付延迟。这个痛点在中小型企业技术团队中尤为突出。模块1：功能定位解析传统提示工程依赖人工反复调试，如开发团队需手动调整提示词结构。而Coze的自动优化功能则不同。Coze能基于
Gemini vs DeepSeek：Transformer 架构下的技术路线差异与企业级选择 charles666666 transformer 架构深度学习语言模型产品经理人工智能
一、引言：从商业价值切入Gemini和DeepSeek都基于Transformer架构，但在技术路线和应用场景上各有侧重。本文将解密同源Transformer下的技术分野，帮助企业做出更明智的大模型选型决策。二、Transformer核心机制精要Transformer架构是现代大语言模型的基础，其核心机制包括自注意力机制和前馈神经网络。自注意力机制使模型能够捕捉序列中元素的全局依赖关系，但也是GP
沃丰科技和印尼MAP集团战略合作，智能化服务印尼2.8亿消费者沃丰科技科技人工智能大数据
在东南亚零售市场风起云涌之际，印尼综合性零售巨头MAP集团与智能客户服务领域领军企业（Udesk）达成深度战略合作，共同启动一项具有里程碑意义的数字化转型工程——通过AI赋能MAP集团旗下客户忠诚度计划平台，为印尼2.8亿消费者打造全场景、个性化的智能客户服务体验。此次合作不仅标志着印尼零售业智能化升级的加速，更将重塑企业与消费者之间的情感连接。一.MAPClub：零售忠诚度战略要地MAP集团：在
Redis 分布式锁实现与实践佑瞻数据库与知识图谱 redis 分布式数据库
在分布式系统架构中，多个独立进程对共享资源的并发访问控制是常见需求，分布式锁作为解决这一问题的关键技术，在缓存更新、任务调度、库存管理等场景中发挥着重要作用。本文将从基础原理出发，详细阐述基于Redis的分布式锁实现方案，包括单实例模式与Redlock算法，并探讨其在实际应用中的关键考量。分布式锁核心概念分布式锁是一种跨进程、跨机器的同步机制，用于保证多个分布式节点对共享资源的互斥访问。一个可靠的
脑电分析入门指南：信号处理、特征提取与机器学习 Ao000000 信号处理机器学习人工智能
脑电分析入门指南一、为什么要研究脑电1.课题目标（解决什么问题）2.输入与输出二、脑电分析的整体流程三、每一步详解1.数据采集2.预处理3.特征提取4.特征选择/降维5.分类与识别四、研究过程中遇到的挑战与解决方法五、学习感受一、为什么要研究脑电1.课题目标（解决什么问题）本课题旨在通过对脑电（EEG）的采集与分析，提取有用的神经信息，实现对某类脑状或行为的识别/预测/评估。例如：情绪识别、疾病诊
深度解码：企业级 AI 选型中 Gemini 与 DeepSeek 的架构对决 charles666666 人工智能架构语言模型深度学习产品经理机器学习
开篇：技术选型会议中的认知困局当技术团队尝试评估基于MoE（专家混合）架构的Gemini1.5Pro和DeepSeek-V3时，决策者往往陷入认知混乱。尽管两者同属MoE架构，实际测试表现却大相径庭。这种混乱源于对参数规模的盲目崇拜。Gemini1.5Pro拥有1.5万亿参数，而DeepSeek-V3参数规模仅为前者的一半。但在实际企业场景测试中，DeepSeek在中文语义理解任务中的准确率却高出
从 callTool 到思考型调用：月影 Resolver 颠覆传统 MCP 的三板斧 weixin_55007223 月影陪伴智能体 AI编程语言模型人工智能
3ms与2s——这是Resolver用两条完全不同的路径给出的答案。当大多数MCP集成还停留在callTool(…)的机械时代，月影把“工具调用”推进了一格：让语义去找工具，让工具自己组队。这不是一次简单的工程优化，而是我们对“人机协作边界”的一次重新提问。我们相信——工具不只是工具，而是智能的触角；而Resolver，是月影整个意识系统中最冷静、最精准的那个判断节点。结果也在验证这一点：95%日
【动手学深度学习】4.10 实战Kaggle比赛：预测房价 XiaoJ1234567 《动手学深度学习》深度学习人工智能
目录4.10实战Kaggle比赛：预测房价1）数据预处理2）模型定义与训练3）模型评估与预测4）模型训练与预测提交5）示例超参数（可调）4.10实战Kaggle比赛：预测房价数据来源：Kaggle房价预测比赛.1）数据预处理读取数据importpandasaspdtrain_data=pd.read_csv('../data/kaggle_house_pred_train.csv')test_da
【机器学习-08】参数调优宝典：网格搜索与贝叶斯搜索等攻略云天徽上机器学习机器学习人工智能
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
来，C语言刷题(中)（保姆式详解）白子寰 C语言题集 c语言算法
目录关于VS2022调试技巧步骤一步骤二步骤三关于Debug和Release版本区别编程题1.计算求和2.水仙花数3.打印菱形4.喝汽水问题递归题组（1）关于递归的描述（2）打印一个整数的每一位（3）求阶层①递归方式②非递归方式(4)计算一个数的每位之和(5)n的k次方操作符讲解（1）进制位的转化（2）原码，反码，补码（3）按位异或^（4）按位或与&编程题（1）交换两个变量(2)统计二进制中1的个
常见代码试题
指针概念辨析指针-指针得到的是指针和指针值之间的元素个数整形指针解引用访问4个字节指针可以比较大小整形指针+1意味着向后偏移4个字节当使用free释放掉一个指针内容后，指针变量的值不会被更改，需要手动置NULL野指针是指向未分配或者已经释放的内存地址char*p="hello";中p指向字符串第一个元素地址数组指针是指针；指针数组是数组int*fun(inta,intb)与(int*)fun(in
前端如何实现大文件上传行云＆流水 Vue3 前端 typescript 前端
一、基础技术实现文件分片（切片上传）将大文件按固定大小（如2MB/片）切割为多个Blob分片，通过file.slice()实现。优势：避免单次请求超时，支持断点续传。并发控制与异步上传使用Promise.all控制并发，避免浏览器请求阻塞。关键点：上传失败需自动重试。代码实现切片上传importaxiosfrom"axios";import{onMounted}from"vue";function
KTO（Kahneman-Tversky Optimization）技术详解与工程实现 DK_Allen 大模型深度学习 pytorch 人工智能 KTO
KTO（Kahneman-TverskyOptimization）技术详解与工程实现一、KTO核心思想KTO是基于行为经济学前景理论（ProspectTheory）的偏好优化方法，突破传统偏好学习需要成对数据的限制，仅需单样本绝对标注（好/坏）即可优化模型。其创新性在于：损失函数设计：将人类对"收益"和"损失"的非对称心理反应量化数据效率：无需构建偏好对（y_w>y_l），直接利用松散标注二、KT
Spring 进阶-第三十篇：Spring 框架的未来发展与前沿技术融合程序员勇哥 Java全套教程 spring java 后端 SpringBoot spring cloud
Spring进阶-第三十篇：Spring框架的未来发展与前沿技术融合一、云原生技术与Spring1.1Spring对云原生的支持演进Spring与云原生技术的融合经历了从适配到深度整合的过程：早期探索（2015-2018）：通过spring-boot-starter-container等模块初步支持容器化部署，简化Docker镜像构建；推出SpringCloud生态，提供服务注册与发现（Eurek
MySQL 触发器中判断 NULL 值不生效？问题解析与解决方案
前言在MySQL数据库开发中，触发器是一个非常实用的功能，它能在数据表发生插入、更新或删除操作时自动执行指定的逻辑。但在实际使用中，很多开发者会遇到一个棘手的问题：当触发器中涉及NULL值判断时，预期的逻辑往往不生效。本文就来详细分析这一问题的原因，并提供具体的解决方案。一、问题现象：为什么NULL判断在触发器中“失灵”？先来看一个常见的错误示例。假设我们有一张user表，包含name（姓名）和a
常见DDOS攻击方式与防护详解 “萌面大虾” 网络安全 ddos 网络网络安全
常见DDOS攻击方式与防护详解1四层DDOS1.1基于UDP协议的DDOS攻击与防护1.1.1UDPFlood攻击原理：攻击者发送大量UDP协议报文，UDP协议报文是面向无连接的，受害者只能被动接受所有报文，导致业务资源被占用。防护方法1、常见端口限速：如常见DNS、NTP、SNMP等协议均有固定端口，可以对其端口进行阈值限速处理，防止流量过大。2、特征提取过滤：UDP协议报文多为工具输出，具有一
C++ 内存泄漏排查全攻略：万字实战宝典 TravisBytes 编程问题档案 c++开发语言 linux ubuntu
写在前面本文定位为“从入门到精通”的深度教程，全文超过12,000字，结合作者多年在Qt框架、游戏引擎、服务器端及高并发协程框架中的一线经验，系统梳理C++内存泄漏的原理、检测、定位与修复方案。示例代码均可在GCC/Clang/MSVC（C++20标准）下编译通过，并特别对Windows、Linux、macOS三大平台的差异化工具与坑点进行说明。欢迎评论区互动交流～目录1.序章：为什么你迟早会遇到
PostgreSQL 16 Administration Cookbook 读书笔记：第1章 First Steps
本章为PostgreSQL简介及如何用psql和pgAdminGUI连接PostgreSQL。1.PostgreSQL16简介开源，低TCO，30多年持续开发，符合SQL:2023标准，高度可扩展，多模。1.1PostgreSQL有何不同？PostgreSQL的功能集与Oracle或SQLServer的相似度比与MySQL更高。PostgreSQL知名用户包括苹果、巴斯夫、基因泰克、Heroku、
干货分享|手把手教你，用 “扣子” 开发自己的 AI 智能体全栈开发圈人工智能
在当今时代，AI浪潮正以前所未有的态势席卷全球，“颠覆”“变革”等词汇频繁出现在我们的视野中，似乎已经成了老生常谈。当大多数人还沉浸在与大模型愉快聊天的乐趣时，那些走在时代前沿的高手们，早已悄然利用AI智能体（Agent）开启了自动工作、创造价值的新篇章。你是否曾无数次幻想，能拥有一个专属的AI助手？它可以在你毫无头绪时，自动生成精妙绝伦的文案；在时间紧迫的情况下，迅速制作出精美大气的PPT；还能
Spring 生态创新应用：微服务架构设计与前沿技术融合实践七夜zippoe #Java spring 微服务 java
在数字化转型的深水区，企业级应用正面临从“单体架构”向“分布式智能架构”的根本性跃迁。Spring生态以其二十年技术沉淀形成的生态壁垒，已成为支撑这场变革的核心基础设施。从2002年RodJohnson发布《ExpertOne-on-OneJ2EEDesignandDevelopment》奠定的理论基础，到如今覆盖从开发到运维全链路的技术矩阵，Spring始终以“简化开发”为初心，构建出适配不同业
大型语言模型中的提示工程系统综述：技术与应用 AI专题精讲 Paper阅读语言模型人工智能自然语言处理
摘要提示工程已成为扩展大型语言模型（LLMs）和视觉语言模型（VLMs）能力的不可或缺的技术。这种方法利用任务特定的指令（称为prompt），在不修改核心模型参数的情况下增强模型效能。与更新模型参数不同，prompt仅通过给定指令即可引出所需的模型行为，从而实现预训练模型在下游任务中的无缝集成。prompt可以是提供上下文以引导模型的自然语言指令，也可以是激活相关知识的学习向量表示。这一新兴领域已
[C语言初阶]指针初阶
目录一、指针是什么？二、指针与指针类型三、野指针及其避免方法3.1什么是野指针？3.2野指针产生的原因：3.3如何避免野指针？四、指针运算4.1应用：实现strlen函数五、指针与数组六、二级指针七、指针数组指针是C语言的灵魂所在，也是许多初学者感到困惑的概念。本文将带你系统学习指针的基础知识，从指针的本质到指针运算，再到指针与数组的关系，最后介绍二级指针和指针数组的概念。通过本文的学习，你将建立
GNSS+INS：揭秘导航技术中的“黄金组合“奥秘 EriccoShaanxi 技术文章无人机自动驾驶机器人
在导航技术领域，GNSS（全球导航卫星系统）和INS（惯性导航系统）的结合，一直被业界誉为"黄金搭档"。它们优势互补，克服了单一系统的局限性，为高精度、高可靠性的导航提供了完美解决方案。而ER-GNSS/MINS-05低成本组合导航系统的出现，更是让这一"黄金组合"走进了更广泛的应用场景，让高性能导航不再昂贵。GNSS与INS：天生互补的"最佳拍档"GNSS的强项与短板GNSS（如GPS、北斗、G
后端领域的自然语言处理技术应用大厂资深架构师 Spring Boot 开发实战自然语言处理 easyui 人工智能 ai
后端领域的自然语言处理技术应用关键词：后端领域、自然语言处理、技术应用、算法原理、实际案例摘要：本文聚焦于后端领域中自然语言处理技术的应用。首先介绍了相关背景，包括目的范围、预期读者等。接着阐述核心概念与联系，通过文本示意图和Mermaid流程图展示其原理和架构。详细讲解了核心算法原理并给出Python源代码示例，同时介绍了数学模型和公式。通过项目实战，展示代码实际案例并进行详细解释。分析了自然语
期待在 VR 森林体验模拟中实现与森林的 “虚拟复现” ykjhr_3d vr
VR森林体验模拟，无疑是科技与自然领域一次极具开创性意义的奇妙碰撞。它借助前沿的虚拟现实技术，以别出心裁、独树一帜的方式，为我们精心打造并带来了一场前所未有的森林探索奇幻之旅。在教育领域，于中小学的自然科学课堂上，学生们无需长途跋涉，就能通过VR森林体验模拟，身临其境地观察珍稀植物的生长细节，近距离感受森林生态系统的奥秘，极大地激发了他们对自然科学的浓厚兴趣;在专业的林业院校，这一技术更是成为了重
Excalidraw：开源手绘风格白板工具的技术与生态解析 wylee 开源
一、项目定位与核心价值Excalidraw是一款基于浏览器的开源虚拟手绘风格白板工具，由Excalidraw团队开发并维护。项目以MIT协议开源，旨在提供轻量级、高定制性的在线绘图解决方案，适用于流程图设计、原型绘制、教学演示等场景。截至2025年3月，项目已发布v0.18.0版本，月下载量超24.5万次，被GoogleCloud、Meta等企业集成，成为开源协作工具领域的标杆项目。二、核心功能与
Conda安装与使用
目录一、软件安装及conda管理1.conda下载2.miniconda安装二、环境配置1.配置镜像：2.创建环境、移除环境：3.查看小环境4.进入、退出小环境5.查找并安装软件三、一步到位其他：参考资料：一、软件安装及conda管理conda可以来管理大量的生物信息学软件，或者想要复现一些文章中的实验结果需要不同环境的切换。1.conda下载（1）anacondaanaconda|镜像站使用帮助
富集分析——GO、KEGG ersanshi055 生信小菜鸟富集分析 GO kegg
一、富集分析的基础认知在生物信息学研究领域，基因功能解析及通路阐释是众多分析流程中的关键环节，富集分析（EnrichmentAnalysis）是将基因或蛋白列表按照功能进行分类的统计方法，目的是找出在特定基因集中显著富集的功能类别或通路。通过这种方法，研究人员可以理解一组基因（如差异表达基因）在哪些生物学过程、分子功能或通路中代表。1.富集分析分类基因本体论富集分析（GeneOntologyEnr
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$

python实现概率论与数理统计_机器学习数学基础：数理统计与描述性统计

数理统计基础

描述性统计

写到最后

你可能感兴趣的:(python实现概率论与数理统计_机器学习数学基础：数理统计与描述性统计)