jasonfreak

使用Python进行描述性统计

1 描述性统计是什么？
2 使用NumPy和SciPy进行数值分析
　　2.1 基本概念
　　2.2 中心位置（均值、中位数、众数）
　　2.3 发散程度（极差，方差、标准差、变异系数）
　　2.4 偏差程度（z-分数）
　　2.5 相关程度（协方差，相关系数）
　　2.6 回顾
3 使用Matplotlib进行图分析
　　3.1 基本概念
　　3.2 频数分析
　　　　3.2.1 定性分析（柱状图、饼形图）
　　　　3.2.2 定量分析（直方图、累积曲线）
　　3.3 关系分析（散点图）
　　3.4 探索分析（箱形图）
　　3.5 回顾
4 总结
5 参考资料

1 描述性统计是什么？

　　描述性统计是借助图表或者总结性的数值来描述数据的统计手段。数据挖掘工作的数据分析阶段，我们可借助描述性统计来描绘或总结数据的基本情况，一来可以梳理自己的思维，二来可以更好地向他人展示数据分析结果。数值分析的过程中，我们往往要计算出数据的统计特征，用来做科学计算的NumPy和SciPy工具可以满足我们的需求。Matpotlob工具可用来绘制图，满足图分析的需求。

2 使用NumPy和SciPy进行数值分析

2.1 基本概念

　　与Python中原生的List类型不同，Numpy中用ndarray类型来描述一组数据：

 1 from numpy import array
 2 from numpy.random import normal, randint
 3 #使用List来创造一组数据
 4 data = [1, 2, 3]
 5 #使用ndarray来创造一组数据
 6 data = array([1, 2, 3])
 7 #创造一组服从正态分布的定量数据
 8 data = normal(0, 10, size=10)
 9 #创造一组服从均匀分布的定性数据
10 data = randint(0, 10, size=10)

2.2 中心位置（均值、中位数、众数）

　　数据的中心位置是我们最容易想到的数据特征。借由中心位置，我们可以知道数据的一个平均情况，如果要对新数据进行预测，那么平均情况是非常直观地选择。数据的中心位置可分为均值（Mean），中位数（Median），众数（Mode）。其中均值和中位数用于定量的数据，众数用于定性的数据。

　　对于定量数据（Data）来说，均值是总和除以总量（N），中位数是数值大小位于中间（奇偶总量处理不同）的值：

　　均值相对中位数来说，包含的信息量更大，但是容易受异常的影响。使用NumPy计算均值与中位数：

1 from numpy import mean, median
2 
3 #计算均值
4 mean(data)
5 #计算中位数
6 median(data)

　　对于定性数据来说，众数是出现次数最多的值，使用SciPy计算众数：

1 from scipy.stats import mode
2 
3 #计算众数
4 mode(data)

2.3 发散程度（极差、方差、标准差、变异系数）

　　对数据的中心位置有所了解以后，一般我们会想要知道数据以中心位置为标准有多发散。如果以中心位置来预测新数据，那么发散程度决定了预测的准确性。数据的发散程度可用极差（PTP）、方差（Variance）、标准差（STD）、变异系数（CV）来衡量，它们的计算方法如下：

　　极差是只考虑了最大值和最小值的发散程度指标，相对来说，方差包含了更多的信息，标准差基于方差但是与原始数据同量级，变异系数基于标准差但是进行了无量纲处理。使用NumPy计算极差、方差、标准差和变异系数：

 1 from numpy import mean, ptp, var, std
 2 
 3 #极差
 4 ptp(data)
 5 #方差
 6 var(data)
 7 #标准差
 8 std(data)
 9 #变异系数
10 mean(data) / std(data)

2.4 偏差程度（z-分数）

　　之前提到均值容易受异常值影响，那么如何衡量偏差，偏差到多少算异常是两个必须要解决的问题。定义z-分数（Z-Score）为测量值距均值相差的标准差数目：

　　当标准差不为0且不为较接近于0的数时，z-分数是有意义的，使用NumPy计算z-分数：

1 from numpy import mean, std
2 
3 #计算第一个值的z-分数
4 (data[0]-mean(data)) / std(data)

　　通常来说，z-分数的绝对值大于3将视为异常。

2.5 相关程度

　　有两组数据时，我们关心这两组数据是否相关，相关程度有多少。用协方差（COV）和相关系数（CORRCOEF）来衡量相关程度：

　　协方差的绝对值越大表示相关程度越大，协方差为正值表示正相关，负值为负相关，0为不相关。相关系数是基于协方差但进行了无量纲处理。使用NumPy计算协方差和相关系数：

 1 from numpy import array, cov, corrcoef
 2 
 3 data = array([data1, data2])
 4 
 5 #计算两组数的协方差
 6 #参数bias=1表示结果需要除以N，否则只计算了分子部分
 7 #返回结果为矩阵，第i行第j列的数据表示第i组数与第j组数的协方差。对角线为方差
 8 cov(data, bias=1)
 9 
10 #计算两组数的相关系数
11 #返回结果为矩阵，第i行第j列的数据表示第i组数与第j组数的相关系数。对角线为1
12 corrcoef(data)

2.6 回顾

包	方法	说明
numpy	array	创造一组数
numpy.random	normal	创造一组服从正态分布的定量数
numpy.random	randint	创造一组服从均匀分布的定性数
numpy	mean	计算均值
numpy	median	计算中位数
scipy.stats	mode	计算众数
numpy	ptp	计算极差
numpy	var	计算方差
numpy	std	计算标准差
numpy	cov	计算协方差
numpy	corrcoef	计算相关系数

3 使用Matplotlib进行图分析

3.1 基本概念

　　使用图分析可以更加直观地展示数据的分布（频数分析）和关系（关系分析）。柱状图和饼形图是对定性数据进行频数分析的常用工具，使用前需将每一类的频数计算出来。直方图和累积曲线是对定量数据进行频数分析的常用工具，直方图对应密度函数而累积曲线对应分布函数。散点图可用来对两组数据的关系进行描述。在没有分析目标时，需要对数据进行探索性的分析，箱形图将帮助我们完成这一任务。

　　在此，我们使用一组容量为10000的男学生身高，体重，成绩数据来讲解如何使用Matplotlib绘制以上图形，创建数据的代码如下：

 1 from numpy import array
 2 from numpy.random import normal
 3 
 4 def genData():
 5     heights = []
 6     weights = []
 7     grades = []
 8     N = 10000
 9 
10     for i in range(N):
11         while True:
12             #身高服从均值172，标准差为6的正态分布
13             height = normal(172, 6)
14             if 0 < height: break
15         while True:
16             #体重由身高作为自变量的线性回归模型产生，误差服从标准正态分布
17             weight = (height - 80) * 0.7 + normal(0, 1)
18             if 0 < weight: break
19         while True:
20             #分数服从均值为70，标准差为15的正态分布
21             score = normal(70, 15)
22             if 0 <= score and score <= 100:
23                 grade = 'E' if score < 60 else ('D' if score < 70 else ('C' if score < 80 else ('B' if score < 90 else 'A')))
24                 break
25         heights.append(height)
26         weights.append(weight)
27         grades.append(grade)
28     return array(heights), array(weights), array(grades)
29 
30 heights, weights, grades = genData()

View Code

3.2 频数分析

3.2.1 定性分析（柱状图、饼形图）

　　柱状图是以柱的高度来指代某种类型的频数，使用Matplotlib对成绩这一定性变量绘制柱状图的代码如下：

 1 from matplotlib import pyplot
 2 
 3 #绘制柱状图
 4 def drawBar(grades):
 5     xticks = ['A', 'B', 'C', 'D', 'E']
 6     gradeGroup = {}
 7     #对每一类成绩进行频数统计
 8     for grade in grades:
 9         gradeGroup[grade] = gradeGroup.get(grade, 0) + 1
10     #创建柱状图
11     #第一个参数为柱的横坐标
12     #第二个参数为柱的高度
13     #参数align为柱的对齐方式，以第一个参数为参考标准
14     pyplot.bar(range(5), [gradeGroup.get(xtick, 0) for xtick in xticks], align='center')
15 
16     #设置柱的文字说明
17     #第一个参数为文字说明的横坐标
18     #第二个参数为文字说明的内容
19     pyplot.xticks(range(5), xticks)
20 
21     #设置横坐标的文字说明
22     pyplot.xlabel('Grade')
23     #设置纵坐标的文字说明
24     pyplot.ylabel('Frequency')
25     #设置标题
26     pyplot.title('Grades Of Male Students')
27     #绘图
28     pyplot.show()
29 
30 drawBar(grades)

　　绘制出来的柱状图的效果如下：

　　而饼形图是以扇形的面积来指代某种类型的频率，使用Matplotlib对成绩这一定性变量绘制饼形图的代码如下：

 1 from matplotlib import pyplot
 2 
 3 #绘制饼形图
 4 def drawPie(grades):
 5     labels = ['A', 'B', 'C', 'D', 'E']
 6     gradeGroup = {}
 7     for grade in grades:
 8         gradeGroup[grade] = gradeGroup.get(grade, 0) + 1
 9     #创建饼形图
10     #第一个参数为扇形的面积
11     #labels参数为扇形的说明文字
12     #autopct参数为扇形占比的显示格式
13     pyplot.pie([gradeGroup.get(label, 0) for label in labels], labels=labels, autopct='%1.1f%%')
14     pyplot.title('Grades Of Male Students')
15     pyplot.show()
16 
17 drawPie(grades)

　　绘制出来的饼形图效果如下：

3.2.2 定量分析（直方图、累积曲线）

　　直方图类似于柱状图，是用柱的高度来指代频数，不同的是其将定量数据划分为若干连续的区间，在这些连续的区间上绘制柱。使用Matplotlib对身高这一定量变量绘制直方图的代码如下：

 1 from matplotlib import pyplot
 2 
 3 #绘制直方图
 4 def drawHist(heights):
 5     #创建直方图
 6     #第一个参数为待绘制的定量数据，不同于定性数据，这里并没有事先进行频数统计
 7     #第二个参数为划分的区间个数
 8     pyplot.hist(heights, 100)
 9     pyplot.xlabel('Heights')
10     pyplot.ylabel('Frequency')
11     pyplot.title('Heights Of Male Students')
12     pyplot.show()
13 
14 drawHist(heights)

　　直方图对应数据的密度函数，由于身高变量是属于服从正态分布的，从绘制出来的直方图上也可以直观地看出来：

　　使用Matplotlib对身高这一定量变量绘制累积曲线的代码如下：

 1 from matplotlib import pyplot
 2 
 3 #绘制累积曲线
 4 def drawCumulativeHist(heights):
 5     #创建累积曲线
 6     #第一个参数为待绘制的定量数据
 7     #第二个参数为划分的区间个数
 8     #normed参数为是否无量纲化
 9     #histtype参数为'step'，绘制阶梯状的曲线
10     #cumulative参数为是否累积
11     pyplot.hist(heights, 20, normed=True, histtype='step', cumulative=True)
12     pyplot.xlabel('Heights')
13     pyplot.ylabel('Frequency')
14     pyplot.title('Heights Of Male Students')
15     pyplot.show()
16 
17 drawCumulativeHist(heights)

　　累积曲线对应数据的分布函数，由于身高变量是属于服从正态分布的，从绘制出来的累积曲线图上也可以直观地看出来：

3.3 关系分析（散点图）

　　在散点图中，分别以自变量和因变量作为横纵坐标。当自变量与因变量线性相关时，在散点图中，点近似分布在一条直线上。我们以身高作为自变量，体重作为因变量，讨论身高对体重的影响。使用Matplotlib绘制散点图的代码如下：

from matplotlib import pyplot

#绘制散点图
def drawScatter(heights, weights):
    #创建散点图
    #第一个参数为点的横坐标
    #第二个参数为点的纵坐标
    pyplot.scatter(heights, weights)
    pyplot.xlabel('Heights')
    pyplot.ylabel('Weights')
    pyplot.title('Heights & Weights Of Male Students')
    pyplot.show()

drawScatter(heights, weights)

　　我们在创建数据时，体重这一变量的确是由身高变量通过线性回归产生，绘制出来的散点图如下：

3.4 探索分析（箱形图）

　　在不明确数据分析的目标时，我们对数据进行一些探索性的分析，通过我们可以知道数据的中心位置，发散程度以及偏差程度。使用Matplotlib绘制关于身高的箱形图的代码如下：

 1 from matplotlib import pyplot
 2 
 3 #绘制箱形图
 4 def drawBox(heights):
 5     #创建箱形图
 6     #第一个参数为待绘制的定量数据
 7     #第二个参数为数据的文字说明
 8     pyplot.boxplot([heights], labels=['Heights'])
 9     pyplot.title('Heights Of Male Students')
10     pyplot.show()
11 
12 drawBox(heights)

　　绘制出来的箱形图中，包含3种信息：

Q2所指的红线为中位数
Q1所指的蓝框下侧为下四分位数，Q3所指的蓝框上侧为上四分位数，Q3-Q1为四分为差。四分位差也是衡量数据的发散程度的指标之一。
上界线和下界线是距离中位数1.5倍四分位差的线，高于上界线或者低于下界线的数据为异常值。

3.5 回顾

方法	说明
bar	柱状图
pie	饼形图
hist	直方图&累积曲线
scatter	散点图
boxplot	箱形图
xticks	设置柱的文字说明
xlabel	横坐标的文字说明
ylabel	纵坐标的文字说明
title	标题
show	绘图

4 总结

　　描述性统计是容易操作，直观简洁的数据分析手段。但是由于简单，对多元变量的关系难以描述。现实生活中，自变量通常是多元的：决定体重不仅有身高，还有饮食习惯，肥胖基因等等因素。通过一些高级的数据处理手段，我们可以对多元变量进行处理，例如特征工程中，可以使用互信息方法来选择多个对因变量有较强相关性的自变量作为特征，还可以使用主成分分析法来消除一些冗余的自变量来降低运算复杂度。

5 参考资料

描述性统计
使用NumPy进行科学计算

不要再让 import“占领满屏“啦？常威和来福回忆 react.js 前端前端框架
javascript代码解读复制代码//不使用重导importModalfrom'@arco-design/web-react/es/Modal'importCheckboxfrom'@arco-design/web-react/es/Checkbox'importMessagefrom'@arco-design/web-react/es/Message'...//使用模块重导import{Mod
并发设计_第八章_《C++并发编程实战》笔记郭涤生 #并发线程 c/c++c++并发编程
并发设计1.线程间工作划分（工作窃取）2.性能优化（伪共享与缓存行对齐）3.设计并发数据结构（无锁队列）4.多选题目5.多选题目答案4.设计题目5.设计题目参考答案1.线程间工作划分（工作窃取）概念：使用工作窃取（WorkStealing）策略平衡负载。空闲线程从其他线程的任务队列尾部“偷”任务执行，减少闲置线程。代码示例：线程池实现工作窃取队列#include#include#include#i
多线程程序的测试和调试_第11章_《C++并发编程实战》笔记郭涤生 #并发线程 c/c++c++笔记并发编程
多线程程序的测试和调试1.并发相关Bug的核心类型1.1数据竞争（DataRace）1.2死锁（Deadlock）1.3活锁（Livelock）2.定位并发Bug的技巧3.代码优化与修复示例3.1修复数据竞争（使用原子操作）3.2避免死锁（统一锁顺序）4.总结5.多选题目及答案6.设计题目7.设计题目参考答案1.并发相关Bug的核心类型1.1数据竞争（DataRace）定义：多线程同时访问共享数据
Python --itertools中accumulate函数详细讲解何等样仁算法与数据结构 python 开发语言
1.1前言：本文将详细讲解itertools中的accumulate，accumulate函数可以在前缀和中运用，否则就需要每次移动的时候维护一个前缀和，大家如果不知道前缀和也可以先了解一下前缀和，前缀和可以解决数组区间和查询问题、矩阵区域和查询问题、连续子数组和问题、最大子段和问题、最大子矩阵和问题这里，但是如果大家不太了解前缀和也可以放心食用，因为运用这个累加函数其实十分简单。1.2定义：it
NAT NAPT 23级二本计科网络服务器运维
NATNAT（NetworkAddressTranslation，网络地址转换）主要用于在不同网络（如私有网络和公共互联网）之间进行IP地址转换，解决IP地址短缺问题，并提供一定的安全性。IPv4地址是32位（最多2^32≈43亿个地址），但全球设备数量远超这个范围。私有IP地址（如192.168.1.0/24）不能直接在公网使用，必须通过NAT转换成公网IP。NATIP转换过程当主机A私有IP地
C# WPF入门学习主线篇（二十四）—— 数据绑定基础 Ice bear433 学习 C#WPF c#wpf 学习
C#WPF入门学习主线篇（二十四）——数据绑定基础数据绑定是WPF的重要特性之一，它允许UI元素和数据源之间建立连接，从而实现数据的自动更新和显示。通过数据绑定，开发者可以减少大量的手动更新代码，使应用程序更具响应性和可维护性。本篇博客将详细介绍WPF数据绑定的基础知识，包括单向绑定、双向绑定、绑定路径和数据上下文。1.数据绑定基础数据绑定是指将控件的属性与数据源进行连接，使得控件的显示内容和数据
C语言入门（大一笔记）函数篇考不上贰幺幺不改名 C语言笔记 c语言程序设计编程语言
第七章C语言函数前言一、基础知识点7.1什么是函数？概念我们将常用的代码以固定的格式封装（包装）成一个独立的模块，只要知道这个模块的名字就可以重复使用它，这个模块就叫做函数（Function）。用比较字符串大小的函数讲解函数的封装以及一些注意事项。库函数和自定义函数C语言自带的函数称为库函数（LibraryFunction）。库（Library）是编程中的一个基本概念，可以简单地认为它是一系列函数
php mysql中几个版本的进化史_PHP 进化史 — 从 v5.6 到 v8.0 插门胡的小背心 php mysql中几个版本的进化史
在此篇文章中，我们将用15分钟对PHPv7.x版本更改进行简要回顾。PHP7.3版本发布后，为了更好地理解这门广泛流行的编程语言的新特性和优化之处，我决定详细地研究下PHP开发：正在开发什么以及其开发方向。在查看了PHP在PHP7.x版本开发过程中实现的一系列特性的简要列表之后，我决定自己整合这个列表作为一个很好的补充，我相信也会有人觉得有用的。我们将从PHP5.6作为基准开始，研究添加或者更改了
文件关键字搜索技术要点与实战体制教科书
本文还有配套的精品资源，点击获取简介：在IT行业中，能够通过输入关键字高效定位和管理大量文档是一项重要的技能。此功能通常集成于文件管理软件、搜索引擎或脚本程序中。技术实现包括文件系统API、文本搜索算法和文件过滤规则。本文将详细介绍这些技术要点，例如使用文件系统API遍历文件、采用高效文本搜索算法（如Boyer-Moore）以及应用文件过滤规则（包括类型筛选和正则表达式匹配）。特殊文件格式如Out
python中很常用的10个内置函数整理（初学必备）程序员七海网络安全程序员黑客 python 网络 windows linux 数据库开源服务器
对于初学Python的小伙伴们来说，掌握内置常用函数是学好Python的重要一步。这些函数不仅能让你的代码更加简洁，还可以提高编程效率。本笔记将为大家整理62个Python中最常用的内置函数，并且给出了一些简单的示例，帮助大家更好地理解和运用这些函数。这些内置函数是Python编程的基础，对于初学者来说，理解和掌握它们是非常重要的。通过实践和运用这些函数，你将能够更加高效地编写Python代码，并
保姆级教学——本地免费部署DeepSeek-R1模型并通过Python调用 shuaige_shiwoa python+AI python 开发语言 AI编程 ai
以下是如何在本地免费部署DeepSeek-R1模型并通过Python调用的详细指南：一、环境准备（Windows/Linux/Mac通用）1.硬件要求最低配置：16GB内存+20GB可用磁盘空间推荐配置：NVIDIAGPU（显存≥8GB）+CUDA11.8（CPU模式支持但速度较慢）2.软件依赖#创建虚拟环境（可选但推荐）condacreate-ndeepseekpython=3.10condaa
ChromeDriver介绍和使用 Chen_Chance chrome
什么是ChromeDriver？ChromeDriver是一个用于在自动化测试中控制GoogleChrome浏览器的工具。它是SeleniumWebDriver的一部分，可以让开发者通过编程的方式操作浏览器进行各种测试。ChromeDriver充当了WebDriver和Chrome浏览器之间的桥梁，使得测试脚本能够与浏览器交互。为什么使用ChromeDriver？在现代软件开发中，确保网页在不同浏
LeetCode HOT 100 —— 146.LRU缓存 HDU-五七小卡 LeetCode 热题 HOT 100 leetcode 缓存链表
题目请你设计并实现一个满足LRU(最近最少使用)缓存约束的数据结构。实现LRUCache类：LRUCache(intcapacity)以正整数作为容量capacity初始化LRU缓存intget(intkey)如果关键字key存在于缓存中，则返回关键字的值，否则返回-1。voidput(intkey,intvalue)如果关键字key已经存在，则变更其数据值value；如果不存在，则向缓存中插入该
C C++ 为什么称为Native代码、虚拟机 TO_ZRG c++开发语言
CC++为什么称为Native代码，为什么要快1.直接编译为机器码无需中间层：C/C++代码通过编译器（如GCC、Clang）直接编译为CPU可执行的机器码（二进制指令），运行时无需虚拟机（如JVM）或解释器（如Python解释器）的介入。减少运行时开销：相比Java、C#等需要运行时环境（JIT编译）的语言，C/C++的执行路径更短，避免了中间层的性能损耗。2.底层硬件访问能力直接操作硬件：C/
leetcode hot100【LeetCode 146. LRU缓存】java实现 DataCrafter LeetCode Hot100 leetcode 缓存 java 链表
LeetCode146.LRU缓存题目描述设计和实现一个LRU(LeastRecentlyUsed)缓存机制。它应该支持以下操作：get(key)：如果缓存中存在key，则返回value，否则返回-1。put(key,value)：如果缓存已满，移除最久未使用的项，然后插入新的key-value对。如果key已存在，则更新其value。Java实现解法解法：使用哈希表和双向链表importjava
用C++代码利用std::filesystem库写入一个文件路径到数据库中新兴AI民工 C++编程实战大杂烩 c++数据库 filesystem 转移字符处理
使用C++代码写数据库不是什么麻烦事，但是和成熟的JAVA体系不一样，C++没有那么多成熟的数据库操作，比如mybatis等等。而且C++一般来说也不会用于写业务软件，不会用比较重的三方库。所以有时用C++代码来直接操作数据库，碰到的一个问题是：在一张数据库表中定义了一个字段：filePathvarchar2(100)需求是将一个形如：c:\test\test.log这样的文件名写入到该字段。本来
LeetCode Hot100 LRU缓存 m0_67582670 leetcode leetcode 缓存 c++
请你设计并实现一个满足LRU(最近最少使用)缓存约束的数据结构。实现LRUCache类：LRUCache(intcapacity)以正整数作为容量capacity初始化LRU缓存intget(intkey)如果关键字key存在于缓存中，则返回关键字的值，否则返回-1。voidput(intkey,intvalue)如果关键字key已经存在，则变更其数据值value；如果不存在，则向缓存中插入该组k
LeetCode 热题 HOT 100 第四十七天 146. LRU 缓存中等题用python3求解阿舒带你学编程面试学习路线阿里巴巴缓存 leetcode 链表面试 java-ee
题目地址请你设计并实现一个满足LRU(最近最少使用)缓存约束的数据结构。实现LRUCache类：LRUCache(intcapacity)以正整数作为容量capacity初始化LRU缓存intget(intkey)如果关键字key存在于缓存中，则返回关键字的值，否则返回-1。voidput(intkey,intvalue)如果关键字key已经存在，则变更其数据值value；如果不存在，则向缓存中插
Unity打包程序嵌入WinForm或者WPF(2) 问题 llhswwha Unity
嵌入方式两种，官方的-parentHandle和我的WinAPI嵌入。问题1.主程序卡死[-parentHandle]:主程序打开3D后，切换到其他程序，再切换回来，卡死。[WinAPI]:主程序打开3D后，过一段时间卡死。其实这里的打开的Unity程序也算是其他程序了。这个问题结果发现是主程序其他部分导致的。问题2.嵌入Unity的控件隐藏后，GPU使用率达到99%。所谓的Unity控件隐藏是指
win10快捷键冲突检测与解决方法 H.ZWei 开发工具的那些事快捷键检测快捷键冲突热键冲突
文章目录背景安装与使用背景相信很多人都遇到过，在使用一个快捷键时会经常与其他软件产生冲突，事与愿违；而且又很难找到是与哪个软件产生了冲突。有一款工具可以帮我们定位到目前的快捷键在哪个软件，这样就可以到对应的软件上把这个热键删除或者改成其他，避免热键冲突。安装与使用FindGlobalHotkey下载链接提取码：mxok下载解压即可使用如果需要检查某个快捷键被使用了，直接FindGlobalHotk
在Android Studio中通过CMake实现交叉编译生成动态so文件 H.ZWei Android NDK android studio android Android NDK CMake 动态so文件交叉编译
文章目录NDK工具链基本步骤CMake配置文件aux_source_directoryinclude_directorieslink_directoriesadd_librarytarget_link_libraries将CMake配置文件依赖到Gradle中交叉编译生成动态库参考NDK工具链最近项目上需要将微信语音silk文件格式进行编解码，在silk、PCM、AMR、MP3间进行格式转换，将s
Python爬虫-请求模块urllib3 andyyah晓波 python 爬虫开发语言
Python爬虫-请求模块urllib3urllib3是一个功能强大、条理清晰，用于HTTP客户端的第三方模块，许多Python的原生系统已经开始使用urllib3。urllib3提供了很多Python标准库里所没有的重要特性：线程安全。连接池。客户端SSL/TLS验证。使用multipart编码上传文件。Helpers用于重试请求并处理HTTP重定向。支持gzip和deflate编码。支持HTT
Python爬虫-请求模块Urllib andyyah晓波 python 爬虫开发语言
Python爬虫-请求模块UrllibPython3中的Urllib模块中包含多个功能的子模块，具体内容如下：urllib.request：用于实现基本HTTP请求的模块。urllib.error：异常处理模块，如果在发送网络请求时出现了错误，可以捕获异常进行异常的有效处理。urllib.parse：用于解析URL的模块。urllib.robotparser：用于解析robots.txt文件，判断
python自制MBTI 16型人格测试1.0 LHTZ python 开发语言娱乐
什么是16型人格测试16型人格测试也叫MBTI（Myers-BriggsTypeIndicator）测试，它是一种基于心理学理论的人格测评工具。这个理论最初是由凯瑟琳・库克・布里格斯（KatharineCookBriggs）和她的女儿伊莎贝尔・布里格斯・迈尔斯（IsabelBriggsMyers）在20世纪40年代开发的。它的理论基础是瑞士心理学家卡尔・荣格（CarlJung）的心理类型理论。MB
Python常用函数及常用库整理 Nicholson07 python
简单整理一下一些常用函数，方便自己查阅。目录文件操作文件夹/目录文件数据格式链表类特殊函数一些常用函数常用库tqdm进度条库tqdm模块参数说明常用函数使用方法yacs参数配置库简介使用方法logging日志库使用方法文件操作文件夹/目录importos1、os.path.exists(path)判断一个文件/目录是否存在，只要存在相匹配的文件或目录就返回True，因此当目录与文件同名时可能报错2
LLM大语言模型书籍：《大模型时代》开启人工智能狂潮！（附文档） Langchain 人工智能 prompt chatgpt ai大模型 LLM 大语言模型大模型时代
哈喽大家好！很久都没有更新大模型这块的书了，今天给大家说一下这本：《大模型时代》，本书对大模型时代的技术、应用和产业变化进行了深入的分析和阐述。近2年GPT风靡全球，然而真正的智慧“心脏”却是大型语言模型（LargeLanguageModel）！生成式大型模型正引领我们进入一个崭新的时代。《本书》深入探讨了大型模型时代的技术演进、应用场景和产业变革。生动地阐释了ChatGPT背后的工作原理，深入解
C#WPF的相关知识点 Documentlv C#wpf c#开发语言 windows
学习C#WPF的路线了解C#编程基础熟悉WPF界面设计原理掌握WPF控件的使用学习数据绑定和MVVM架构深入理解WPF动画和转换效果学习WPF中的多媒体和图形绘制掌握WPF中的布局和控件模板学习WPF中的自定义控件和样式了解C#编程基础如果你想开始学习C#编程语言，这里是一些关键的基础知识，可以帮助你快速上手。C#是什么C#是一种通用的、面向对象的编程语言，由微软公司开发。它在.NET框架上运行，
郝斌C语言_分支；循环；数组；函数；运算符(笔记) sugario C c语言笔记
笔记目录前言一、选择_If1.求分数等级2.互换两个数字3.对任意三个数字进行排序4.看懂/掌握一个程序5.If常见问题二、选择_Switch三、循环_for1. 1+2+...+1002. 1~10的奇数之和3.For与If的嵌套使用_被3整除的数字之和4.For与If的嵌套使用_斐波拉契序列5.强制类型转换6. 1/1+1/2+...+1/1007.试数举例_18.浮点数存储9.多层For循环
如何在Python中安装itchat\n介绍\n在Python中安装itchat可以帮助你实现微信的自动化操作，比如发送消息、接收消息等。本文将帮助你学习如何在Python中安装itchat。拉保小跑博客竞赛 python 计算机网络 python 开发语言学习
如何在Python中安装itchat\n介绍\n在Python中安装itchat可以帮助你实现微信的自动化操作，比如发送消息、接收消息等。本文将帮助你学习如何在Python中安装itchat。\n\n整体流程\n下面是安装itchat的整体流程：\n\n2022-10-01\n2022-10-02\n2022-10-02\n2022-10-03\n2022-10-03\n2022-10-04\n2
Python中很常用的100个函数整理请为小H留灯 python中函数 python 开发语言
Python内置函数提供了强大的工具，涵盖数据处理、数学运算、迭代控制、类型转换等。本文总结了100个常用内置函数，并配备示例代码，提高编程效率。1.abs()取绝对值print(abs(-10)) #102.all()判断所有元素是否为真print(all([True,1,"hello"])) #Trueprint(all([True,0,"hello"])) #False3.any()判断任意
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文