云流寂川

kaggle竞赛——桑坦德银行客户满意度预测（二）

桑坦德银行客户满意度预测

探索性数据分析（二）
- 分析带关键词前缀的特征
- - var前缀特征
  - imp特征
  - saldo特征
  - num特征
  - ind特征

探索性数据分析（二）

分析带关键词前缀的特征

var前缀特征

在上一章中我们对主要的var特征进行过分析，现在我们可以看看var关键字特征有哪些

import re
[col for col in train.columns if col[:3] == 'var']

['var3', 'var15', 'var36', 'var21', 'var38', 'var15_below_23']

其中，var15_below_23是我们新创建的特征，代表用户是否小于23岁。那除了var关键字，是否还有其他的关键字呢？

f_keywords = {col.split('_')[0] for col in train.columns if (len(col.split('_')) > 1) &~ ('var15' in col)}#&~:满足前面但不满足后面
f_keywords

结果如下：

{'imp', 'ind', 'num', 'saldo'}

# 计算每种关键词前缀特征的计数
f_keywords = zip(f_keywords, np.zeros(len(f_keywords),dtype=int))
f_keywords = dict(f_keywords)
for key in f_keywords.keys():
    for col in train.columns:
        if key in col:
            f_keywords[key] += 1
f_keywords

关键字及其包含特征数如下：

key	value
ind	32
num	64
imp	14
saldo	26

我们用直方图来直观的展示这个列表：

k = pd.Series(f_keywords)
ax = sns.barplot(x=k.index,y=k.values)
plt.title('特征关键词前缀的频数分布')
plt.ylabel('频数')
plt.xlabel('关键词前缀')
plt.show()

接下来我们先来分析特征最少的imp关键字特征。

imp特征

我们先来查看imp特征有哪些

imp = [col for col in train.columns if 'imp' in col]
imp

['imp_ent_var16_ult1',
 'imp_op_var39_comer_ult1',
 'imp_op_var39_comer_ult3',
 'imp_op_var41_comer_ult1',
 'imp_op_var41_comer_ult3',
 'imp_op_var41_efect_ult1',
 'imp_op_var41_efect_ult3',
 'imp_op_var41_ult1',
 'imp_op_var39_efect_ult1',
 'imp_op_var39_efect_ult3',
 'imp_op_var39_ult1',
 'imp_aport_var13_hace3',
 'imp_var43_emit_ult1',
 'imp_trans_var37_ult1']

共有14个特征，由于逐一分析难度较大且同一关键字特征的分布应该存在共性，所以我们随机选取其中一个进行分析。

random.seed(a = 0)
print('被随机选择中的imp特征：%s' % (random.sample(imp,1)))

被随机选择中的imp特征：imp_trans_var37_ult1
接下来我们查询出特征的最小值和最大值，并绘制它的频数分布直方图。

col = 'imp_trans_var37_ult1'
print("训练集中 saldo_medio_var13_corto_ult3 最小值为：%i，最大值为：%i" % (train[col].min(), train[col].max()))
print("测试集中 saldo_medio_var13_corto_ult3 最小值为：%i，最大值为：%i" % (test[col].min(), test[col].max()))
# 绘制特定列的频数分布折线图
valuecounts_plot(train=train, test=test, col=col)

训练集特征'imp_trans_var37_ult1'其值占比(top 5): 
值	 占比%
0.0       87.069192
300.0      0.536701
600.0      0.420942
1500.0     0.361747
150.0      0.344646
Name: imp_trans_var37_ult1, dtype: float64

训练集特征'imp_trans_var37_ult1'其值占比(bottom 5): 
值	 占比%
2.37       0.001315
4171.68    0.001315
7881.96    0.001315
4740.00    0.001315
792.81     0.001315
Name: imp_trans_var37_ult1, dtype: float64

测试集特征'imp_trans_var37_ult1'其值占比(top 5): 
值	 占比%
0.0       87.235221
300.0      0.563191
600.0      0.465589
1500.0     0.391728
3000.0     0.319185
Name: imp_trans_var37_ult1, dtype: float64

测试集特征'imp_trans_var37_ult1'其值占比(bottom 5): 
值	 占比%
3309.84     0.001319
662.88      0.001319
2206.53     0.001319
5576.19     0.001319
10938.60    0.001319
Name: imp_trans_var37_ult1, dtype: float64

分析以上图表我们可以知道，大约87%的训练数据和测试数据都为0
由于大部分0值的存在，非0值的分布情况我们观察不清楚，所以接下来我们排除0值，将非0值的频数分布绘制出来

valuecounts_plot(train=train[train[col] != 0],test=test[test[col] != 0],col=col)

我们可以发现，对于该特征，绝大多数的非零值都在500000之内且非零值呈现出一定的右偏分布且其他的imp特征也有类似的规律。所以我们可以考虑：将imp特征的零值不变，非零值进行对数变换使之接近正态分布。

df = train[train[col] != 0]
df1 = test[test[col] != 0]
for data in [df, df1]:
    data.loc[data[col] != 0, col] = np.log(data.loc[data[col] != 0, col])
hisplot_comb(col, train=df, test=df1)

对数变换后，数据的分布好了很多当特征imp_trans_var37_ult1 不为0时，经过对数变换，训练集和测试集数据均近似服从正态分布

saldo特征

我们还是先来查看saldo关键词特征列表

saldo = [col for col in train.columns if 'saldo' in col]
saldo

 'saldo_var12',
 'saldo_var13_corto',
 'saldo_var13',
 'saldo_var24',
 'saldo_var26',
 'saldo_var25',
 'saldo_var30',
 'saldo_var37',
 'saldo_var42',
 'saldo_medio_var5_hace2',
 'saldo_medio_var5_hace3',
 'saldo_medio_var5_ult1',
 'saldo_medio_var5_ult3',
 'saldo_medio_var8_hace2',
 'saldo_medio_var8_ult1',
 'saldo_medio_var8_ult3',
 'saldo_medio_var12_hace2',
 'saldo_medio_var12_hace3',
 'saldo_medio_var12_ult1',
 'saldo_medio_var12_ult3',
 'saldo_medio_var13_corto_hace2',
 'saldo_medio_var13_corto_hace3',
 'saldo_medio_var13_corto_ult1',
 'saldo_medio_var13_corto_ult3']

一共有26个特征，我们仍然随机选取一个

random.seed(a=77)
print('被随机选择的saldo特征：%s' % (random.sample(saldo,1)))

被随机选择的saldo特征：saldo_medio_var13_corto_ult3
通过对该特征进行如上分析，我们发现saldo类型特征呈现出与imp特征相似的零值占比大、非零值分布右偏的情况，因此这里我们可以对saldo特征采取和imp特征相同的处理方式。

num特征

我们还是先打印出包含num关键字的特征列表

num = [col for col in train.columns if 'num' in col]
print('包含前缀num的特征共有 %i 个' % (len(num)))
num[:10]

包含前缀num的特征共有 64 个，前10个为：
['num_var1_0',
 'num_var4',
 'num_var5_0',
 'num_var5',
 'num_var8_0',
 'num_var8',
 'num_var12_0',
 'num_var12',
 'num_var13_0',
 'num_var13_corto_0']

和上面一样我们从中随机选取一个特征进行分析。

random.seed(a = 420)
print('被随机选择的num特征：%s ' % (random.sample(num,1)))

被随机选择的num特征：num_var5

col = 'num_var5'
print("训练集中 num_var5 最小值为：%i，最大值为：%i" % (train[col].min(), train[col].max()))
print("测试集中 num_var5 最小值为：%i，最大值为：%i" % (test[col].min(), test[col].max()))
valuecounts_plot(train=train, test=test, col=col)

**************************************************************************************	
训练集特征'num_var5'其值占比(top 5): 
值	 占比%
3     66.120758
0     33.624046
6      0.249934
9      0.003946
15     0.001315
Name: num_var5, dtype: float64
****************************************************************************************************
训练集特征'num_var5'其值占比(bottom 5): 
值	 占比%
3     66.120758
0     33.624046
6      0.249934
9      0.003946
15     0.001315
Name: num_var5, dtype: float64
测试集特征'num_var5'其值占比(top 5): 
值	 占比%
3     66.133372
0     33.625260
6      0.233454
9      0.006595
12     0.001319
Name: num_var5, dtype: float64
****************************************************************************************************
测试集特征'num_var5'其值占比(bottom 5): 
值	 占比%
3     66.133372
0     33.625260
6      0.233454
9      0.006595
12     0.001319
Name: num_var5, dtype: float64

我们可以看到，此特征只有5个唯一值，表明他是一个分类特征。并且他们都是3的倍数，其中3的出现次数最多，均占66%，我们发现15不出现在测试数据中，12不出现在训练数据中
接下来我们看看num_var5的唯一值分布情况和不满意客户在num_var5的分布情况：

hisplot_comb(col=col,bins=10)
histplot_target(col=col, bins=10)
for i in train[col].unique():
    print("当 '%s'==%i 时，不满意客户数量为：%i，其占比为：%.3f%%" %
          (col, i,  train[(train['TARGET'] == 1) & (train[col] == i)].shape[0],
           train[(train['TARGET'] == 1) & (train[col] == i)].shape[0]*100 / train[train[col] == i].shape[0]))

当 'num_var5'==0 时，不满意客户数量为：1959，其占比为：7.664%
当 'num_var5'==3 时，不满意客户数量为：1042，其占比为：2.073%
当 'num_var5'==6 时，不满意客户数量为：7，其占比为：3.684%
当 'num_var5'==9 时，不满意客户数量为：0，其占比为：0.000%
当 'num_var5'==15 时，不满意客户数量为：0，其占比为：0.000%

我们可以发现，该特征中唯一值3和0占比最大，共达到了99%且唯一值0的不满意客户占比最多。
那么，既然num_var5是分类型特征，那其他的num型特征是否也为分类型特征呢？我们可以将所有的num型特征的唯一值输出出来看看。

for feat in num:
    print("%s \t unique-values:%i \t dtype:%s" % (feat, train[feat].nunique(), train[feat].dtype))

num_var1_0 	 unique-values:3 	 dtype:int64
num_var4 	 unique-values:8 	 dtype:int64
num_var5_0 	 unique-values:5 	 dtype:int64
num_var5 	 unique-values:5 	 dtype:int64
num_var8_0 	 unique-values:3 	 dtype:int64
num_var8 	 unique-values:2 	 dtype:int64
num_var12_0 	 unique-values:6 	 dtype:int64
num_var12 	 unique-values:4 	 dtype:int64
num_var13_0 	 unique-values:7 	 dtype:int64
num_var13_corto_0 	 unique-values:3 	 dtype:int64
num_var13_corto 	 unique-values:3 	 dtype:int64
num_var13_largo_0 	 unique-values:7 	 dtype:int64
num_var13 	 unique-values:7 	 dtype:int64
num_var14_0 	 unique-values:5 	 dtype:int64
num_var24_0 	 unique-values:4 	 dtype:int64
......
num_var45_ult1 	 unique-values:94 	 dtype:int64
num_var45_ult3 	 unique-values:172 	 dtype:int64

我们发现，num特征的唯一值从2到172不等，在7万多条样本的规模下，基本满足分类型变量的特点，对于分类问题，我们通常需要将分类变量进行编码处理，但是如果进行独热编码，对于具有较多唯一值的特征我们可能会新增172个新字段，过大的稀疏性同样会降低分类效果。因此，我们设置一个阈值10，当num特征的nunique()小于10的时候，我们选择将它编码，如果大于10，我们选择不作处理。

ind特征

同样先查看特征列表

ind = [col for col in train.columns if 'ind' in col]
print("关键词前缀ind特征共有 %i 个" % (len(ind)))
ind[:10]

ind特征共有32个，其中10个为：
['ind_var1_0',
 'ind_var5_0',
 'ind_var5',
 'ind_var8_0',
 'ind_var8',
 'ind_var12_0',
 'ind_var12',
 'ind_var13_0',
 'ind_var13_corto_0',
 'ind_var13_corto']

我们随机选取一个特征进行分析：ind_var5_0

输出他的最小值和最大值并绘制频数分布折线图：

col = 'ind_var5_0'
print("训练集中 ind_var5_0 最小值为：%i，最大值为：%i" % (train[col].min(), train[col].max()))
print("测试集中 ind_var5_0 最小值为：%i，最大值为：%i" % (test[col].min(), test[col].max()))
valuecounts_plot(train=train, test=test, col=col)

我们可以发现，该特征是一个分类型变量且只有两个值0和1，且1占比绝大部分，约为96%，我们再看看不满意客户在唯一值中的分布情况。

histplot_target(col=col, bins=10)
for i in train[col].unique():

    print("当 '%s'==%i 时，不满意客户数量为：%i，其占比为：%.3f%%" %
          (col, i,  train[(train['TARGET'] == 1) & (train[col] == i)].shape[0],
           train[(train['TARGET'] == 1) & (train[col] == i)].shape[0]*100 / train[train[col] == i].shape[0]))

当 'ind_var5_0'==1 时，不满意客户数量为：2784，其占比为：3.823%
当 'ind_var5_0'==0 时，不满意客户数量为：224，其占比为：7.020%

通过nunique()我们可以得知，所有的ind特征均为二分类特征。因此，我们可以不对ind特征进行处理。

最终这一阶段我们得到的训练集和测试集的shape为：

((76020, 144), (75818, 143))

我们将df保存为pickle文件，这种文件的读取速度比csv文件更快。

train.to_pickle('./data/santander-customer-satisfaction/output/train.pkl')
test.to_pickle('./data/santander-customer-satisfaction/output/test.pkl')

Django5.1（91）—— 如何删除一个 Django 应用小天的铁蛋儿 django Python django python 后端
如何删除一个Django应用Django提供了将一组功能组织成名为应用程序的Python包的能力。当需求发生变化时，应用程序可能会变得过时或不再需要。以下步骤将帮助你安全地删除一个应用程序。删除所有与该应用程序相关的引用（导入、外键等）。从相应的models.py文件中删除所有模型。通过运行makemigrations来创建相关的迁移。这一步会生成一个迁移，用于删除已删除模型的表，以及与这些模型相
【python实用小脚本-125】基于 Python 的 Gmail 邮件发送工具：实现高效邮件自动化 Kyln.Wu Python python 自动化网络
引言在现代办公和开发环境中，邮件通信是一种重要的沟通方式。自动化发送邮件可以大大提高工作效率，例如发送通知、报告或文件。本文将介绍一个基于Python的Gmail邮件发送工具，它能够通过Gmail的SMTP服务器发送邮件，并支持附件功能。该工具主要利用了Python的smtplib库和email库，结合了邮件构建和网络通信技术，为用户提供了一个简单易用的邮件发送解决方案。总体功能概述Gmail邮件
Python之聚合函数 _AndyLau 手把手学python python
Python聚合函数文章目录Python聚合函数聚合函数使用多个聚合函数结合`annotate`和`values`进行分组聚合注意事项F表达式和Q表达式F表达式Q表达式注意事项视图HTML中的表单概述Django中表单概述ModelForm关键点使用示例创建ModelForm在视图中使用ModelForm模板总结Cookie和SessionDjango中的Cookie操作Django中的Sessi
Python报错信息归类以及处理
ʕᵔᴥᵔʔPython的错误和异常可以分为多个类别，了解这些类别有助于更好地调试和处理错误。以下是Python中常见报错信息的归类和分析。1.语法错误(SyntaxError)在代码执行前被解析器捕获的错误，通常是由于代码不符合Python语法规则。常见子类：IndentationError：缩进错误TabError：Tab和空格混用示例：#缺少冒号ifTrueprint("Hello")#Syn
python 获取mac地址 Take_a_chestnut python 小工具 python 开发语言
python获取mac地址方法一：使用socket库使用了socket库中的ioctl函数和fcntl模块来获取MAC地址importsocketimportfcntlimportstructdefget_mac_address():interface='eth0'#替换为你的网络接口名称，例如eth0或en0sock=socket.socket(socket.AF_INET,socket.SOC
LRU缓存算法在搜索引擎中的应用数据结构与算法学习缓存算法搜索引擎 ai
LRU缓存算法在搜索引擎中的应用关键词：LRU算法、缓存淘汰、搜索引擎、哈希表、双向链表、性能优化、访问频率摘要：本文深入探讨了LRU(最近最少使用)缓存算法在搜索引擎中的关键应用。我们将从基本概念出发，通过生活化的比喻解释LRU的工作原理，分析其在搜索引擎架构中的具体实现方式，并通过Python代码示例展示如何构建一个高效的LRU缓存系统。文章还将讨论LRU算法的数学建模、实际应用场景以及未来发
60天python训练计划----day59
在之前的学习中，我们层层递进的介绍了时序模型的发展，从AR到MA到ARMA，再到ARIMA。本质就是把数据处理的操作和模型结合在一起了，实际上昨天提到的季节性差分也可以合并到模型中，让流程变得更加统一。季节性差分用S来表示，所以这个模型叫做SARIMA模型一、SARIMA模型SARIMA(SeasonalAutoRegressiveIntegratedMovingAverage)是标准ARIMA模
【python实用小脚本-128】基于 Python 的 Hacker News 爬虫工具：自动化抓取新闻数据 Kyln.Wu Python python 爬虫自动化
引言在技术社区中，HackerNews是一个汇聚最新技术文章和讨论的热门平台。许多开发者和技术爱好者依赖它来获取行业动态和前沿资讯。然而，手动浏览和筛选这些文章可能耗时且低效。本文将介绍一个基于Python的HackerNews爬虫工具，它能够自动化地从HackerNews网站抓取最新文章，并将结果保存为CSV文件。该工具主要利用了Python的requests、BeautifulSoup和csv
python系列之：使用md5和sha256完成签名认证，调用接口快乐骑行^_^ 前端和后端开发 python系列使用md5和sha256 完成签名认证调用接口
python系列之：使用md5和sha256完成签名认证，调用接口MD5签名和sha256签名认证md5认证代码sha256认证代码拼接签名生成签名拼接url调用接口MD5签名和sha256签名认证MD5签名认证算法特性：生成128位(16字节)的哈希值计算速度快已被证明存在碰撞漏洞(不同输入可能产生相同输出)签名认证流程：发送方对原始数据计算MD5哈希值将哈希值附加到数据中发送接收方重新计算接收
Kafka系列之：不删除Kafka Topic，清理Kafka Topic中的数据快乐骑行^_^ Kafka Kafka系列不删除Kafka Topic 清理Kafka Topic数据
Kafka系列之：不删除KafkaTopic，清理KafkaTopic中的数据一、需求二、Java删除Topic中数据三、python删除Topic中数据一、需求需要清理topic中的数据但是不能通过删除topic删除数据，则采取基于topic的offset删除topic中的数据二、Java删除Topic中数据HashMapdeleteRecords=newHashMap<>();这一行创建了一个
python模拟行星运动_动态模拟运行太阳系的行星运转
在地理学科中，都要学习认识太阳系的知识，对于天体的运动，没有动态演示的话，学生们只能凭空想象，无法观看到九大行星之间到底是如何运转的。几何画板作为人教版指定教育软件，被老师们广泛用于教学中，不仅仅可以用来演示几何图形，还可以应用在地理学科中演示天体运动情况，下面就给大家介绍利用几何画板制作的动态模拟运行太阳系的九大行星课件。几何画板动态模拟运行太阳系的九大行星课件样图：几何画板课件模板——动态模拟
如何用 Python 实现模拟木星的运行轨道、自转、公转 wh3933 python 开发语言
用Python来模拟木星的轨道运行、自转和公转是一个非常有趣且富有挑战性的项目。这需要结合天文学知识和编程技巧。我们将使用VPython这个库来实现这个模拟。VPython非常适合创建简单的3D物理场景和动画，它的语法直观，能够让我们快速地将物理概念转化为可视化的三维模型。在开始之前，请确保您已经安装了VPython。如果尚未安装，可以通过pip进行安装：pipinstallvpython模拟思路
python输出小郭爱吃糖 python 开发语言
Python基础1.1基本的输出函数内置的函数print语法：print(输出内容)print()函数完整的语法格式print(value,……,sep="",end="\n",file=None)示例：a=50b=100print(90)print(a)print(a*b)print('HelloWorld')print("HelloWorld")print("""HelloWorld""")1
Python 中 Pendulum 库的详细使用：更精确的日期时间处理数据知道 python3案例和总结 python 开发语言 Pendulum库
文章目录一、Pendulum概述1.1Pendulum介绍1.2安装Pendulum1.3注意事项二、基本使用2.1创建Pendulum对象2.2格式化输出2.3时间运算三、高级使用3.1时区处理3.2时间间隔3.3日期比较四、实际应用案例4.1日志时间处理4.2会议时间提醒4.3工作日计算4.4Pendulum与datetime互操作一、Pendulum概述1.1Pendulum介绍Pendul
python库 arrow 库的各种案例的使用详解（更人性化的日期时间处理）数据知道 python3案例和总结 python 开发语言时间处理
文章目录一、arrow概述1.1arrow介绍1.2安装arrow1.3注意事项二、基本使用2.1创建Arrow对象2.2格式化输出2.3时间运算三、高级功能3.1时区处理3.2时间范围3.3时间间隔四、实际应用案例4.1日志时间处理4.2会议时间提醒4.3国际化时间显示5.Arrow与datetime互操作一、arrow概述1.1arrow介绍Arrow是一个Python库，提供了比标准库dat
python 魔法方法常用_Python魔法方法指南 weixin_39603505 python 魔法方法常用
有很多人说学习Python基础之后不知道干什么，不管你是从w3c还是从廖雪峰的教程学习的，这些教程都有一个特点：只能引你快速入门，但是有关于Python的很多基础内容这些教程中都没介绍，而这些你没学习的内容会让你在后期做项目的时候非常困惑。就比如下面这篇我要给大家推荐的文章所涉及的内容，不妨你用一天时间耐心看完，把代码都敲上一遍。--11：33更新--很多人想要我的一份学习笔记，所以在魔法指南之前
Python 基础入门第十三讲魔法方法补充、单例模式、reflect反射（getattr、hasattr、__import__()）
第十三讲一、特殊成员和魔法方法在之前的课程中已经学习过如__init__、__str__、__dir__等魔法方法，现补充一些常用的魔法方法：1.__doc__魔法方法该魔法方法的作用为打印类的说明文档，举个例子：print(str().__doc__)###输出结果为：str(object='')->strstr(bytes_or_buffer[,encoding[,errors]])->str
python魔法方法长文详解千翻娃儿 python原生基础 python
python魔法方法详解1.什么是魔法方法魔法方式（Magicmethods）是python的内置函数，一般以双下划线开头和结尾，比如__add__,__new__等。每个魔法方法都有对应的一个内置函数或者运算符。当我们个对象使用这些方法时，相当于对这个对象的这类方法进行重写（如运算符重载）。魔法方法的存在是对类或函数进行了提炼，供python解释器直接调用。当使用len(obj)时，实际上调用的
微信聊天记录监听与转发工具明天过后0122 高效办公微信
以下是基于您需求撰写的《微信聊天记录监听与转发工具需求分析开发文档》：微信聊天记录监听与转发工具需求分析开发文档一、项目概述1.1目标开发基于wxauto的自动化工具，实现：实时监听指定微信聊天窗口（群组/个人）捕获并处理新消息按指定策略转发至目标用户"元宝"确保操作间隔符合10秒限制1.2技术栈核心框架：Python3.8+微信自动化：wxauto_custom(基于wxauto的定制版本)并发
支持向量机（SVM）在肝脏CT/MRI图像分类（肝癌检测）中的应用及实现猿享天开医学影像支持向量机机器学习人工智能算法
博主简介：CSDN博客专家、CSDN平台优质创作者，高级开发工程师，数学专业，10年以上C/C++,C#,Java等多种编程语言开发经验，拥有高级工程师证书；擅长C/C++、C#等开发语言，熟悉Java常用开发技术，能熟练应用常用数据库SQLserver,Oracle,mysql,postgresql等进行开发应用，熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,
Python built-in types - Numeric Types LorgSher Python笔录 python
Python内建类型之数值类型-整数、浮点数和复数ManualTherearethreedistinctnumerictypes:integers,floatingpointnumbers,andcomplexnumbers.Inaddition,Booleansareasubtypeofintegers.Integershaveunlimitedprecision.Floatingpointnu
深入理解 Python 中的异步操作：async 和 await | python小知识
一、深入理解Python中的异步操作：async和await引言在现代编程中，异步操作是一个非常重要的概念，尤其是在处理I/O密集型任务时。使用异步操作可以显著提高程序的性能和响应速度。Python提供了async和await关键字，使得编写异步代码变得更加直观和简洁。在这篇文章中，我们将深入探讨Python的异步操作，并通过实际代码示例来说明其使用方法。目录什么是异步操作？Python中的异步编
python :built-in functions angry_grina python
今天研究下python的内建函数：Built-inFunctionsabs()divmod()input()open()staticmethod()all()enumerate()int()ord()str()any()eval()isinstance()pow()sum()basestring()execfile()issubclass()print()super()bin()file()ite
Python标准库The Python Standard Library GarfieldEr007 Python Python 标准库 Standard Library
WhileThePythonLanguageReferencedescribestheexactsyntaxandsemanticsofthePythonlanguage,thislibraryreferencemanualdescribesthestandardlibrarythatisdistributedwithPython.Italsodescribessomeoftheoptionalc
Python operator - Standard operators as functions Yongqiang Cheng Python 3 -Python 2 -Cython Python operator operators functions
Pythonoperator-Standardoperatorsasfunctions1.MappingOperatorstoFunctions2.In-placeOperatorsReferenceshttps://docs.python.org/3/library/operator.htmlTheoperatormoduleexportsasetofefficientfunctionscorr
使用 Python 在 Word 文档中插入数学公式 - 详解 nuclear2011 Python Word python 插入数学公式到Word文档添加数学表达式到Word文档给Word文档添加数学公式 MathML数学公式 LaTeX数学公式
目录为什么在Word文档中插入数学公式？环境准备如何使用Python在Word文档中插入数学公式方法一：使用EQ域插入数学公式方法二：通过LaTeX和MathML插入复杂数学公式总结在金融、工程、教育和科研等专业领域的文档中常常需要包含复杂且精确的数学公式。将数学公式直接嵌入文档中，不仅能够提升文档的专业水准，还能实现公式的自动更新和动态计算，从而有效提升工作效率和内容的准确性。本文将介绍如何使用
【雕爷学编程】MicroPython手册之 ESP32-CAM 机器人目标跟踪驴友花雕机器人目标跟踪人工智能嵌入式硬件 python MicroPython ESP32-CAM
MicroPython是为了在嵌入式系统中运行Python3编程语言而设计的轻量级版本解释器。与常规Python相比，MicroPython解释器体积小(仅100KB左右)，通过编译成二进制Executable文件运行，执行效率较高。它使用了轻量级的垃圾回收机制并移除了大部分Python标准库，以适应资源限制的微控制器。MicroPython主要特点包括:1、语法和功能与标准Python兼容,易学
【雕爷学编程】MicroPython手册之 ESP32-S3 USB摄像头驴友花雕嵌入式硬件单片机 python MicroPython ESP32-S3 USB摄像头
MicroPython是为了在嵌入式系统中运行Python3编程语言而设计的轻量级版本解释器。与常规Python相比，MicroPython解释器体积小(仅100KB左右)，通过编译成二进制Executable文件运行，执行效率较高。它使用了轻量级的垃圾回收机制并移除了大部分Python标准库，以适应资源限制的微控制器。MicroPython主要特点包括:1、语法和功能与标准Python兼容,易学
【雕爷学编程】MicroPython手册之 ESP32-CAM 图像识别驴友花雕 1024程序员节单片机嵌入式硬件 MicroPython python ESP32-CAM 图像识别
MicroPython是为了在嵌入式系统中运行Python3编程语言而设计的轻量级版本解释器。与常规Python相比，MicroPython解释器体积小(仅100KB左右)，通过编译成二进制Executable文件运行，执行效率较高。它使用了轻量级的垃圾回收机制并移除了大部分Python标准库，以适应资源限制的微控制器。MicroPython主要特点包括:1、语法和功能与标准Python兼容,易学
线性回归 python代码黄涵奕 python 线性回归 numpy 机器学习开发语言
下面是一个线性回归模型的Python代码示例：importnumpyasnpfromsklearn.linear_modelimportLinearRegression#训练数据x=np.array([[1],[2],[3],[4],[5]])y=np.array([5,7,9,11,13])#建立模型reg=LinearRegression().fit(x,y)#预测reg.predict(np
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla