O_Oreo

（金融）银行贷款的用户增长项目——数据分析

银行贷款项目的用户特征数据分析

1、案例背景

Thera Bank是一家拥有不断增长客户群的银行。这银行中大多数客户的存款规模都是不一样的。由于贷款业务的客户数量很少，所以银行希望有效地将存款用户转化为贷款用户以此扩大贷款业务量的基础，以带来更多的贷款业务，并在此过程中，通过贷款利息赚取更多。

因此，该银行去年为存款用户但未办理个人贷款业务的客户开展了一项推广活动来促使其办理个人贷款业务，有部分客户通过此活动已经办理了相关服务。这时的零售营销部门希望制定更好的策略去定位营销，以最小的预算提高成功率。该部门希望识别出更有可能购买贷款的潜在客户，提高转化的成功率，降低营销的费用。

#导入相关模块
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

#连接mysql
import pymysql
pymysql.install_as_MySQLdb()
from sqlalchemy import create_engine
engine=create_engine('mysql://ID:password@localhost:3306/database?charset=gbk')

#读取数据
Bank_Personal_Loan=pd.read_sql_query('select * from Personal_Loan',con=engine)

2、理解数据

数据集共包含5000条记录，14个字段，对应字段含义如下：

ID - 客户
Age - 客户年龄
Experience - 客户工作经验
Income - 客户年收入（单位：千美元）
ZIPCode - 家庭地址邮政编码
Family - 客户的家庭规模
CCAvg - 每月信用卡消费额（单位：千美元）
Education - 教育水平（1: 本科; 2: 研究生; 3: 高级）
Mortgage - 房屋抵押价值（如有）（单位：千美元）
Personal Loan - 此客户是否接受上一次活动中提供的个人贷款？（1：是 0：否）
Securities Account - 是否有证券账户？（1：是 0：否）
CD Account - 是否有存款证明（CD）帐户吗（1：是 0：否）
Online - 是否开通网上银行？（1：是 0：否）
CreditCard - 是否有信用卡？（1：是 0：否）

Bank_Personal_Loan.head()

	ID	Age	Experience	Income	ZIP Code	Family	CCAvg	Education	Securities Account	CreditCard
0	1	25	1	49	91107	4	1.6	1	1	0
1	2	45	19	34	90089	3	1.5	1	1	0
2	3	39	15	11	94720	1	1	1	0	0
3	4	35	9	100	94112	1	2.7	2	0	0
4	5	35	8	45	91330	4	1	2	0	1

#观察数据整体情况
Bank_Personal_Loan.info()


RangeIndex: 5000 entries, 0 to 4999
Data columns (total 14 columns):
ID                    5000 non-null object
Age                   5000 non-null object
Experience            5000 non-null object
Income                5000 non-null object
ZIP Code              5000 non-null object
Family                5000 non-null object
CCAvg                 5000 non-null object
Education             5000 non-null object
Mortgage              5000 non-null object
Personal Loan         5000 non-null object
Securities Account    5000 non-null object
CD Account            5000 non-null object
Online                5000 non-null object
CreditCard            5000 non-null object
dtypes: object(14)
memory usage: 547.0+ KB

观察各字段基础信息，数据并无重复，缺失情况；对于一些数值型的字段则需要做一些数据类型的转化

#更改变量类型,方便后续做统计分析
Bank_Personal_Loan['Age']=Bank_Personal_Loan['Age'].astype('int')
Bank_Personal_Loan['Experience']=Bank_Personal_Loan['Experience'].astype('int')
Bank_Personal_Loan['Family']=Bank_Personal_Loan['Family'].astype('int')
Bank_Personal_Loan['Education']=Bank_Personal_Loan['Education'].astype('int')
Bank_Personal_Loan['ZIP Code']=Bank_Personal_Loan['ZIP Code'].astype('int')
Bank_Personal_Loan['Personal Loan']=Bank_Personal_Loan['Personal Loan'].astype('int')
Bank_Personal_Loan['CD Account']=Bank_Personal_Loan['CD Account'].astype('int')
Bank_Personal_Loan['Securities Account']=Bank_Personal_Loan['Securities Account'].astype('int')
Bank_Personal_Loan['Online']=Bank_Personal_Loan['Online'].astype('int')
Bank_Personal_Loan['CreditCard']=Bank_Personal_Loan['CreditCard'].astype('int')
Bank_Personal_Loan['Income']=Bank_Personal_Loan['Income'].astype('float')
Bank_Personal_Loan['CCAvg']=Bank_Personal_Loan['CCAvg'].astype('float')
Bank_Personal_Loan['Mortgage']=Bank_Personal_Loan['Mortgage'].astype('float')

#观察数据的一个描述性信息
Bank_Personal_Loan.describe()

	Age	Experience	Income	ZIP Code	Family	CCAvg	Education	Mortgage	Personal Loan	Securities Account	CD Account	Online	CreditCard
count	5000.000000	5000.000000	5000.000000	5000.000000	5000.000000	5000.000000	5000.000000	5000.000000	5000.000000	5000.000000	5000.00000	5000.000000	5000.000000
mean	45.338400	20.104600	73.774200	93152.503000	2.396400	1.937913	1.881000	56.498800	0.096000	0.104400	0.06040	0.596800	0.294000
std	11.463166	11.467954	46.033729	2121.852197	1.147663	1.747666	0.839869	101.713802	0.294621	0.305809	0.23825	0.490589	0.455637
min	23.000000	-3.000000	8.000000	9307.000000	1.000000	0.000000	1.000000	0.000000	0.000000	0.000000	0.00000	0.000000	0.000000
25%	35.000000	10.000000	39.000000	91911.000000	1.000000	0.700000	1.000000	0.000000	0.000000	0.000000	0.00000	0.000000	0.000000
50%	45.000000	20.000000	64.000000	93437.000000	2.000000	1.500000	2.000000	0.000000	0.000000	0.000000	0.00000	1.000000	0.000000
75%	55.000000	30.000000	98.000000	94608.000000	3.000000	2.500000	3.000000	101.000000	0.000000	0.000000	0.00000	1.000000	1.000000
max	67.000000	43.000000	224.000000	96651.000000	4.000000	10.000000	3.000000	635.000000	1.000000	1.000000	1.00000	1.000000	1.000000

发现Experience出现负值，有异常数据

#考虑将Experience的负值改为0
Bank_Personal_Loan.loc[Bank_Personal_Loan['Experience']<0,'Experience']=0
Bank_Personal_Loan.Experience.describe()

count    5000.000000
mean       20.119600
std        11.440484
min         0.000000
25%        10.000000
50%        20.000000
75%        30.000000
max        43.000000
Name: Experience, dtype: float64

3、数据分析

整体思路：

1.去年银行举办的推广活动的效果如何？

2什么类型的存款用户成为银行贷款业务的潜在客户可能性更大？

2.1随着客户年收入的增长，贷款情况是如何变化？

2.2随着客户年龄的增长，贷款情况如何变化？

#活动推广结果分析
Bank_Personal_Loan.groupby('Personal Loan').size()

Personal Loan
0    4520
1     480
dtype: int64

通过这次推广活动以后，5000名客户中，有480个客户开通了个人贷款业务。由于该活动是针对未办理个人贷款业务的客户开展的，对比从以往数据来看，个人贷款业务增长了近10%，说明此次推广活动的效果还是不错的

?sns.heatmap

#探索其他变量与Personal Loan变量的关系
print(Bank_Personal_Loan.corr()['Personal Loan'])
#fig代表绘图窗口(Figure)；axis代表这个绘图窗口上的坐标系(axis)
fig,axis=plt.subplots(figsize=(12,12))
#绘制热力图，颜色越深，相关性越强
ax=sns.heatmap(Bank_Personal_Loan.corr(),annot=True,cmap='YlGnBu')
#bottom代表y轴下限，top表示y轴上限（有些matplotlib版本画热力图上下边框只显示一半）
bottom,top=ax.get_ylim()
ax.set_ylim(bottom+0.5,top-0.5)

Age                  -0.007726
Experience           -0.007858
Income                0.502462
ZIP Code              0.000107
Family                0.061367
CCAvg                 0.366891
Education             0.136722
Mortgage              0.142095
Personal Loan         1.000000
Securities Account    0.021954
CD Account            0.316355
Online                0.006278
CreditCard            0.002802
Name: Personal Loan, dtype: float64





(13.0, 0.0)

从图中可以看出：

1、和开通信贷强相关的变量有：收入(0.5)，信用卡消费额(0.37)及是否有该银行存款账户(0.32)；

2、和开通信贷弱相关的变量有：受教育程度(0.14)，房屋抵押贷款数(0.14)；

3、邮编(0.00011)、是否是证券账户(0.022)，是否开通网上银行(0.0063)及是否有信用卡(0.0028)，关系都不大；

4、年龄(-0.0077)、工作经验(-0.0011)虽然关系也不大，但它们属于连续的数值变量，所以需要分箱后再做观察，看看是否有某一段存在特殊值。

#先剔除无关的变量，对其余相关变量进行分析
#1 定性变量与开通贷款的关系（对定性变量中是否有该银行存单账户、受教育程度、家庭人数与是否开通贷款的关系进行探究）
#1.1 是否有该银行存单账户
print(Bank_Personal_Loan.groupby('CD Account')['Personal Loan'].agg(np.mean))
sns.countplot(x='CD Account',data=Bank_Personal_Loan,hue='Personal Loan')

CD Account
0    0.072371
1    0.463576
Name: Personal Loan, dtype: float64

开通了银行存单账户的客户，其申请贷款的可能性是没有开通的6倍多,说明开通了银行账户的客户是一个主要的目标客户；找到方法让客户开通该银行存款账单也是一个提高申请贷款率的可能选项。

#1.2 教育水平
print(Bank_Personal_Loan.groupby('Personal Loan')['Education'].agg(np.mean))
sns.catplot(x='Education',data=Bank_Personal_Loan,hue='Personal Loan',kind='count')

Personal Loan
0    1.843584
1    2.233333
Name: Education, dtype: float64

学历越高，贷款意愿的比率越多,说明教育水平越高，越能接受超前消费观念，其贷款意愿越高。学历层次越高的用户的存款用户成为银行贷款业务的潜在客户可能性会更大

#1.3 家庭人数
print(Bank_Personal_Loan.groupby('Family')['Personal Loan'].agg(np.mean))
sns.catplot(x='Family',data=Bank_Personal_Loan,hue='Personal Loan',kind='count')

Family
1    0.072690
2    0.081790
3    0.131683
4    0.109656
Name: Personal Loan, dtype: float64

单身人士与没有孩子的家庭的贷款率都比较低，有孩子的家庭用户相对而言更有意愿转化为贷款用户，特别是独生子女家庭

#2、定量变量与开通贷款的关系（对定量变量中的年领、收入、信用卡还款额和房屋抵押贷款与是否开通贷款的关系进行探究）
#2.1.1年龄
Bank_Personal_Loan.groupby('Age')['Personal Loan'].agg(np.mean)
sns.boxenplot(x='Personal Loan',y='Age',data=Bank_Personal_Loan)

#2.1.2 对年龄分层
Bank_Personal_Loan['Income Bins']=pd.cut(Bank_Personal_Loan.Age,6)
print(Bank_Personal_Loan.groupby('Income Bins')['Personal Loan'].agg([np.mean,'count']))
Bank_Personal_Loan.groupby('Income Bins')['Personal Loan'].agg({'Loan Rate':np.mean}).plot()

                      mean  count
Income Bins                      
(22.956, 30.333]  0.105769    624
(30.333, 37.667]  0.106605    863
(37.667, 45.0]    0.087209   1032
(45.0, 52.333]    0.093785    885
(52.333, 59.667]  0.086768    922
(59.667, 67.0]    0.102374    674


/home/anaconda3/lib/python3.7/site-packages/ipykernel_launcher.py:4: FutureWarning: using a dict on a Series for aggregation
is deprecated and will be removed in a future version. Use                 named aggregation instead.

    >>> grouper.agg(name_1=func_1, name_2=func_2)

  after removing the cwd from sys.path.

综合来看，各阶段的年龄的贷款意愿都相差不大，相对来说38岁以下和60岁以上的客户意愿较强

取平均来看，高收入的人群会比低收入的人群更愿意申请贷款

#2.2.1 收入分层
Bank_Personal_Loan['Income_bins']=pd.qcut(Bank_Personal_Loan.Income,20)
print(Bank_Personal_Loan.groupby('Income_bins')['Personal Loan'].agg([np.mean,'count']))
Bank_Personal_Loan.groupby('Income_bins')['Personal Loan'].agg({'Loan Rate':np.mean}).plot()

                    mean  count
Income_bins                    
(7.999, 18.0]   0.000000    278
(18.0, 22.0]    0.000000    229
(22.0, 29.0]    0.000000    295
(29.0, 33.0]    0.000000    227
(33.0, 39.0]    0.000000    283
(39.0, 42.0]    0.000000    237
(42.0, 45.0]    0.000000    224
(45.0, 52.0]    0.000000    229
(52.0, 59.0]    0.000000    278
(59.0, 64.0]    0.007407    270
(64.0, 71.0]    0.012987    231
(71.0, 78.0]    0.008403    238
(78.0, 82.0]    0.007905    253
(82.0, 88.3]    0.043860    228
(88.3, 98.0]    0.066929    254
(98.0, 113.0]   0.179775    267
(113.0, 128.0]  0.275862    232
(128.0, 145.0]  0.395437    263
(145.0, 170.0]  0.412766    235
(170.0, 224.0]  0.526104    249


/home/anaconda3/lib/python3.7/site-packages/ipykernel_launcher.py:4: FutureWarning: using a dict on a Series for aggregation
is deprecated and will be removed in a future version. Use                 named aggregation instead.

    >>> grouper.agg(name_1=func_1, name_2=func_2)

  after removing the cwd from sys.path.

# pd.cut()根据值本身来选择箱子均匀间隔，即每个箱子的间距都是相同的
#pd.qcut()根据这些值的频率来选择箱子的均匀间隔,即每个箱子中含有的数的数量是相同的

当年收入超过82时，贷款意愿会有5倍以上的上升，超过98时，贷款意愿达到17%以上，超过170时，贷款意愿达到一半，相对收入越高，贷款的意愿越强烈

#2.3.1 房屋抵押值
print(Bank_Personal_Loan.groupby('Mortgage')['Personal Loan'].agg([np.mean,'count']))
sns.catplot('Personal Loan','Mortgage',data=Bank_Personal_Loan,kind='boxen')

              mean  count
Mortgage                 
0.0       0.090121   3462
75.0      0.125000      8
76.0      0.083333     12
77.0      0.000000      4
78.0      0.000000     15
...            ...    ...
590.0     1.000000      1
601.0     0.000000      1
612.0     1.000000      1
617.0     1.000000      1
635.0     0.000000      1

[347 rows x 2 columns]

#2.3.2 对房屋抵押值分层
Bank_Personal_Loan['Mortgage Bins']=pd.cut(Bank_Personal_Loan.Mortgage,10)
print(Bank_Personal_Loan.groupby('Mortgage Bins')['Personal Loan'].agg([np.mean,'count']))
Bank_Personal_Loan.groupby('Mortgage Bins')['Personal Loan'].agg({'Loan Rate':np.mean}).plot(rot=-45)

                    mean  count
Mortgage Bins                  
(-0.635, 63.5]  0.090121   3462
(63.5, 127.0]   0.043630    573
(127.0, 190.5]  0.052257    421
(190.5, 254.0]  0.114173    254
(254.0, 317.5]  0.228346    127
(317.5, 381.0]  0.324324     74
(381.0, 444.5]  0.355556     45
(444.5, 508.0]  0.333333     21
(508.0, 571.5]  0.615385     13
(571.5, 635.0]  0.800000     10


/home/anaconda3/lib/python3.7/site-packages/ipykernel_launcher.py:4: FutureWarning: using a dict on a Series for aggregation
is deprecated and will be removed in a future version. Use                 named aggregation instead.

    >>> grouper.agg(name_1=func_1, name_2=func_2)

  after removing the cwd from sys.path.

当房屋抵押值大于190.5千美元时，贷款申请的意愿有明显的提升，总体来看，抵押值越高，贷款意愿越强烈

#2.4.1 每月信用卡消费额
print(Bank_Personal_Loan.groupby('CCAvg')['Personal Loan'].agg([np.mean,'count']))
sns.catplot('Personal Loan','CCAvg',data=Bank_Personal_Loan,kind='boxen')

           mean  count
CCAvg                 
0.0    0.009434    106
0.1    0.010929    183
0.2    0.039216    204
0.3    0.024896    241
0.4    0.022346    179
...         ...    ...
8.8    0.111111      9
8.9    1.000000      1
9.0    1.000000      2
9.3    1.000000      1
10.0   1.000000      3

[108 rows x 2 columns]

大部分没有申请贷款的，信用卡消费额的均值在1.7K美元左右，而申请贷款的客户信用款消费额均值达到3.9K美元，是其2倍有多。

#2.4.2 对每月消费额进行分层
Bank_Personal_Loan['CCAvg Bins']=pd.cut(Bank_Personal_Loan.CCAvg,20)
Bank_Personal_Loan.groupby('CCAvg Bins')['Personal Loan'].agg([np.mean,'count'])
Bank_Personal_Loan.groupby('CCAvg Bins')['Personal Loan'].agg({'Loan Rate':np.mean}).plot()

/home/anaconda3/lib/python3.7/site-packages/ipykernel_launcher.py:4: FutureWarning: using a dict on a Series for aggregation
is deprecated and will be removed in a future version. Use                 named aggregation instead.

    >>> grouper.agg(name_1=func_1, name_2=func_2)

  after removing the cwd from sys.path.

大概在每月消费额为2.8千美元时，申请贷款率会增大将近4倍，超过6千美元时，申请申请贷款率会有所回落到31%左右，但这个贷款意愿相对还是很强烈的，可对每月消费额在2.8千美元以上的客户加大力度去营销

4、结论

通过这次活动，个人贷款业务增长了近10%，说明此次推广活动的效果还是不错的
对于开通了银行账户的用户需要加强营销力度，他们的贷款意愿相对于没有开通银行账户更强
教育水平越高的客户越容易接受贷款
家庭人口较多的家庭贷款意愿较强，尤其是独生子女的家庭
年龄区间在30-40岁的客户相对贷款意愿更强
相对收入越高，贷款的意愿越强烈，当年收入超过82k时，贷款意愿会有5倍以上的上升，超过98k时，贷款意愿达到17%以上，超过170k时，贷款意愿达到一半
当房屋抵押值大于190.5k美元时，贷款申请的意愿有明显的提升
每月消费额在2.8k美元以上的客户，贷款申请的意愿有明显的提升

FastAPI vs Flask vs Django：Python Web框架全面对比天天进步2015 python python fastapi flask
Python作为最受欢迎的编程语言之一，其Web开发生态极为丰富。FastAPI、Flask和Django是当前主流的三大PythonWeb框架，各有千秋。本文将从架构设计、开发效率、性能表现、生态支持、适用场景等方面，全面对比这三大框架，帮助开发者选择最适合自己的技术栈。目录框架简介架构设计与理念开发效率与易用性性能对比生态与扩展性典型应用场景总结与选型建议参考资料框架简介FastAPI定位：新
2025学年湖北省职业院校技能大赛 “信息安全管理与评估”赛项样题卷（四）落寞的魚丶网络空间安全（职业技能大赛）#信息安全管理与评估赛项 2025职业湖北职业技能大赛职业技能大赛省赛高职组信息安全评估与管理赛项
2025学年湖北省职业院校技能大赛“信息安全管理与评估”赛项样题卷（四）第二部分：网络安全事件响应、数字取证调查、应用程序安全任务书任务1：应急响应（可以培训有答案）任务2：通信数据分析取证（40分）任务3：基于Windows计算机单机取证（120分）任务4：PHP代码审计（40分）第三部分：网络安全渗透、理论技能与职业素养任务一：商城购物系统（60分）可以培训任务二：办公系统（60分）任务三：F
如何在CentOS7上搭建自己的GitLab仓库详解 ytttr873 gitlab
在CentOS7上搭建自己的GitLab仓库的详细步骤如下：更新系统：在开始之前，确保您的系统已经更新到最新版本。打开终端，并执行以下命令：sudoyumupdate-y安装依赖：在安装GitLab之前，需要安装一些依赖项。执行以下命令来安装所需的软件包：sudoyuminstall-ycurlpolicycoreutils-pythonopenssh-server添加GitLab仓库：执行以下命
基于python快速部署属于你自己的页面智能助手小张Tt python 人工智能腾讯云AI代码助手
文章目录前言一、实现目标二、代码解析2.1目录结构2.2后端：Flask服务器的搭建2.2.1安装Flask2.2.2创建Flask应用2.3实现聊天界面与消息交互2.3.1创建聊天界面三、跨域问题的解决3.1安装flask-cors3.2在Flask中启用CORS五效果展示前言 AI聊天机器人已经成为了许多应用场景中的重要组成部分。通过与用户的对话，聊天机器人不仅能够提升用户体验，还能通过不断
60 python asyncio模块(异步IO) 爬呀爬的水滴 python零基础到入门 python 开发语言前端 asyncio 异步io
一、asyncio概述asyncio是Python标准库中用于编写异步I/O操作的强大模块，特别适用于处理I/O密集型任务。在传统同步编程中，当程序遇到网络请求、文件读写等I/O操作时会阻塞等待，导致资源浪费。而asyncio通过异步编程模型，让程序在等待I/O操作时能同时处理其他任务，极大提升了单线程程序的并发效率。二、asyncio核心概念2.1协程（Coroutine）协程是asyncio的
python日期时间用哪个模块_python模块介绍-datetime介绍：基本的日期和时间类型
待更新介绍gevent是基于协程的Python网络库。特点：基于libev的快速事件循环(Linux上epoll，FreeBSD上kqueue)。基于greenlet的轻量级执行单元。API的概念和Python标准库一致(如事件，队列)。可以配合socket，ssl模块使用。能够使用标准库和第三方模块创建标准的阻塞套接字(gevent.monkey)。默认通过线程池进行DNS查询,也可通过c-ar
AI表格数据分析
简单发一篇文章，最近看到AI数据分析是越来越火了哈，把简单的流程进行一次简要的分享。AI数据分析的本质，是“结构化数据→模式识别→可视化表达+洞察输出”。1、分析流程详解：（1）数据预处理什么是数据预处理呢？其实它可以理解成你给的是什么。步骤1：识别数据结构表头，字段的含义等。步骤2：清洗数据去除空值、格式错误、重复数据。步骤3：类型识别判断哪些是时间字段？哪些是数值型？哪些是分类字段？总结：类似
python 获取节假日 AI算法网奇 python宝典
www.easybots.cn是不准的，不能用，比如20190913，不能判断节假日#-*-coding:utf-8-*-importjsonimporturllib.requestimporttimeimportdatetimedefa1(date_str):server_url="http://api.goseek.cn/Tools/holiday?date="#server_url="htt
Solidity学习 - 断言失败本郡主是喵 #Solidity 学习区块链 Solidity
文章目录前言一、原理剖析（一）断言的作用（二）断言失败的影响（三）与require的区别二、案例分析（一）某去中心化金融（DeFi）借贷合约案例（二）某加密货币交易平台智能合约案例三、解决办法（一）正确区分assert和require的使用场景前言在Solidity智能合约开发领域，确保代码的稳健性和安全性是至关重要的。其中，断言失败漏洞是一个需要开发者高度警惕的问题，它可能会对智能合约的正常运行
ADIOS2 介绍与使用指南东北豆子哥 HPC/MPI HPC
文章目录ADIOS2介绍与使用指南什么是ADIOS2?ADIOS2的主要特点ADIOS2核心概念ADIOS2安装Linux系统安装Windows安装ADIOS2基本使用C++示例Python示例ADIOS2高级特性并行I/O流模式ADIOS2引擎类型性能优化建议总结ADIOS2介绍与使用指南什么是ADIOS2?ADIOS2(AdaptableInputOutputSystemversion2)是一
《网络攻防技术》《数据分析与挖掘》《网络体系结构与安全防护》这三个研究领域就业如何？扣棣编程其他网络数据分析安全
这几个研究领域都是当前信息技术领域的热点方向，就业前景总体来说都非常不错，但各有侧重和特点。我来帮你详细分析一下：1.网络攻防技术就业前景：非常火热且持续增长。核心方向：渗透测试、漏洞挖掘与分析、恶意软件分析、入侵检测/防御、应急响应、威胁情报、安全审计、红蓝对抗等。市场需求：极高。数字化转型深入、网络攻击日益频繁和复杂（勒索软件、APT攻击、供应链攻击等）、数据安全与隐私保护法规（如GDPR、中
核密度估计KDE和概率密度函数PDF（深入浅出）赵孝正深度学习数学基础 pdf KDE
目录1.和密度估计（KDE）核密度估计的基本原理核密度估计的公式核密度估计的应用Python中的KDE实现示例代码结果解释解释结果总结2.概率密度函数（PDF）概率密度函数（PDF）是怎么工作的：用图画来解释解释这个图：问题解答：总结3.核密度估计（KDE）和概率密度函数（PDF）之间的关系故事开始：第一种方法：概率密度函数（PDF）第二种方法：核密度估计（KDE）总结一下：问题解答：1.和密度估
CIANNA由天体物理学家提供/为天体物理学家提供的卷积交互式人工神经网络 struggle2025 神经网络
一、软件介绍文末提供程序和源码下载CIANNA是一个通用的深度学习框架，主要用于天文数据分析。根据天体物理问题解决的相关性添加功能和优化。CIANNA可用于为各种任务构建和训练大型神经网络模型，并提供高级Python接口（类似于keras、pytorch等）。CIANNA的特点之一是它定制实施了受YOLO启发的对象探测器，用于2D或3D射电天文数据产品中的星系探测。该框架通过低级CUDA编程完全实
PyTorch study notes[4]
文章目录thesystemofequationsreferencesthesystemofequationsthedefinitionofmatrixwithmathematicalform.thefollowingsamplecodeexpressesthemaxtrixandsquarematrix.importtorch#从Python列表创建矩阵matrix=torch.tensor([[
Python 移位操作与 C移位操作你搁这儿写bug呢？ Python 移位操作 Python C
在C语言中左移：m>nm>>n表示把m向右移动n位，右移n位时，最右边的n位将被抛弃，最左边空出来的位置使用符号位填充。在Python中右移n位可以定义为除以pow(2,n)，左移n位可以定义为乘以pow(2,n)；对于普通整数是没有溢出检查的,因此若结果的绝对值大于等于pow(2,31)，这个运算会截掉相应的位并且符号位也在移位处理之列.参考：https://www.cnblogs.com/zh
Python的移位运算符墨宇的博客 Python python
Python的移位运算符正整数的移位运算#1.正整数左移相当于乘以二>>>4>>4>>8>>14>>
Python爬虫短视频平台数据抓取：抓取视频和评论技术方案数据狐（DataFox） 2025年爬虫实战项目 python 爬虫开发语言
一、摘要本方案提供完整的Python爬虫实现流程，涵盖短视频平台(以抖音为例)的视频与评论数据采集技术，包含环境配置、核心代码实现及反爬优化策略。通过模拟浏览器操作、API接口分析及数据持久化处理，实现高效合规的数据采集。二、引言短视频平台数据具有巨大商业价值，但直接爬取面临动态渲染、加密参数等反爬机制挑战。本方案采用混合技术路线，结合网页解析与移动端API分析，平衡效率与成功率。三、环境配置基础
Python HTTP日志分析：Nginx/Apache日志的Python解析华科℡云网络协议负载均衡运维
Web服务器日志是监控流量模式、性能瓶颈及安全威胁的关键数据源。Python凭借其丰富的库生态，可高效解析Nginx与Apache的日志格式，实现结构化数据提取与分析。日志格式解析基础Nginx默认采用combined格式，字段包括：$remote_addr（客户端IP）、$time_local（时间戳）、$request（请求方法+URL+协议）、$status（HTTP状态码）、$body_b
Python HTTP服务监控：Prometheus与自定义Exporter开发指南
在微服务架构中，HTTP服务的高效监控对保障系统稳定性至关重要。Prometheus作为云原生监控标杆，通过其Pull模型与灵活的指标体系，结合Python开发的自定义Exporter，可实现HTTP服务性能、可用性及业务指标的全面观测。Prometheus监控核心机制Prometheus采用时间序列数据库存储指标数据，每条数据由指标名称（如http_requests_total）、标签（如met
Host '*' is not allowed to connect to this MariaDB server weixin_34358365 数据库 python
2019独角兽企业重金招聘Python工程师标准>>>MYSQL权限问题原因：安装MySQL时没有勾选“Enablerootaccessfromremotemachines”如何开启MySQL的远程帐号-1）首先以root帐户登陆MySQL在Windows主机中点击开始菜单，运行，输入“cmd”，进入控制台，然后cd进入MySQL的bin目录下，然后输入下面的命令。>MySQL-uroot-p12
合规型区块链RWA系统解决方案报告——机构资产数字化的终极武器 Ashlee_guweng22346 区块链需求分析架构 python eclipse c#git
（跨境金融科技解决方案白皮书）一、直击机构客户四大痛点痛点传统方案缺陷我们的破局点✖️跨境资产流动性差结算周期30+天，摩擦成本超8%▶️7×24h全球实时交易（速度提升90%）✖️合规成本飙升KYC/AML人工审核占成本35%+▶️自动化合规引擎（成本降低50%）✖️资产透明度缺失多层中介导致权属不清▶️链上全生命周期溯源（100%防篡改）✖️新型资产配置难非标资产难分割、难定价▶️碎片化代币发
AI+实时计算如何赋能金融系统？DolphinDB 在国泰君安期货年度中期策略会的演讲
6月25日，国泰君安期货2025年度中期策略会在上海顺利开幕。本次策略会以“观势明变，本固枝荣”为主题，特邀15位重量级行业嘉宾和52位明星分析师发表精彩观点，DolphinDB受邀出席会议并作主题演讲。实时计算如何赋能量化投研交易下午13:30分，AI投资主题分论坛正式启幕，DolphinDB创始人周小华博士在随后登台发言，带来了题为《AI+实时计算赋能量化金融》的精彩发言。演讲中，周小华博士首
稳定币技术全解：从货币锚定机制到区块链金融基础设施 Ashlee_guweng22346 游戏区块链金融架构人工智能自动化 java
引言：稳定币的技术定位根据国际清算银行（BIS）2025年定义：稳定币是以法定资产或算法机制维持价值稳定的区块链代币，其本质是传统金融与加密技术的接口层。核心价值：解决加密货币波动性问题→成为DeFi生态的计价基准与结算工具第一章技术原理：稳定币如何实现“稳定”？1.1锚定机制的三类技术路径graphTBA[稳定币类型]-->B[法币储备型]A-->C[加密资产抵押型]A-->D[算法调控型]B-
Django ORM 1. 创建模型（Model）博观而约取 Python django 数据库 python
1.ORM介绍什么是ORM？ORM，全称Object-RelationalMapping（对象关系映射），一种通过对象操作数据库的技术。它的核心思想是：我们不直接写SQL，而是用Python对象（类/实例）来操作数据库表和记录。ORM就像一个“翻译官”，帮我们把Python代码翻译成数据库能听懂的SQL命令。为什么使用ORM?Django中的ORM提供了一个高层次、抽象化的接口来操作数据库，它的优
SQLite 数据库在大数据分析中的应用潜力数据库管理艺术数据库 sqlite 数据分析 ai
SQLite数据库在大数据分析中的应用潜力关键词：SQLite、大数据分析、轻量级数据库、嵌入式数据库、数据仓库、OLAP、性能优化摘要：本文深入探讨了SQLite这一轻量级嵌入式数据库在大数据分析领域的应用潜力。我们将从SQLite的核心架构出发，分析其在大数据场景下的优势和限制，并通过实际案例展示如何通过优化策略和扩展技术使SQLite能够处理大规模数据集。文章包含性能对比测试、优化技巧和实际
Python中np.vstack和np.hstack的应用解释
Python中np.vstack和np.hstack的应用解释用法说明对于np.vstack和np.hstack各自有两种用法•第1种：np.vstack((a,b))或np.hstack((a,b))，即常规用法，也就是两个维数相等的ndarray在对应的方向上进行合并•第2种：np.vstack(a)或np.hstack(a)，对一个ndarray在其内部对应的方向上进行合并，这种属于非常规用
python np.hstack gz153016 python语法总结
importnumpyasnparr1=np.array([1,2,3])arr2=np.array([4,5,6])#print('np.vstack((arr1,arr2)):',np.vstack((arr1,arr2)))print('np.hstack((arr1,arr2)):',np.hstack((arr1,arr2)))#np.hstack((arr1,arr2)):[12345
Python个人学习基础笔记-3.爬虫（1）孜宸润泽 python 学习笔记
一.爬虫的定义爬虫（crawler/spider）是模拟浏览器行为，按照编写规则，自动接收网页信息的工具。通常而言爬虫首先从初始URL集选择URL，向目标网页发起请求，获取网页的HTML源码，然后将获取的数据进行解析过滤，保存我们所需要的标题、内容等，最后提取新的URL加入待爬序列。爬虫常见所需要的库包括Request库、BeautifulSoup4库、Scrapy库和Selenium库等。二.R
和李沐老师学深度学习--2.数据操作部分代码实现（学习笔记）
大家对代码有不懂地方都可以上网去查找，最好是有一定的数据分析基础比较容易理解，李沐老师课程视频链接我放在这里了大家有不懂都可以观看课程进行学习04数据操作+数据预处理【动手学深度学习v2】_哔哩哔哩_bilibili深度学习课程电子书：大家可以使用翻译插件观看书的内容Preface—DiveintoDeepLearning1.0.3documentation深度学习github项目：https:/
Python开发AI智能体(三)———Langchain定义提示词模板【本人】 Agent智能体 python 人工智能 langchain 语言模型
前言上篇文章给大家介绍AI项目检测平台LangSmish以及开源框架Langchain的使用，并且带领大家编写了一个案例。这篇文章将介绍在Langchain框架中如何定义提示词模板一、什么是提示词模板？提示词模板（PromptTemplate）是大语言模型（LLM）应用开发中的核心概念，本质是预定义的提示结构框架。它通过将静态文本与动态变量结合，实现标准化、可复用的提示生成机制。它提示词可以是一个
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息