weixin_39529302

python贷款_利用python分析Lending Club贷款数据

一、目录

文章分为以下几个内容项目介绍

数据准备

数据处理

构建模型

总结

二、项目介绍

本项目分析P2P平台Lending Club的贷款数据，Lending Club的背景可参照以下链接：娜姐的学习录：Lending Club贷款数据分析背景介绍zhuanlan.zhihu.com

主要分析以下两个问题：了解P2P平台的业务特点、产品类型、资产质量、风险定价？

有什么建议？

三、数据准备数据下载地址：https://www.lendingclub.com/info/download-data.actionwww.lendingclub.com开发样本与验证样本选择在保证建模数据量的前提下，建模样本尽量选择距离当前时间较近的可用数据。因为如果距离当前时间较长的话，客户群体可能发生变化，社会环境、市场也有可能发生变化。缩短模型迭代周期。开发样本期间：2017年第3、4季度(7月~12月)，2018第1季度的数据

验证样本区间：2018年第2季度(4月~6月)

本次开发样本总共有349219条数据；验证样本数据有130733条数据，所以我们的数据量还是比较大的。

四、数据处理

第一步，导入包

import pandas as pd

import numpy as np

import matplotlib as mp1

import matplotlib.pyplot as plt

#plt.style.use('ggplot') #风格设置近似R这种的ggplot库

import seaborn as sns

sns.set(context='notebook',style='ticks',palette="GnBu_d",font_scale=1.5,font='ETBembo',rc={"figure.figsize": (10, 6)})

import warnings

warnings.filterwarnings('ignore')

%matplotlib inline

from pyecharts import Pie

pd.set_option('precision',5)#设置精度

pd.set_option('display.float_format', lambda x: '%.5f' % x)#为了直观的显示数字，不采用科学计数法

pd.options.display.max_rows = 200 #最多显示200行

第二步，合并文件

lcvs=[]

lcvs.append(pd.read_csv('E:/chenln/Documents/python/ch3/project/LoanStats_2017Q3.csv',skiprows=0,header=1))

lcvs.append(pd.read_csv('E:/chenln/Documents/python/ch3/project/LoanStats_2017Q4.csv',skiprows=1))

lcvs.append(pd.read_csv('E:/chenln/Documents/python/ch3/project/LoanStats_2018Q1.csv',skiprows=1))

file=pd.concat(lcvs)

#三季度合并的文件写入到prj.csv

file.to_csv('E:/chenln/Documents/python/ch3/project/prj.csv',index=False)

第三步，将准备好的数据读入Pandas

data=pd.read_csv('E:/chenln/Documents/python/ch3/project/prj.csv',encoding="ISO-8859-1")

#使用shape方法查看数据行数及列数

data.shape

(349219, 145)

'''使用head()方法默认查看前5行数据，另外还有tail()方法是默认查看后5行,当然可以输入整数作为参考自定义查看行数'''

data.head(3)

data.info()

#共有145个变量，38个是object类型

RangeIndex: 349219 entries, 0 to 349218

Columns: 145 entries, id to settlement_term

dtypes: float64(107), object(38)

memory usage: 386.3+ MB

首先对于object这类非数值变量，pandas的describe方法会给出变量的：‘非空值数量’、‘unique数量’、‘最大频数变量’、‘最大频数’，

为了直观的观测缺失情况，后面添加了‘缺失值比重’

data.select_dtypes(include=['O']).describe().T\

.assign(missing_pct=data.apply(lambda x : (len(x)-x.count())/len(x)))

从图表中可以得到部分信息：

1.贷款共7个等级，占比最多的是B级

2.还款的形式有两种，占比最多的是36个月

3.贷款人中大多数人工龄10+年

第四步，数据处理

(1) 缺失值处理

percent_count = len(data)/10 # 设定阀值，90%

data = data.dropna(thresh = percent_count, axis = 1 ) #若某一列数据缺失的数量超过阀值就会被删除

data.to_csv('E:/chenln/Documents/python/ch3/project/loans_pro.csv', index = False) # 将预处理后的数据转化为csv

data=pd.read_csv('E:/chenln/Documents/python/ch3/project/loans_pro.csv',encoding="ISO-8859-1")

data.shape

#经过初步处理，变量由145个减少到120

(349219, 120)

#按缺失值比例从大到小排列

data.isnull().sum(axis=0).sort_values(ascending=False)/float(len(data))

对于缺失值处理，各种资料给出很多方法，包括：直接舍弃(一般缺失值占比较多的)

均值，中位数，众数等填充法(一般缺失值占比较少的)，或者填充0

用上下数据进行填充

插值法(拉格朗日插值法)

机器学习算法拟合或预测缺失值(如使用随机森林进行缺失值预测)

关于缺失值的处理，我们分以下2种情况：

1)针对缺失值比例10%的以上的变量，我们结合实际业务变量含义，

对缺失比例较大的变量的缺失值进行处理999填充处理或者均值填充处理。

# 缺失比例较大的变量的缺失值处理

values = {'sec_app_revol_util': 999,

'verification_status_joint': 999,

'revol_bal_joint': 999,

'annual_inc_joint': 999,

'sec_app_collections_12_mths_ex_med': 999,

'sec_app_chargeoff_within_12_mths': 999,

'sec_app_num_rev_accts': 999,

'sec_app_open_act_il': 999,

'sec_app_open_acc': 999,

'sec_app_mort_acc': 999,

'sec_app_inq_last_6mths': 999,

'sec_app_earliest_cr_line': 999,

'dti_joint': 999,

'mths_since_last_record': 999,

'mths_since_recent_bc_dlq': 999,

'mths_since_last_major_derog': 999,

'mths_since_recent_revol_delinq': 999,

'mths_since_last_delinq': 999,

'next_pymnt_d': 999,

'il_util': 999,

'mths_since_recent_inq': 999

}

data.fillna(value=values,inplace = True)

2)针对缺失比例低于10%的变量，考虑到我们建模数据量还是比较大的，我们采取直接删除含任意缺失值的记录。

data.shape

(349219, 120)

data = data.dropna(axis = 0, how='any')

data=data.reset_index(drop=True)

data.shape

(291736, 120)

删除含任意缺失值的记录后，我们的数据量从34.9万条变为29.1万条，删除了约5万条含缺失值的记录。

(2) 数据清洗-异常值处理

从分析目的出发，将从原始数据中挑选出一些变量进行分析

analysis_columns=['issue_d','term','int_rate','grade','home_ownership','verification_status',

'purpose','loan_amnt','total_pymnt','out_prncp',

'total_rec_int','total_rec_prncp','installment',

'annual_inc','dti','addr_state','open_acc','loan_status',

'delinq_amnt','acc_now_delinq','tot_coll_amt','emp_length']

analysis_data = data[analysis_columns]

删除特征变量值结尾多余的字符，比如'year','years','%',' ','months','xx'等；

def del_str_process(data):

data['term'] = data['term'].str.replace('months',' ').str.strip().astype('float64')

data['int_rate'] = data['int_rate'].str.replace('%',' ').str.strip().astype('float64')

data['emp_length'] = data['emp_length'].str.replace('< 1 year','0').str.replace('10+ years','11').str.replace('n/a','-1').str.strip()

data['emp_length'] = data['emp_length'].str.replace('years',' ').str.replace('year',' ').str.strip()

data['emp_length'][data['emp_length'] == '10+'] = 11

data['emp_length'] = data['emp_length'].astype('float64')

data['issue_d'] = pd.to_datetime(data['issue_d'])

data['annual_inc'] = data['annual_inc'].astype('float64') # 未核实的年收入(本来就是数值型)

return data

analysis_data = del_str_process(analysis_data)

#analysis_data.head()

好坏定义如下：

Bad: Late (31-120 days) , Charged Off(坏账)

Indeterminate: Late (16-30 days) ,In Grace Period (处于宽限期)

Good: Current, Fully Paid(结清)

def coding(col, codeDict):

colCoded = pd.Series(col, copy=True)

for key, value in codeDict.items():

colCoded.replace(key, value, inplace=True)

return colCoded

#把贷款状态LoanStatus编码为违约=1, 正常=0, 表现期：2:

pd.value_counts(analysis_data["loan_status"])

analysis_data["loan_status"] = coding(analysis_data["loan_status"], {'Current':0,

'Fully Paid':0,

'Late (31-120 days)':1,

'Charged Off':1,

'Late (16-30 days)':2,

'In Grace Period':2,

'Default': 2})

print( '\nAfter Coding:')

pd.value_counts(analysis_data["loan_status"])

After Coding:

0 274570

1 12921

2 4245

Name: loan_status, dtype: int64

第五步，构建模型

单变量分析

1.贷款状态分布

analysis_data["loan_status"].value_counts().plot.pie(autopct='%1.2f%%',figsize=(5, 5))

从图中可以看出，平台贷款发生违约的数量占少数。贷款正常状态占比为94.12%。贷款状态将作为我们建模的标签

2.贷款金额分布

plt.figure(figsize=(10, 5))

sns.set()

sns.set_context("notebook", font_scale=1, rc={"lines.linewidth":2 } )

sdisplot_loan = sns.distplot(analysis_data['loan_amnt'] )

plt.xticks(rotation=90)

plt.xlabel('Loan amount')

plt.title('Loan amount\'s distribution')

sdisplot_loan.figure.savefig("Loan_amount")

贷款金额最小值为1,000美元，最大值为40,000美元，

贷款金额主要集中在10,000美元左右，中位数为12,000美元，

可以看出平台业务主要以小额贷款为主。贷款金额越大风险越大。

3.贷款期限分布

analysis_data["term"].value_counts().plot.pie(autopct='%1.2f%%',figsize=(5, 5))

平台贷款产品期限分为36个月和60个月两种，其中贷款期限为60个月的贷款占比为30.03%，贷款期限为36个月的贷款占比为69.97%。

一般来说贷款期限越长，不确定性越大，违约的可能性更大，期限较长的贷款产品风险越高。从期限角度看，平台风险偏小的资产占大部分。

4.贷款产品用途种类比较

analysis_data['purpose'].value_counts()# 按借款用途统作统计

debt_consolidation 156286

credit_card 61824

other 24041

home_improvement 21931

major_purchase 8081

medical 4571

small_business 3576

car 3536

house 3086

vacation 2340

moving 2285

renewable_energy 176

wedding 2

educational 1

Name: purpose, dtype: int64

plt.figure(figsize=(8, 4))

sns.set()

sns.set_context("notebook", font_scale=1.5, rc={"lines.linewidth": 2.5})

total = float(len(data.index))

ax = sns.countplot(x="purpose", data=analysis_data, palette="Set2")

ax.set(yscale = "log")

plt.xticks(rotation=90)

plt.title('Purpose')

plt.show()

ax.figure.savefig("Purpose")

P2P平台贷款用途最多的为债务重组(借新债还旧债)，其次是信用卡还款，第三是Other。一般来说，贷款用途为债务重组和信用卡还款的客户现金流较为紧张，此类客户也是在传统银行渠道无法贷款才转来P2P平台贷款，这部分客户的偿还贷款能力较弱，发生违约的可能性较高。用途为Other的贷款，需要通过其他维度来分析其风险。

5.客户信用等级占比

analysis_data["grade"].value_counts().plot.pie(autopct='%1.2f%%',figsize=(10, 10))

Lending Club平台对客户的信用等级分7类，A~G，信用等级为A的客户信用评分最高，信用等级为G的客户最低，信用等级的客户发生违约的可能性更低。目前，平台客户信用等级占比较多的客户为B类，其次是C类和A类，三者合计占比为81.12%。此外信用等级为E、F、G类的客户占比为5.42%。可以看出Lending Club授信部门对申请人的资信情况把关较严。

6.贷款利率种类分布

analysis_data.describe()

plt.figure(figsize=(18, 9))

sns.set()

sns.set_context("notebook", font_scale=1, rc={"lines.linewidth":2 } )

sdisplot_loan = sns.distplot(analysis_data['int_rate'] )

plt.xticks(rotation=90)

plt.xlabel('Interest Rate')

plt.title('Interest Rate\'s distribution')

sdisplot_loan.figure.savefig("Interest Rate")

Lending Club平台贷款利率中位数12.86%，利率最高值为31.00%，利率最小值为5.32%。利率是资金的价格，利率越高，借款人借贷成本越高，借款人违约的可能性越高。

多维变量分析

1.探索贷款与时间的关系

data_group_by_date = analysis_data.groupby(['issue_d']).sum()

data_group_by_date.reset_index(inplace=True)

data_group_by_date['issue_month'] = data_group_by_date['issue_d'].apply(lambda x: x.to_period('M')) # 新增月份列

loan_amount_group_by_month = data_group_by_date.groupby('issue_month')['loan_amnt'].sum() #按月份统计贷款金额

loan_amount_group_by_month_df = pd.DataFrame(loan_amount_group_by_month).reset_index() # 输出结果转成DataFrame

loan_amount_group_by_month_df

# 可视化

plt.figure(figsize=(15, 9))

sns.set()

sns.set_context("notebook", font_scale=1, rc={"lines.linewidth": 2})

plot1 = sns.barplot(y= 'loan_amnt', x='issue_month',data=loan_amount_group_by_month_df )

plt.xlabel('Month')

plt.ylabel('Loan_amount')

plt.title('Mounth VS Loan_amount')

plot1.figure.savefig("Mounth VS Loan_amount.png")

本数据集包含2017Q3, Q4, 2018Q1的数据，初步看来Leding Club平台在该时间段业务趋于平稳。

2.探索贷款金额与州之间的关系

data_group_by_state = analysis_data.groupby(['addr_state'])['loan_amnt'].sum() # 按州统计贷款金额

data_group_by_state_df= data_group_by_state.reset_index() # 将结果转为 dataframe

sns.set()

plt.figure(figsize=(15, 9))

sns.set_context("notebook", font_scale=1, rc={"lines.linewidth": 5})

sbarplot = sns.barplot(y='loan_amnt' , x='addr_state' , data=data_group_by_state_df )

plt.xlabel('State')

plt.ylabel('Loan_amount')

plt.xticks(rotation=90)

plt.title('State VS Loan_amount')

sbarplot.figure.savefig("State VS Loan_amount")

得知Lending Club 的总部在加州，因此加州的市场开拓也相对其他较好。其次是德克萨斯州和纽约州。

同时，从风险防范角度来看，应重点审核这几个城市贷款申请人的基本信息。

3.探索信用评级、贷款期限和利率的关系

data_group_by_grade_term = analysis_data.groupby(['grade', 'term'])['int_rate'].mean()

data_group_by_grade_term_df = pd.DataFrame(data_group_by_grade_term).reset_index()

data_group_by_grade_term_pivot = data_group_by_grade_term_df.pivot(index='grade', columns='term', values='int_rate')

data_group_by_grade_term_pivot # 输出数据透视表

used_data['grade'].value_counts() # 查看信用评级的分布

B 87715

C 85857

A 63066

D 39259

E 11049

F 2823

G 1967

Name: grade, dtype: int64

从表格可以看出，P2P平台的利率最高档为30%，而利率最低档为7%左右，总体利率水平也相对传统银行较高。信用评级从A到G，A的的借款人信用评分最高，财务状况较好，违约发生的可能性较低，因此利率也相对较低。

贷款期限长意味着不确定性增加，风险也随之增加，期限较长的贷款在同信用等级下的借款利率也相对高。

4.探索贷款用途与利率的关系

plt.figure(figsize=(15, 9))

sns.set_context("notebook", font_scale=1.5, rc={"lines.linewidth": 2.5})

#loans['int_rate_num'] = loans['int_rate'].str.rstrip("%").astype("float")

sboxplot = sns.boxplot(y="purpose", x="int_rate", data=analysis_data)

sns.despine(top=True)

plt.xlabel('Interest_Rate')

plt.ylabel('Purpose')

plt.xticks(rotation=90)

plt.show()

sboxplot.figure.savefig("Purpose VS Rate")

贷款用途分别为renewable_enery、small_business以及Other的贷款利率较高。其中贷款用途为renewable_enery的贷款利率为最高。

第六步，总结

1.Lending Club 平台特点平台业务持续稳定发展：平台平稳发展，业务主要集中于加州、德克萨斯州和纽约州。

平台贷款金额以小额贷款为主，贷款金额主要集中在10,000美元左右，小而散的贷款金额能够很好的分散资金风险。

平台贷款利率较高，贷款利率集中在12.86%，贷款利率相对传统金融机构较高。

平台二季度违约风险得到良好的控制，平台贷款发生违约的数量较少，贷款正常状态占比为94.12%。

2.个人建议完善客户画像和产品设计：信贷业务开展前，首先要明确信贷机构的目标客户群、目标客户的特征和画像信息是什么。例如Lending Club平台的small business业务，中小企业目标群体的特征描述应包括能够反映企业的资产负债和现金流相关的财务报表信息或表外债务信息等。完整的客户信息有利于风控人员和系统分析把控违约风险。

优化贷款模型：完善客户信息的同时，借助机器学习的技术持续优化贷款模型。

参考链接：Rho：注册会计师带你探索风险分析(EDA)zhuanlan.zhihu.com

你可能感兴趣的:(python贷款_利用python分析Lending Club贷款数据)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
2021-08-26 影幽
在生活中，女人与男人的感悟往往有所不同。人生最大的舞台就是生活，大幕随时都可能拉开，关键是你愿不愿意表演都无法躲避。在生活中，遇事不要急躁，不要急于下结论，尤其生气时不要做决断，要学会换位思考，大事化小小事化了，把复杂的事情尽量简单处理，千万不要把简单的事情复杂化。永远不要扭曲，别人善意，无药可救。昨天是张过期的支票，明天是张信用卡，只有今天才是现金，要善加利用！执着的攀登者不必去与别人比较自己的
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1