数模竞赛Paid answer

2022年数维杯数学建模A题银行效率评价与破产成因分析求解全过程文档及程序

2022年数维杯数学建模

A题银行效率评价与破产成因分析

原题再现：

银行在国家经济社会发展过程中扮演者重要的决策，银行的破产会对企业和个人造成众多不利的影响。相比国内的银行，国际银行的倒闭频次更高，因此国际银行倒闭原因的分析与预测受到众多管理者与学术研究者的广泛关注。附件 1中提供了波兰 2017 年至 2021 年的现存或倒闭银行的 64 项指标数据，各项数据指标具有对应的解释。请你结合这些数据完成以下五项任务：
任务 1：请你从这 64 项数据中整理出适合的投入产出数据，并对各银行的效率展开对应评价，同时提供银行倒闭效率的分界线；
任务 2：请利用该 64 项指标对银行倒闭的原因进行挖掘，并提供最为重要的5 项指标数据及其对应的权重；
任务 3：对任务 1 和任务 2 中的银行倒闭分析结果展开比对分析，同时提出一个精确的倒闭风险预测模型；
任务 4：你能否从 2021 年银行数据中筛选出最具代表意义的 20 家现存银行和 20 家倒闭银行，并利用这些银行数据对其它银行倒闭风险进行预测；
任务 5：你能否通过相关理论分析出 2017 年至 2021 年的银行数据中哪些数据可能来自同一家银行，并结合同一家银行的时间序列数据预测哪些银行呈现出了倒闭的趋势。

整体求解过程概述(摘要)

随着全球经济一体化趋势加剧，金融业所面临的挑战越发明显。许多银行由于不良贷款、坏账等情况激增，导致银行负债乃至破产，为此对其他国家的银行进行效率评价及破产分析，从而避免我国国民经济遭到损失显得至关重要。本文建立5个数学模型进行深入分析研究。
针对问题 1，首先对附件的数据进行预处理，剔除缺失值占比高的银行数据。而问题1属于提取数据问题，为了整理出合适的投入产出数据，我们建立基于主成分分析法和聚类分析法的银行效率评价模型，利用碎石图、因子荷载象限二维分布图和热力图进行分析，得到 13 个主要指标，并进行银行效率评价，然后利用聚类分析，将 13 个指标的中心值的连线作为银行倒闭效率的分界线。
针对问题 2，是关于数据指标提取问题，为得到最重要的 5 项指标，我们建立基于模糊神经网络的银行倒闭分析模型，结合模糊神经网络拓扑结构图与相关算法进行银行银行倒闭指标的挖掘，根据雷达图找出权重最大的 5 项指标为 X19、X34、X48、X26 和 X44，其权重值依次为 0.0661、0.0424、0.0339、0.0322 、0.0280。
针对问题 3，首先我们对问题 1 和问题 2 的结果进行对比分析，然后根据 18 个重要指标，建立基于动态参数优化神经网络的银行倒闭风险预测模型，在将传统神经网络和动态参数优化的神经网络精度进行对比后，发现后者预测银行倒闭风险更加准确。
针对问题 4，是关于数据筛选和预测类问题，为筛选出最具代表意义的 20 家现存银行和 20 家倒闭银行，我们建立基于 XGBoost 的银行筛选与预测模型，在结合聚类分析的方法和问题 1、2 和 3 的结论进行筛选后，通过 SPSSPRO 对其他银行倒闭风险进行了预测。
针对问题 5，我们首先规定同一银行具备三大特征：（1）五年内 64 项指标地数据平均误差不超过 16%；（2）指标变化的范围在 10%以内；（3）指标的波动情况大抵一致。然后结合相关理论，建立动态神经网络时间序列预测模型，经过网络训练发现有324 家银行为同一家银行，其中时间序列预测呈现倒闭趋势的银行有 167 家，未出现倒闭趋势的银行有 157 家。
最后，我们详细地分析了模型的误差，总结了所建立的模型优缺点，并对模型的发展做出了推广。

问题分析：

对于问题 1，整理出合适的投入产出数据，有利于了解银行的经营状况，从而更好做出分析。首先我们对数据进行预处理，剔除缺失值多的银行数据。而问题1属于提取数据问题，对解决这类问题，我们建立基于主成分分析法和聚类分析法的银行效率评价模型，利用碎石图、因子荷载象限二维分布图和热力图进行分析提取主要指标，并进行银行效率评价，然后利用聚类分析，分为两类，求解银行倒闭效率的分界线，具体思路如图 2-1 所示。

对于问题 2，数据指标提取问题，为得到最重要的 5 项指标，我们建立基于模糊神经网络的银行倒闭评价模型，结合模糊神经网络拓扑结构图与相关算法进行银行银行倒闭指标的挖掘，根据雷达图的结果，最后找出权重最大的 5项指标，具体思路如图 2-2 所示。

对于问题 3 是一个预测类问题，首先我们对问题 1 和问题 2 的结果进行分析，然后根据以上两个问题的重要指标，建立基于动态参数优化神经网络的银行倒闭风险预测模型进行求解，并对传统神经网络和动态参数优化的神经网络精度进行对比后，利用后者预测银行倒闭风险，具体思路如图 2-3 所示。

对于问题 4，属于数据筛选和预测类问题，为筛选出最具代表意义的 20 家现存银行和 20 家倒闭银行，我们建立基于 XGBoost 的银行筛选与预测模型，利用聚类分析法和问题 1、2 和 3 的结论进行筛选，并通过 SPSSPRO 根据 XGBoost 模型，结合 40 家银行的数据预测其它银行，具体思路如图 2-4 所示。

对于问题 5，属于数据筛选和预测类问题，我们首先规定同一银行具备的特征，然后根据特征情况进行筛选，然后建立动态神经网络时间序列预测模型，预测同一银行的倒闭趋势，具体思路如图 2-5 所示。

模型假设：

1. 假设题目所给的银行 64 个指标的数据真实可靠；
2．假设银行倒闭的因素取决于所给的 64 个指标，且无其他因素影响。
3．假设数据处理所剔除的数据不影响 5 个问题的分析；
4．假设最具代表性的银行具有共同的特性；
5．假设问题 5 可以通过前 4 个问题的结果进行预测。

数据的预处理

本题中的共有五年的数据，其中第一年数据包含预测期第一年的财务比率和相应的类别标签，表示 5 年后的破产状态。该数据包含 7027 个实例（财务报表），271 个代表破产的银行，6756 个在预测期内没有破产的银行。第二年的数据包含预测期第二年的财务比率和相应的类标签，表示 4 年后的破产状态。数据包含 10173 个实例（财务报表），400 个代表破产的银行，9773 个在预测期没有破产的银行。第三年的数据包含预测期第三年的财务比率和相应的类标签，表示 3 年后的破产状态。数据包含 10503 个实例（财务报表），495个代表破产的银行，10008个在预测期没有破产的银行。第四年的数据包含 9792 个实例（财务报表），515 个代表破产的银行，9277 个在预测期内没有破产的银行。第五年的数据包含预测期第 5 年的财务比率和相应的类标签，表示 1 年后的破产状态。数据包含 5910 个实例（财务报表），410 个代表破产的银行，5500 个在预测期没有破产的银行。我们将这些数据进行汇总，预处理后发现，存在数据缺失，如图5-1、图 5-2 和图 5-3 所示。

通过上述三幅图，可以发现 65 个变量中，有 18 个变量存在缺失值，全部数据中缺失数据占 0.322%，由于部分银行缺失数据较多，我们选择将其剔除，不予考虑。

模型的建立与求解

基于主成分分析法和聚类分析法的银行效率分析模型的建立

在研究波兰各个银行的效率评价问题研究上，需要将 64 类指标进行分类，挖掘出合适的投入指标和产出指标，而主成分分析法和聚类分析法刚好通过全面地进行分析比较符合题目要求，所以我们建立基于主成分分析法和聚类分析法的银行效率评价模型进行研究。

主成分分析法

由于所给数据缺乏一定的合理性，而主成分分析法是通过降维处理，将原始指标转化为少数几个综合指标进行分析，派出了不确定性。另外本题中的原始指标达到了64 个，指标数量多、相关关系复杂，因此选取主成分妇女洗发，可以在最大限度上保留原始指标信息基础上，进行降维处理，从而得到具有代表性的指标。

聚类分析方法

聚类分析法是常用的数据分析方法，根据指标的特性进行分类，从而减少研究指标的数量，具有较强的科学性，避免了认为因素对定性分析的影响。

基于主成分分析法和聚类分析法的银行效率分析模型的求解

根据上述所建立的模型，利用 SPSSPRO 软件进行求解，其求解步骤为：
1）进行 KMO 和 Bartlett 的检验，判断是否可以进行主成分分析。对于 KMO 值：0.8 上非常合适做主成分分析，0.7-0.8 之间一般适合，0.6-0.7 之间不太适合，0.5-0.6 之间表示差，0.5 下表示极不适合，对于 Bartlett 的检验（p < 0.05,严格来说 p < 0.01），若显著性小于 0.05 或 0.01，拒绝原假设，则说明可以做主成分分析，若不拒绝原假设，则说明这些变量可能独立提供一些信息，不适合做主成分分析;
2）通过分析方差解释表格和碎石图，确定主成分的数量方差解释表格主要是看主成分对于变量解释的贡献率（可以理解为究竟需要多少主成分才能把变量表达为100%），如果太低（如低于 60%）则需要调整主成分数据;碎石图的作用是根据特征值下降的坡度来确认需要选择的主成分个数，这两者结合可用于确认或调整主成分个数;
3）通过分析主成分载荷系数与热力图，可以分析到每个主成分中隐变量的重要性;
4）基于主成分载荷图通过将多主成分降维成双主成分或者三主成分，通过象限图的方式呈现主成分的空间分布。如果提取2个主成分时，无法呈现三维载荷主成分散点图，如果提取 1 个主成分时，无法显示主成分象限图;
5）通过分析成分矩阵，得出主成分成分公式与权重;
6）输出主成分分析法综合得分。

从图 5-4，可以清楚地发现，通过主成分分析法，对特征值进行重要性分析，排名前八的指标特征值明显比其他指标地特征值大，分别为 11.687、10.773、6.831、3.447、2.957、2.855、2.350、和 2.193，同样可以根据特征值下降的坡度得到需要选择的主成分个数为8个。由于前四个主成分特征值相比其他而言更为显著，所以本题中对银行投入和产出的数据指标为 4 种主成分。

根据图 5-5，通过象限图的方式呈现主成分的空间分布。由于我们提取的主成分为4 个，所以可以直接呈现二维载荷主成分散点图，从而得到第一象限分布指标数量最多，第二象限和第四象限次之，第三象限最少。根据上述情况，我们得到主成分的权重分布结果，如表 5-1 所示。

由图 5-7，可知 X13 的相关性为-0.129, X16 的相关性为-0.134,存在较强的相关性。X12 的相关性为-0.111、X13 的相关性为-0.129、X17 的相关性为-0.111、X19 的相关性为-0.107、X23 的相关性为-0.109、X25 的相关性为-0.130、X39 的相关性为-0.110、X46的相关性为-0.110。
根据热力图的相关性可以发现 X1、X2、X6、X8、X12、X13、X16、X17、X19、X23、X25、X39 和 X46，一共 13 项与银行是否倒闭存在较强的相关性，我们对着 13项进行聚类分析，且分为两类。分析步骤为：
1）根据字段进行聚类类别差异性分析;
2）根据聚类汇总分析各聚类类别的频数;
3）根据数据集聚类标注可以知道每一个样本数据被分到哪个类别;
4）聚类中心坐标可以用于分析各样本与中心点的距离;
5）对分析进行综述。

由上图可以得知，聚类结果共分为 2 类，聚类类别 1 的频数为 19719，所占百分比为 99.995%；聚类类别 2 的频数为 1，所占百分比为 0.005%，所得到的聚类中心点坐标如表 5-2 所示。

对于问题一，为整理出适合银行的投入产出数据，我们基于主成分分析法和相关性分析法进行建模求解，通过碎石图、因子荷载象限二维分布图和相关性热力图可视化得到适合的指标为 X1 净利润/总资产、X2 负债总额/资产总额、X6 留存收益/总资产、X8 权益的账面价值/总负债、X12 毛利/短期负债、X13(毛利+折旧)/销售额、X16(毛利润+折旧)/总负债、X17 总资产/总负债、X19 毛利/销售额、X23 净利润/销售额、X25(权益+股本)/总资产、X39 销售利润/销售额和 X46(流动资产-存货)/短期负债，一共 13 项
可以代表银行的投入产出数据，具体评价情况见支撑材料。为了计算银行倒闭效率的分界线，我们利用聚类分析方法进行分析求解，设置以银行是否倒闭作为类别，将 64 种指标分为两类，计算各样本与中心点的距离，即为银行倒闭效率的分界线，结果可视化如图 5-9 所示。

基于动态参数优化神经网络的银行倒闭风险预测模型的求解

我们将处理后的数据进行汇总，在任务 1 中得到适合投入和产出的指标为 X1 净利润/总资产、X2 负债总额/资产总额、X6 留存收益/总资产、X8 权益的账面价值/总负债、X12 毛利/短期负债、X13(毛利+折旧)/销售额、X16(毛利润+折旧)/总负债、X17 总资产/总负债、X19 毛利/销售额、X23 净利润/销售额、X25(权益+股本)/总资产、X39 销售利润/销售额和 X46(流动资产-存货)/短期负债，一共 13 项，在任务 2 中得到最为重要的五项指标为 X19 毛利/销售额、X34 营业费用/总负债、X48 EBITDA (经营活动的利润-折扣)/总资产、X26 (净利润+折扣)/总负债和 X44 (应收账款* 365)/销售额。所以在这里我们将 18 项指标数据数据带入上述模型，通过 SPSSPRO 软件进行分析预测。具体步骤如下：
(1)通过训练集数据来建立动态参数优化神经网络回归模型。
(2)将建立的动态参数优化神经网络模型应用到训练、测试数据，得到模型评估结果。
(3)由于动态参数优化神经网络具有随机性，每次运算的结果不一样，若保存本次训练模型，后续可以直接上传数据代入到本次训练模型进行计算预测。

通过图 5-13 和图 5-14. 可以得到传统神经网络模型和动态参数优化神经网络模型的预测结果，通过图示发现，经过动态参数优化的神经网络预测精度远远比传统神经网络的精度高，两者精度对比如表 5-5 所示。

针对问题 3，我们总结问题 1 和问题 2 并进行对比分析发现影响银行破产的因素共有 18 个，分别为 X1净利润/总资产、X2负债总额/资产总额、X6留存收益/总资产、X8权益的账面价值/总负债、X12 毛利/短期负债、X13(毛利+折旧)/销售额、X16(毛利润+折旧)/总负债、X17 总资产/总负债、X19 毛利/销售额、X23 净利润/销售额、X25(权益+股本)/总资产、X39 销售利润/销售额和 X46(流动资产-存货)/短期负债、X19 毛利/销售额、X34 营业费用/总负债、X48 EBITDA (经营活动的利润-折扣)/总资产、X26 (净利润+折扣)/总负债和 X44 (应收账款*365)/销售额。影响因素具有多角度、多层次、集中性的特征。
之后我们通过 SPSSPRO 软件进行模型求解，将 18 项影响指标作为自变量、是否破产作为因变量，进行预测分析，并对比传统神经网络预测和动态参数优化的神经网络预测精度，发现动态参数优化的神经网络对银行倒闭风险预测更为准确，说明所建立的模型具有准确性、可靠性、合理性。

论文缩略图：

程序代码：

from fileinput import filename
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier as KNN
# 导入数据
df = pd.read_excel('附件（数据处理后 5 年合集）.xlsx')
data = df.iloc[:1:65] #X
target = df.iloc[:65:66] #y
X_train,X_test,y_train,y_test = train_test_split(data,target,test_size=0.2,random_state=0)
# K 值为 1，模型训练
knn = KNN(n_neighbors=1)
knn.fit(X_train,y_train)
# 模型预测，模型评估
y_pred = knn.predict(X_test)
knn_c = round(knn.score(X_test,y_test),2)
print("Test set score:",knn_c)
#Test set score:0.95
#持久化模型
import joblib
filename = 'KNN_model.sav' joblib.dump(knn,filename)
''' 以下为 k 近邻算法与其他算法的对'''
from sklearn.linear_model import LogisticRegression
clf = LogisticRegression(penalty='l2')
clf.fit(X_train, y_train)
LogisticRegression_c = round(clf.score(X_test,y_test),6)
from sklearn.ensemble import RandomForestClassifier
clf = RandomForestClassifier(n_estimators=8)
clf.fit(X_train, y_train)
RandomForestClassifier_c = round(clf.score(X_test,y_test),6)
from sklearn.svm import SVC
clf = SVC(kernel='rbf', probability=True)
clf.fit(X_train, y_train)
SVC_c = round(clf.score(X_test,y_test),6)
from sklearn import tree
clf = tree.DecisionTreeClassifier()
clf.fit(X_train, y_train)
DecisionTreeClassifier_c = round(clf.score(X_test,y_test),6)
print(LogisticRegression_c,RandomForestClassifier_c,SVC_c,DecisionTreeClassifier_c)''' def add_labels(rects): #添加数据标签
for rect in rects:
height = rect.get_height()
plt.text(rect.get_x() + rect.get_width()/2, height, height, ha='center', va='bottom')
rect.set_edgecolor('white')
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = 'SimHei' plt.rcParams['axes.unicode_minus'] = False
xz = ['K 近邻','逻辑回归','随机森林','支持向量机','决策树']
yz = [0.95,0.945,0.948,0.950,0.942]
bar = plt.bar(xz,yz,width=0.5,color=['skyblue','tomato','peru','tan','grey'])
add_labels(bar)
plt.xlabel('不同的分类算法')
plt.ylabel('scores')
plt.show()

10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
我的烦恼余建梅
我的烦恼。女儿问我：“你给学生布置什么作文题目？”“《我的烦恼》。”“他们都这么大了，你觉得他们还有烦恼吗？”“有啊！每个人都会有自己烦恼。”“我不相信，大人是没有烦恼的，如果说一定有的话，你的烦恼和我写作业有关，而且是小烦恼。不像我，天天被你说，有这样的妈妈，烦恼是没完没了。”女儿愤愤不平。每个人都会有自己的烦恼，处在上有老下有小的年纪，烦恼多的数不完。想干好工作带好孩子，想孝顺父母又想经营好自
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
如果做到轻松在股市赚钱？只要坚持这三个原则。履霜之人
大A股里向来就有七亏二平一赚的说法，能赚钱的都是少数人。否则股市就成了慈善机构，人人都有钱赚，谁还要上班？所以说亏钱是正常的，或者说是应该的。那么那些赚钱的人又是如何做到的呢？普通人能不能找到捷径去分一杯羹呢？方法是有的，但要做到需要你有极高的自律。第一，控制仓位，散户最大的问题是追涨杀跌，只要涨起来，就把钱往股票上砸，然后被套，隔天跌的受不了，又一刀切，全部割肉。来来回回间，遍体鳞伤。所以散户首
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本