A题是经典的数据问题,那对这类问题我们首先要做的就是数据预处理,至于怎么处理,删除或者填补都是可以的。
问题1:请你从这64项数据中整理出适合的投入产出数据,并对各银行的效率展开对应评价,同时提供银行倒闭效率的分界线;
银行效率是银行竞争能力的综合反映,也是银行核心竞争力的重要体现,因此,提升银行效率是预防金融风险,促进银行业可持续发展的基础。
针对存在的问题提出建议,并运用数据包络分析法(DEA)构建了银行效率评价指标体系。 来源于下面这个论文。
《基于DEA模型的商业银行经营效率实证研究》
再进阶一点在传统两阶段DEA模型中引入交叉效率,并对两阶段生产系统的内部结构进行优化,构建了考虑共享投入和非期望产出的两阶段交叉效率模型。来源于下面这个论文。
《基于两阶段交叉效率模型的中国商业银行效率评价》
下面给出DEA算法的程序:
a=input('请输入投入数据:','s');
X=str2num(a);%用户输入多指标输入矩阵X
b=input('请输入产出数据:','s');
Y=str2num(b);%用户输入多指标输出矩阵Y
n=size(X', 1)
m=size(X,1);
s=size(Y,1);
epsilon=10^-10;
f=[zeros(1,n) -epsilon*ones(1,m+s) 1];
A=zeros(1,n+m+s+1);b=0;
LB=zeros(n+m+s+1,1);
UB=[];
LB(n+m+s+1)=-inf;
for i=1:n;
Aeq=[X eye(m) zeros(m,s) -X(:,i)
Y zeros(s,m) -eye(s) zeros(s,1)
ones(1,n) zeros(1,m+s+1)];
beq=[zeros(m,1)
Y(:,i)
1];
w(:,i)=linprog(f, A, b, Aeq, beq, LB, UB);
end
w
Lambda=w([1:n],:)
s_minus=w([n+1:n+m],:)
s_plus=w([n+m+1:n+m+s],:)
theta=w(n+m+s+1,:)
转载于:https://www.cnblogs.com/hydbk/p/6675703.html
问题2:请利用该 64 项指标对银行倒闭的原因进行挖掘,并提供最为重要的 5 项指标数据及其对应的权重;
针对这个问题,针对这个问题,确定权重和评价的方法有很多,熵权法、Tosis、灰色评价等。第一问还是比较简单的,可以参考2020年的国赛C题。
function y=guiyi(x,type,ymin,ymax)
[n,m]=size(x);
y=zeros(n,m);
for i=1:n
for j=1:m
y(i,j)=x(i,j)/sum(x(:,j));%归一化方法
end
end
function [s,w]=shang(x,ind)
%s返回各行(样本)得分,w返回各列权重
[n,m]=size(x); % n个样本, m个指标
X=guiyi(x,1,0.002,0.996);
%%计算第j个指标下,第i个样本占该指标的比重p(i,j)
for i=1:n
for j=1:m
p(i,j)=X(i,j)/sum(X(:,j));
end
end
%%计算第j个指标的熵值e(j)
k=1/log(n);
e=ones(1,m);
for j=1:m
e(j)=-k*sum(p(:,j).*log(p(:,j)));
end
d=ones(1,m)-e; %计算信息熵冗余度
w=d./sum(d); %求权值w
s=100*w*X'; %求综合得分
转载于:数学建模——熵权法Matlab编程计算权重_TyaTi的博客-CSDN博客_matlab求权重代码
问题3:对任务 1 和任务 2 中的银行倒闭分析结果展开比对分析,同时提出 一个精确的倒闭风险预测模型;
针对这个问题,这个问题可以考虑用机器学习结合0-1分类。无非就是倒闭或者没倒闭,0-1分类还是很好做的。
问题4:你能否从 2021 年银行数据中筛选出最具代表意义的 20 家现存银行 和 20 家倒闭银行,并利用这些银行数据对其它银行倒闭风险进行预测;
针对这个问题,套用前一问的模型即可。
问题5:你能否通过相关理论分析出 2017 年至 2021 年的银行数据中哪些数 据可能来自同一家银行,并结合同一家银行的时间序列数据预测哪些银行呈现出 了倒闭的趋势。
针对这个问题的话,目前我还没想到很好的做法,后面想到了我再更新。
对于数据题来说,数据预处理是必须的!!!
以上只是我个人拙见,不一定是正确的。后续有新思路或者修改,我会继续更新。
对这种题,机器学习是比较好的选择。而且机器学习花点时间琢磨琢磨,上手还是比较容易的。
先进行数据预处理(必须要做的)确定权重分析主要指标,方便后续计算。PCA、LDA、LLE、Lapacian Eigenmaps这四个是机器学习的降维算法。
再确定权重,上述算法都可以,当然还有很多。上面的也不是最好的选择,只是个人的一点拙见。
至于风险预测,Logistic回归这个算法是很经典的机器学习二分类,简单易用。