xu_yushu

Matlab 模糊C均值聚类分析与因子分析实验报告

Matlab 模糊C均值聚类分析与因子分析实验报告

提示：数据资源在本CSDN号的上传资料中直接领取

1 引言

数据：gyzb.mat（按顺序对应每一列）为：31个省市区的国有控股企业的主要指标（包括：总利润（亿元）、总资产贡献率（%）、资产负债率（%）、流动资产周转次数（次/年）、工业成本费用利用率（%）和人均主营收入（万元/人））。需要使用数据分析方法对该数据进行分析，试着得到一些结论。这里使用的分析方法为：模糊C均值聚类分析、因子分析。

2 算法原理

2.1 模糊C均值聚类分析的简介及算法原理：

（1）简介：

模糊C均值聚类分析（FCM，Fuzzy c-means）是从C从均值算法（Hard c-means）发展而来的。模糊聚类分析是根据研究对象本身的属性来构造模糊矩阵，并在此基础上根据隶属度来确定聚类关系，即确定样本之间的模糊关系定量。

（2）算法原理：

（3）算法步骤：

【1】设置好聚类类别数，设定迭代收敛条件，初始化各个聚类中心；

【2】用当前的聚类中心，计算隶属度值度函数。

【3】使用隶属度函数，重新计算计算各个聚类的中心。

【4】重复【2】、【3】的运算，直到各个样本的隶属度稳定；

【5】当算法收敛时，就得到了各类的聚类中心和各样本对于各类的隶属度值，从而完成了模糊聚类划分。

2.2 因子分析的简介及算法原理：

（1）简介：

因子分析(factor analysis)是通过研究多个变量间相关矩阵（或协方差矩阵）的内部依赖关系，找出能综合所有变量主要信息的少数几个随机变量的一种统计分析方法、预处理方法、降维技术。这几个随机变量不能直接测量，通常称为因子。各个因子间互不相关，所有变量都可以表示成公因子的线性组合。因子分析的目的就是减少变量的数目，用少量因子（若干更基本的有代表的变量）代替所有变量去分析整个问题；这些更基本的变量也叫做公共因子或共性因子。

（2）算法原理：

设有n个样本，p个指标，X = (X1, X2, X3, ……，XP)T为随机向量，要寻找的公因子为F = (F1,F2,……，Fm)T，则模型

X1 = a11F1 + a12F2 + …… + a1mFm + ε1

X2 = a21F1 + a22F2 + …… + a2mFm + ε2

……

XP = aP1F1 + aP2F2 + …… + apmFm +εp

被称为因子模型。矩阵A = (aij)称为因子载荷矩阵，aij为因子载荷（loading）,其实质就是公因子Fi和变量Xj的相关系数。ε为特殊因子，代表公因子以外的影响因素所导致的（不能被公因子所解释的）变量变异，在实际分析时忽略不计。

对于求得的公因子，需要观察它们在哪些变量上有较大的载荷，再据此说明该公因子的实际含义。但对于分析得到的初始因子模型，其因子载荷矩阵往往比较复杂，难于对因子Fi给出一个合理解释，此时可以进一步做因子旋转，以便旋转后得到更加合理的解释。

（3）算法步骤：

【1】将原始数据标准化，以消除变量间在数量级和量纲上的不同。

【2】求标准化后的样本数据的相关系数矩阵。

【2】求其特征值和特征向量。

【3】计算方差贡献率和累积方差贡献率。

【4】确定因子。

【5】进行因子旋转，使因子变量更具有可解释性。

【6】计算因子得分。

（4）适用范围：

用途范围广泛。但要求样本数据的各个变量应当具有相关性，不彼此独立。因子分析中公因子应当具有实际意义。

3 实验结果与分析

(实验思路,步骤及结果分析)

3.1 模糊C均值聚类分析的实验结果与分析：

（1）实验思路：

数据文件gyzb.mat是一个每一列都是数据值的样本数据矩阵，没有可供判断类别列也没有时间值等。想到刚大致学了模糊C均值聚类分析，便考虑到选择对gyzb.mat数据文件进行模糊C均值聚类分析。加上Matlab有强大的fcm()等自带函数，就开始实验了。

（2）实验步骤：

【1】先导入gyzb.mat数据文件，然后观察数据的大致情况；

【2】选择模糊C均值聚类分析；

【3】先在matlab脚本中写好大致的代码思路；

【4】再试着进行编写matlab代码；

【5】对运行得出的结果及统计图进行分析。

（3）结果及分析：

（3.1）matlab代码：

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 
clc
% （1）导入样本数据
load('gyzb_data.mat');
disp('【1】模糊C均值聚类分析:')
% （2）设置类的数量为3
num_cluster = 3;
% （3）进行模糊C均值聚类分析
% num_cluster为类的数量；gyzb_data为样本数据；center是一个表示聚类中心的坐标矩阵；
% u是类组成函数矩阵，包括每类中包含的样本数据的等级，0表示空类，1表示满员，介于0~1表示部分填充的类。在每次循环中，目标函数被最小化以搜索类别的最佳位置。
% obj_fcn是最佳位置的值；
disp('(1)Iteration count为迭代次数，obj. fcn为最佳位置的值：')
[center, u, obj_fcn] = fcm(gyzb_data, num_cluster);
disp('(2)聚类中心的坐标矩阵：')
disp(center)
disp('(3)类组成函数矩阵：')
disp(u)
% （4）查找并输出隶属矩阵u每列最大值的行标，确定每个样本的类
id1 = find(u(1, :) == max(u));
id2 = find(u(2, :) == max(u));
id3 = find(u(3, :) == max(u));
disp('(4)聚类结果：')
disp('(4.1)属于第一类[id1]的样本数据行号：')
disp(id1)
disp('(4.2)属于第二类[id2]的样本数据行号：')
disp(id2)
disp('(4.3)属于第三类[id3]的样本数据行号：')
disp(id3)
% （5）选取样本数据的前两列（属性）进行绘图，来可视化。
figure(1);
plot(gyzb_data(:,1),gyzb_data(:,2),'r.','MarkerSize',12)
title('样本数据的前两列的散点图：')
xlabel('样本数据的前第一列值');
ylabel('样本数据的前第二列值');
figure(2);
plot(gyzb_data(id1, 1), gyzb_data(id1, 2), 'marker', '*', 'color', 'r');
hold on
plot(gyzb_data(id2, 1), gyzb_data(id2, 2), 'marker', '*', 'color', 'g');
hold on
plot(gyzb_data(id3, 1), gyzb_data(id3, 2), 'marker', '*', 'color', 'b');
title('样本的模糊C均值聚类示意图：')
xlabel('样本数据的前第一列值');
ylabel('样本数据的前第二列值');
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *

(3.2)实验截图及分析：

【1】Iteration count 代表迭代次数，观察这组数据，当迭代了24次时，迭代过程中的目标函数趋于稳定时，此时停止迭代，计算出聚类中心、隶属度等结果。但多次测量后每次的迭代次数是不确定的。

【2】上图为聚类中心的坐标矩阵、隶属度矩阵（类组成函数矩阵）。每组数据对应3个聚类中心的隶属度，第m列代表第m组数据，分别对应四个聚类中心的隶属度值。

【3】上图为多次测试（设置类的数量为3，由于每次测试都是一样，这里就用只显示一张图）的用聚类结果：

属于第一类的5组数据：1，9,15,19,27

属于第二类的8组数据：2,7,8,10,11,17,23,31

属于第三类的18组数据：3,4,5,6,12,13,14,16,18,20,21,22,24,25,26,28,29,30

【4】该图是样本数据的前两列的散点图，由于样本数据不变，因而该图也是趋于不变。

【4】上面这两张图的在不改变类别（簇）的数目，几乎是趋于不变的，（由于每次测试都是一样，这里就用只显示一张图），可见，在设定好同一数目的类别（簇）下，模糊C聚类分析下即使每次迭代次数可能不一样，但结果总是会区于一个稳定值，聚类结果也是趋于一个结果。但聚类结果还是受到研究者所设置的聚类数目的多少等影响，即主观影响大。

3.2 因子分析的实验结果与分析：

（1）实验思路：

数据文件gyzb.mat是一个每一列都是数据值的样本数据矩阵，没有可供判断类别列也没有时间值等。考虑到可选择对gyzb.mat数据文件进行因子分析，加上Matlab有factoran()等自带函数，就开始实验了。

（2）实验步骤：

【1】先导入gyzb.mat数据文件，然后观察数据的大致情况；

【2】选择因子分析；

【3】先在matlab脚本中写好大致的代码思路；

【4】再试着进行编写matlab代码;

【5】对运行得出的结果及统计图进行分析。

（3）结果及分析：

（3.1）matlab代码：

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
disp(' ')
disp('【2】因子分析：')
% （1）导入样本数据
% （2）使用标准化，对样本进行归一化处理, z为标准化后的数据，mu是原样本的均值，sigma是原样本的方差。
z  = zscore(gyzb_data);
% （3）计算z的相关系数矩阵,r为样本的相关系数矩阵
r = corrcoef(z);
disp('(1)标准化后的样本的相关系数矩阵：')
disp(r)
% （4）设置3个公共因子
number = 3;
% （5）进行因子分析
% 求lambda是因子载荷值；psi是方差构成的向量；T是旋转矩阵；% stats是相关信息统计；F是因子得分矩阵；number是公共因子的数量；
[lambda, psi, T, stats, F] = factoran(gyzb_data, number);
disp('(2) 3个公共因子的情况下：')
disp('(2.1)因子载荷值：')
disp(lambda)
disp('(2.2)方差构成的向量：')
disp(psi)
disp('(2.3)旋转矩阵为：')
disp(T)
% （6）计算贡献率并绘制出柱形图
ctb = 100 * sum(lambda .^ 2) / size(gyzb_data, 2);
disp('(3)3个因子的方差贡献率(单位为 %)：')
disp(ctb)
figure(3)
bar(ctb)
title('3个因子的方差贡献率柱形图：')
xlabel('因子序号');
ylabel('方差贡献率(单位为 %)')
% （7）计算累积方差贡献率
cumctb = cumsum(ctb);
disp('(4)因子的累积方差贡献率(单位为 %)：')
disp(cumctb)
% （8）输出因子得分矩阵 F
disp('(5)因子得分矩阵：')
disp(F)
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *

（3.2）实验截图及分析：

【1】由于上下三张图的方差贡献率、累积方差贡献率、旋转矩阵、因子得分矩阵等可见：3个因子的累积方差贡献率为69.8283%，已经超过方差贡献率的2/3，可知因子分析是需要大量数据的，这里大致可以用这3个公共因子（更基本的变量）替代原来的6个变量，来实现降维。

4 总结

模糊C聚类分析的结果不是惟一的，受测试者的主观因素算是很大的。样本数据中的异常值和特殊变量对聚类分析的结果影响比较大。由于样本数据量太少，因而因子分析不太合适。一般而言，样本量还是需要为变量数的10倍以上。但两种分析方法都相互表意了这个数据文件gyzb.mat是可以进行压缩的。即对行进行归类，对列进行抽出公共因子。

参考文献

Matlab的模糊聚类分析的传递方法》，计算机应用，2004.11

郭珉，《模糊聚类分析算法的Matlab语言实现》，农业网络信息，2004.5

由伟、刘亚秀，《MATLAB数据分析教程》，清华大学出版社

李柏年、吴礼斌，《MATLAB数据分析方法》，机械工业出版社

你可能感兴趣的:(实验报告,数据分析,聚类,数据分析,matlab)

基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
matlab卷积矩阵绝对值,MATLAB矩阵分析和计算 weixin_39928736 matlab卷积矩阵绝对值
MATLAB矩阵分析和计算编辑锁定讨论上传视频本词条缺少概述图，补充相关内容使词条更完整，还能快速升级，赶紧来编辑吧！《MATLAB矩阵分析和计算》是清华大学出版社出版的一本图书。[1]书名MATLAB矩阵分析和计算作者杜树春出版社清华大学出版社出版时间2019年6月1日定价59元ISBN9787302524816印次1-1印刷日期2019.04.23MATLAB矩阵分析和计算图书内容编辑本书侧重
数据分析常用指标名词解释及计算公式走过冬季学习笔记数据分析大数据
数据分析中有大量常用指标，它们帮助我们量化业务表现、用户行为、产品健康度等。下面是一些核心指标的名词解释及计算方式，按常见类别分类：一、流量与用户规模指标页面浏览量名词解释：用户访问网站或应用时，每次加载或刷新一个页面就算一次PV。它衡量的是页面被打开的总次数。计算方式：PV=∑(所有页面被加载的次数)(通常由埋点或日志直接统计)独立访客数名词解释：在特定时间范围内（如一天、一周、一月），访问网站
24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策
Ollama平台里最流行的embedding模型： nomic-embed-text 模型介绍和实践 skywalk8163 人工智能 embedding 人工智能服务器
nomic-embed-text模型介绍nomic-embed-text是一个基于SentenceTransformers库的句子嵌入模型，专门用于特征提取和句子相似度计算。该模型在多个任务上表现出色，特别是在分类、检索和聚类任务中。其核心优势在于能够生成高质量的句子嵌入，这些嵌入在语义上非常接近，从而在相似度计算和分类任务中表现优异。之所以选用这个模型，是因为在Ollama网站查找这个模型，发现
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
Matlab裁剪降水数据：1km掩膜制作实战咋（za）说 matlab 降水数据处理裁剪掩膜制作降水数据裁剪 China_Pre
1km降水数据处理-制作数据裁剪掩膜1.数据概述2掩膜文件制作示例2.1数据准备2.2matlab掩膜制作示例代码3结语中国1km分辨率逐月降水量数据集（1901-2024）是高精度、长时间序列的气候数据产品，广泛应用于水文、生态、农业等领域的研究。本篇基于应用需要，以该数据集为输入，结合研究区shp边界文件，制作用于数据提取/裁剪的掩膜文件。下面为具体内容。1.数据概述中国1km分辨率逐
python-pandas数据分析+案例分析
文章目录前言一、汽车销售数据可视化分析1.各年度汽车总销量及环比，各车类、级别车辆销量及环比2.车辆销售规模及环比、不同价位车销量及环比3.各车系、厂商、品牌车销量及环比，市占率及变化趋势4.品牌、车类、车型、级别的各top销量二、地质灾害航空公司客户价值分析1.原始数据存在少量的缺失值和异常值前言一、汽车销售数据可视化分析1.各年度汽车总销量及环比，各车类、级别车辆销量及环比importnump
数据分析案例-电脑笔记本价格数据可视化分析3 艾派森数据分析信息可视化 python 数据分析数据挖掘电脑
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍3.技术工具
用Python做数据分析之数据统计学掌门 Python 数据分析大数据 python 数据分析人工智能
接下来说说数据统计部分，这里主要介绍数据采样，标准差，协方差和相关系数的使用方法。1、数据采样Excel的数据分析功能中提供了数据抽样的功能，如下图所示。Python通过sample函数完成数据采样。2、数据抽样Sample是进行数据采样的函数，设置n的数量就可以了。函数自动返回参与的结果。1#简单的数据采样2df_inner.sample(n=3)3、简单随机采样Weights参数是采样的权重，
pandas销售数据分析
pandas销售数据分析数据保存在data目录消费者数据：customers.csv商品数据：products.csv交易数据：transactions.csvcustomers.csv数据结构：字段描述customer_id客户IDgender性别age年龄region地区membership_date会员日期products.csv数据结构：字段描述product_id产品IDcategory
MATLAB实现快速非局部均值图像去噪方法一只爪子
本文还有配套的精品资源，点击获取简介：非局部均值滤波是一种先进的图像去噪技术，与传统方法相比，它利用图像的全局信息来去除噪声，同时保持图像细节。该算法通过搜索和利用整个图像中相似的像素块，对每个像素点进行去噪处理。本文提供的MATLAB代码FAST_NLM_II.m实现此算法，并包含必要的参数设置、相似性计算、加权平均和图像更新步骤。了解并应用此代码是学习和进一步改进非局部均值滤波技术的基础。1.
Python数据分析：从入门到精通
引言在当今数据驱动的时代，数据分析已成为企业和组织做出明智决策的关键。Python作为一种强大的编程语言，因其简洁性和丰富的数据分析库而成为数据科学领域的首选工具。无论你是初学者还是有一定经验的数据分析师，本指南都将带你从入门到精通Python数据分析，掌握必备技能和最佳实践。数据分析的重要性与Python的角色数据分析涉及收集、处理和解释数据，以揭示模式、趋势和见解。它有助于解决复杂问题，优化业
数据分析框架和方法 XiaoQiong.Zhang 人工智能
一、核心分析框架(TheBigPictureFrameworks)描述性分析(WhatHappened?)目的：了解过去发生了什么，描述现状，监控业务健康。核心工作：汇总、聚合、计算基础指标(KPI)，生成报表和仪表盘。常用方法/指标：计数/求和/平均值/中位数：DAU/MAU，总销售额，客单价等。比率：转化率，点击率，流失率，毛利率等。分布：用户活跃度分布、订单金额分布、地域分布等。常用于理解群
python基于Hadoop的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
matlab画信号图方法,献给初学者：手把手教你绘制信号通路图
信号通路是指能将细胞外的分子信号经细胞膜传入细胞内发挥效应的一系列酶促反应通路。细胞信号通路图是科研研究过程中最常见也是最常用到的，如何绘制适合我们自己科研课题的信号通路图呢？可以试试pathwaybuildertool软件。这款软件简单易学，即便是零基础的同学，也可以做出漂亮的信号通路。1.首先，打开PathwayBuilderTool2.0软件，软件自带分子生物学会用到的基本元素，如不同的细胞
【数据分析】多数据集网络分析：探索健康与退休研究中的变量关系生信学习者1 数据分析 (2025版)数据分析 r语言数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理函数网络分析画图保存图片总结系统信息介绍在医学和社会科学研究中，理解多个变量之间的复杂关系对于揭示潜在的病理生理机制和社会行为模式至关重要。本文介绍了一种基于R语言的网络分析方法，用于探索HRS（健康与退休研究）及其类似研究（CHARLS、ELSA、MHAS、SHARE）中的变
基于Python的旅游数据可视化应用
摘要本文详细介绍了一个功能完善的基于Python语言开发的旅游行业数据可视化分析应用系统。该系统采用Pandas这一强大的数据处理库进行数据清洗、转换和预处理工作，确保数据质量可靠。在可视化展示方面，系统整合了Matplotlib和Seaborn两大主流可视化库，通过丰富的图表类型直观呈现数据分析结果。特别值得一提的是，所有可视化图表均采用统一的绿色主题配色方案，这种设计不仅美观大方，更能突出体现
Pandas 学习教程 _pass_ Data-Alaysis pandas 信息可视化
目录定义基本操作一维数组操作二维数组操作数据选择过滤数据处理数据清洗数据转换数据分析排序分组聚合数据透视表高级操作合并数据时间序列处理自定义函数调用数据可视化集成数据导出和导入大数据分块处理定义全称：'paneldata'and'pythondataanalysis'Analy:Series(一维数据)、DataFrame(二维数据)主要应用：数据清洗：处理缺失数据、重复数据等数据转换：改变数据的
【kafka】在Linux系统中部署配置Kafka的详细用法教程分享景天科技苑 linux基础与进阶 shell脚本编写实战 kafka linux 分布式 kafka安装配置 kafka优化
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，PyQt5和Tkinter桌面应用开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，云原生K8S，Prometheus监控，数据分析，Django
动态时间规整（Dynamic Time Warping，DTW）介绍 EmorZhong 机器学习人工智能深度学习数据结构算法
在时序数据分析中，动态时间规整（DynamicTimeWarping，DTW）是一种经典的用于度量两个时间序列相似度的算法。它的核心价值在于解决了传统距离度量（如欧氏距离）在处理时间序列时的局限性——尤其是当序列存在时间错位（如节奏快慢不同）或长度差异时，仍能准确捕捉它们的“形状相似性”。一、为什么需要DTW？传统的距离度量（如欧氏距离）要求两个时间序列必须长度相同且时间点严格对齐。但实际场景中，
【论文复现】Taylor算法用于TOA（到达时间）的三维标签位置解算，360个标签、12个基站的环境作为验证，附MATLAB例程 MATLAB卡尔曼论文复现算法 matlab 开发语言
本文给出论文《基于Taylor-Chan算法的改进UWB室内三维定位方法》中的Taylor算法来解算TOA的复现程序（MATLAB）。使用论文中给定的12个锚点/360个测试的标签用来测试算法性能文章目录运行结果程序介绍核心功能概述结果输出应用场景MATLAB源代码运行结果误差输出：程序介绍本程序基于Taylor迭代算法，实现了对三维空间内360个目标点的TOA（TimeofArrival）定位解
python 计算生态概览的概述
文章目录前言python计算生态库的介绍1.网络爬虫2.数据分析3.文本处理4.数据可视化5.机器学习6.图形用户界面7.游戏开发8.网络应用开发前言python计算生态概览的解释Python计算生态概览是对Python作为一门强大而广泛使用的编程语言所拥有的庞大软件集合的整体描述和概述。这个生态体系不仅包含了Python的标准库（stdlib），即随Python解释器安装的基本模块，还涵盖了极其
matlab计算转子系统的固有频率、振型、不平衡响应
可以计算转子系统的固有频率、振型、不平衡响应MatrixRiccati/code/Dichotomy_1(2).m,2210MatrixRiccati/code/Dichotomy_1.m,2210MatrixRiccati/code/RiccatiSY_1.m,2756MatrixRiccati/code/Trans1x(2).m,451MatrixRiccati/code/Trans1x.m,
一文搞懂怎么入门大模型
在人工智能飞速发展的当下，大模型已然成为推动众多领域创新变革的核心力量。无论是在智能客服、内容创作，还是数据分析、科学研究等方面，大模型都展现出了令人瞩目的能力。对于渴望踏入大模型领域的初学者而言，构建一个系统且全面的入门路径至关重要。接下来，我们将以DeepSeek为例，详细阐述如何系统地入门大模型。一、理论基础：搭建认知框架在深入实践之前，理解大模型的基础理论是关键。大模型，通常指具有海量参数
基于MATLAB的语音信号预处理
3.1.语音信号的预加重处理对语音的的高频部分进行加重以去除口唇部分的影响，就必须要对输入的数字语音信号进行预加重处理，以此来增加语音的高频分辨率。通常通过传递函数为的一阶FIR高通数字滤波器来实现预加重，其中为预加重系数，0.9<<1.0。设n时刻的语音采样值为X(n),经过预加重处理的结果为，这里取=0.98。图3.1为该高通滤波器的幅频特性及相频特性。图3.2中分别给出了预加重前和预加重后的
从零到一：王者荣耀英雄数据采集与技能图谱异步爬虫实战程序员威哥爬虫 python 开发语言自动化 scrapy
引言：随着游戏行业的迅猛发展，王者荣耀作为一款深受玩家喜爱的手游，其英雄数据和技能信息成为了爬虫开发者研究的热点之一。通过抓取英雄数据并对技能图谱进行可视化，我们不仅能够更好地理解游戏数据，还可以为游戏爱好者或数据分析师提供一个有价值的数据分析平台。本篇文章将带你一步步实现王者荣耀英雄数据的采集与技能图谱的可视化，并使用异步爬虫技术提高爬取效率。我们将结合实际开发中的需求，深入讲解如何使用异步爬虫
【HTML网页】智能健康监测——全方位健康管理专家（包含网页源代码）
智能健康监测分析系统智能健康监测分析系统是一种基于物联网、大数据、人工智能等技术的综合性健康管理解决方案。它具有以下六大核心功能：实时监测系统通过智能传感器和可穿戴设备，实时采集用户的生理数据，例如心率、血压、血氧饱和度、血糖水平和睡眠质量等，确保用户随时掌握自己的身体状况。健康数据分析利用人工智能和大数据分析技术，系统对采集到的数据进行处理和分析，提取有价值的健康信息，如心率变异性、呼吸频率等，
【字节跳动】数据挖掘面试题0010：解释全国人均收入下降，各省份人均收入增加的现象，属于辛普森悖论（开放性问题）言析数智数据挖掘常见面试题辛普森悖论局部与整体分析差异归因数据分析面试题
文章大纲一、辛普森悖论的核心定义二、现象成因：加权平均中的“权重偏移”三、数学逻辑与案例说明1.数学表达式2.具体案例四、辛普森悖论的本质：忽略“混杂因素”的影响五、生活中常见的辛普森悖论案例及应对策略1.医疗疗法效果评估2.大学录取率的性别偏差3.篮球运动员投篮效率4.公司员工绩效与部门规模如何利用辛普森悖论？（数据分析中的价值）六、总结全国人均收入下降而各省份人均收入增加的现象，确实属于辛普森
大模型学习应用 6: Vercel 部署自动获取微信公众号文章获取项目大地之灯大模型应用与学习学习微信大模型应用开发 python github flask
大模型落地开发实战指南！请关注微信公众号：「AGI启程号」深入浅出，助你轻松入门！数据分析、深度学习、大模型与算法的综合进阶，尽在CSDN博客主页本文将详细介绍如何在Vercel平台上部署自动微信公众号文章获取项目，包括项目结构、代码实现、部署流程以及常见问题的解决方案。注意：本项目源代码github链接，可自行克隆到自己的代码仓库完成vercel部署，注意需要稳定ip输出（微信白名单需求），免费
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他