静静的喝酒

机器学习笔记之降维(三)从最大投影方差角度观察主成分分析

机器学习笔记之降维——从最大投影方差角度观察主成分分析

引言
- 回顾：样本均值与样本方差的矩阵表示
- 主成分分析
- - 最大投影方差
  - 基于最大投影方差的最优特征方向求解过程
- 总结

引言

上一节介绍了高维空间中样本均值和样本方差的矩阵表示。本节将介绍主成分分析，并从最大投影方差角度观察主成分分析。

回顾：样本均值与样本方差的矩阵表示

已知包含 $N$ 个样本的数据集合 $\mathcal X$ ，集合中各元素 $x^{(i)} (i=1,2,\cdots,N)\in \mathcal X$ 是 $p$ 维向量：
$\mathcal X = \left(x^{(1)},x^{(2)},\cdots,x^{(N)}\right)^{T} = \begin{pmatrix}x_1^{(1)},x_2^{(1)},\cdots,x_p^{(1)} \\ x_1^{(2)},x_2^{(2)},\cdots,x_p^{(2)} \\ \vdots \\ x_1^{(N)},x_2^{(N)},\cdots,x_p^{(N)}\end{pmatrix}_{N \times p};x^{(i)} \in \mathbb R^p,i=1,2,\cdots,N$

数据集合 $\mathcal X$ 的样本均值 $\bar {\mathcal X}$ 表示如下：
$\bar {\mathcal X}_{p \times 1} = \frac{1}{N} \sum_{i=1}^N x^{(i)} = \frac{1}{N} \mathcal X^{T} \cdot \mathcal I_N$
其中 $\mathcal I_N$ 表示各元素均为1的 $N$ 维列向量；样本均值 $\bar {\mathcal X}$ 是一个 $p$ 维向量；
$\mathcal I_N = \left(1,1,\cdots,1\right)^{T}_{N \times 1}$
数据集合 $\mathcal X$ 的样本方差 $\mathcal S$ 表示如下：
$\begin{aligned} \mathcal S_{p \times p} & = \frac{1}{N} \sum_{i=1}^N (x^{(i)} - \bar {\mathcal X})(x^{(i)} - \bar {\mathcal X})^{T} \\ & = \frac{1}{N} \mathcal X^{T} \cdot \mathcal H \cdot \mathcal X \end{aligned}$
其中 $\mathcal H$ 表示中心矩阵(Centering Matrix)； $\mathcal E_N$ 表示 $N$ 阶单位向量；样本方差 $\mathcal S$ 是一个 $p$ 阶矩阵。
$\mathcal H = \mathcal E_N - \frac{1}{N} \mathcal I_N\mathcal I_N^{T}$

主成分分析

主成分分析(Principle Component Analysis)，其核心是将一组可能线性相关的特征通过正交变换得到一组相互正交的特征。换句话说，它是对 原始特征空间的重构：

假设样本集合 $\mathcal X$ 在样本空间中的表示如下：

import matplotlib.pyplot as plt
import random
import numpy as np

random.seed(1)
def f(x,y):
    z = x + y + random.uniform(-0.75,0.75)
    return [z,x + y]

x = list(np.linspace(0,1.5,100))
y = list(np.linspace(0,1.5,100))
z = [f(i,j)[0] for _,(i,j) in enumerate(zip(x,y))]

fig = plt.figure()
ax = fig.add_subplot(111,projection="3d")
plot_im = ax.plot(x,[f(i,j)[1] for _,(i,j) in enumerate(zip(x,y))],y,c="tab:orange")
im = ax.scatter(x,z,y,s=2,c="tab:blue")
plt.show()

从运行图像可知，上述图像中的样本点均在同一平面内，是否可以将该平面通过旋转，平移等操作将样本点所在平面与样本空间中的任一平面重合，重合后意味着 可以省略一个维度，并且不会丢失样本的特征信息。
上述图像描述的是一个‘极特殊情况’——所有样本点均在同一平面内，因而没有丢失信息。但一般情况下，如果噪声向其他维度延伸，导致降维操作在核心信息保留的基础上，依然会损失一定信息。
换句话说， $z$ 轴信息可以通过 $x, y$ 轴信息进行表示，即 $z$ 轴对于 $x, y$ 之间存在线性相关的情况；

而特征空间重构是基于样本内部维度特征之间可能存在线性相关的情况，从而通过正交变换，使可能存在线性相关的一组特征转换成相互正交的(必然也是线性无关的) 的一组新特征。

最大投影方差

最大投影方差是针对原始特征空间重构的一种角度的方法，其本质上是选择某一特征方向(轴)，使得样本点在该轴上投影结果的方差达到最大。
依然以上图为例，在上述图像中增加一条线：

plot_im_2 = ax.plot([-1 * i + 2 for i in x],[f(i, j)[1] for _,(i,j) in enumerate(zip(x,y))],[-1 * i + 2 for i in y],c="tab:green")

对应图像结果如下图：

可以明显观察得到：蓝色样本点在绿色线上投影结果够成的范围明显小于橙色线上的范围。即样本点在绿色线上的投影方差更小。
可能橙色线也并不是最优特征方向，但相比于绿色线，它更接近最优特征方向。
假设橙色线就是要找的最优特征方向，我们称该特征方向为主成分(Principle Component)。
与该特征方向相垂直的特征方向与该特征方向组成一组正交基(2个)；同理，我们同样可以找到与该正交基均垂直的第三个特征方向，从而构成一组新的正交基(3个)，以此类推。

区别于原始的 $x, y, z$ 三轴，这组正交基就是重构后新的特征空间。
我们发现，这组新的正交基中每个特征方向的权重截然不同：

权重最高的是 橙色线对应的特征方向，因为其投影方差结果最大；
权重次之的是与橙色线相垂直条件下，投影方差最大的特征方向；
权重最小的是与上述两特征方向相垂直的其他特征方向，由于上述样本点均在同一平面内，但该特征方向已经垂直于样本点所在平面，因此其投影方差基本可以忽略不计。

同理，在高维空间中也会得到一组正交基，即两两相互正交的特征方向的集合。并且这些特征方向都是主成分。

在找到这些主成分之后，如果需要降维至 $\mathcal Q$ 维，仅需要找到前 $\mathcal Q$ 个权重最高的主成分，剩余的主成分被忽略掉。
降维过程中可能出现特征信息丢失的原因。

基于最大投影方差的最优特征方向求解过程

如何找到最优特征方向？具体步骤描述如下：

将当前数据集合中的样本中心化：将所有样本点平移至样本空间的中心位置，而样本之间的相对位置不发生变化。
针对数据集合 $\mathcal X$ 中的任意样本点 $x^{(i)} \in \mathcal X$ ，中心化后的样本点结果表示如下：
$\hat {x}^{(i)} = x^{(i)} - \bar {\mathcal X}$
针对中心化后的样本，计算 $\hat {x}^{(i)}$ 关于 某向量 $\vec {u}$ (某特征方向) 的投影结果 $x^{(i)}_{\mathcal S}$ ：
令向量 $\vec {u}$ 的模 $|\vec {u}| = 1$ ， $\hat {x}^{(i)}$ 关于 $\vec {u}$ 的投影结果及对应图像表示如下：

$\begin{aligned} x^{(i)}_{\mathcal S} & = |\hat {x}^{(i)}| \cdot |\vec u| \cdot \cos \theta \\ & = |\hat {x}^{(i)}| \cdot \cos \theta \end{aligned}$
其中 $|\hat {x}^{(i)}|$ 表示中心化后向量 $\hat {x}^{(i)}$ 的模； $\theta$ 表示 $\hat {x}^{(i)}$ 和 $\vec {u}$ 之间的夹角。
而根据向量的乘法公式，向量 $\hat {x}^{(i)}$ 与向量 $\vec {u}$ 之间的乘法结果表示如下：
$\hat {x}^{(i)}$ 在 $\vec{u}$ 的投影结果就是 $\hat {x}^{(i)}$ 和 $\vec{u}$ 的向量乘积结果。
$\begin{aligned} \hat {x}^{(i)} \cdot \vec {u} & = |\hat {x}^{(i)}| \cdot |\vec u| \cdot \cos \theta \\ & = |\hat {x}^{(i)}| \cdot \cos \theta \\ & = x^{(i)}_{\mathcal S} \end{aligned}$
由于投影结果是一个标量，因此，更容易将投影结果表示为如下形式：
$\begin{aligned} x^{(i)}_{\mathcal S} & = \left[\hat x^{(i)}\right]^{T} \cdot \vec u \\ & = \left(x^{(i)} - \bar {\mathcal X}\right)^{T}_{1 \times p} \cdot \vec u_{p \times 1} \end{aligned}$
注意，此时的 $\vec {u}$ 存在约束条件，即 $|\vec {u}| = 1$ ：
向量的模可以随意变化，但方向不会。这里为简化运算，设定其模为1。
$s.t.\quad |\vec {u}| = \vec {u} ^{T} \cdot \vec {u} = 1$
当投影结果计算结束后，继续计算投影结果的方差：
- 由于 $x^{(i)}$ 中心化后 投影的均值为 $0$ ：
  其中 $\mu_{\mathcal S}$ 表示‘投影均值’。
  $\begin{aligned} \mu_{\mathcal S} & = \frac{1}{N} \sum_{i=1}^N x_{\mathcal S}^{(i)} \\ & = \frac{1}{N} \sum_{i=1}^N \left[\left(x^{(i)} - \bar {\mathcal X}\right)^{T} \cdot \vec {u}\right] \end{aligned}$
  并且上述每一项中均含 $\vec {u}$ ，并且 $\vec {u}$ 与 $N$ 无关，因此，将 $\vec {u}$ 提出来：
  $\mu_{\mathcal S} = \left[\frac{1}{N} \sum_{i=1}^N \left(x^{(i)} - \bar {\mathcal X}\right)^{T}\right] \cdot \vec u$
  观察中括号内的项：
  $\bar {\mathcal X}$ 和 $N$ 无关。
  $\begin{aligned} \frac{1}{N} \sum_{i=1}^N \left(x^{(i)} - \bar {\mathcal X}\right)^{T} & = \frac{1}{N} \sum_{i=1}^N x^{(i)} - \frac{1}{N} \cdot N \cdot \bar {\mathcal X} \\ & = \bar {\mathcal X} - \bar {\mathcal X} \\ & = 0 \end{aligned}$
  从而有：
  $\mu_{\mathcal S} = 0 \cdot \vec{u} = 0$
- 投影结果的方差表示如下：
  $\mathcal S_{\mathcal S}^{(i)}$ 表示'投影结果' $x_{\mathcal S}^{(i)}$ 的方差结果。
  $\begin{aligned} \mathcal S_{\mathcal S}^{(i)} & = \left(x_{\mathcal S}^{(i)} - \mu_{\mathcal S}\right)\cdot \left(x_{\mathcal S}^{(i)} - \mu_{\mathcal S}\right)^{T} \\ & = \left(x_{\mathcal S}^{(i)}\right)^2 \\ & = \left[(x^{(i)} - \bar {\mathcal X})^{T} \cdot \vec {u}\right]^2 \end{aligned}$
由于 $\mathcal S_{\mathcal S}^{(i)}$ 仅是中心化后的样本点 $x^{(i)} - \mathcal X$ 在 $\vec {u}$ 上的投影方差，因而 样本空间中所有样本点在 $\vec {u}$ 中投影方差总和 $\mathcal J$ 表示如下：
$\begin{aligned} \mathcal J & = \frac{1}{N}\sum_{i=1}^N \mathcal S_{\mathcal S}^{(i)} \\ & = \frac{1}{N} \sum_{i=1}^N \left[(x^{(i)} - \bar {\mathcal X})^{T} \cdot \vec {u}\right]^2 \\ & = \frac{1}{N} \sum_{i=1}^N \left[(x^{(i)} - \bar {\mathcal X})^{T} \cdot \vec {u}\right]^{T} \cdot \left[(x^{(i)} - \bar {\mathcal X})^{T} \cdot \vec {u}\right] \\ & = \frac{1}{N} \sum_{i=1}^N \vec {u}^{T} \left(x^{(i)} - \bar {\mathcal X}\right) \cdot \left(x^{(i)} - \bar {\mathcal X}\right)^{T}\vec {u} \end{aligned}$
因为 $\vec {u}$ 是特征方向，与 $N$ 无关；因此上式可以继续化简：
$\mathcal J = \vec {u}^{T} \cdot \left[\frac{1}{N} \sum_{i=1}^N \left(x^{(i)} - \bar {\mathcal X}\right)\left(x^{(i)} - \bar {\mathcal X}\right)^{T}\right] \cdot \vec {u}$
中括号内的项是样本集合 $\mathcal X$ 的协方差矩阵，最终样本投影方差总和 $\mathcal J$ 可化简为：
$\mathcal J = \vec {u}^{T} \cdot \mathcal S \cdot \vec {u}$
至此，将最大投影方差思想总结为如下 优化问题：
$\begin{cases} \hat {u} = \mathop{\arg\max}\limits_{\vec u} \mathcal J \\ s.t. \quad \vec {u} ^{T} \cdot \vec {u} = 1 \end{cases}$
使用拉格朗日乘数法处理该问题：
$\mathcal L(\vec u,\lambda) = \vec {u}^{T} \cdot \mathcal S \cdot \vec {u} + \lambda (1 - \vec {u} ^{T} \cdot \vec {u})$
对 $\vec {u}$ 求解偏导，并令导数结果为 $0$ ：
这里依然用到矩阵的求导公式~
$\frac{\partial \mathcal L(\vec u,\lambda)}{\partial \vec u} \triangleq 0 \to 2\mathcal S \cdot \vec u - 2\lambda \cdot \vec u = 0 \\ \to \mathcal S \cdot \vec u = \lambda \cdot \vec u$
观察该式， $\lambda$ 求解结果就是样本集合 $\mathcal X$ 的协方差矩阵 $\mathcal S$ 的特征值(Engen Value)，当求得协方差矩阵 $\mathcal S$ 的最大特征值时，样本投影方差总和 $\mathcal J$ 达到最大。

此时，最大特征值对应的特征向量就是最优特征方向，即第一个主成分；
同理，第二个主成分是 第一个主成分正交的特征向量，也就是第二大特征值对应的特征向量；第三个主成分就是分别与第一、第二主成分两两正交的特征向量，以此类推。

总结

在极特殊(样本分布足够简单)的条件下，利用特征空间重构降维不会损失特征信息，一般情况下，混损失部分特征信息；
主成分并非代表一个特征方向，而是一组正交基，可以看成一组两两相互正交的向量构成的新的特征空间；
只需要求出最优的特征方向，后续的主成分均可通过上一个特征向量的正交空间中找到。并满足新特征向量与之前找出的特征量两两相互正交。

相关参考：
降维算法-从最大化投影方差角度看主成分分析
机器学习-降维3-主成分分析（PCA）-最大投影方差角度

day15 容器有好多东西需要记住的想成为大佬的每一天 c++开发语言
Vectorvector数据结构和数组非常相似，也称为单端数组,与数组不同在于数组是静态空间，而vector可以动态扩展,动态扩展不是在原有空间之后续接空间，而是找更大的内存空间，将原数据拷贝到新空间，释放原空间。构造方式//vector构造方式vectorv1;//默认，无参构造vectorv2(v1.begin(),v1.end());//通过区间的方式进行构造vectorv3(5,20);/
“四预”驱动数字孪生水利：让智慧治水守护山河安澜 GeoSaaS 实景三维智慧城市人工智能 gis 大数据安全
近年来，从黄河秋汛到海河特大洪水，从珠江流域性洪灾到长江罕见骤旱，极端天气频发让水安全问题备受关注。如何实现“治水于未发”？数字孪生水利以“预报、预警、预演、预案”（四预）为核心，正在掀起一场水利治理的智慧革命。一、数字孪生水利：从物理世界到虚拟镜像的跃迁数字孪生水利并非简单的“数字建模”，而是通过高精度传感器、大数据、人工智能等技术，在虚拟空间构建与物理流域完全映射的“数字分身”，实现水情、工情
低空航路：低空经济的基础设施 GeoSaaS 低空经济自动驾驶汽车信息可视化人工智能大数据
低空经济作为新兴产业，正逐渐成为推动城市高质量发展的新引擎。低空航路的构建是实现低空经济发展的关键，它涉及到无人机、电动垂直起降飞行器(eVTOL)等航空器的运行，对城市物流、旅游、农业、应急救援等领域产生深远影响。低空航路的内涵低空航路指的是在城市低空空域中为无人机和eVTOL等航空器规划的飞行路径。这些航路需要满足安全、高效、有序的飞行需求，同时还需考虑与城市建筑、人口密集区等的协调。构建低空
DeepSeek带来服务器与显卡需求激增的核心逻辑 DeepSeek+NAS 人工智能服务器运维网络安全计算机网络
随着DeepSeek等开源AI模型的普及，个人开发者和小型企业正加速构建私有化AI服务器，以处理敏感数据和定制化任务。这种趋势不仅重构了算力需求的结构，更推动服务器和显卡市场进入新一轮增长周期。以下从技术迭代、行业需求、市场格局三个维度展开论述。一、私有化部署：从数据安全到算力自主的核心驱动力数据隐私与合规性需求公共AI平台的数据泄露风险促使企业选择本地化部署。例如，医疗机构的患者数据、金融企业的
Win NAS 的数据传输原理分析，超级详细！ DeepSeek+NAS 家用NAS WinNAS 飞牛NAS 人工智能安卓NAS
WinNAS是一款运行在Windows系统上的NAS服务，允许用户通过手机客户端远程访问和管理电脑上的文件。为了实现这一功能，WinNAS与手机之间的数据传输过程涉及多个步骤，具体取决于手机和WinNAS电脑所处的网络环境。以下是整个数据传输过程的详细说明：1.权限认证与连接建立无论手机和WinNAS电脑是否在同一个局域网内，手机客户端在访问WinNAS之前，都需要先通过耘想公司的云服务器进行权限
APP怎么抓取原生日志 - Android篇大汉堡玩测试 android 功能测试
文章目录前言为什么要抓原生页面的日志举一个抓取原生日志的例子AndroidDebugBridge(ADB)安装ADB连接设备验证连接抓取日志注意点总结前言好困~写点我觉得重要的吧，IOS和HarmonyOSNEXT这周写为什么要抓原生页面的日志原生日志能够捕捉到与操作系统和应用框架交互的关键信息，包括性能瓶颈、崩溃报告和安全事件等，而这些是纯H5日志无法提供的，确保了对应用行为的全面监控和精准调试
Python 正则表达式小结1 大收藏家 Python 正则表达式 python
[声明]：本文参考了白夜黑雨老师的网页讲解。如有侵权，请与我联系！！！Python正则表达式小结11.正则表达式验证2.特殊元字符及含义3匹配某种字符类型4.正则表达式举例大收藏家说1.正则表达式验证提供两个网站用于正则表达式的验证，可以敲入文本与正则表达式。通过该网站，验证正则表达式的正确性。非常好用！英文网站中文网站2.特殊元字符及含义元字符含义.表示要匹配除了换行符之外的任何单个字符*星号-
vr中的计算机知识,VR技术基本常识淡庸 vr中的计算机知识
虚拟现实技术是仿真技术的一个重要方向是仿真技术与计算机图形学人机接口技术多媒体技术传感技术网络技术等多种技术的集合是一门富有挑战性的交叉技术前沿学科和研究领域。虚拟现实技术(VR)主要包括模拟环境、感知、自然技能和传感设备等方面。模拟环境是由计算机生成的、实时动态的三维立体逼真图像。感知是指理想的VR应该具有一切人所具有的感知。除计算机图形技术所生成的视觉感知外，还有听觉、触觉、力觉、运动等感知，
RIP路由欺骗攻击与防御实验详解 w2361734601 智能路由器网络
一、基础网络配置1.路由器R1配置interfaceGigabitEthernet0/0/0ipaddress192.1.2.254255.255.255.0!interfaceGigabitEthernet0/0/1ipaddress192.1.3.254255.255.255.0!routerrip1version2network192.1.2.0network192.1.3.02.路由器R2
常见FUZZ姿势与工具实战：从未知目录到备份文件漏洞挖掘 w2361734601 web安全安全
本文仅供学习交流使用，严禁用于非法用途。未经授权，禁止对任何网站或系统进行未授权的测试或攻击。因使用本文所述技术造成的任何后果，由使用者自行承担。请严格遵守《网络安全法》及相关法律法规！目录本文仅供学习交流使用，严禁用于非法用途。未经授权，禁止对任何网站或系统进行未授权的测试或攻击。因使用本文所述技术造成的任何后果，由使用者自行承担。请严格遵守《网络安全法》及相关法律法规！一、FUZZ技术概述二、
基于AT89C52单片机的智能导盲杖报警设计七月小卖铺单片机单片机嵌入式硬件
点击链接获取Keil源码与ProjectBackups仿真图：https://download.csdn.net/download/qq_64505944/90498287?spm=1001.2014.3001.5503C+22部分参考设计如下：摘要超声波测距技术因其具有较强的指向性、低能耗、较长的传播距离等优点，已成为广泛应用于各类传感器技术和自动控制技术相结合的测距方案之一。超声波传感器利用声
【DeepSeek】全方位使用指南————简版諰. 人工智能 ai AI写作
一、平台概述DeepSeek（深度求索）是专注实现AGI的中国的人工智能公司，提供多款AI产品：智能对话（Chat）文生图（Art）代码助手（Coder）API开发接口企业定制解决方案二、注册与登录2.1账号创建访问官网https://www.deepseek.com点击右上角「注册」支持三种方式：手机号+短信验证邮箱注册（需验证邮件）第三方登录（微信/Google账号）2.2订阅计划套餐类型免费
共筑智慧城市新生态！YashanDB与荣科科技完成兼容互认证科技圈快讯 oracle 数据库
近日，深圳计算科学研究院的崖山数据库系统YashanDB与荣科科技股份有限公司的智慧工程移动管理平台V1.0与不动产智能管理系统V1.0成功完成了兼容性互认证，标志着双方在智慧城市建设领域实现关键突破，以国产化高性能数据库技术为核心，为工程建设与不动产管理领域提供安全可控、高效稳定的数字化解决方案。‌在兼容性互认证过程中，双方针对功能、性能、兼容性以及稳定性等关键指标进行了多轮严格测试，验证了Ya
【Linux】Linux下调试器gdb的使用安度因 Linux linux 运维服务器测试工具调试
作者主页：@安度因学习社区：StackFrame专栏链接：Linux文章目录一、前言二、铺垫三、指令集和使用1、指令集2、演示四、结语如果无聊的话，就来逛逛我的博客栈吧!一、前言前几篇Linux博客中，我们分别学习了与编辑、编译、自动化构建代码、上传代码的工具。而今天，我们将学习最后一个工具——Linux下的调试器gdb
ACI EP Learning Whitepaper 1. ACI EP组件 m0_54931486 思科 ACI 网络思科 ACI Endpoint ACI fabric Nexus EP 学习
1.ACIEndpointACI网络架构的Endpoint表整合了传统MAC地址表和ARP表的功能。其核心机制是通过硬件层直接学习数据包的源MAC地址与IP地址映射关系，摒弃了传统ARP协议依赖广播请求获取下一跳MAC地址的模式。这种设计优化体现在两方面：1）减少控制面ARP流量处理带来的资源消耗；2）基于终端实际流量即可实时感知主机IP/MAC地址的拓扑迁移，无需依赖GARP通告即可实现终端移动
什么是MCP？看不懂你打我 X.Cristiano 深度学习 MCP
什么是MCP？MCP是一种协议，它实现了大模型资源调用的标准化。千百年来，随着人类社会的发展，标准化的进程不断推进。大模型与外部资源的对接同样需要标准化，MCP正是为此而生！接下来的文字，或许，将帮助你奶奶明白MCP对于她意味着什么。2011年，微信发布。想象一下，你奶奶刚开始用微信。那时，还没有小程序。她的体验或许是这样的：第一个月，她惊喜地发现微信能订电影票了！再过一个月，她发现微信又能约出租
8、Python 字符串处理与正则表达式实战指南 wolf犭良 python python 正则表达式
Python字符串处理与正则表达式实战指南文章概述本文深入探讨Python字符串处理核心方法与正则表达式实战技巧，涵盖字符串编码转换、分割替换、正则表达式语法精髓，并通过日志解析、数据清洗等真实场景案例展示高阶应用。最后提供10道阶梯式练习题（附完整答案代码），助你从基础到进阶全面掌握文本处理技能。一、字符串处理核心三剑客1.1编码转换（encode/decode）text="中文文本"utf8_
deepseek api参数详解孽小倩大语言模型 python java 前端人工智能 deepseek
deepseek的参数与openai保持兼容，所以openai能用的参数deepseek都可以使用，以下是常用的参数介绍。在使用Deepseek/OpenAI的PythonAPI时，最常用的API端点是chat/completions，用于调用deepseek生成文本对话内容。以下是openai.ChatCompletion.create()方法的主要参数及其作用：1.model作用：指定使用的模
数智读书笔记系列021《大数据医疗》：探索医疗行业的智能变革 Allen_Lyb 数智读书笔记大数据健康医疗人工智能 python
一、书籍介绍《大数据医疗》由徐曼、沈江、余海燕合著，由机械工业出版社出版。徐曼是南开大学商学院副教授，在大数据驱动的智能决策研究领域颇有建树，尤其在大数据驱动的医疗与健康决策方面有着深入研究，曾获天津优秀博士论文、教育部博士研究生新人奖。沈江等作者也在相关学术和实践领域有着丰富的经验和深厚的专业知识。这本书系统且深入地探讨了大数据技术在医疗领域的应用与变革，对推动医疗行业的智能化发展具有重要的理论
国家标准与行业标准：差异剖析与协同共进德为先科技标准执行标准国家标准大数据业界资讯
在社会经济与产业发展进程中，标准是保障产品质量、规范市场秩序以及促进技术进步的关键要素。其中，国家标准和行业标准扮演着极为重要的角色，它们既有紧密联系，又存在显著区别。深入了解二者差异，对企业生产、行业发展乃至国家经济运行意义深远。一、定义与制定主体国家标准是指由国家标准化管理机构批准发布，在全国范围内统一适用的标准。它体现了国家在某个领域的整体意志与基本要求，旨在确保全国范围内的产品、服务等具备
无人机喊话系统：空中扩音器的科技密码！云卓SKYDROID 无人机科技人工智能云卓科技科普高科技
一、技术核心：空中声波系统的三重架构1.声源处理中枢支持双模输入：麦克风实时采集与数字音频导入搭载DSP数字信号处理器，实现动态降噪（信噪比＞70dB）自适应EQ调节，针对不同场景优化频响曲线（如灾害现场增强低频穿透力）2.定向声场发生器采用相控阵扬声器技术，波束角可调范围15°-60°声压级最高达125dB（相当于喷气式飞机起飞噪音）有效投射距离300米（静风环境下）3.飞控集成平台专用减震支架
支付宝MAU全解析：小程序生态的核心指标 ckx666666cky 小程序性能优化支付宝搜索引擎支付宝mau 支付宝mau优化
支付宝作为中国领先的移动支付和生活服务平台，其月活跃用户数（MonthlyActiveUsers，简称MAU）是衡量平台活力和商业价值的关键指标。MAU不仅反映了用户对平台的黏性和活跃度，还直接影响支付宝的商业潜力和市场竞争力。支付宝MAU概况截至最近公开数据，支付宝的MAU已突破9亿，这一庞大的用户基础为支付宝小程序生态提供了强大的流量支持。与微信支付等竞争对手相比，支付宝用户群体具有更强的消费
CAN协议简介：从基础到高级应用 New_Teen 嵌入式硬件学习笔记嵌入式硬件物联网
文章目录引言一、CAN协议概述1.1基本特性1.2典型应用场景二、物理层解析2.1信号规范2.2网络拓扑三、数据链路层机制3.1帧类型对比3.2非破坏性仲裁3.3错误处理机制四、帧结构详解4.1标准数据帧结构4.2扩展帧结构五、高级特性5.1CANFD协议增强5.2报文过滤机制六、同步与定时6.1位时间组成6.2同步规则七、开发实践要点结语引言在现代工业控制和汽车电子领域，CAN（Controll
【AI大模型应用开发】RAG-Fusion框架：忘掉 RAG，未来是 RAG-Fusion 同学小张大模型人工智能笔记 chatgpt agi embedding RAG prompt
大家好，我是同学小张，+v:jasper_8017一起交流，持续学习C++进阶、OpenGL、WebGL知识和AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，共同学习和进步。RAG目前很火，但是也有一些不足的地方。有不足就有改进方法。本文我们来看一个方法：RAG-Fusion，理解其原理，并看一下其实现源码。文章目录0.RAG的不足1.RAG-Fusion原理概述2.步骤拆解与代码示例2.1
端到端数字人生产线：如何实现日均3000条视频的工业级输井云AI 人工智能
端到端数字人生产线：基于DAG引擎如何实现日均3000条视频的工业级输出？一、行业困局：短视频生产的效率魔咒2025年《内容科技白皮书》数据显示：83%企业因人工剪辑效率低下错失流量红利（MCN机构月损500万+）6小时/条传统视频从脚本到成片的平均耗时（行业调研）15%误判率人工审核导致优质内容被误杀（教育品牌实测）这些数字背后，是内容生产领域的三重矛盾：质量、效率与合规的不可兼得。二、技术破局
图像识别技术与应用课后总结（20）一元钱面包人工智能
图像分割概念图像分割是把图像中不同像素划分到不同类别，预测目标轮廓，属于细粒度分类。比如将图像里不同物体、背景等区分开来，就像把一幅画里的各个元素精准归类。应用场景人像抠图：能精准分离人物和背景，用于图片编辑、影视制作等，比如去除照片背景换背景。医学组织提取：在医学影像（如CT、MRI图像）中分离出不同组织，辅助疾病诊断、手术规划等。遥感图像分析：分析卫星或航空遥感图像时，区分土地、植被、建筑等不
AI赋能视频创作：蓝耘MaaS与海螺AI技术的深度融合云边有个稻草人热门文章人工智能音视频图片生成视频蓝耘智算蓝耘MaaS平台体验海螺AI 高效视频渲染和优化
云边有个稻草人-CSDN博客目录一、蓝耘MaaS平台概述（1）平台的模块化设计（2）蓝耘MaaS的灵活性与扩展性（3）蓝耘MaaS的安全性与隐私保护二、海螺AI视频模型简介（1）海螺AI的核心技术（2）海螺AI的视频生成流程（3）海螺AI的应用场景三、在蓝耘Maas平台如何使用海螺AI生成视频（1）注册蓝耘平台账号（2）点击MaaS平台（3）点击视觉模型并选择l2V-01视频模型（4）体验图片生成
架构设计的灵魂交响曲：系统设计各维度的深度解析与实战指南领码科技 IT职场技能篇架构设计系统设计功能模块模型驱动协同设计
引言:系统设计的背景与重要性在快速变化的技术环境中，数字化转型成为企业生存与发展的核心驱动力。系统设计能力不仅是技术团队的核心竞争力，也是推动业务创新和提升整体效率的关键因素。根据Gartner的研究，超过70%的数字化转型项目未能实现预期结果，这强调了有效系统设计的重要性。企业需通过科学合理的系统设计来应对市场变化、用户需求和技术发展，从而实现更高的业务价值。文章将深入探讨架构设计的各个维度，通
滑块式分拣优势骞途笔记人工智能经验分享
高速滑块式分拣机是一种智能物流输送设备，可引导和分拣中型货物、包袋、纸箱。与普通分拣机不同的是，双向滑块使货物能够在分拣机两侧卸下，提高了空间利用率，同时增大了设计灵活性。超高速、高性能，高可靠性，灵活配置。双向、轻柔分拣。采用搭锁/脱开滑块，滚柱轴承精确。更换损坏的滑块不需要拆下板，分拣机控制人员可以使用标准软件包快速、方便地安装。1.性能参数滑块式分拣适用于纸箱、周转箱及其他不规则形状的物品，
机器学习课堂4线性回归模型+特征缩放木尘152132 机器学习线性回归 python
一、实验2-2，线性回归模型，计算模型在训练数据集和测试数据集上的均方根误差代码：#2-2线性回归模型importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#参数设置iterations=3000#迭代次数learning_rate=0.0001#学习率m_train=3000#训练样本的数量flag_plot_lines=False
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l