Lane Phoebe

基于批量随机梯度下降的非负矩阵分解

非负矩阵分解(NMF)

NMF的基本思想
为什么分解的矩阵式非负？
为什么要运用非负矩阵分解？
非负矩阵分解的算法和实现
- 两种损失函数的定义方式
1. 平方距离
2. KL散度
- 算法步骤
1. 平方距离
2. KL散度
- 非负矩阵分解的伪代码
- 非负矩阵分解的实现代码

NMF的基本思想：

对于任意给定的一个非负矩阵V，NMF算法能够通过计算，从原矩阵提取权重矩阵和特征矩阵两个不同的矩阵出来。（限制条件：W和H中的所有元素都要大于0）

注：
W：权重矩阵（字典矩阵）
H：特征矩阵（扩展矩阵）
V：原矩阵

为什么分解的矩阵式非负？

网上流传一种很有利的解释就是非负为了使数据有效，负数对于数据是无效的。个人认为取非负元素主要是运用于实际问题中。例如图像数据中不可能有负值的像素点，文本数据采用二进制表示…

非负性会引发稀疏
非负性会使计算过程进入部分分解

为什么要运用非负矩阵分解？

从上面的模型中，很容易发现：当N、M特别大时，原矩阵面积V远大于权重矩阵W和特征矩阵H的和，也就是n*m>>(n+m)*r。因此如果用W+H代替V来存储或读取，能很大程度上节约存储空间或大大提高读取速度。

当然，讲到这里NMF好像很简单，只是对矩阵进行分解。不过仔细想想如果只是简单对矩阵进行分解早就被人提出来引用了，正是因为如何分解矩阵才能更好地对矩阵进行解析，也就是如何解NMF矩阵本身就是一个难题，因此还有很多问题值得我们一起去探讨的，接下来具体介绍下算法实现。

非负矩阵分解的算法和实现

NMF求解问题实际上是一个最优化问题，利用乘性迭代的方法求解和，非负矩阵分解是一个NP问题。NMF问题的目标函数有很多种，应用最广泛的就是欧几里得距离和KL散度。由于W与H的乘积是对V的近似估计，所以评价分解好坏的标准便是两者之间的差异。

两种损失函数的定义方式：

$在NMF的分解问题中，假设噪声矩阵为E\in R^{n\ast m}，那么有E=V-WH。$ 现在要找出合适的W和H使得||E||最小。

假设噪声服从不同的概率分布，通过最大似然函数会得到不同类型的目标函数。

a. 平方距离

噪声服从高斯分布
假设噪声服从高斯分布，也称作为平方距离。
平方距离定义：
$\left \| A-B \right \|^{2} = \sum_{i,j}\left ( A_{i,j}-B_{i,j} \right )^{2}$
step1：得到最大似然函数L(W,H)为
$=\prod_{i,j}\frac{1}{\sqrt{2\pi} \sigma _{ij}}e^{-\frac{E_{ij}^{2}}{2 \sigma _{ij}}}=\prod_{i,j}\frac{1}{\sqrt{2\pi} \sigma _{ij}}e^{-\frac{[V_{ij}-(WH)_{ij}]^{2}}{2 \sigma _{ij}}}$

step2：两边取对数，得到对数似然函数lnL(W,H)
$=\sum_{i,j}(ln \frac{1}{\sqrt{2\pi}\sigma _{ij}}-\frac{[V_{ij}-(WH)_{ij}]^{2}}{2 \sigma _{ij}})=\sum_{i,j}ln \frac{1}{\sqrt{2\pi}\sigma _{ij}}- \frac{1}{ \sigma _{ij}}.\frac{1}{2}\sum_{i,j}[V_{ij}-(WH)_{ij}]^{2}$

step3：假设各数据点噪声的标准差σ一样，那么接下来要使得对数似然函数lnL(W,H) 取值最大，只需要下面目标函数J(W,H)值最小
$\frac{1}{2}\sum_{i,j}[V_{ij}-(WH)_{ij}]^{2}$
该函数是基于欧几里得距离的度量
$(WH)_{ij} = \sum_{k}W_{ik}H_{kj}\Rightarrow \frac{\partial(WH)_{ij}}{\partial W_{ik}}=H_{kj}\\ (WH)_{ij} = \sum_{k}W_{ik}H_{kj}\Rightarrow \frac{\partial(WH)_{ij}}{\partial H_{kj}}=W_{ik}$

step4：目标函数J(W,H)求偏导
$\frac{\partial J(W,H)}{\partial W_{ik}}= \sum_{i,j}[H_{kj}(V_{ij}-(WH)_{ij})] =\sum_{i,j}[V_{ij}H_{kj}-(WH)_{ij}H_{kj}]\\ =\sum_{i,j}[V_{ij}H_{jk}^{T}-(WH)_{ij}H_{jk}^{T}] = (VH^{T})_{ik}-(WHH^{T})_{ik}$
同理
$\frac{\partial J(W,H)}{\partial H_{kj}}=\sum_{i,j}[W_{ik}(V_{ij}-(WH)_{ij})]= \sum_{i,j}[W_{ik}V_{ij}-W_{ik}(WH)_{ij}]\\ =\sum_{i,j}[W_{ki}^{T}V_{ij}-W_{ki}^{T}(WH)_{ij}] = (W^{T}V)_{kj}-(W^{T}WH)_{kj}$

step5：使用梯度下降进行迭代
$W_{ik}=W_{ik}+\alpha _{1}[(VH^{T})_{ik}-(WHH^{T})_{ik}]\\ H_{kj}=H_{kj}+\alpha _{2}[(W^{T}V)_{kj}-(W^{T}WH)_{kj}]$

step5：选取合适的α，得到最终迭代式
$\alpha _{1} = \frac{W_{ik}}{(WHH^{T})_{ik}} \qquad \alpha _{2} = \frac{H_{kj}}{(W^{T}WH)_{kj}}$

$W_{ik}=W_{ik}\frac{(VH^{T})_{ik}}{(WHH^{T})_{ik}}① \qquad H_{kj}=H_{kj}\frac{(W^{T}V)_{kj}}{(W^{T}WH)_{kj}}②$
可看出这是乘性迭代规则，每一步都保证了结果为正数。

b. KL散度

噪声服从泊松分布
假设噪声服从泊松分布，也称作为KL散度。

step1：KL散度并不是那么的直观，下面画图来理解下。首先说明一点：KL散度是非对称的。

从图中很容易写出解的切线方程，其实如果接近，这就是一阶Taylor近似，写成更一般的形式：
$f(y)\approx f(x)-\triangle f(x)(x-y)$

step2：推广开来这就是Bregman距离：
$令：D\rightarrow R为定义在闭合凸集D\subseteq D\subseteq R_{+}^{k}的一连续可微分凸函数。\\ - - \\ 与函数对应的两个向量x,y\in D之间的Bregman距离记作：B_{\varphi}(x||y)=\varphi(y)-\varphi(x) + \langle \triangle \varphi(x),x-y\rangle \\$

step3：如果凸函数：
$\varphi(x)=\sum_{i=1}^{k}x_{i}lnx_{i}$
可以得到
$B_{\varphi}(x||y)=\sum_{i=1}^{k}[y_{i}lnx_{i}-x_{i}lnx_{i}+(lnx_{i}+1)(x_{i}-y_{i})] =\sum_{i=1}^{k}(y_{i}ln\frac{x_{i}}{y_{i}}-x_{i}+y_{i})$

step4：所以通过KL散度定义的损失函数为：
$\sum_{i,j} (V_{ij}ln\frac{V_{ij}}{(WH)_{ij}}-V_{ij}+(WH)_{ij})$
在KL散度的定义中，D(A∥B)⩾0，当且仅当A=B时取得等号。
此步证明可参考：https://blog.csdn.net/cumttzh/article/details/79790953

step5：目标函数J(W,H)求偏导
$\frac{\partial J(W,H)}{\partial W_{ik}} = \sum_{i,j}(H_{kj}-V_{ij}\frac{H_{kj}}{(WH)_{ij}}) =\sum_{i,j}(H_{kj}-\frac{V_{ij}H_{kj}}{(WH)_{ij}})$
同理：
$\frac{\partial J(W,H)}{\partial H_{kj}} = \sum_{i,j}(W_{ik}-V_{ij}\frac{W_{i k}}{(WH)_{ij}}) =\sum_{i,j}(W_{ik}-\frac{V_{ij}W_{ik}}{(WH)_{ij}})$

step6：使用梯度下降进行迭代
$W_{ik}=W_{ik}+\alpha _{1}\sum_{i,j}(H_{kj}-\frac{V_{ij}H_{kj}}{(WH)_{ij}})\\--\\ H_{kj}=H_{kj}+\alpha _{2}\sum_{i,j}(W_{ik}-\frac{V_{ij}W_{ik}}{(WH)_{ij}})$

step7：选取合适的α，得到最终迭代式
$\alpha _{1} = W_{ik}\sum_{i,j}\frac{(WH)_{ij}}{V_{ij}H_{kj}} \qquad \alpha _{2} =H_{kj}\sum_{i,j}\frac{(WH)_{ij}}{V_{ij}W_{ik}}$

$W_{ik}=W_{ik}\sum_{j}H_{kj}\sum_{i,j}\frac{(WH)_{ij}}{V_{ij}H_{kj}}③ \qquad H_{kj}=H_{kj}\alpha _{2}\sum_{i}H_{ik}\sum_{i,j}\frac{(WH)_{ij}}{V_{ij}W_{ik}} ④$

算法步骤

$W_{ik}=W_{ik}\frac{(VH^{T})_{ik}}{(WHH^{T})_{ik}}① \qquad H_{kj}=H_{kj}\frac{(W^{T}V)_{kj}}{(W^{T}WH)_{kj}}②$
$W_{ik}=W_{ik}\sum_{j}H_{kj}\sum_{i,j}\frac{(WH)_{ij}}{V_{ij}H_{kj}}③ \qquad H_{kj}=H_{kj}\alpha _{2}\sum_{i}H_{ik}\sum_{i,j}\frac{(WH)_{ij}}{V_{ij}W_{ik}} ④$

a. 平方距离

1）随机生成一个W矩阵；
2）固定H，按照公式①迭代更新W直到收敛（W不变或变化很小）
3）固定W，按照公式②迭代更新H直到收敛（H不变或变化很小）
4）重复2）、3）步骤直到对应的损失函数不变或变化很小

b. KL散度

1）随机生成一个W矩阵；
2）固定H，按照公式③迭代更新W直到收敛（W不变或变化很小）
3）固定W，按照公式④迭代更新H直到收敛（H不变或变化很小）
4）重复2）、3）步骤直到对应的损失函数不变或变化很小

非负矩阵分解的伪代码

输入参数：Ｘ，Ｒ，MATRIX
============> Ｘ为被分解的矩阵
============> Ｒ为降阶后W的秩
============> MATRIX为迭代次数
输出参数：W，Ｈ
１）：初始化矩阵W，Ｈ为非负数，同时对W的每一列数据归一化
２）：for i=1:MAXITER
a：更新矩阵H的一行元素：H(i,k)=H(i,j)×(W’×X)(i,j)/(W’×W×H)(k,j)
b：更新矩阵W的一列元素：W(k,j)=W(k,j)×(X×H’)(k,j)/(W×H×H’)(i,k);
c: 重新对B进行列归一化
3）end

你可能感兴趣的:(python)

Python爬虫selenium验证-中文识别点选+图片验证码案例 dme. Python爬虫零基础入门 python 爬虫
1.获取图片importreimporttimeimportddddocrimportrequestsfromseleniumimportwebdriverfromselenium.webdriver.common.byimportByfromselenium.webdriver.chrome.serviceimportServicefromselenium.webdriver.support.w
深度强化学习算法在金融交易决策中的优化应用【附数据】算法与数据算法
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
物联网数据采集平台【物联网毕业论文】算法与数据物联网
物联网技术与数据分析|物联网系统设计|模型构建✨专业领域：物联网系统架构设计智能设备与传感器网络数据采集与处理物联网大数据分析智能家居与工业物联网边缘计算与云计算物联网安全与隐私保护擅长工具：Python/R/Matlab数据分析与建模物联网平台与设备编程数据流与实时监控系统设计机器学习与预测模型应用物联网协议（MQTT,CoAP,HTTP）物联网数据可视化工具✅物联网专业题目与数据：物联网毕业论
利用python实现小提琴图的代码 python游乐园可视化 python 开发语言
importseabornassnsimportmatplotlib.pyplotasplt#加载seaborn内置的鸢尾花数据集iris=sns.load_dataset("iris")#设置绘图风格，可选，这里使用默认风格#sns.set_style("whitegrid")#绘制小提琴图，以'species'为分类依据，绘制'sepal_length'特征的小提琴图#可以根据实际需求更改x和
【数据序列化协议】Protocol Buffers 茉菇网络
一、为什么需要序列化？数据跨平台/语言交互：不同编程语言（如Java、Python、Go）的数据结构不兼容，序列化提供统一的数据表示。例如：Java的HashMap和Python的dict需转换为通用格式（如JSON、Protobuf）才能通信。网络传输优化：原始内存中的对象包含指针、元数据等冗余信息，无法直接传输。序列化后数据体积更小，减少带宽占用，提升传输效率。持久化存储：将对象转换为字节流或
pythonmatplotlib绘图小提琴_Matplotlib提琴图 weixin_39797393
小提琴图类似于箱形图，除了它们还显示不同值的数据的概率密度。这些图包括数据中位数的标记和表示四分位数范围的框，如标准框图中所示。在该箱图上叠加的是核密度估计。与箱形图一样，小提琴图用于表示跨不同“类别”的可变分布(或样本分布)的比较。小提琴图形比普通图形更具信息性。事实上，虽然箱形图仅显示平均值/中位数和四分位数范围等汇总统计量，但小提琴图显示了数据的完整分布。importmatplotlib.p
pythonmatplotlib绘图小提琴_python 箱线图和小提琴图奥利奥东
箱形图(Box-plot)又称为盒须图、盒式图或箱线图是一种用作显示一组数据分散情况资料的统计图，因形状如箱子而得名。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。箱形图绘制须使用常用的统计量，能提供有关数据位置和分散情况的关键信息，尤其在比较不同的母体数据时更可表现其差异。箱形图的绘制主要包含六个数据节点，需要先将数据从大到小进行排列，然后分别计算出它的上边缘，上四分位数，中位数，
python绘图之回归拟合图 pianmian1 python 回归开发语言
回归拟合图在数据分析中具有重要作用，它不仅可以帮助我们理解变量之间的关系，还可以评估模型的拟合效果、进行预测和推断、发现异常值，以及用于模型比较和结果展示。importpandasaspdimportseabornassnsimportmatplotlib.pyplotasplt#创建一个示例数据集#假设我们有一些鱼的重量和高度数据data={'Weight':[100,150,200,250,3
python绘图之密集散点图 pianmian1 python 开发语言
密集散点图主要目的是生成一个可视化图表，展示insurance数据集中bmi（身体质量指数）和charges（医疗费用）之间的关系，并通过不同的维度对数据进行分组和区分，以便更清晰地观察数据的分布和特征。importseabornassns#导入Seaborn，用于绘图importmatplotlib.pyplotasplt#导入Matplotlib，用于显示图表importpandasaspd#
Python的几种实现 weixin_34097242 python java c/c++
Python自身作为一门编程语言，它有多种实现。这里的实现指的是符合Python语言规范的Python解释程序以及标准库等。这些实现虽然实现的是同一种语言，但是彼此之间，特别是与CPython之间还是有些差别的。下面分别列出几个主要的实现。1.CPython：这是Python的官方版本，使用C语言实现，使用最为广泛，新的语言特性一般也最先出现在这里。CPython实现会将源文件（py文件）转换成字
Python--函数进阶（上）索然无味io Python安全开发 python 开发语言 windows 网络安全 web安全笔记学习
1.参数深入理解1.1参数传递的内存机制Python中参数传递的是内存地址（引用传递），而非值拷贝。这意味着：可变对象（列表、字典）在函数内修改会影响外部变量。不可变对象（数字、字符串）在函数内重新赋值会创建新对象。defmodify_list(lst):lst.append(4)#修改原列表my_list=[1,2,3]modify_list(my_list)print(my_list)#输出：
python-leetcode-二叉树的中序遍历 Joyner2018 leetcode 算法职场和发展
94.二叉树的中序遍历-力扣（LeetCode）方法1:递归实现#Definitionforabinarytreenode.#classTreeNode:#def__init__(self,val=0,left=None,right=None):#self.val=val#self.left=left#self.right=rightclassSolution:definorderTraversa
python 如何生成requirements.txt 「已注销」 python 开发语言
在Python项目中，requirements.txt文件通常用于列出项目依赖的库及其版本号。这样可以方便地在其他环境中安装相同的依赖。以下是生成requirements.txt文件的几种方法：方法1：使用pipfreeze如果你已经在虚拟环境或全局环境中安装了所有需要的依赖包，可以直接使用以下命令生成requirements.txt：bash代码解读复制代码pipfreeze>requireme
Python 爬虫实战：深入酷狗音乐，抓取热门歌手歌曲播放量数据西攻城狮北 python 爬虫开发语言实战案例
目录引言一、准备工作1.1技术选型1.2环境配置二、爬取热门歌手歌曲播放量数据2.1获取排行榜页面2.2解析HTML内容2.3数据存储三、数据分析与可视化3.1数据清洗3.2数据分析3.3数据可视化四、总结与展望引言在数字音乐时代，音乐平台的排行榜和歌曲播放量数据对于音乐爱好者、歌手以及音乐产业从业者来说具有重要的参考价值。通过分析这些数据，可以了解当前的音乐趋势、歌手的受欢迎程度以及用户的音乐偏
Deepseek在【python】三帧差法实现运动目标检测百态老人 python 目标检测目标跟踪
deepseek在【python】三帧差法实现运动目标检测一、三帧差法原理三帧差法是一种改进的帧差法，通过比较连续的三帧图像来检测运动目标。具体来说，它首先计算前两帧图像之间的差值，再计算后两帧图像之间的差值，最后将这两个差值图像进行“与”运算，以确定运动目标的变化部分。这种方法能够更好地消除“双影”现象，提高目标检测的准确性。二、实现步骤读取视频帧：使用OpenCV库读取视频序列中的连续三帧图像
比Python、Java更快的 Go 语言，能否称霸江湖？ weixin_33686714 python java ruby
文章来源：jb51.net有一种语言堪称比语言排行榜前五热门选手的Python、Java更快，它就是GO语言。Go于2009年11月正式宣布推出，成为开放源代码项目，并在Linux及MacOSX平台上进行了实现，后来追加了Windows系统下的实现。在2016年，Go被软件评价公司TIOBE选为“TIOBE2016年最佳语言”。目前，Go每半年发布一个二级版本（即从a.x升级到a.y）。在Go语言
C/C++ 指针对齐样式：对齐方式谏君之 C/#C++c语言 c++开发语言
几乎所有的编码风格问题都是主观意见和个人品味的问题。制表符v.空格，Allmanv.K&R，运算符填充v.无;无论你站在哪个位置，你几乎可以肯定你选择的风格都有一系列的理由，你可以保证其他阵营也是如此。一些语言，如Python，甚至定义了大量的标准样式约定（PEP-8）。C和C++没有这样的官方统一标准。因此，这些语言中存在无数的样式约定排列。看看AStyle的文档有多大！没关系！每个开发人员、项
Python部署工控安全风险评估系统 mosquito_lover1 安全 pytorch python
1.工控安全基础理论1.1风险评估概念风险定义：风险=事件发生的可能性×事件的影响影响分析（ImpactAnalysis）：评估特定事件（如设备故障、网络攻击）对工控系统的关键资产（设备、数据、流程）的破坏程度，通常从以下维度分析：机密性（Confidentiality）：数据是否被泄露。完整性（Integrity）：数据或设备是否被篡改。可用性（Availability）：系统是否能够正常运行。
【python】三帧差法实现运动目标检测 Jackilina_Stone #python 计算机视觉 python 运动目标检测 OD
三帧差法是一种常用的运动目标检测方法，它通过比较连续三帧图像之间的差异来检测运动物体。这种方法尤其适用于背景变化较小的场景。目录1方案2实践①代码②效果图1方案具体步骤如下：①读取视频流：使用cv2.VideoCapture()读取视频文件。②灰度化：将彩色图像转换为灰度图，简化后续计算。③帧间差分：计算连续三帧之间的差分，absdiff函数计算两个灰度图像的绝对差值。然后，将两帧差相加。④阈值处
argparse模块使用说明浩瀚之水_csdn #Python学习 python
argparse是Python标准库中的一个模块，它提供了一个简单的方式来为Python程序添加命令行参数。以下是argparse的详细说明及使用指南：导入模块首先，你需要在你的Python脚本中导入argparse模块：importargparse创建解析器接下来，你需要创建一个ArgumentParser对象。这个对象将包含你的程序所接受的命令行参数的信息：parser=argparse.Ar
Python 潮流周刊#90：uv 一周岁了，优缺点分析（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目以下是本期摘要：文章&教程①Python3.14的尾调用解释器（及其它更新）②UV一周年：优点、缺点以及是否迁移？③创建Django的MongoDB数据库后端④Py
大数据安全项目是小酒大数据 python pycharm sql mysql
1.项目详情用python写一个大数据安全项目（使用tk，页面布局使用盒子模型，页面中各个按钮，主题要美观，按扭间的距离不要太进），需要连接数据库连接名是root（数据库名为bigdata_security,数据库密码是123456。查询数据库中的student表（包括id，name,sex,school,height,weight这些字段））。包括管理员和学生两个功能。2.代码详
【Python】Python与C的区别 Reese_Cool Python C语言 python c语言 java
文章目录语句结束符代码块表示变量声明函数定义注释格式Python的标识符数据输入input()函数数据输出print()函数语句结束符C语言C语言中每条语句必须以分号;结束。例如，inta=10;、printf("Hello,World!");。分号是语句的一部分，用于告诉编译器一条语句在哪里结束。如果忘记添加分号，编译器会报错，提示语法错误。Python语言Python语句一般不需要特定的结束符
Ubuntu24.04安装不同版本的pip Zucker N LINUX ubuntu python linux
目录1.安装pip2.为不同的Python版本安装`pip3.安装python库1.安装pip一般情况下，Ubuntu系统默认提供Python3，但可能没有安装`pip`。可以通过以下命令安装`pip`sudoaptupdatesudoaptinstallpython3-pip安装完成后，可以通过以下命令确认`pip`是否安装成功：pip3--version输出版本号就说明安装成功2.为不同的Py
【华为OD技术面试手撕真题】98、同构字符串 | 手撕真题+思路参考+代码解析（C & C++ & Java & Python & JS）（0ms） KJ.JK 华为OD技术面试手撕真题华为od 面试 c语言华为od机试真题华为od机试E卷 javascript 同构字符串
文章目录一、题目题目描述样例1二、代码参考C语言思路C语言代码C++语言思路C++代码Java语言思路Java代码Python语言思路Python代码JS语言思路JS代码作者：KJ.JK个人博客首页：KJ.JK专栏介绍：本专栏更新每年华为OD机试的高频手撕代码题，每个题目都会使用五种语言进行解答（C&C++&Java&Python&JS），思路分析都非常详细，争取实现最低的时间复杂度和高通过率，每
【A/B测试】深度解析：从理论到实践Python实现详解（含源码）絆人心 python 前端开发语言数据分析信息可视化数据挖掘机器学习
目录前言一、什么是A/B测试？A/B测试的常见应用场景二、A/B测试的基本流程三、假设检验：零假设与备择假设Python代码示例：A/B测试的实践四、A/B测试中的统计学方法五、总结附录：完整代码前言A/B测试（也称分流测试）在数据分析和产品优化中扮演重要角色。无论是在网站优化、营销活动还是产品改进中，A/B测试都帮助通过数据驱动决策、测试和验证论文提出了实际操作的基本概念，详细讲解了如何实施A/
python实现文件下载-python实现文件上传下载 weixin_37988176
创建自己的ftp类myftp.py废话不多说，前方上代码！！！#!/usr/bin/python#coding:utf-8#author:zhj#info:数据传输平台importftplib,socket,os,sysclassMyFtp(object):def__init__(self,host,port,name,passwd):self.host=hostself.port=portsel
Python——生成AIGC图像朱剑君 AIGC 人工智能 python
文章目录一、背景介绍二、效果图展示三、完整代码四、分步解释五、实用建议1）提示词技巧2）性能优化3）常见问题处理4）扩展功能建议六、注意事项1.硬件要求2.法律合规3.模型安全一、背景介绍AIGC（AI-GeneratedContent），即由人工智能生成的内容，涵盖了文本、图像、音频、视频等各种形式。通过深度学习、生成对抗网络（GAN）和扩散模型等技术，AIGC能够生成高度逼真、具有艺术性的内容
python：实现简易FTP服务(附完整源码) 源代码大师 Python实战教程 python 开发语言
python：实现简易FTP服务importsocket,threading,os,sys,timeimporthashlib,platform,statlisten_ip="localhost"listen_port=21conn_list=[]root_dir
Python爬虫 +数据采集分析：淘宝商品评论页面数据接口代码逐梦人爬虫技能晋升路线 python 爬虫开发语言
Python爬虫+数据采集分析：淘宝商品评论页面数据接口一、引言在当今数字化商业时代，电商平台的数据蕴含着巨大的价值。淘宝作为全球知名的电商平台，其商品评论数据能反映消费者的真实反馈、偏好和需求，对于商家优化产品、制定营销策略，以及研究人员进行市场分析等都具有重要意义。然而，直接从淘宝商品评论页面采集数据并非易事，淘宝有严格的反爬机制。为了高效、合法地获取这些数据，利用数据接口是一种可行的解决方案
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他