Mac Jiang

Programming Exercise 7:K-means Clustering and Principal Component Analysis 第一部分

大家好，我是Mac Jiang，今天和大家分享Coursera-Stanford University-Machine Learning-Programming Exercise 7:K-means Clustering and Principal Principal Component Analysis的第一部分的编码。第一部分讲的是K-means Clustering,即K均值算法的实现过程，虽然我写的代码是正确的，但不一定是最好的，如果有更好的实现方法，请留言指正。当然，欢迎大家转载我的博客，不过在转载之前请标明出处，谢谢。第二部分的地址为：http://blog.csdn.net/a1015553840/article/details/50879343

好的，我们开始讲解第一部分K-means Clustering的具体实现过程。

这部分的主要有两大块内容：

(1)主要是训练PCA算法，并在OpenGL上绘制出K均值算法的具体计算过程，绘制出每次分类情况和中心变换情况。

(2)利用K均值算法对一幅图像进行压缩，此图像为128*128，每个像素由RGB三种颜色标识，而每种颜色用1BYTE（8bit）表示，范围为0-255。如果不采取压缩，那么图像所占存储空间大小为128*128*3BYTE=128*128*24bits = 393,216bits。我们要进行的是利用K均值算法聚类出最常用的16中颜色，这16中颜色只要用4bit标识，加上这十六种颜色与RGB的映射关系共128*128*4 + 16*24 = 65,920bit。可以看到，压缩后存储只占压缩前存储量的1/6左右。

数据集：ex7data2.mat---用于训练K均值算法的训练样本

bird_small.png---用于做压缩测试的图像

函数：displayData.m---把训练样本X的数据可视化

drawLine.m---画出2D降为1D的直线 plotDataPoints.m---k均值算法的点，当属于不同中心时用不同颜色画出

plotProgresskMeans.m---做出k均值算法的中心 runMeans.m---运行k均值算法

ex7.m---K均值算法的主控制函数，控制算法的进行过程

kMeansInitCentroid.m---初始化k均值算法的中心，需要完善代码！

findClosestCentroids.m---将每个样本归为离他最近的中心的那一类，需要完善代码！

computeCentroids.m---将上面求得的类，计算每一类的新的中心，需要完善代码！

这部分作业共三个文件需要完善代码

K均值算法的计算为：

初始化中心；（kMeansInitCentroids.m实现）

Repeat{

from 1 to m:计算每个样本离各类中心的距离，将每个样本分别归类（findClosestCentroids.m实现）

from 1 to K:z在归类后，计算各类的中心（compureCentroids.m实现）

}

这我们需要完成的任务就是编写初始化，样本分类，求新分类中心三个操作

1.ex7的控制过程

%% Machine Learning Online Class
%  Exercise 7 | Principle Component Analysis and K-Means Clustering
%
%  Instructions
%  ------------
%
%  This file contains code that helps you get started on the
%  exercise. You will need to complete the following functions:
%
%     pca.m
%     projectData.m
%     recoverData.m
%     computeCentroids.m
%     findClosestCentroids.m
%     kMeansInitCentroids.m
%
%  For this exercise, you will not need to change any code in this file,
%  or any other files other than those mentioned above.
%

%% Initialization
clear ; close all; clc

%% ================= Part 1: Find Closest Centroids ====================
%  To help you implement K-Means, we have divided the learning algorithm 
%  into two functions -- findClosestCentroids and computeCentroids. In this
%  part, you shoudl complete the code in the findClosestCentroids function. 
%
fprintf('Finding closest centroids.\n\n');

% Load an example dataset that we will be using
load('ex7data2.mat');

% Select an initial set of centroids
K = 3; % 3 Centroids
initial_centroids = [3 3; 6 2; 8 5];

% Find the closest centroids for the examples using the
% initial_centroids
idx = findClosestCentroids(X, initial_centroids);

fprintf('Closest centroids for the first 3 examples: \n')
fprintf(' %d', idx(1:3));
fprintf('\n(the closest centroids should be 1, 3, 2 respectively)\n');

fprintf('Program paused. Press enter to continue.\n');
pause;

%% ===================== Part 2: Compute Means =========================
%  After implementing the closest centroids function, you should now
%  complete the computeCentroids function.
%
fprintf('\nComputing centroids means.\n\n');

%  Compute means based on the closest centroids found in the previous part.
centroids = computeCentroids(X, idx, K);

fprintf('Centroids computed after initial finding of closest centroids: \n')
fprintf(' %f %f \n' , centroids');
fprintf('\n(the centroids should be\n');
fprintf('   [ 2.428301 3.157924 ]\n');
fprintf('   [ 5.813503 2.633656 ]\n');
fprintf('   [ 7.119387 3.616684 ]\n\n');

fprintf('Program paused. Press enter to continue.\n');
pause;


%% =================== Part 3: K-Means Clustering ======================
%  After you have completed the two functions computeCentroids and
%  findClosestCentroids, you have all the necessary pieces to run the
%  kMeans algorithm. In this part, you will run the K-Means algorithm on
%  the example dataset we have provided. 
%
fprintf('\nRunning K-Means clustering on example dataset.\n\n');

% Load an example dataset
load('ex7data2.mat');

% Settings for running K-Means
K = 3;
max_iters = 10;

% For consistency, here we set centroids to specific values
% but in practice you want to generate them automatically, such as by
% settings them to be random examples (as can be seen in
% kMeansInitCentroids).
initial_centroids = [3 3; 6 2; 8 5];

% Run K-Means algorithm. The 'true' at the end tells our function to plot
% the progress of K-Means
[centroids, idx] = runkMeans(X, initial_centroids, max_iters, true);
fprintf('\nK-Means Done.\n\n');

fprintf('Program paused. Press enter to continue.\n');
pause;

%% ============= Part 4: K-Means Clustering on Pixels ===============
fprintf('\nRunning K-Means clustering on pixels from an image.\n\n');
%  Load an image of a bird
A = double(imread('bird_small.png'));
A = A / 255; % Divide by 255 so that all values are in the range 0 - 1

% 图片为128行，128列，每个像素RGB三种颜色，每个颜色1Byte = 8bit，共128*128*24bits
img_size = size(A);

%原图A为img_size(1)行，img_size(2)列，每个像素点的颜色由RGB三种表示，每种8bit共3字节，故为img_size(1)*img_size(2)*3
%由于我们要使用K-means，所以我们要把行和列铺平，成为一个响亮，成为一个长度为img_size(1)*img_size(2)的向量，每个元素有RGB三种共3字节
%把图像铺平，这样每个元素即为一个输入x，他有RGB三个维度
X = reshape(A, img_size(1) * img_size(2), 3);

%我们的目的是把RGB共256*256*256种颜色压缩成16种颜色，这16种颜色是通过K均值算法计算出来的
%假如不压缩，原图为128*128*3Byte = 128*128*24bit = 393216bits;
%如果压缩成16种颜色，那么只要4bit表示颜色的种类，然后再记录用到的这16种颜色的RGB表示16*24bits...
%共16*24 +%128*128*4 = 65920bit8,图像压缩了将近6倍
K = 16; 
max_iters = 10;
%初始化中心
initial_centroids = kMeansInitCentroids(X, K);
%运行K均值算法
[centroids, idx] = runkMeans(X, initial_centroids, max_iters);

fprintf('Program paused. Press enter to continue.\n');
pause;


%% ================= Part 5: Image Compression ======================
fprintf('\nApplying K-Means to compress an image.\n\n');
% Find closest cluster members
idx = findClosestCentroids(X, centroids);

% Essentially, now we have represented the image X as in terms of the
% indices in idx. 

% We can now recover the image from the indices (idx) by mapping each pixel
% (specified by it's index in idx) to the centroid value
X_recovered = centroids(idx,:);

% Reshape the recovered image into proper dimensions
%本实验本身并未压图片，最后只是把各点颜色用那16种代替了而已，但是提供的是一种压缩图片的思想
X_recovered = reshape(X_recovered, img_size(1), img_size(2), 3);

% Display the original image 
subplot(1, 2, 1);
imagesc(A); 
title('Original');

% Display compressed image side by side
subplot(1, 2, 2);
imagesc(X_recovered)
title(sprintf('Compressed, with %d colors.', K));

fprintf('Program paused. Press enter to continue.\n');
pause;

Part1:Find Closest Centroids---利用ex7data2.mat和当前中心，计算的每个样本离每个中心的距离，将他们分为最近的中心的类别中

Part2:Compute Means---利用第一部分的到的新的分类，计算每个新的分类的中心

Part3:K-Means Clustering---利用K均值算法进行聚类，并画出每次聚类的类别变化过程和新中心的转变过程

Part4:K-Means Clustering Pixels---利用K均值算法对图像进行聚类分析，找到16中使用最多的颜色】

Park5:Image Compressing---在part4得到的16种颜色的基础上，对图像进行压缩。这里实际上并未对图像进行压缩，而是把图片各颜色换成16中颜色内与之相近的颜色。这里只是给我们提供这种图片压缩的方法，并未最终实现

2.kMeansInitCentroids.m的实现

function centroids = kMeansInitCentroids(X, K)
%KMEANSINITCENTROIDS This function initializes K centroids that are to be 
%used in K-Means on the dataset X
%   centroids = KMEANSINITCENTROIDS(X, K) returns K initial centroids to be
%   used with the K-Means on the dataset X
%
% You should return this values correctly
centroids = zeros(K, size(X, 2));
% ====================== YOUR CODE HERE ======================
% Instructions: You should set centroids to randomly chosen examples from
%               the dataset X
%
%初始化中心centroids，从X中随机取K行作为初始化中心
randidx = randperm(size(X,1));            %打乱X的行，列不变
centroids = X(randidx(1:K),:);            %从打乱的X中取前K个作为初始化中心
% =============================================================
end

初始化中心时，是随机选取训练样本X中的K个作为初始化中心，所以先打乱X，然后取前K个即可。

3.findcloestCentroids.m的实现

function idx = findClosestCentroids(X, centroids)
%FINDCLOSESTCENTROIDS computes the centroid memberships for every example
%   idx = FINDCLOSESTCENTROIDS (X, centroids) returns the closest centroids
%   in idx for a dataset X where each row is a single example. idx = m x 1 
%   vector of centroid assignments (i.e. each entry in range [1..K])
%
% Set K
K = size(centroids, 1);
% You need to return the following variables correctly.
idx = zeros(size(X,1), 1);
% ====================== YOUR CODE HERE ======================
% Instructions: Go over every example, find its closest centroid, and store
%               the index inside idx at the appropriate location.
%               Concretely, idx(i) should contain the index of the centroid
%               closest to example i. Hence, it should be a value in the 
%               range 1..K
%
% Note: You can use a for-loop over the examples to compute this.
%
temp = zeros(K,1);                                           %存储样本x离各个中心距离的距离，方便求解该x离哪个点最近
for i = 1:size(X,1),                                         %对X的每个样本进行遍历
    for j = 1:K,                                             %在进行x(i)时候，计算他离每个中心的距离，存储在temp中
        temp(j) = sum((X(i,:) -  centroids(j,:)).^2);        
        [value,idx(i)] = min(temp,[],1);                     %计算temp中最小值的行号，就是x(i)距离最近的中心标号
    end
end
% =============================================================
end

4.computeCentroids.m的实现

function centroids = computeCentroids(X, idx, K)
%COMPUTECENTROIDS returs the new centroids by computing the means of the 
%data points assigned to each centroid.
%   centroids = COMPUTECENTROIDS(X, idx, K) returns the new centroids by 
%   computing the means of the data points assigned to each centroid. It is
%   given a dataset X where each row is a single data point, a vector
%   idx of centroid assignments (i.e. each entry in range [1..K]) for each
%   example, and K, the number of centroids. You should return a matrix
%   centroids, where each row of centroids is the mean of the data points
%   assigned to it.
%
% Useful variables
[m n] = size(X);
% You need to return the following variables correctly.
centroids = zeros(K, n);
% ====================== YOUR CODE HERE ======================
% Instructions: Go over every centroid and compute mean of all points that
%               belong to it. Concretely, the row vector centroids(i, :)
%               should contain the mean of the data points assigned to
%               centroid i.
%
% Note: You can use a for-loop over the centroids to compute this.
%
for i = 1:K,                                              %对每个中心遍历，一个一个计算
    centroids(i,:) = (X' * (idx == i)) / sum(idx == i);   %矩阵的方法，idx == i的意思是是idx向量的元素为i的位置置1，不为i的置0；
                                                          %然后乘以X’就是把对应中心i的X值加起来，最后除以sum及求平均
                                                          %这里实际上可以再采用一个for循环计算centroids，但是向量的方法更快，故采取向量的方法
end
% =============================================================
end

这里对每个类别进行遍历（共K类），然后对每类计算他的中心。对每个类别进行遍历时候需要一个FOR循环；在计算每个类别的中心时也可以采取一个for循环，但是这样太慢，可以采取向量的方法加快计算速度。

向量的方法即利用（idx==i）得到一个m*1的向量，当idx对应的位置为i时，此向量对应位置为1，否则为0。

FROM:http://blog.csdn.net/a1015553840/article/details/50877623

Avada 使用教程：从基础到进阶的全面指南专业WP网站开发-Joyous Wordpress php
概述在WordPress世界中，选择一个合适的主题对网站的成功至关重要。Avada是其中最受欢迎的选项之一，不仅因为其销售量，更因其功能强大、定制性强和用户友好性。无论你是初学者还是专业的网页开发者，Avada都提供了你所需的工具来构建你心中的网站。本文将详细介绍如何从基础到进阶地使用Avada，为你提供一个超过5000字的全方位指南。第一步：购买与安装购买Avada选择平台:Avada可以在Th
大数据学习（七）Python3操作livy（使用pylivy模块）猪笨是念来过倒大数据大数据 python
Livy是一个用于与Spark交互的开源REST接口。pylivy是Livy的Python客户端，可以在Spark集群上轻松实现远程代码执行。安装$pipinstall-Ulivy请注意，pylivy需要Python3.6或更高版本。用法所述LivySession类的主界面提供由pylivy：from
F1. Omsk Metro (simple version) L_M_TY 算法
题目链接：Problem-F1-Codeforces题目大意：有一棵树，然后通过“+”，“？”，其中“+”代表将一个权重为xi的新节点添加到vi(xi,vi,见输入介绍)；“？”代表查询u,v,里的简单路径是否有一个权重和正好等于ki的路径子段（可以为空）有YES,无NO,并题目保证为ui==1,输入：符号"+"(不带引号)，然后是两个数字vi和xi(xi∈{−1,1}），也保证存在数字vi的顶点
2024年wordpress、d-link等相关的多个cve漏洞poc 棉花糖网络安全圈漏洞复现网络安全
⚠️漏洞✅CVE-2024-10914在D-LinkDNS-320、DNS-320LW、DNS-325和DNS-340L中发现的漏洞，版本直到20241028GET/cgi-bin/account_mgr.cgi?cmd=cgi_user_add&name=%27;id;%27HTTP/1.1✅CVE-2024-11305在AltenergyPowerControlSoftware中发现的关键漏洞
《石头做的汤》 jerry201108 教育学习
资料来源《程序员修炼之道：通向务实的最高境界（第2版）》我记得幼儿园时的绘本中好像就有《石头汤》，不知道变成大孩子后对石头汤的理解是怎样的，回头可以再让他看看这段故事说说其中的体会。有三个战场归途中的士兵饥肠辘辘。他们看到前方有一座村庄，顿时重整精神——他们觉得村民们会给口饭吃。可是当他们抵达那里时，却发现四处门窗紧闭。多年战乱下，村民们食物短缺，仅有的存粮都藏了起来。士兵们没有气馁，他们烧了一锅
【转载】wordpress工作原理 iteye_20685 WordPress 工作 PHP Blog F#
[url]http://blog.ossxp.com/2010/01/166/[/url]WP初始化的过程：当你输入/wordpress对wordpress进行初始化时，wordpress默认会找根目录下的index.php页面，看一下index.php页面。你会发现，它会去调用根目录下的wp-blog-header.php，我们继续看wp-blog-header.php。通过wp-load.ph
Python进阶—高级语法 Echo.py Python基础语法 python 开发语言
目录文章目录目录1、在==和is之间选择2、元组的相对不可变性3、字典中的键映射多个值4、Linux5、python中字典的key要求6、编码7、进制之间的转换8、关系运算符(时间处理)9、时间处理模块❶常用时间处理方法❷转化为13位时间戳10、三元运算符11、成员运算符12、For循环机制13、变量的分类14、闭包(函数的嵌套)15、函数(方法)的执行流程16、匿名函数17、Django和Fla
Agent评估【Langchain】 BBluster langchain
Agent评估【LangChain&LangSmith】简介LangChain提供了三种LLM-Agent的评估方案最终响应：评估代理的最终响应单步：单独评估任何代理步骤（例如，是否选择了适当的工具）轨迹：评估代理是否采用了预期路径（例如，工具调用）来得出最终答案构建智能体接下来将使用LangGraph构建一个Agent环境设置下载依赖项pipinstall--upgrade--quietlang
FluentCMS：基于 ASP.NET Core 和 Blazor 技术构建的开源CMS内容管理系统编程乐趣 asp.net 开源后端
推荐一个基于ASP.NETCore和Blazor技术构建的、功能完善的开源CMS内容管理系统。01项目简介FluentCMS是一个基于强大的ASP.NETCore和创新的Blazor技术构建的现代内容管理系统（CMS）。FluentCMS设计为快速、灵活且用户友好，它不仅是一个传统的基于内容的CMS，还是一个无头（Headless）CMS，使其非常适合各种应用场景。此项目还在开发中，还有部分问题，
对本地部署的ChatGLM模型进行API调用 BBluster LLM python 开发语言语言模型
ChatGLM作为一个小参数模型，给予了我们在本地部署LLM的条件，接下来我将展示如何使用python对本地部署的ChatGLM模型进行API调用对于如何部署本地ChatGLM模型我们可以访问本地化部署大语言模型ChatGLM接下来我首先分享api调用的测试代码：importtimeimportrequests#测试GPU运行是否成功deftest_function_1():importtorch
Traceback包【持续更新】 BBluster python python
Traceback包简介traceback是Python标准库中的一个模块，它提供了一组用于提取、格式化和打印程序执行过程中的堆栈跟踪信息的工具。当程序发生异常且未被捕获时，Python会自动生成一个堆栈跟踪，显示出错的位置和调用栈。这有助于开发者理解和调试程序中出现的问题。主要功能当程序发生异常时，traceback模块可以用来捕获和格式化相关的堆栈信息。这有助于开发者快速定位问题所在。格式化的
Vim命令&快捷键 BBluster 系统 vim 编辑器 linux
Vim命令&快捷键简介Vim（ViIMproved）是一个功能强大的文本编辑器，广泛用于编程和其他文本编辑任务。它是基于vi编辑器，添加了很多新的功能。Vim使用模式编辑，主要包括普通模式、插入模式和命令行模式。命令基础命令i-进入插入模式，可以开始输入文本。Esc-退出当前模式，回到普通模式。:w-保存文件。:q-退出Vim。:wq或:x-保存并退出。:q!-强制退出而不保存更改移动光标h-左移
Vector的扩容过程是怎样的 codedadi java
Vector的扩容过程在C++中是一个动态调整内存空间以容纳更多元素的过程。这一过程主要发生在向Vector中添加元素时，如果当前Vector的容量不足以容纳新元素，就会触发扩容操作。以下是Vector扩容过程的详细步骤：扩容机制判断是否需要扩容：当向Vector中添加新元素，且当前容量不足以容纳新元素时，Vector会判断是否需要扩容。确定新的容量大小：Vector的扩容策略通常是按照一定的增长
Python timeit的使用 egzosn python 开发语言
假设您要测量代码段的执行时间。你是做什么？直到现在，我就像大多数人一样会做以下事情：登录后复制#导入时间start_time=time.time()"""某些代码"""end_time=time.time()print(f“执行时间为：{end_time-start_time}”)1.2.3.4.5.现在说我们要比较两个不同函数的执行时间，然后：登录后复制#导入时间deffunction_1(*参
【前端异常】JavaScript错误处理：分析 Uncaught (in promise) error egzosn 前端 javascript 开发语言 ecmascript
在前端开发中，JavaScript异常是不可避免的。随着现代前端应用越来越多地使用异步操作(如Promise、async/await等)，开发者常常会遇到Uncaught(inpromise)error错误。这个错误是由于未正确处理Promise的拒绝(rejection)而导致的，常常出现在异步操作失败的情况下。如果不妥善处理，可能会导致应用的不稳定和用户体验的下降。本文将深入分析Uncaugh
【前端异常】JavaScript错误处理：分析 Uncaught (in promise) error egzosn 前端 javascript 开发语言 ecmascript
在前端开发中，JavaScript异常是不可避免的。随着现代前端应用越来越多地使用异步操作(如Promise、async/await等)，开发者常常会遇到Uncaught(inpromise)error错误。这个错误是由于未正确处理Promise的拒绝(rejection)而导致的，常常出现在异步操作失败的情况下。如果不妥善处理，可能会导致应用的不稳定和用户体验的下降。本文将深入分析Uncaugh
c#延时程序手搓人生 C#编程 c#线程延时
有效避免sleep带来的线程休眠问题（如界面假死）publicstaticvoidDelay(inttime){intstart=Environment.TickCount;while(Math.Abs(Environment.TickCount-start)
Alibaba Spring Cloud 三 Seata 的三大核心组件：TC，TM，RM 空灵宫（Ethereal Palace） Alibaba Spring Cloud spring cloud 架构 spring
Seata的架构由三大核心组件构成：TransactionCoordinator（TC）、TransactionManager（TM）和ResourceManager（RM）。它们协同工作，用于管理分布式事务的生命周期，确保全局数据一致性。以下是对这三个组件的详细解析及其作用：1.Seata的三大核心组件1.1TransactionCoordinator（TC）事务协调者作用：负责管理全局事务的生
基于FPGA的DDS设计 Squirrels43 verilog fpga
文章目录目标一、DDS电路核心RTL1.设计一个DDS的核心RTL代码。2.使用Matlab生成DDS的波表ROM3.验证目标二、DDS开发板测试平台1.使用Quartus的SignalTAP观察DDS的输出波形2.导出SignalTAP的捕获数据至电脑（生成List文件）3.用UltraEdit的列操作模式编辑数据格式。（matlab变量定义）4.使用Matlab分析DDS生成的正弦信号的频谱纯
智慧脚下生根，智能井盖监测终端引领城市安全新革命旭华智能安全
在繁忙的都市生活中，我们往往只关注地面的繁华与喧嚣，却忽略了隐藏在地面之下的基础设施——井盖。这些看似不起眼的井盖，实则承担着排水、通讯、电力等重要功能，是城市安全运转的重要一环。然而，传统的井盖管理面临着诸多挑战，如被盗、损坏、移位等问题频发，给市民的生活带来诸多不便，甚至引发安全事故。为了破解这一难题，旭华智能井盖在线监测设备应运而生，成为守护城市安全的“地下守护者”。由旭华智能研发生产的智能
Python多进程 multiprocessing 培之编程语言 python 机器学习开发语言
在大数据时代，Python已经成为最受追捧的语言。在本文中，让我们专注于Python的一个特定方面，它使其成为最强大的编程语言之一——Multi-Processing。在阅读本文之前，我建议您阅读我之前关于Python中的线程的文章，因为它可以为当前文章提供更好的上下文。多进程是什么？假设你是一名小学生，你的作业是让1200对数字相乘，这让你感到麻木。假设您能够在3秒内将一对数字相乘。那么总共需要
Python 并发 multiprocessing-Process lainegates python Python multiprocess
＊multiprocessing支持子进程、通信和共享数据、执行不同形式的同步。＊Process创建进程的类：Process([group[,target[,name[,args[,kwargs]]]]])，target表示调用对象，args表示调用对象的位置参数元组。kwargs表示调用对象的字典。Name为别名。Group实质上不使用。方法有：is_alive()、.join([timeout
如何提升IP地址查询数据服务的安全？ IpdataCloud tcp/ip 安全网络
随着网络科技深入人们的生活之中，数据相关服务顺时代浪潮应运而生。而在数据查询相关服务之中，数据安全乃是重中之重。而如何部署数据查询服务安全，今天让我们来大致了解一下：数据加密数据加密是数据查询服务安全的核心技术之一，为了提高在数据传输过程中的数据安全性，技术人员可采用SSL或是TLS协议对数据进行更进一步的加密，以此来防止网络数据被篡改。设立访问控制体系IP数据查询服务商应建立完整的访问控制体系，
Flask --（2）Flask 框架的诞生 feiyy404 flask
Flask诞生于2010年，是Arminronacher（人名）用Python语言基于Werkzeug工具箱编写的轻量级Web开发框架。Flask本身相当于一个内核，其他几乎所有的功能都要用到扩展（邮件扩展Flask-Mail，用户认证Flask-Login），都需要用第三方的扩展来实现。比如可以用Flask-extension加入ORM、窗体验证工具，文件上传、身份验证等。Flask没有默认使用
数据结构之栈，队列，树一只小bit 数据结构数据结构开发语言 c语言 c++
目录一.栈1.栈的概念及结构2.栈的实现3.实现讲解1.初始化栈2.销毁栈3.压栈4.出栈5.返回栈顶元素6.返回栈内元素个数7.判断栈内是否为空二.队列1.队列的概念及结构2.队列的实现3.实现讲解1.初始化队列2.销毁队列3.单个成员入队列4.单个成员出队列5.判断队列是否为空6.返回队列内元素个数7.返回队列首个元素8.返回队列尾部元素三.树1.树的概念概念及结构2.树的相关概念3.树的实现
使用 Tokenizers 分割文本：深入了解与实践 AWsggdrg python
在开发应用自然语言处理（NLP）模型时，一个常见的需求是将文本拆分为较小的块，通常称为“tokens”。现代语言模型对tokens的数量有限制，因此在处理长文本时，我们需要仔细计算tokens以避免超过限制。本文将介绍如何使用不同的tokenizer来分割文本，并提供实用代码示例。技术背景介绍自然语言处理中的tokenization是指将文本拆分为更小的、可管理的单元，称为tokens。使用tok
LangServe：快速部署和运行LangChain的实用指南 AWsggdrg langchain python
LangServe：快速部署和运行LangChain的实用指南在AI应用开发领域，LangServe为开发者提供了便利的方式，将LangChain的运行单元和链路部署为RESTAPI。本文将通过技术解析和实战示例，带您深入了解LangServe的强大功能和应用场景。1.技术背景介绍LangServe是一个基于Python的库，整合了FastAPI和Pydantic技术，用于将LangChain的运
vector迭代器黄亚磊11 c++
vector迭代器：除了使用下标来访问vector对象的元素外，标准库还提供了另一种检测元素的方法：使用迭代器（iterator）。迭代器是一种允许程序员检查容器内元素，并实现元素遍历的数据类型。迭代器类型提供了比下标操作更一般化的方法：所有的标准容器容器都定义了相应的迭代器类型，而只有少数的容器支持下标操作。因为迭代器对所有的容器都适用，现代C++程序更倾向于使用迭代器而不是下标访问容器元素，即
对象的克隆单例模式黄亚磊11 c++
1)如何实现对象的克隆？1、为什么需要实现对象的克隆？在某些情况下，需要创建一个与现有对象完全相同的副本，这就是对象克隆。例如，在需要对对象进行备份、在不同的上下文中使用相同的类型的对象或者实现某些设计模式（如原型模式）时，克隆对象是很有用的。2、在C++中如何实现对象的克隆？浅克隆：简单的复制对象的成员变量，但如果成员变量是指针类型，只会复制指针的值，而不是指针所指向的对象。这可能会导致多个对象
【Bug合集】——Java大小写引起传参失败，获取值为null的解决方案三三是该溜子 java 开发语言 Springboot
阿华代码，不是逆风，就是我疯你们的点赞收藏是我前进最大的动力！！希望本文内容能够帮助到你！！目录一：本文面向的人群二：错误场景引入三：正确场景引入四：问题解决五：解决方法1：public修饰2：使用@JsonProperty注解一：本文面向的人群本文主要针对类中成员变量命名问题引起传送json字符串，但是变量为null的情况做出解释。其中涉及到@Data注解（Spring自动生成的get和set方
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交

Programming Exercise 7:K-means Clustering and Principal Component Analysis 第一部分

你可能感兴趣的:(Mac,Jiang的机器学习专栏)