Mac Jiang

Programming Exercise 6:Support Vector Machines 第二部分

大家好，我是Mac Jiang，今天和大家分享一下coursera网站上Stanford University的Machine Learning公开课（吴恩达老师）课程第六次作业：Programming Exercise 6:Support Vector Machines。写这篇博客的目的是为在课程学习中遇到困难的同学提供一些帮助，同时帮助自己巩固这周的课程内容。欢迎博友转载此文章，但希望您在转载之前与我联系并标明文章的出处，谢谢！

由于Programming Exercise 6的作业内容可以分为两大块，即1Support Vector Machines 2Span Classification.其中，第一块主要是描述SVM算法的具体实现过程，是本周课程内容的基础，第二块垃圾邮件分类是基于第一块代码的基础上的具体实际应用。第一部分的实现过程已经在前一篇博客中给出，地址为：第一部分：Support Vector Machines。下面介绍第二部分Spam Classification(垃圾邮件分类)的实现过程。

好的，话不多说，开始我们的讲解。

数据集:spamTrain.mat ---训练样本，用于训练垃圾邮件分类器，有4000个训练样本

spamTest.mat ---测试样本，用于查看已得到的分类器对新样本的泛化能力，有1000个训练样本

vocab.txt ---分类器用到的词汇集合，保存在txt中，存有编号和对应的词汇，这里设置的是1899个常用词汇

emailSample1.txt ，emailSample2.txt---邮件样例，用于查看邮件处理算法对邮件的处理效果

spamSample1.txt，spamSample2.txt ---垃圾邮件，用于对以训练的样本进行预测，看分类器判断是否为垃圾邮件

函数文件：ex6_spam.m --- 实验的控制文件，描述实验的进行过程，控制输入输出，绘图等操作。不用修改

getVocabList.m ---将vocab.txt读入matlab中，并放在一个一维字符数组vocabList中。不用修改，直接调用

porterStemmer.m ---英文分词函数。不用修改，直接调用

readFile.m ---读取邮件文本函数。不用修改，直接调用

processEmain.m ---对读取的字符串进行加工，如：去标点，分词，去网址，去数字等。需要修改

emailFeature.m ---看分好词后，这个词是否在词汇库vocabList中，如果在，则在对应的向量上置1。需要修改

svmTrain.m --- 利用训练样本训练SVM分类器，不用修改，直接调用。上篇博客解释过

linearKernel.m --- 线性核函数，不用修改，直接调用。上篇博客解释过

svmPredict.m --- 利用训练得到的model对新样本进行预测，不用修改，直接调用。上篇博客提到过

1.ex6_spam.m为此程序的实现流程，代码如下

%% Initialization
clear ; close all; clc
%% ==================== Part 1: Email Preprocessing ====================
%  To use an SVM to classify emails into Spam v.s. Non-Spam, you first need
%  to convert each email into a vector of features. In this part, you will
%  implement the preprocessing steps for each email. You should
%  complete the code in processEmail.m to produce a word indices vector
%  for a given email.
fprintf('\nPreprocessing sample email (emailSample1.txt)\n');
% Extract Features
file_contents = readFile('emailSample1.txt');
word_indices  = processEmail(file_contents);
% Print Stats
fprintf('Word Indices: \n');
fprintf(' %d', word_indices);
fprintf('\n\n');
fprintf('Program paused. Press enter to continue.\n');
pause;

%% ==================== Part 2: Feature Extraction ====================
%  Now, you will convert each email into a vector of features in R^n. 
%  You should complete the code in emailFeatures.m to produce a feature
%  vector for a given email.

fprintf('\nExtracting features from sample email (emailSample1.txt)\n');

% Extract Features
file_contents = readFile('emailSample1.txt');
word_indices  = processEmail(file_contents);
features      = emailFeatures(word_indices);
% Print Stats
fprintf('Length of feature vector: %d\n', length(features));
fprintf('Number of non-zero entries: %d\n', sum(features > 0));
fprintf('Program paused. Press enter to continue.\n');
pause;

%% =========== Part 3: Train Linear SVM for Spam Classification ========
%  In this section, you will train a linear classifier to determine if an
%  email is Spam or Not-Spam.

% Load the Spam Email dataset
% You will have X, y in your environment
load('spamTrain.mat');

fprintf('\nTraining Linear SVM (Spam Classification)\n')
fprintf('(this may take 1 to 2 minutes) ...\n')

C = 0.1;
model = svmTrain(X, y, C, @linearKernel);
p = svmPredict(model, X);
fprintf('Training Accuracy: %f\n', mean(double(p == y)) * 100);

%% =================== Part 4: Test Spam Classification ================
%  After training the classifier, we can evaluate it on a test set. We have
%  included a test set in spamTest.mat

% Load the test dataset
% You will have Xtest, ytest in your environment
load('spamTest.mat');
fprintf('\nEvaluating the trained Linear SVM on a test set ...\n')
p = svmPredict(model, Xtest);
fprintf('Test Accuracy: %f\n', mean(double(p == ytest)) * 100);
pause;

%% ================= Part 5: Top Predictors of Spam ====================
%  Since the model we are training is a linear SVM, we can inspect the
%  weights learned by the model to understand better how it is determining
%  whether an email is spam or not. The following code finds the words with
%  the highest weights in the classifier. Informally, the classifier
%  'thinks' that these words are the most likely indicators of spam.
%
% Sort the weights and obtin the vocabulary list
[weight, idx] = sort(model.w, 'descend');
vocabList = getVocabList();
fprintf('\nTop predictors of spam: \n');
for i = 1:15
    fprintf(' %-15s (%f) \n', vocabList{idx(i)}, weight(i));
end
fprintf('\n\n');
fprintf('\nProgram paused. Press enter to continue.\n');
pause;

%% =================== Part 6: Try Your Own Emails =====================
%  Now that you've trained the spam classifier, you can use it on your own
%  emails! In the starter code, we have included spamSample1.txt,
%  spamSample2.txt, emailSample1.txt and emailSample2.txt as examples. 
%  The following code reads in one of these emails and then uses your 
%  learned SVM classifier to determine whether the email is Spam or 
%  Not Spam
% Set the file to be read in (change this to spamSample2.txt,
% emailSample1.txt or emailSample2.txt to see different predictions on
% different emails types). Try your own emails as well!
filename = 'spamSample1.txt';
% Read and predict
file_contents = readFile(filename);
word_indices  = processEmail(file_contents);
x             = emailFeatures(word_indices);
p = svmPredict(model, x);
fprintf('\nProcessed %s\n\nSpam Classification: %d\n', filename, p);
fprintf('(1 indicates spam, 0 indicates not spam)\n\n');

part1:Email Preprocessing---读取样本邮件，利用processEmail函数处理读入的数据，得到便于处理的标准英文单词

part2:Feature Extraction ---建立一个和字典vocabList等长的向量x，有part1得到的标准数据输入，假如该单词在字典中，向量x对应位置置1

part3:Train Linear SVM for Spam Classification ---建立线性和函数的SVM，利用spanTrain.mat中的（X,y）对SVM进行训练，得到model

part4:Test Spam Classification ---在part4得到的model基础上，利用spamTest.mat中的（Xtest,ytest）对model进行测试，查看它的准确率

part5:Top Predictors of Spam ---给出训练得到的model中出现概率最高的15个单词

part6:Try Your Own Emails ---对一封信件进行预测，输出为0表示它不是垃圾邮件，输出为1表示它是垃圾邮件

2.完善processEmail.m（此处需要编写代码！！！）

function word_indices = processEmail(email_contents)
% Load Vocabulary    导入词汇列表
vocabList = getVocabList();
% Init return value   建立返回字符串数组
word_indices = [];
% Lower case    将大写字母全都转换成
email_contents = lower(email_contents);
% Strip all HTML
% Looks for any expression that starts with < and ends with > and replace
% and does not have any < or > in the tag it with a space
email_contents = regexprep(email_contents, '<[^<>]+>', ' ');  %将所有html标记
% Handle Numbers
% Look for one or more characters between 0-9
email_contents = regexprep(email_contents, '[0-9]+', 'number');%删除所有数字，改写成字符串number

% Handle URLS
% Look for strings starting with http:// or https://
email_contents = regexprep(email_contents, ...
                           '(http|https)://[^\s]*', 'httpaddr');%家那个多有http地址改写成字符串httpaddr

% Handle Email Addresses
% Look for strings with @ in the middle
email_contents = regexprep(email_contents, '[^\s]+@[^\s]+', 'emailaddr');%将多有email地址改写成字符串emailaddr

% Handle $ sign
email_contents = regexprep(email_contents, '[$]+', 'dollar');%将$符号改写成字符串dollar


% ========================== Tokenize Email ===========================

% Output the email to screen as well
fprintf('\n==== Processed Email ====\n\n');

% Process file
l = 0;

while ~isempty(email_contents)

    % Tokenize and also get rid of any punctuation   删除标点
    [str, email_contents] = ...
       strtok(email_contents, ...
              [' @$/#.-:&*+=[]?!(){},''">_<;%' char(10) char(13)]);
   
    % Remove any non alphanumeric characters     删除非数字，字母的符号
    str = regexprep(str, '[^a-zA-Z0-9]', '');

    % Stem the word   找词干
    % (the porterStemmer sometimes has issues, so we use a try catch
    % block)删除多余空格
    try str = porterStemmer(strtrim(str)); 
    catch str = ''; continue;
    end;

    % Skip the word if it is too short
    if length(str) < 1
       continue;
    end
    % ====================== YOUR CODE HERE ======================

    vocab_length = length(vocabList);
    for i = 1:vocab_length,                               %将str与vocabList中的每个元素进行比较
        if(strcmp(str,vocabList(i)) == 1)
            word_indices = [word_indices;i];              %若存在，则将其对应的字符编号加入word_indices中
        end
    end
    % =============================================================
    % Print to screen, ensuring that the output lines are not too long
    if (l + length(str) + 1) > 78
        fprintf('\n');
        l = 0;
    end
    fprintf('%s ', str);
    l = l + length(str) + 1;
end
% Print footer
fprintf('\n\n=========================\n');

end

这个文件的作用是对读入的邮件进行改造，先后进行1.大写字符转化成小写 2.删除所有HTML编辑 3.将所有数字改写成字符串number 4.将所有http地址改写成字符串httpaddr 5.将所有email地址改写成emailaddr 6.将所有$符号改写成字符串dollar 7.删除标点，删除多余空格，查找词干，删除非数字字母符号。

最后，将str与vocabList中的每个元素进行比较，若str在其中，则将他在vocabList中的位置记录在数字数组word_indices中。

3.完善emailFeature.m（此处需要编写代码！！！）

function x = emailFeatures(word_indices)
% Total number of words in the dictionary
n = 1899;
% You need to return the following variables correctly.
x = zeros(n, 1);
% ====================== YOUR CODE HERE ======================
k = length(word_indices);
for i = 1:k,
    if(x(word_indices(i)) == 0)
        x(word_indices(i)) = x(word_indices(i)) + 1;
    end
end
% =========================================================================
end

这个文件的左右是将2得到的word_indices转换成向量x。因为word_indices存储的是文件中存在单词在词汇列表vocabList中的位置，我们建立一个与vocabList等长的向量x，将所有出现的词汇列表的单词对应位置上标1。这样就将输入样本转换成标准输入数据了。

from:http://blog.csdn.net/a1015553840/article/details/50826728

【大数据分析】Spark SQL查询：使用SQL命令 sword_csdn Spark spark 数据分析 sql
对于使用关系型数据库或分布式数据库的用户可能更容易和更自然地使用SQL，比如Hive。在SparkSQL编写SQL命令时，它们将被转换为DataFrame上的操作。通过连接到Spark的Thrift服务器，它们可以通过标准的JDBC或ODBC协议从应用服务器连接到Spark。Spark支持两种SQL方言：SQL和HQL。Spark社区推荐的是HQL，因为HQL具有更丰富的功能。要使用HQL，需要使
人工智能专业毕业设计题目精选：推荐合集 HaiLang_IT 毕业设计选题计算机视觉人工智能目标检测
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了计算机专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇总
LVS-DR集群搭建 afei00123 Linux
目录1.LVS-DR实验拓扑2.实验环境3.配置LVS3.1IP配置3.2生成ens37:1配置文件3.3配置LVS-DR规则4.配置RealServer4.1配置IP，生成lo:1文件4.2安装httpd服务，编写测试页面4.3关闭ARP转发5.测试6.LVS的多种调度模式1.LVS-DR实验拓扑afeiLVS-DR的特点：（1）NAT模式效率太低；（2）LVS-DR基于2层的数据报文的转发，要
跨语言语义理解与生成：多语言预训练方法及一致性优化策略网罗开发 AI 大模型人工智能深度学习负载均衡
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
【虚拟机网络】虚拟机的网络配置教程，亲测有效！ 2022lcl 网络
一、环境准备虚拟机软件：VMwareWorkstation17操作系统：CentOS7/Ubuntu22.04网络模式：NAT模式（VMnet8）二、配置虚拟网络编辑器1.启用VMnet8打开VMware，进入编辑>虚拟网络编辑器。选择VMnet8，勾选NAT模式，点击确定保存。2.设置默认网关和静态ip池点击更改设置获取管理员权限。进入NAT设置，填写默认网关（例如192.168.177.2）。
使用SingleStoreDB构建高效的AI检索器 qahaj 人工智能 python
在构建现代AI应用时，高效存储和检索向量数据是不可或缺的一环。SingleStoreDB是一款高性能的分布式SQL数据库，不仅支持云端和本地部署，还具备向量存储能力及相关函数（如dot_product和euclidean_distance），能够很好地支持基于向量的应用场景，如文本相似度匹配。本文将以SingleStoreDB为核心，结合LangChain生态系统，展示如何实现一个简单但功能强大的
C++虚函数：解锁多态的“动态密码福鸦 c++c++开发语言
C++虚函数：解锁多态的“动态密码”开篇小故事：遥控器的“智能按钮”假设你有一个万能遥控器，上面只有一个“开关”按钮：按下时，电视会开机，空调会制冷，电灯会亮起。同一个按钮，却能根据设备类型触发不同行为。C++中的虚函数（VirtualFunction）就像这个“智能按钮”，允许基类指针在运行时动态调用子类的具体实现。今天，我们就来揭开虚函数的神秘面纱！一、虚函数是什么？虚函数是C++实现运行时多
C语言pta程序设计---实验八（指针） .又是新的一天. 大学课程汇总专栏算法数据结构 c++
6-1sdut-C语言实验-n个数的排序Qiao当上了体育委员，现在老师让他去给班级里的人排队，Qiao刚学了排序，所以他想以这种方式给班级里的人排队（从矮到高），他想知道排序完成后的结果。函数接口定义：voidsort(int*p,intn)；其中p和n都是用户传入的参数。p的值为传递过来的地址；n的为正整数（1voidsort(int*p,intn)；intmain(){inta[100];i
SeaTunnel社区「Demo方舟计划」首期活动上线—— MySQL CDC实时同步至PostgreSQL实战数据库
引言凌晨2点，某电商公司的数据工程师小李正对着屏幕抓狂——业务部门临时要求将MySQL的订单表实时同步到PostgreSQL进行分析，众所周知，在数据驱动的业务场景中，异构数据源同步是高频刚需。以MySQL到PostgreSQL的CDC同步为例，开发者常面临以下问题：：配置复杂：CDC组件参数众多（如server-id分配、binlog解析模式）。调优缺失：社区示例多为基础配置，缺乏高并发、容错、
XSS 与 CSRF 攻击你了解多少呢 javascript前端安全
网络安全至关重要，它保护着我们的个人信息和网站的正常运行。XSS和CSRF是两种常见且危险的网络威胁，它常常困扰着我们，而你又了解多少呢？一、XSS攻击深度剖析（一）概念溯源与攻击本质XSS，即跨站脚本攻击，其核心在于攻击者利用网站对用户输入数据处理的漏洞，将恶意脚本注入网页。当其他用户访问该网页时，浏览器会误将这些恶意脚本当作正常网页内容执行，从而沦为攻击者的“傀儡”，实现用户敏感信息窃取、会话
Docker部署Kibana8 GitIDEA docker 容器运维
安装Kibana安装Kibana前置创建并配置kibana.yml启动Kibana检查是否启动成功通过页面访问Docker安装Kibana:GitIDEA安装Kibana前置Kibana是一款适用于Elasticsearch的源可用数据可视化仪表板软件。使用docker下载kibanadockerpullkibana:8.13.0查看es的ipdockerinspect809c99acde7f|g
基于Rust开发git-cryptx与Obsidian实现加密多机同步的写作方案
「知识管理的尽头，是安全与效率的平衡」——你的每一份笔记都值得被加密保护痛点直击：为什么需要加密同步？Obsidian的好用程度不必多说（个人心目中最佳），然而官方同步服务年费高达48~96美元，且对隐私敏感用户而言，将笔记明文存储在第三方平台存在风险。使用ObsidianGit插件同步方案虽然免费，但安全性存在两大硬伤：隐私泄露：配置文件、日记、账号密码等敏感内容以明文形式存储Github、Gi
编程语言難釋懷开发语言
在当今数字化的时代，编程语言作为人与计算机交流的桥梁，扮演着至关重要的角色。无论是开发一款手机应用、创建一个网站还是实现复杂的数据分析，选择合适的编程语言都是成功的关键之一。本文将带你走进编程语言的世界，探索它们的基本概念、类型以及如何根据项目需求选择最合适的工具。一、什么是编程语言？编程语言是一种用于编写计算机程序的形式化语言，它定义了一套规则和语法，让开发者能够指示计算机执行特定任务。编程语言
为什么说异步编程是反人类编程异步编程
异步编程作为一种编程模式，在提高程序响应性、效率和可扩展性方面具有显著优势。然而，很多开发者称异步编程为“反人类”，主要是因为其相对复杂的逻辑、调试困难以及在一些情况下可能带来的潜在陷阱。异步编程的难点在于理解异步执行的时序、错误处理的方式以及在多线程和异步操作混合使用时的复杂性。这一模式特别适合处理I/O密集型操作，然而它的实现和管理常常让开发者感到头痛。一、异步编程的复杂性异步编程本质上是为了
本地运行 DeepSeek-R1 的成本究竟多高？前端javascript
ReactHook深入浅出CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读本地运行DeepSeek-R1的成本究竟多高？DeepSeek让人们对大规模生成式模型的追求更进一步，甚至有人想在本地跑下规模高达671B参数的版本。但要在家里开这种“巨无霸”，可不是闹着玩的：光是推理就对硬件提出了非常高的要求。这篇文章将大致拆解一下，如果真想在个人电脑上运行DeepSeek-R1，可能需
CSDN2019博客之星评选——期待各位大佬的投票！十步杀一人_千里不留行程序人生
我的序号是68，68，68！！http://m234140.nofollow.ax.mvote.cn/opage/d4cf886a-057e-1c0d-56f1-3a86340af8fd.html2019年CSDN博客之星年度总评选已开启：68.十步杀一人_千里不留行，微信、QQ、微博渠道可以连投5票哦！扫码为我投票哦：
《现代CSS技术应用与实践》小册完结啦！
历时125天，《现代CSS技术应用与实践》小册迎来了完结，总篇数40篇，约11万字。后续还会继续更新，欢迎订阅支持我。《现代CSS技术应用与实践》是一本专注于现代CSS技术应用与实践的指导手册。小册旨在帮助读者深入理解现代CSS新特性的概念、原理和应用，掌握现代CSS技术的最新进展和实践经验，从而提升网页设计和开发的技能。小册内容涵盖现代CSS的基础知识、CSS嵌套及作用域、CSS布局技术与技巧、
Python 抽象基类 ABC ：从实践到优雅 python
今天我们来聊聊Python中的抽象基类（AbstractBaseClass，简称ABC）。虽然这个概念在Python中已经存在很久了，但在日常开发中，很多人可能用得并不多，或者用得不够优雅。让我们从一个实际场景开始：假设你正在开发一个文件处理系统，需要支持不同格式的文件读写，比如JSON、CSV、XML等。初始版本：简单但不够严谨我们先来看看最简单的实现方式：classFileHandler:de
Python 并发编程实战：优雅地使用 concurrent.futures python
在Python多线程编程中，concurrent.futures模块提供了一个高层的接口来异步执行可调用对象。今天，我们将通过一个循序渐进的案例，深入了解如何使用这个强大的工具。从一个模拟场景开始假设我们需要处理一批网络请求。为了模拟这个场景，我们使用sleep来代表耗时操作：importtimeimportrandomdefslow_operation(task_id):"""模拟一个耗时的网络
shutil 标准库： Python 文件操作的万用刀 python
今天来聊一个被低估的Python标准库-shutil。工作中我们用Python（尤其是写一些短小轻快的脚本）虽然经常和文件打交道，却很少用到shutil。但实际上，shutil提供了比os模块更高级的文件操作接口，能让我们写出更Pythonic的代码。从一个真实场景说起最近在整理项目代码时，需要将散落在各处的配置文件归类到统一目录。按以往的习惯，我会这样写：importos#创建目标目录ifnot
Python 自带的日期日历处理大师：calendar 库 python
在Python开发中，我们经常需要处理日期和时间。虽然datetime库是最常用的选择，但其实Python标准库中的calendar模块也是一个强大的工具，特别适合处理日历相关的计算和展示。从一个真实场景开始假设你正在开发一个会议室预订系统，需要：展示月度视图计算工作日处理节假日逻辑让我们看看如何用calendar来优雅地解决这些问题。基础用法：生成日历importcalendar#创建日历对象c
Python性能优化的幕后功臣： __pycache__与字节码缓存机制 python
在日常Python开发中，我们经常会看到项目目录下神秘的__pycache__文件夹和.pyc文件。作为经验丰富的Python开发者，今天让我们深入理解这个性能优化机制。从一个性能困扰说起最近在优化一个数据处理微服务时，发现每次启动服务都需要2-3秒的预热时间。通过profile可以发现大量时间花在了Python模块的加载上。Python的编译过程与大多数人的认知不同，Python并不是纯解释型语
在VS-qt的程序中,后期增加PCH预编译功能,提高编译速度 blueman8888 QT qt 开发语言
由于前期创建qt程序的时候未勾选pch功能,导致没有启动预编译的功能.这种情况下需要增加pch功能应该怎么做?在项目中增加2个文件stdafx.h和stdafx.cpp文件stdafx.h增加qt常用头文件#pragmaonce//windows#include//qt常用#include#include#include#include#include#include#include#includ
推荐文章：高效录屏新纪元 —— 屏幕捕捉录像器DXGI版嵇李美Rosalie
推荐文章：高效录屏新纪元——屏幕捕捉录像器DXGI版screen-capture-record2dxgi演示.zip项目地址:https://gitcode.com/open-source-toolkit/67c73随着在线教育、游戏直播、远程办公等领域的发展，高质量的屏幕录制工具已成为不可或缺的辅助软件。今天，我们要向大家隆重推荐一款开源项目——《ScreenCaptureRecorder升级D
Python Generator：一个被低估的性能利器 python
调用OpenAI的API时，设置stream=True，接着forchunkincompletion:我们就可以“流式”地获取响应的内容。而非等待远程的模型将所有内容生成完毕，再返回给我们（这通常要等很久）。本文讨论这背后的PythonGenerator。从一个经典问题开始假设我们要处理一个超大的日志文件，需要按行读取并分析。传统的做法是：defread_log_file(filename):re
Python `__slots__` 进阶指南：不止于节省内存，从原理到实践 python
相信不少Python开发者都听说过__slots__，知道它可以帮助节省内存。但你是否思考过它背后的原理，以及在实际开发中的其他妙用？让我们一起深入探讨。从一个性能问题说起假设你的一个系统需要处理大量的订单对象：classOrder:def__init__(self,order_id,symbol,price,quantity):self.order_id=order_idself.symbol=
Python 元类（Meta Class）：解密 Python 面向对象编程的幕后推手后端python
在Python编程中，我们每天都在和类打交道，但是你是否也和我一样想过：类本身是什么？是谁创建了类？元类（MetaClass）就是用来创建类的"类"。今天让我们一起深入理解这个强大而神秘的特性。从一个简单的类说起classPerson:def__init__(self,name):self.name=namedefgreet(self):returnf"Hello,I'm{self.name}"#
langchain系列（二）- 提示词模板以及消息码--到成功大语言模型 langchain
导读环境：OpenEuler、Windows11、WSL2、Python3.12.3langchain0.3背景：前期忙碌的开发阶段结束，需要沉淀自己的应用知识，过一遍LangChain时间：20250212说明：技术梳理提示词模板理论说明提示模板将用户输入和参数转换为语言模型的指令，以此来实现模型的响应，帮助它理解上下文并生成相关且连贯的基于语言的输出。其接受一个字典作为输入，其中每个键代表提示
Qt/C++编写自定义控件72-提示进度条 feiyangqingyun Qt/C++自定义控件 Qt自定义控件提示进度条插件免费
一、前言我们在很多的安装包中，在安装过程中，经常可以在底部看到一个漂亮的进度条，上面悬浮着显示对应的进度，然后底部进度多种颜色渐变展示，Qt自带的进度条或者操作系统的进度条样式，不够炫，这次索性直接来个自定义绘制实现，至于是继承QWidget类还是QProgressBar类，都无所谓，如果是继承自QWidget类的话，就需要自己设置最大值最小值范围值，而继承自QProgressBar的话就可以直接
langchain系列 - FewShotPromptTemplate 少量示例码--到成功大语言模型 langchain
导读环境：OpenEuler、Windows11、WSL2、Python3.12.3langchain0.3背景：前期忙碌的开发阶段结束，需要沉淀自己的应用知识，过一遍LangChain时间：20250220说明：技术梳理，针对FewShotPromptTemplate专门来写一篇博客概念说明few-shot最初来源于机器学习的概念，还有one-shot、zero-shot概念，概念如下：机器学习
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR

Programming Exercise 6:Support Vector Machines 第二部分

你可能感兴趣的:(Mac,Jiang的机器学习专栏)