Eastmount

【学习排序】 Learning to Rank中Pointwise关于PRank算法源码实现

最近终于忙完了Learning to Rank的作业,同时也学到了很多东西.我准备写几篇相关的文章简单讲述自己对它的理解和认识.第一篇准备讲述的就是Learning to Rank中Pointwise的认识及PRank算法的实现.主要从以下四个方面进行讲述：
1.学习排序(Learning to Rank)概念
2.基于点的排序算法(Pointwise)介绍
3.基于顺序回归(Ordinal Regression-based)的PRank排序算法
4.PRank算法Java\C++实现及总结

一. 学习排序(Learning to Rank)概念

学习排序概念推荐转载的文章：机器学习排序之Learning to Rank简单介绍
1.首先,为什么会出现学习排序呢?
传统的排序方法是通过构造一个排序函数实现，在Information Retrieval领域一般按照相关度进行排序。比较典型的是搜索引擎中一条查询query，将返回一个相关的文档document，然后根据(query,document)之间的相关度进行排序,再返回给用户。
而随着影响相关度的因素(如PageRank)变多，Google目前排序方法考虑了200多种方法。这使得传统排序方法变得困难，人们就想到通过机器学习来解决这一问题，这就导致了Learning to Rank的诞生。
2.然后是学习排序的基本流程如下图所示.
很明显它就是基本步骤就是通过训练集数据(Train Set)学习得到模型h,然后通过该模型去对测试集数据(Test Set)进行计算和排序,最后得到一个预测的结果.

【学习排序】 Learning to Rank中Pointwise关于PRank算法源码实现_第1张图片

3.那么,学习排序的数据集是怎样的一个东西呢?也就是上图中x、y、h分别代表着什么呢?
数据集可参考微软136维数据——MSLR-WEB10K 它是2010年的数据.形如：
=============================================================
0 qid:1 1:3 2:0 3:2 4:2 ... 135:0 136:0
2 qid:1 1:3 2:3 3:0 4:0 ... 135:0 136:0
=============================================================
其数据格式： label qid:id feaid:feavalue feaid:feavalue ...
每行表示一个样本,相同的查询请求的样本qid相同,上面就是两个对qid为“1”的查询;label表示该样本和该查询请求的相关程度,该label等级划分方式为 {Perfect, Excellent,Good, Fair, Bad} 共五个类别,后面对应的是特征和特征值,我们通常使用的即是<特征量,人工标注>.
同样你也可以使用比较经典的2007的数据集——LETOR4.0,它是46维数据.如下图所示:

【学习排序】 Learning to Rank中Pointwise关于PRank算法源码实现_第2张图片

它表示每行相当于一个Document(样本文档),第一行是样本相关程度,在46维中label共三个值：2-完全相关、1-部分相关、0-不相关;同时qid相同表示同一个查询对应多行样本;中间是46维特征之,最后#相当于注释解释.
4.如果你还是不清楚,我换成通俗的例子解释:

【学习排序】 Learning to Rank中Pointwise关于PRank算法源码实现_第3张图片

比如,现在你在Google浏览器中输入"Learning to Rank",它就相当于一个qid.而下面列出的各个链接就是多个样本集合,其中每一个都有200多种影响因素(如其中一种PageRank).在学习过程中需要找到一个模型来预测新查询文档的得分,并排序计算出用户最想要的结果.
PS:这是我的个人理解,如果有错误或不足之处,欢迎提出!

二. 基于点的排序算法(Pointwise)介绍

机器学习解决排序学习问题可分为3类:
1.基于回归排序学习(regression-based algorithms):序列转为实数
2.基于分类排序学习(classification-based algorithms):二值分类
3.基于顺序回归排序学习(ordinal regression-based algorithms)
但是这里我想讲述的是最常见的分类,它们应该与上面是交叉的:
1.基于点的LTR算法——Pointwise Approach
2.基于对的LTR算法——Pairwise Approach
3.基于列的LTR算法——Listwise Approach

Pointwise处理对象是一篇文档,将文档转化为特征向量后,机器学习系统根据训练得出的模型对文档进行打分(注意:训练集学习出权重模型去给测试集文档打分是LTR中非常经典的用法),打分的顺序即为搜索排序的结果.
Score(x)=w1*F1+w2*F2+w3*F3+...+w136*F136
其中w1-w136为136维对应权重参数,由训练集训练得到;F1-F136为测试文档给出136个特征值.
原数据有5个类标(0-4代表相关程度：Perfect>Excellent>Good>Fair>Bad),则设置5个阈值来区分所得分数的分类.如果得分大于相关阈值,则划分为相应的类.常见算法包括：Prank、McRank
下面是我自己画的一张图,其中四根红线是四个阈值,它把这些文档集划分为了五个不同类.每当一个新的文档来测试,它都会根据已有模型计算出相应分数,再根据分数和阈值划分类即可.

【学习排序】 Learning to Rank中Pointwise关于PRank算法源码实现_第4张图片

三. PRank算法介绍

PRank算法是基于点的排序学习,顺序回归学习问题.其算法主要参考Kolby Crammer & Yoram Singer(From:The HeBrew University,以色列希伯来大学)论文《Pranking with Ranking》.网址如下：
http://papers.nips.cc/paper/2023-pranking-with-ranking.pdf
算法过程如下：

【学习排序】 Learning to Rank中Pointwise关于PRank算法源码实现_第5张图片

算法描述:(感觉算法一目了然,但是我功力不够描述不清楚)
对于46维数据而言,它存在3个类标(0-2).故上述算法中初始阈值b[0]=b[1]=b[2]=0,b[3]=正无穷.
注意它只有一层循环For(1...T)表示样本集的总行数,而没有进行迭代(CSDN三国那个例子含迭代错误);它主要是通过预测标号y~和实际标号y进行对比,来更新权重和阈值.
在H排序决策函数中,它通过K个阈值b把空间划分为K个连续的子空间,每个子空间对应一个序列号,即满足所有的样本x都有相同的排序结果.对每个样本,先计算权重w与xi的内积w·x,找出所有满足w·x-br中最小的br,并将此br对应的序标号xi作为排序模型对样本的预测排序结果.
推荐中文资料：南开大学论文《基于PRank算法的主动排序学习算法》

四. PRank算法Java\C++实现及总结

1.Java代码实现
代码中有详细注释,每个步骤都是按照上面的算法进行设计的.左图是主函数,它主要包括：读取文件并解析数据、写数据(该函数可注释掉,它是我用于验证读取是否正确时写的)、学习排序模型和打分预测.右图是预测排序结果的算法.

【学习排序】 Learning to Rank中Pointwise关于PRank算法源码实现_第6张图片

【学习排序】 Learning to Rank中Pointwise关于PRank算法源码实现_第7张图片

代码如下：

package com.example.pointwise;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.List;

/**
 * Pointwise基于点学习排序(Learning to Rank)的Prank算法
 * @author Eastmount YXZ
 * 参考资料
 * 该算法从136维数据集改成46维数据集,中间可能有注释不一致现象
 * （原始论文） http://papers.nips.cc/paper/2023-pranking-with-ranking.pdf
 * （新浪） http://blog.sina.com.cn/s/blog_4c98b960010008xn.html
 * （CSDN）http://blog.csdn.net/pennyliang/article/details/17333373
 */
public class Prank {
	
	public int RANK_NUM = 10000; //记录总样本数 (总行数)
	public int RANK_CATA = 46;   //排序的特征维数 (数据集136维 后改为46维)
	public int RANK_ITER = 1;    //排序的迭代次数 (原文迭代1次)
	public int RANK_LABEL= 3;    //排序划分的阈值 (微软数据集划分5类 0-4) 3维全相关,部分相关,不相关
	
	//采用该方法实现动态数组添加数据
	List weight = null;   //特征值的权重向量 (46个 136个)
	//训练集数据 每行共48个数据  (46个特征值 二维数组-feature[行号][46] + 真实Label值0-2 + qid值)
	List> x = null;       
	Float [] b = null;           //阈值数 K+1个(RANK_LABEL+1)
	public int sumLabel = 0;     //文件总行数 (标记数)
	
	/**  
	 * 函数功能 读取文件
	 * 参数 String filePath 文件路径
	 */
	public void ReadTxtFile(String filePath) throws IOException {
		String encoding="GBK";
		File file = new File(filePath);  //文件
		BufferedReader bufferedReader = null;
		try {
			//判断文件是否存在
			if(file.isFile() && file.exists()) { 
				//输入流
				InputStreamReader read = new InputStreamReader(new FileInputStream(file), encoding); 
			    bufferedReader = new BufferedReader(read);
				String lineTxt = null;
				sumLabel =0;  //记录总样本数
				x = new ArrayList> ();
				
				//按行读取数据并分解数据
				while((lineTxt = bufferedReader.readLine()) != null) {
					String str = null;
					int lengthLine = lineTxt.length();
					List subList=new ArrayList();
					x.add(subList);
					//获取数据 字符串空格分隔
                	String arrays[] = lineTxt.split(" ");
                	for(int i=2; i=48) { //#号后跳出 后面注释不进行读取
	    					continue;
	    				}
                		 //获取特征:特征值 如1:0.0004
                		String subArrays[] = arrays[i].split(":");
                		int number = Integer.parseInt(subArrays[0]); //判断特征 
	    				float value = Float.parseFloat(subArrays[1]); 
	    				subList.add(value);	
                	}
                	//获取每行样本的Label值 i=0 （五个等级0-4）
                	subList.add(Float.parseFloat(arrays[0]));
                	//获取qid值 i=1
                	String subArrays[] = arrays[1].split(":");
                	subList.add(Float.parseFloat(subArrays[1]));
                	//总行数+1
                	sumLabel++;  
				} //End 按行读取
				read.close();
			} else {
        		System.out.println("找不到指定的文件\n");
        	}
		} catch (Exception e) {
            System.out.println("读取文件内容出错");
            e.printStackTrace();
        } finally {
        	bufferedReader.close();
        }
	}
	
	/**
	 * 函数 写文件
	 * 参数 String filePath 文件路径
	 * 注意 该函数还是136维数据，但算法该成46维 故不使用该函数 
	 */
	public void WriteTxtFile(String filePath) {
		try {
			System.out.println("文件输出");
			String encoding = "GBK";
			FileWriter fileWriter = new FileWriter(filePath);
			//按行写文件
			for(int i=0; i();
		for(int i=0; i< RANK_CATA; i++){ //特征向量的维数
			weight.add((float) 0.0);
		}
		//初始化阈值 b[0]=b[1]=[2]=0 b[3]=正无穷大
		b=new Float[RANK_LABEL+1];
		for(int i=0; i

 
       运行结果如下图所示,算法流程分析都很清楚,同时我采用的是下标从0开始取.b[1]和[2]两个阈值即可划分为3个不同的类,b[3]=Infinity.但是预测结果总是一个值,不知道为什么?可能算法中有些细节错误,纠结了我很长时间.如果知道希望告知.下面是采用C++实现.

 
      2.C++代码实现
    该部分代码参考自新浪播客：
    http://blog.sina.com.cn/s/blog_4c98b960010008xn.html
     运行结果过程如下图所示,通过train.txt数据集得到model.txt,里面存储的是46个权重.如:
     -0.052744 1.886342 1.002179 -6.400005 -1.824795 0.000000 0.000000 ..
    然后通过该模型对test.txt进行打分预测,同时计算正确率(已标注Label=预测Label). 
  
 
   
    
   
  #include 
#include 
#include 
#include 

using namespace std;

#define K 3  //排序的序数,即如排成全相关,部分相关,不相关,序数就是3
#define N 46 //特征的维数

double *w;			//权值 
int *b;				//偏置项 
int *y;
int *t;

//从文件中获得特征值 X 存储特征向量 yt 存储标签
bool getData(double *x,int &yt,ifstream &fin)	 
{
    if (fin.eof())
        return false;

    char data[1024];
    int index = 1;
    fin.getline(data,1024);
    char *p = data;
    char q[100];
    q[0] = p[0];
    q[1] = '\0';
    yt = atoi(q) + 1;								// 标签 
    p = p+8;//跳过qid:xx的冒号
    for( ; *p != '\0'; ++p)
    {
        if(*p == ':')
        {
            ++p;
            int i = 0;
            for(i=0; *p != ' '; i++, p++)
            {
                q[i] = *p;
            }
            q[i] = '\0';      
            x[index ++] = atof(q);
        }
    }
    return true;
}

//各变量进行初始化
void Initialize()
{
    w = new double[N+1];
    b = new int[K+1];
    y = new int[K+1];
    t = new int[K+1];
    int i;
    int r;
    for(i=1; i<=N;i++)
        w[i] = 0 ;
    for(r=1;r<=K-1;r++)
        b[r] = 0;
    b[K] = std::numeric_limits::max();//无穷大
}

//利用Prank算法进行训练
void PrankTraining(double *x,int yt)
{
    int i;
    int r;
    double wx = 0;				//存储 W*X 的计算结果 
    for(i =1; i<=N; i++)		//计算 W*X 
        wx += w[i] * x[i];
    for(r =1; r<=K; r++)		//找到满足 W*X-b<0 的最小 r 
    {
        if(wx - b[r] <0 )
            break;
    }
    int yy = r ;				//预测值 
    if (yy == yt)				//预测正确，直接返回 
	{
		return;
	}				
    else						//预测错误，权值更新 
    {
        for(r=1; r
 
   
  五. 总结与问题 
       最后讲述在该算法中你可能遇到的问题和我的体会:
     1.由于它是读取文件,可能文件很大(几百兆或上G).最初我设计的数组是double feature[10000][136],用来存储每行特征值,但是如果行数太大时,What can do?此时我们应该设置动态数组>>x解决.
    2.最初阅读了CSDN的Prank代码,它迭代了1万次,最后查看原文发现它并没有迭代.所以你可以参考C++那部分代码,每次只需要读取一行数据处理,并记住上一次的46维权重和阈值即可.
     3.为什么我从136维数据转变成了46维数据?
     你打开136维特征值数据时,你会发现它的值特别大,不论是Pointwise,还是Pairwise和Listwise都可能出现越界,一次内积求和可能就10的7次方数据了.但是46维数据,每个特征值都是非常小的,所以如果用136维数据,你需要对数据进行归一化处理,即数据缩小至-1到1之间.
     4.评价Pointwise、Pairwise和Listwise指标通常是MAP和NDCG@k,后面讲述基于对的学习排序和基于列的学习排序会具体介绍.
     5.你可能会发现数据集中存在vail验证集,以及交叉验证、交叉熵、梯度下降后面都会讲述.但由于相对于算法,我对开发更感兴趣,很多东西也是一知半解的.
     6.最后要求该算法到Hadoop或Spark实现并行化处理,但算法的机制是串行化.有一定的方法,但我没有实现.我们做的是一种伪并行化处理,即模型得到权重后进行并行化计算分数排序.
     最后简单附上我们的实验结果,后面的算法实验结果是基于MAP和NDCG@k
 
   
    
   
   
   

 
    
       希望文章对大家有所帮助!主要是现在看到LTR很多都是理论介绍,论文也没有具体代码,而开源的RankLib有点看不懂,所以提出了自己的认识及代码执行.我也是才接触这个一个月,可能过程中存在错误或不足之处,欢迎提出建议~同时感谢一起奋斗的伙伴,尤其是Pu哥.
       （By:Eastmount 2015-01-28 夜5点半    http://blog.csdn.net/eastmount/）

pytorch与深度学习随记——AlexNet 黑色的山岗在沉睡深度学习随记深度学习 pytorch 人工智能
AlexNet和LeNet的设计理念非常相似，但也存在显著差异：基本结构对比网络深度：AlexNet比LeNet-5要深得多，AlexNet由八层组成：五个卷积层、两个全连接隐藏层和一个全连接输出层。激活函数：AlexNet使用ReLU而不是sigmoid作为其激活函数，这有助于缓解梯度消失问题并加速训练过程。AlexNet架构的创新点局部响应归一化(LRN)：AlexNet引入LRN层，可以创建
Prometheus+Grafana监控畅云客 Prometheus 监控服务器运维 linux 运维开发 grafana prometheus 云计算
目录资源列表一、基础环境关闭防火墙关闭selinux修改主机名节点添加主机名与IP对应关系二、部署Prometheus下载安装包解压创建用于运行Prometheus的组和用户创建Prometheus数据存储目录给Prometheus主目录赋用户Prometheus权限修改配置文件启动三、部署Grafana下载安装包创建grafana用户及数据存放目录修改配置文件启动四、node节点部署node_e
深度学习-138-LangGraph之应用实例(七)构建自动绘图系统皮皮冰燃深度学习深度学习人工智能 LangGraph
文章目录1初始化核心功能1.1大语言模型1.2结构化输出1.3搜索引擎1.4Python执行环境2编排流2.1创建图2.2可视化图2.3应用图3绘图指定线型4添加工具增强4.1执行工具和打印工具4.2绑定工具4.3编排流4.4可视化图4.5应用1初始化核心功能1.1大语言模型importosos.environ['OLLAMA_HOST']='127.0.0.1'os.environ['OLLAM
GD32F4xx SD卡读写及FATFS移植记录 madao1024 GD32F4xx MCU GD32F4xx SDIO FATFS
最近调试了一下GD32F450Z的SDIO接口，读写microSD卡并移植了FATFS调试过程记录如下，调试时使用的是16GBKingstonTF卡。说一下思路：分3步实现1、从资料中首先学习一下SDIO接口的相关内容；2、根据例程调通SDcard的读写驱动程序；3、最后移植FATFS文件系统，文件系统来操作SD卡。目录1、GD32F4xxSDIO接口2、GD32F4xxSDIO驱动3、FAT
穿越AI边界：深度集成DeepSeek API与云平台的实践之路云边有个稻草人热门文章人工智能 DeepSeek 大数据集成DeepSeek API DeepSeek算法阿里云百炼平台集成
云边有个稻草人-CSDN博客随着人工智能技术的日益发展，深度学习和自然语言处理（NLP）已经在很多领域得到了广泛的应用。DeepSeek作为一款领先的大型语言生成模型，凭借其强大的推理和生成能力，已经被越来越多的开发者和行业专家所青睐。通过DeepSeek提供的API接口，开发者可以在多个领域中实现先进的自然语言理解和生成任务。本文将深入探讨如何使用Python调用DeepSeek的API接口，并
从0开始的IMX6ULL学习篇——裸机篇之外设资源分析 charlie114514191 从0开始的学习ARMv7a IMX6ULL芯片学习 IMX6ULL 外设嵌入式硬件
这个就是现在可以买到之后开发板的模样。我们从最右上角那一处依次逆时针一个个分析。我们跳过显然的电源插孔，拨动开关和3V3与5V的外接板。第一个就是USBHOST接口。USBHost是USB通信协议中的一个重要概念，它指的是控制USB总线数据传输的主端设备。在USB通信中，只能有一个Host，它负责管理整个USB总线上的数据传输。与之相对的是USBDevice或USBSlave，即从设备，它们依赖于
U-Boot 之六详解 U-Boot 及 SPL 的链接脚本、启动流程 ZC·Shou U-Boot u-boot SPL 启动
基本环境我这里的基本开发环境与运行环境在之前的博文U-Boot之二零基础编译、详解Image镜像及DTB文件已经详细介绍过了，这里就不在赘述。如果在构建时遇到错误，可以参考上面的博文来解决。示例代码嵌入式Linux运行环境搭建系列博文涉及的所有源代码均放到了我个人的Gitee上：https://gitee.com/itexp/BOARD-STM32F769I-EVAL。这个仓库中包含了的所
Qt 多线程误区：QThread 任务未正确执行及收尾回调未触发的原因分析丰年稻香 QT qt
问题背景在开发Qt项目时，我们希望并行执行多个任务来提高效率，并在所有任务完成后进行收尾处理。为此，我们使用QThread来执行任务，并在QThread::finished事件触发时调用收尾函数。原始代码voidMyClass::runTaskInThread(void(MyClass::*task)(),void(MyClass::*onFinished)()){QThread*thread=n
Spark核心算子对比：`reduceByKey`与`groupByKey`源码级解析及生产调优指南数据大包哥大数据 spark 分布式
Spark核心算子对比：reduceByKey与groupByKey源码级解析及生产调优指南1.核心机制对比在Spark中，reduceByKey和groupByKey都是对键值对RDD（RDD[(K,V)]）进行聚合操作的高阶算子，但两者的底层实现和性能表现截然不同。特性reduceByKeygroupByKeyShuffle前预聚合✅启用（mapSideCombine=true）❌禁用（map
腾讯SQL面试题解析：如何找出连续5天涨幅超过5%的股票数据大包哥 #大厂SQL面试指南 sql 大数据数据库
腾讯SQL面试题解析：如何找出连续5天涨幅超过5%的股票作者：某七年数据开发工程师|2025年02月23日关键词：SQL窗口函数、连续问题、股票分析、腾讯面试题一、问题背景与难点拆解在股票量化分析场景中，"连续N天满足条件"是高频面试题类型。本题要求在单表stock_data中，筛选出连续5天以上（含）每日涨幅≥5%的股票，并输出连续天数及起止日期。其核心难点在于：涨幅计算：需通过时间窗口函数获取
AI在农业中的应用:精准农业的新时代 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI,农业,精准农业,机器学习,深度学习,计算机视觉,农业机器人1.背景介绍农业是人类文明的基石，也是全球经济的重要支柱。然而，随着人口增长和资源短缺，传统农业面临着诸多挑战，例如低效率、资源浪费、环境污染和气候变化的影响。为了应对这些挑战，精准农业应运而生。精准农业是指利用现代信息技术和数据分析手段，对农业生产进行精细化管理，提高资源利用效率、产量和产品质量，同时减少环境污染。人工智能（AI）作
AI驱动的企业学习管理系统 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
AI、机器学习、深度学习、企业学习管理系统、个性化学习、学习路径推荐、知识图谱1.背景介绍在当今瞬息万变的数字化时代，企业面临着前所未有的挑战和机遇。知识更新速度加快，技术迭代日新月异，员工需要不断学习新技能，提升自身竞争力，才能适应不断变化的市场环境。传统的企业学习管理系统(LearningManagementSystem,LMS)往往以标准化课程和批量学习为主，难以满足员工个性化学习需求，且缺
使用 PM2 部署和管理 Node.js 应用 JJCTO袁龙 Node.js node.js
使用PM2部署和管理Node.js应用在现代Web开发中，Node.js已经成为了后端开发的主流选择之一。无论是构建RESTfulAPI，还是实时通讯应用，Node.js都能以优异的性能和丰富的生态体系满足我们的需求。然而，当应用越来越复杂，如何高效地部署和管理Node.js应用就显得尤为重要。在这篇博文中，我们将探讨如何使用PM2来部署和管理Node.js应用，同时提供一些示例代码以便更好地理解
量子计算如何提升机器学习效率：从理论到实践 Echo_Wish 人工智能前沿技术量子计算机器学习人工智能
量子计算如何提升机器学习效率：从理论到实践在人工智能和机器学习的高速发展中，传统计算方法已经逐渐面临性能瓶颈。随着数据量的激增、算法复杂度的提高，传统计算机在处理某些特定任务时的效率显得捉襟见肘。而量子计算，作为一项颠覆性的技术，正逐步展现出在机器学习领域中的巨大潜力。量子计算不仅能够加速特定任务的执行，还能为一些经典算法提供更高效的解决方案。今天，我们将深入探讨量子计算如何提升机器学习效率，解析
PHP Captcha实现图片验证码生成及识别（附源码） mayday1102 PHP php captcha
目录什么是Captchacomposer安装思路修改Captcha.php源码调用什么是CaptchaCAPTCHA（CompletelyAutomatedPublicTuringTesttoTellComputersandHumansApart）是区分计算机和人类的一种程序算法。composer安装composerrequirephp-quickorm/captcha思路由于原扩展基于sessi
Windows用pm2部署node.js项目秦时明月之君临天下 Node.js Next.js windows node.js
Windows上pm2启动命令不生效按照常规启动命令应该如下，但是发现不生效pm2startnpm--name"project-name"--start具体如下，可以看到状态都是stopped$pm2startnpm--name"chatgpt-next-web"--start[PM2]StartingF:\PROGRAMFILES\NODEJS\NPM.CMDinfork_mode(1insta
表单排版_流程引擎——OA流程表单的认识及优化 SchwatzWagen 表单排版
编辑导语：在工作中经常会遇到流程表单的运用，OA工作流的表单设计器是最常用控件的用法；本文作者分享了工作流引擎流程表单的相关内容，以及对OA流程表单的一些细节优化，我们一起来看一下。现在企业内部产品大多会涉及工作流，不论CRM、OA、WMS、ERP等，都有流程引擎应用的场景。我在工作中一直接触OA，流程表单运用很多，但在之前的使用过程中发现还有些细节可以优化；所以根据应用经验及使用的需求整理了如下
从零到精通：小白DeepSeek全栈入门指南好东西不迷路各自资源 AI 前端 html python
第一部分：认知准备（1-3天）1.1基础概念搭建人工智能三要素：数据/算法/算力深度学习与传统机器学习的区别神经网络基本结构（输入层/隐藏层/输出层）常用术语解析：epoch、batch、loss、accuracy1.2环境配置实战Python环境搭建（推荐Anaconda）condacreate-ndeepseekpython=3.8condaactivatedeepseek深度学习框架选择指南
paddlepaddle(飞浆）报错name ‘libpaddle‘ is not defined及paddle.fluid.core_noavx 管春数据分析 paddlepaddle paddle 人工智能
最近有一个OCR中文识别的需求，用到paddleocr，但服务器死活装不上paddlepaddle（python3.10.4,win8环境)先装了2.6.0的paddele,报name‘libpaddle’isnotdefined，然后降版本（2.4的某个版本，忘了），paddle.fluid.core_noavximport失败，发现服务器没有avx，这个版本不支持noavx的，去paddlep
通俗易懂的一致性哈希原理 eternity_zzy java java
一致性哈希（Consistenthashing）算法是由MIT的Karger等人与1997年在一篇学术论文（《Consistenthashingandrandomtrees:distributedcachingprotocolsforrelievinghotspotsontheWorldWideWeb》）中提出来的，用于解决分布式缓存数据分布问题。在传统的哈希算法下，每条缓存数据落在那个节点是通过
Python小实验——归结反演我没得冰阔落. 人工智能 python 人工智能
实验目的打印所有互补文字;头现命题逻辑简单归结;实验内容及结果#归结反演过程，传入外面最大的数组里面的两个小数组，也就是两个子句，消掉对应的谓词公式defresult(m=[],n=[]):after=0whilelen(m)!=after:after=len(m)foriinm:forjinn:if(
解析Linux中的系统安全及应用（二）石头城云计算笔记 Linux su命令切换用户 sudo机制提升权限 PAM安全认证网络端口扫描弱口令检测
各位小伙伴大家好，本次和大家分享的是Linux系统中的系统安全及应用的相关理论知识及操作。我将通过以下几点和相关的实验进行分析说明：（接上篇）五.使用su命令切换用户：1、用途及方法用途：SubstituteUser，切换用户格式：su-目标用户（bash环境）2、密码验证root→任意用户，不验证密码普通用户→其他用户，验证目标用户的密码[jerry@localhost~]$su-root（带-
Node.js学习01-初识Node.js与内置模块 Meowmow nodejs node.js 学习 javascript
目录初识Node.js在Node.js环境执行js代码内置模块fs文件系统模块路径动态拼接问题path路径模块http模块request请求对象初识Node.jsNode.js是基于ChromeV8引擎的JavaScript运行环境，无法调用DOM和BOM等浏览器内置API。使用Node.js可以：基于Express框架快速搭建web应用基于Electron框架构建跨平台的桌面应用基于restif
Python vLLM 实战应用指南 ghostwritten python python 开发语言
文章目录1.vLLM简介2.安装vLLM3.快速开始3.1加载模型并生成文本3.2参数说明4.实战应用场景4.1构建聊天机器人示例对话：4.2文本补全输出示例：4.3自定义模型服务启动服务调用服务5.性能优化5.1GPU加速5.2动态批处理6.总结vLLM是一种高性能的开源深度学习推理引擎，专注于高效的生成式模型推理任务。它通过动态批处理和内存优化技术大幅提高了大模型（如GPT系列）的推理性能，非
python学习笔记——三元操作符面向对象的邓老凉茶 python
三元操作符三元操作符的基本格式为：result=xifx<yelsey其中，x<y为判断语句。若x<y为真则result=x，否则result=y。
从零到一：利用DeepSeek构建高精度图像分类模型实战解析一碗黄焖鸡三碗米饭人工智能前沿与实践分类数据挖掘人工智能
引言：为什么选择DeepSeek进行图像分类？在计算机视觉领域，图像分类作为基础任务，其技术演进经历了从传统特征工程到深度学习的革命性转变。DeepSeek作为国产自研的深度学习框架，凭借其高效计算优化和灵活架构设计，在ImageNet等基准测试中展现出与PyTorch、TensorFlow等主流框架相媲美的性能。本文将手把手带您实现从零搭建工业级图像分类模型的全过程。一、DeepSeek技术架构
python中httpx库的详细使用及案例数据知道 2025年爬虫和逆向教程 python httpx 开发语言爬虫
文章目录1.安装httpx2.同步请求3.异步请求4.高级功能5.错误处理6.配置客户端7.结合BeautifulSoup使用8.示例：抓取并解析网页9.注意事项httpx是一个现代化的PythonHTTP客户端库，支持同步和异步请求，功能强大且易于使用。它比requests更高效，支持HTTP/2和异步操作。以下是httpx的详细使用方法：1.安装httpx首先，确保已经安装了httpx。可以通
Python学习(八):返回值&变量的作用域&参数的传递&浅拷贝和深拷贝&类对象和方法追梦梓辰 Python python 开发语言
Python学习分享:今日学习:返回值&变量的作用域&参数的传递&浅拷贝和深拷贝&类对象和方法返回值return返回值要点:1.如果函数体中包含return语句，则结束函数执行并返回值2.如果函数体中不包含return语句，则返回none值3.要返回多个返回值，使用列表，元组，字典，集合将多个值“存起来”即可。#定义一个返回两个数平均值的函数:defmy_avg(a,b):return(a+b)/
深度学习模型可视化：通俗易懂的全面解读 Crazy learner 模型部署深度学习人工智能
目录1.什么是深度学习模型可视化？2.张量（Tensors）：深度学习中的核心数据结构3.常见的节点操作**Gather**操作**Transpose**操作**Pow**操作**Add**操作**Mix**操作4.查看模型详情5.可视化工具总结在深度学习领域，理解模型内部的工作原理对于优化、调试和改进模型至关重要。随着神经网络的复杂性日益增加，开发者和研究人员逐渐意识到，可视化不仅是理解模型的一
查看Python库依赖关系的解决方案爱编程的喵喵 Python基础课程 python 依赖关系
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了查看Python库依赖关系的解决方案
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

【学习排序】 Learning to Rank中Pointwise关于PRank算法源码实现

一. 学习排序(Learning to Rank)概念

二. 基于点的排序算法(Pointwise)介绍

三. PRank算法介绍

四. PRank算法Java\C++实现及总结

五. 总结与问题

你可能感兴趣的:(机器学习,学习排序,知识图谱,web数据挖掘及NLP)