小明同学YYDS

Flink：调用JPMML机器学习模型

有个需求就是要使用数据分析团队实现好的模型，而且是python的，要求在Flink平台上跑起来提供实时调用模型处理数据

文章目录

背景

JPMML介绍

环境准备

安装

使用

步骤

示例：决策树分类Iris数据集

训练模型并获得PMML文件

JAVA工程调用PMML模型

总结

背景

在Flink平台上通过调用现有python实现的模型，进行实时预测处理

Flink V1.11
Java 1.8
Python3
jpmml

JPMML介绍

预言模型标记语言(Predictive Model Markup Language，PMML)
是一种利用XML描述和存储数据挖掘模型的标准语言，它依托XML本身特有的数据分层思想和应用模式，实现了数据挖掘中模型的可移植性。
其中的 J 就是java 调用处理
GITHUB：https://github.com/jpmml/jpmml-evaluator

环境准备

安装

sklearn2pmml 0.14.0 or newer.

pip install sklearn2pmml -i https://pypi.tuna.tsinghua.edu.cn/simple/

使用

这里基于sklearn做测试，其他框架的pmml包请查阅作者github示例。

作者示例：https://github.com/jpmml/sklearn2pmml

步骤

A typical workflow can be summarized as follows:

1.Create a PMMLPipeline object, and populate it with pipeline steps as usual. Class sklearn2pmml.pipeline.PMMLPipeline extends class sklearn.pipeline.Pipeline with the following functionality:

If the PMMLPipeline.fit(X, y) method is invoked with pandas.DataFrame or pandas.Series object as an X argument, then its column names are used as feature names. Otherwise, feature names default to “x1”, “x2”, …, “x{number_of_features}”.

If the PMMLPipeline.fit(X, y) method is invoked with pandas.Series object as an y argument, then its name is used as the target name (for supervised models). Otherwise, the target name defaults to “y”.

2.Fit and validate the pipeline as usual.

3.Optionally, compute and embed verification data into the PMMLPipeline object by invoking PMMLPipeline.verify(X) method with a small but representative subset of training data.

4.Convert the PMMLPipeline object to a PMML file in local filesystem by invoking utility method sklearn2pmml.sklearn2pmml(pipeline, pmml_destination_path).

以上是作者写的原文流程，我就不翻译了，直接上重点：
1.创建一个PMMLPipeline对象，并设置它的pipeline。
2.训练并校验
3.[可选操作]用一小部分具有代表性的训练数据给到PMMLPipeline对象。预热模型。
4.把PMMLPipeline对象转换成PMML文件

示例：决策树分类Iris数据集

github上作者有两个示例，一个决策树分类iris数据集，一个逻辑回归分类iris数据集，我这只演示决策树的示例

训练模型并获得PMML文件

import pandas
from sklearn.datasets import load_iris

# github上作者的代码示例，我这直接用sklearn里的，不读文件
# iris_df = pandas.read_csv("Iris.csv")
# iris_X = iris_df[iris_df.columns.difference(["Species"])]
# iris_y = iris_df["Species"]

# 加载鸢尾花数据集（sklearn中的数据集）
iris = load_iris()
# 通过feature_names构造dataFrame
iris_df = pandas.DataFrame(iris.data, columns=iris.feature_names)
# 把iris的结果放到dataFrame的label属性中
iris_df['label'] = iris.target
# 声明dataFrame的新列项
iris_df.columns = ['sepal length', 'sepal width', 'petal length', 'petal width', 'label']
# 划分数据集
iris_X =iris_df[iris_df.columns.difference(["label"])]
iris_y = iris_df["label"]

from sklearn.tree import DecisionTreeClassifier
from sklearn2pmml.pipeline import PMMLPipeline

# 这里分类模型就写classifier，作者定义好了不同模型的pipeline标识，
# 工作流内需要设置二元组，(名称,模型对象),名称也不是乱指定的，每个名称都是对应特定功能的transformer的
# 像"selector"对应特征选择，“mapper”对应特征预处理，”pca“对应pca，”classifier“对应分类器，”regressor“对应回归器
# 具体去看github上说明吧
pipeline = PMMLPipeline([
	("classifier", DecisionTreeClassifier())
])
# 训练
pipeline.fit(iris_X, iris_y)

from sklearn2pmml import sklearn2pmml

# 把模型转成pmml文件
sklearn2pmml(pipeline, "D:\DecisionTreeIris.pmml", with_repr = True)

注意，执行时出现如下warn，无需理会

D:\ITinstall\anaconda3\lib\subprocess.py:848: RuntimeWarning: line buffering (buffering=1) isn't supported in binary mode, the default buffer size will be used
  self.stdout = io.open(c2pread, 'rb', bufsize)
D:\ITinstall\anaconda3\lib\subprocess.py:853: RuntimeWarning: line buffering (buffering=1) isn't supported in binary mode, the default buffer size will be used
  self.stderr = io.open(errread, 'rb', bufsize)

如下是针对PMMLPipeline构造的更多一些说明

能设置的名称其实不少，但是关于怎么设置这些二元组，作者都是在github上使用示例代码给出的，挺多使用方法分散在项目的不同角落（主要是README），找起来还挺费劲（估计都是用到了才会仔细一点一点搜，要不就在issue直接问作者了），而且也没统一的文档什么的。（可能作者觉得自己写的那些使用说明很详细，大家都能在各种链接之间跳来跳去找到问题的答案）

要对指定特征就行预处理需要用到mapper
mapper = mapper = DataFrameMapper([
  (X.columns.to_list(), [ContinuousDomain(with_data = False),StandardScaler()]),
])
classifier = RandomForestClassifier(**params)
pipeline = PMMLPipeline([
    ("mapper",mapper),
    ("selector", SelectorProxy(VarianceThreshold())),
    ("classifier", classifier),
])
DataFrameMapper中传入二元组列表，前面是指定的列名，可以是多个，后面是处理方式。上面演示的是标准缩放，也可以进行行独热编码。

ContinuousDomain是这个库特色的特征装饰器，这个是对连续型特征进行装饰

装饰器主要作用就是能进行一些错误值、空值和离群点的处理。
还有其他像是”顺序特征“，”分类特征“，”时间特征“的装饰器，具体可以看官方说明
比较坑的一点是，连续型特征的装饰器会学习训练数据，分析离群点，然后在预测的时候会强制将离群点判定为非法值，从而导致预测的时候可能会发生拒绝接受特征的报错。这里再里设置with_data = False可以避免这个问题。
with_data是设置是否要再训练时对数据进行分析（分析离群点）
作者这样设计好像是因为，他认为模型不应该预测不在接受范围内的值，所以强迫你对离群点啊什么的进行处理。

使用selector需要使用SelectorProxy对feature_selection下的对象进行包裹。

JAVA工程调用PMML模型

maven引入包（我这是完整的Flink工程，故有比较完整的Flink依赖，注意适当取用）


<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0modelVersion>

    <groupId>org.examplegroupId>
    <artifactId>Flink_secondartifactId>
    <version>1.0-SNAPSHOTversion>

    <properties>
        <project.build.sourceEncoding>UTF-8project.build.sourceEncoding>
        <maven.compiler.source>1.8maven.compiler.source>
        <maven.compiler.target>1.8maven.compiler.target>
        <pmml.version>1.5.15pmml.version>
    properties>

    <dependencies>
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-javaartifactId>
            <version>1.11.1version>
        dependency>
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-streaming-java_2.12artifactId>
            <version>1.11.1version>
        dependency>
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-connector-kafka-0.11_2.12artifactId>
            <version>1.11.1version>
        dependency>
        <dependency>
            <groupId>org.apache.bahirgroupId>
            <artifactId>flink-connector-redis_2.11artifactId>
            <version>1.0version>
        dependency>
        <dependency>
            <groupId>mysqlgroupId>
            <artifactId>mysql-connector-javaartifactId>
            <version>5.1.44version>
        dependency>

        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-connector-elasticsearch6_2.12artifactId>
            <version>1.11.1version>
        dependency>
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-statebackend-rocksdb_2.12artifactId>
            <version>1.11.1version>
        dependency>
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-table-planner_2.12artifactId>
            <version>1.11.1version>
        dependency>
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-table-planner-blink_2.12artifactId>
            <version>1.11.1version>
        dependency>
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-csvartifactId>
            <version>1.11.1version>
        dependency>
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-clients_2.12artifactId>
            <version>1.11.0version>
        dependency>
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-cep_2.11artifactId>
            <version>1.11.1version>
        dependency>


        
        <dependency>
            <groupId>org.jpmmlgroupId>
            <artifactId>pmml-evaluatorartifactId>
            <version>${pmml.version}version>
        dependency>
        <dependency>
            <groupId>org.jpmmlgroupId>
            <artifactId>pmml-evaluator-extensionartifactId>
            <version>${pmml.version}version>
        dependency>
        
        <dependency>
            <groupId>com.alibabagroupId>
            <artifactId>fastjsonartifactId>
            <version>1.2.78version>
        dependency>



    dependencies>

    <build>
        <plugins>
            <plugin>
                <groupId>org.apache.maven.pluginsgroupId>
                <artifactId>maven-compiler-pluginartifactId>
                <version>3.1version>
                <configuration>
                    <source>1.8source>
                    <target>1.8target>
                configuration>
            plugin>
            <plugin>
                <artifactId>maven-assembly-pluginartifactId>
                <configuration>
                    <descriptorRefs>
                        <descriptorRef>jar-with-dependenciesdescriptorRef>
                    descriptorRefs>
                configuration>
            plugin>

        plugins>
    build>

project>

将获得的模型DecisionTreeIris.pmml文件放到java工程的resources目录下

载入模型工具类PMMLUtils

package com.mym.jpmml.util;

import org.jpmml.evaluator.Evaluator;
import org.jpmml.evaluator.InputField;
import org.jpmml.evaluator.LoadingModelEvaluatorBuilder;
import org.xml.sax.SAXException;

import javax.xml.bind.JAXBException;
import java.io.IOException;
import java.util.List;


public class PMMLUtils {
    public static void main(String[] args) throws IOException, JAXBException, SAXException {
        Evaluator evaluator = loadEvaluator("/DecisionTreeIris.pmml");
        // Printing input (x1, x2, .., xn) fields
        List<? extends InputField> inputFields = evaluator.getInputFields();
        System.out.println(inputFields);
    }

    /**
     * 载入PMML模型的方法
     *
     * @param pmmlFileName
     * @return
     * @throws JAXBException
     * @throws SAXException
     * @throws IOException
     */
    public static Evaluator loadEvaluator(String pmmlFileName) throws JAXBException, SAXException, IOException {
        Evaluator evaluator = new LoadingModelEvaluatorBuilder()
                .load(PMMLUtils.class.getResourceAsStream(pmmlFileName))
                .build();
        //自校验&预热模型
        evaluator.verify();
        System.out.println("评估器自校验&预热完成");
        return evaluator;
    }
}

构建评估器：决策树Iris评估器

package com.mym.jpmml.predictor;

import com.mym.jpmml.util.PMMLUtils;
import org.dmg.pmml.FieldName;
import org.jpmml.evaluator.Evaluator;
import org.jpmml.evaluator.EvaluatorUtil;
import org.jpmml.evaluator.FieldValue;
import org.jpmml.evaluator.InputField;

import java.io.Serializable;
import java.util.LinkedHashMap;
import java.util.Map;

public class DecisionTreeLrisPredictor implements Serializable {

    /* 结果标签名对应的key， 不同模型可能label标签名称不一致，故这里开放给调用处设置 */
    public String RESULT_LABEL_NAME = "labelName";

    private Evaluator evaluator;

    public DecisionTreeLrisPredictor() throws Exception {
        evaluator = PMMLUtils.loadEvaluator("/DecisionTreeIris.pmml");
    }

    public Object predict(Map<String, ?> inputRecord) {
        if (inputRecord == null) {
            throw new NullPointerException("特征为空！");
        }
        // 封装参数：特征转成模型可识别的参数
        Map<FieldName, FieldValue> arguments = new LinkedHashMap<>();
        for (InputField inputField : evaluator.getInputFields()) {
            FieldName inputName = inputField.getName();
            Object rawValue = inputRecord.get(inputName.getValue());
            FieldValue inputValue = inputField.prepare(rawValue);
            arguments.put(inputName, inputValue);
        }
        // 评估-预测
        Map<FieldName, ?> results = evaluator.evaluate(arguments);
        // 结果解析
        Map<String, ?> resultRecord = EvaluatorUtil.decodeAll(results);
        // 获取标签：获取分类结果
        return resultRecord.get(inputRecord.get(RESULT_LABEL_NAME));
    }
}

[可选]定义一个Flink处理的特征数据对象

package com.mym.jpmml.bean;


import java.io.Serializable;

public class IrisModel implements Serializable {
    //petal length、petal width、sepal length、sepal width
    private double petalLength;
    private double petalWidth;
    private double sepalLength;
    private double sepalWidth;

    public IrisModel(double petalLength, double petalWidth, double sepalLength, double sepalWidth) {
        this.petalLength = petalLength;
        this.petalWidth = petalWidth;
        this.sepalLength = sepalLength;
        this.sepalWidth = sepalWidth;
    }

    public IrisModel() {
    }

    public double getPetalLength() {
        return petalLength;
    }

    public void setPetalLength(double petalLength) {
        this.petalLength = petalLength;
    }

    public double getPetalWidth() {
        return petalWidth;
    }

    public void setPetalWidth(double petalWidth) {
        this.petalWidth = petalWidth;
    }

    public double getSepalLength() {
        return sepalLength;
    }

    public void setSepalLength(double sepalLength) {
        this.sepalLength = sepalLength;
    }

    public double getSepalWidth() {
        return sepalWidth;
    }

    public void setSepalWidth(double sepalWidth) {
        this.sepalWidth = sepalWidth;
    }

    @Override
    public String toString() {
        return "IrisModel{" +
                "petalLength=" + petalLength +
                ", petalWidth=" + petalWidth +
                ", sepalLength=" + sepalLength +
                ", sepalWidth=" + sepalWidth +
                '}';
    }
}

调用模型：Flink算子进行调用模型

package com.mym.jpmml.flinkpredictor;import com.mym.jpmml.bean.IrisModel;import com.mym.jpmml.predictor.DecisionTreeLrisPredictor;import org.apache.flink.api.common.functions.FlatMapFunction;import org.apache.flink.streaming.api.datastream.DataStream;import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;import org.apache.flink.util.Collector;import java.util.HashMap;import java.util.Map;public class IrirsJPMMLFlinkInvokeTest {    public static void main(String[] args) throws Exception {        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();        env.setParallelism(1);        DataStream<String> inputStream = env.socketTextStream("localhost", 7777);        DataStream<IrisModel> dataStream = inputStream.map(line -> {            String[] fields = line.split(",");            return new IrisModel(new Double(fields[0]), new Double(fields[1]), new Double(fields[2]), new Double(fields[3]));        });        SingleOutputStreamOperator<Object> result = dataStream.flatMap(new PredictorFlatMapFunction());        result.print("result");        env.execute();    }    static class PredictorFlatMapFunction implements FlatMapFunction<IrisModel, Object>{        private DecisionTreeLrisPredictor predictor;        public PredictorFlatMapFunction() throws Exception {            this.predictor = new DecisionTreeLrisPredictor();        }        @Override        public void flatMap(IrisModel irisModel, Collector<Object> collector) throws Exception {            Map<String, Object> inputRecord = new HashMap<>();            // petal length、petal width、sepal length、sepal width            // 1.4,0.2,5.1,3.5            inputRecord.put("petal length", irisModel.getPetalLength());            inputRecord.put("petal width", irisModel.getPetalWidth());            inputRecord.put("sepal length", irisModel.getSepalLength());            inputRecord.put("sepal width", irisModel.getSepalWidth());            inputRecord.put(predictor.RESULT_LABEL_NAME, "label");            Object predict = predictor.predict(inputRecord);            collector.collect(predict);        }    }}

我这里使用netcat网络socket方式测试，可以改成使用其他任何方式测试，测试数据如下（测试数据可以自行查看sklearn的iris数据集）

测试

测试数据和对应标签结果：label表示分类结果，实际0，1代表鸢尾花的啥，自行去研究下iris数据集的分类吧
```
sepal length | sepal width | petal length | petal width | label1.4,0.2,5.1,3.5 01.4,0.2,4.9,3.0 01.3,0.2,4.7,3.2 01.5,0.2,4.6,3.1 01.4,0.2,5.0,3.6 04.2,1.2,5.7,3.0 14.2,1.3,5.7,2.9 14.3,1.3,6.2,2.9 13.0,1.1,5.1,2.5 14.1,1.3,5.7,2.8 1
```
测试输入
```
C:\Users\mym>nc -l -p 77771.4,0.2,5.1,3.55.7,2.8,4.1,1.34.1,1.3,5.7,2.85.7,2.8,4.1,1.34.1,1.3,5.7,2.81.4,0.2,5.1,3.5
```
flink预测输出
```
result> 0result> 2result> 1result> 2result> 1result> 0
```
总结
- 预测模型是一次预测一条数据，很适合flink的流计算
- 生成的.pmml模型很大，如果在调用处打jar后还是很大时要考虑压缩。
- jpmml支持大部分机器学习框架比如sklearn、sparkml、python、R、lightgbm、xgboost、tensorflow等等

python 复制word表格并粘贴_Python应用之可控顺序复制粘贴 weixin_40005887 python 复制word表格并粘贴
1、应用场景：有大量源数据（保存在Excel表格中）需要逐个进行筛查（在第三方平台接口进行查询）。2、场景举例：由于学生无法上网，老师需要帮助上百名同学在第三方平台查询考试成绩。平台无法批量导入查询，只能逐个输入查询。3、常规操作步骤：从excel表格复制一个源数据，然后粘贴到第三方平台输入口，然后点击查询，获取查询结果。4、常规操作的问题：频繁切换窗口从excel中单元格中复制数据比较繁琐，此动
python word表格操作_Python|处理word的基本操作苗舰舰 python word表格操作
问题描述众所周知python有很多第三方库，这也是python简单实用的原因。要想用python处理word文档就需要安装python-docx库。解决方案1安装python-docx库首先找到python根目录(就是有python.exe的文件夹)打开Scripts文件夹Shift+鼠标右键选择在此处打开powershell窗口或者cmd窗口输入pipinstallpython-docx按下回车
Hadoop WordCount 程序实现与执行指南
HadoopWordCount程序实现与执行指南下面是使用Python实现的HadoopWordCount程序，包含完整的Mapper和Reducer部分。这个程序可以在PyCharm中本地测试，也可以部署到远程Hadoop集群上运行。mapper.pyimportsys#从标准输入读取数据forlineinsys.stdin:#移除行首行尾的空白字符line=line.strip()#将行分割为
Python|读取word文档表格内容算法与编程之美算法之美编程语言人工智能 python 数据挖掘数据可视化
本文首发于微信公众号："算法与编程之美"，欢迎关注，及时了解更多此系列文章。引言在日常生活里，不管是办公、学习还是制作邀请函、请柬、简历等等，我们都会使用一个软件MicrosoftOfficeWord，OfficeWord是微软公司的一个收费文字处理应用程序，是最流行的文字处理程序之一，它虽功能强大，但简学易懂，但同时也有一个缺点，当一个Word文档储存的内容特别庞大的时候，使用者想要提取自己想要
【机器学习&深度学习】模型微调的基本概念与流程一叶千舟深度学习【理论】机器学习深度学习人工智能
目录前言一、什么是模型微调（Fine-tuning）？二、预训练vs微调：什么关系？三、微调的基本流程（以BERT为例）1️⃣准备数据2️⃣加载预训练模型和分词器3️⃣数据编码与加载4️⃣定义优化器5️⃣开始训练6️⃣评估与保存模型四、是否要冻结BERT层？五、完整训练示例代码5.1环境依赖5.2执行代码总结：微调的优势前言在自然语言处理（NLP）快速发展的今天，预训练模型如BERT成为了众多任务
Python解释器路径查找
1.Pythoninterpreter获取Python解释器的完整路径。importsysprint(sys.executable)2.安装了多个Python，查看每个的位置win+Rcmd打开控制台输入：wherepython
HOW - 图像加载自动优化方案 @PHARAOH java spring 前端
文章目录前言next/image自动优化的实现原理1.图像请求通过ImageOptimizationAPI拦截2.根据设备屏幕密度自动调整图像尺寸3.自动格式转换（WebP/AVIF）4.CDN缓存与重用（在Vercel上）5.LazyLoading&优化加载顺序总结：自动优化是如何做到的生成的HTMLsrc设置:w=750&q=75的含义为什么要调整尺寸w？1.响应式设计需求2.节省带宽，避免加
WHAT - npm 不同版本变化和 pnpm 依赖管理方案 @PHARAOH 前端Node.js学习专栏开源学习专栏 npm 前端 node.js
目录一、介绍二、npm不同版本2.1从v1到v22.2从v2到v32.3从v3到v42.4从v4到v5二、扁平化依赖管理基本原理及其存在的问题三、npmls：依赖关系树四、pnpm：performantnodepackagemanager4.1介绍4.2依赖管理机制一、介绍在WHAT-npm和npx中我们介绍过npm，可以跳转阅读。简而言之，npm（NodePackageManager）是用于管理
前沿技术推动机器人的智能化升级 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据机器人 ai
前沿技术推动机器人的智能化升级关键词：机器人智能化、人工智能、机器学习、计算机视觉、自主导航、人机交互、边缘计算摘要：本文深入探讨了前沿技术如何推动机器人从传统自动化向智能化升级的演进过程。文章首先分析了机器人技术发展的历史脉络和当前挑战，然后详细阐述了人工智能、机器学习、计算机视觉等关键技术如何赋能机器人智能化。通过算法原理分析、数学模型构建和实际项目案例，展示了智能机器人的核心技术实现路径。最
Html Webpack Plugin: ReferenceError: process is not defined 真·skysys 大前端和跨平台技术 electron-vue ejs electron vue
修改ejs文件将改成：
Spring Boot 实现不同用户不同访问权限周凡123 spring boot java
前提近期在使用SpringBoot，用户角色被分为管理者和普通用户；角色不同，权限也就存在不同。在SpringBoot里实现不同用户拥有不同访问权限，可借助SpringSecurity框架达成。实现1.添加必要依赖首先要在pom.xml里添加SpringSecurity和JPA的依赖。org.springframework.bootspring-boot-starter-securityorg.s
提升首屏加载的秘密武器：一文讲透 CDN 加速核心逻辑网罗开发实战源码前端 json javascript
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
PHP基础语法讲解程序员小羊！杂文 php
大家好，我是程序员小羊！前言：PHP（HypertextPreprocessor）是一种常用于网页开发的服务器端脚本语言，易于学习并且与HTML紧密结合。以下是PHP的基础语法详细讲解。1.PHP基础结构1.1PHP脚本结构PHP代码通常嵌入到HTML文件中，并且用特殊的标记或短标记包围：是结束标记。PHP代码可以放在HTML代码中间，服务器解析时只执行PHP代码，输出结果会生成标准HTML页面。
python3常用模块 ZZH1120KQ python 开发语言
1数学运算模块math“math”模块提供了许多常用的数学函数，例如三角函数、四舍五入、指数、对数、平方根、总和等importmath1.1常数math.pi返回圆周率的数学常数。math.e返回指数的数学常数示例：print(math.pi)print(math.e)1.2fabs(x)取绝对值示例：print(math.fabs(5))print(math.fabs(-5))1.3ceil(x
Django REST framework - 设置 djangopython
settings.py命名空间是个绝妙的主意，让我们多用用吧！——《Python之禅》DjangoREST框架的配置都放在一个命名空间内，即Django的一个设置，名为REST_FRAMEWORK。例如，项目的settings.py文件可能包含类似以下内容：REST_FRAMEWORK={'DEFAULT_RENDERER_CLASSES':['rest_framework.renderers.J
生信分析用python还是r_生信分析利器：JupyterLab weixin_39612726 生信分析用python还是r
生信分析对计算机的开发环境有诸多要求，随之而来的自然就是很多麻烦。不说别的，要兼顾Python和R的问题就有够头疼。一边想着用Python搭流程处理文本和分析结果，另一边还想着用R来做统计分析和画图，而且大多数时候生信分析还得在服务器上完成。Python你用Pycharm，R用Rstudio，一会这儿一会那儿的切来切去，还得设置服务器连接(Pycharm如果不是付费版本，要连服务器还挺麻烦)。完了
Python 爬虫实战：抓取哔哩哔哩收藏夹视频（API 逆向 + 视频分类整理）西攻城狮北 python 爬虫音视频
引言哔哩哔哩（B站）作为国内知名的视频分享平台，拥有丰富多样的视频资源和活跃的用户社区。对于视频创作者、数据分析人员或爬虫学习者来说，抓取B站收藏夹中的视频数据，不仅能帮助我们更好地了解用户喜好和视频内容，还能为创作和研究提供有力支持。本文将深入浅出地讲解如何通过Python爬虫实现抓取哔哩哔哩收藏夹视频，并对其进行分类整理，涵盖从环境搭建、API逆向分析到数据处理与存储等关键步骤，旨在为读者提供
【Python学习】可视化图表-使用matplotlib绘制不同种类散点图西攻城狮北 Python实用案例 python 学习 matplotlib 可视化图形
一、引言在数据可视化领域，散点图是一种极其强大的工具，它能够直观地展示变量之间的关系、数据分布的模式以及潜在的聚类情况等。通过散点图，我们可以轻松地发现数据中的异常值、相关性以及其他隐藏的特征。Python的matplotlib库提供了丰富而灵活的功能，可以帮助我们绘制出各种类型的散点图，以满足不同的数据分析和展示需求。本文将深入探讨如何使用matplotlib绘制多种类型的散点图，并提供详细的代
18个Python高效编程技巧！程序员笑武 python 开发语言数据分析信息可视化运维
初识Python语言，觉得python满足了我上学时候对编程语言的所有要求。python语言的高效编程技巧让我们这些大学曾经苦逼学了四年c或者c++的人，兴奋的不行不行的，终于解脱了。高级语言，如果做不到这样，还扯啥高级呢？01交换变量>>>a=3>>>b=6这个情况如果要交换变量在c++中，肯定需要一个空变量。但是python不需要，只需一行，大家看清楚了>>>a,b=b,a>>>print(a
python连接db2的官方库ibm_db的api 数据-脚本-资源-管道 ibm-db python 数据库 python
IBM_DBAPI详细文档ibm_db.active描述检查指定的数据库连接是否处于活动状态传入参数connection:有效的数据库连接资源返回值True:资源处于活动状态False:资源未处于活动状态例子importibm_dbconn=ibm_db.connect("DATABASE=testdb;HOSTNAME=localhost;PORT=50000;PROTOCOL=TCPIP;UI
Python 爬虫实战：动态数据+定时任务+价格预测全链路解析西攻城狮北 python 爬虫开发语言
一、动态数据捕获技术栈1.1目标网站分析（以某OTA平台为例）实现原理：本节演示如何使用Selenium自动化浏览器访问机票查询页面。选择Selenium而非直接请求API的原因在于：目标网站采用JavaScript动态渲染价格数据需要模拟用户操作（如选择日期、舱位）触发数据加载需处理反爬机制（如Cookie验证、行为检测）fromseleniumimportwebdriverfromseleni
Python并发编程基础：进程与线程本质区别详解 Yant224 python #并发编程 python 进程与线程并发编程多线程原理多进程原理并发模型线程安全
一、进程与线程的本质概念1.核心定义操作系统进程1进程2线程1线程2线程3线程1线程2进程(Process)：操作系统进行资源分配的基本单位线程(Thread)：操作系统进行任务调度的基本单位每个进程至少包含一个主线程，线程是进程的执行分支二、核心区别深度解析1.资源分配对比维度进程线程内存空间独立地址空间共享进程内存空间文件句柄独立文件描述符表共享进程文件描述符网络连接独立socket连接共享进
IDE：vscode常用插件十秒耿直拆包选手 IDE&OS ide vscode
BetterComments一款美化注释的插件，可以根据不同种类的注释，显示不同的颜色，一目了然。BracketPairColorizer/BracketPairColorizer2这是一个找对象的插件，不是帮你们找对象啊，是帮你找到括号的另一半。HighlightMatchingTag这也是一个找对象的插件，找的是标签的对象，看我上一个插件的演示图片中，当我点击一下html标签，配对的标签就会出
Python 自动批量生成发卡平台卡密信息并导入数据库拉灯的小手支付相关及一些实用小脚本 Python脚本 Python 自动脚本自动发卡平台发卡网
本文仅供学习交流使用，如侵立删！demo下载见文末Python自动批量生成发卡平台卡密信息并导入数据库环境win10Python：3.6.7os、csv、uuid、datetime1、生成脚本生成卡密文件：txt、csv各一份txt：导入发卡平台csv：导入数据库#-*-coding:utf-8-*-#作者：Administrator#文件：提取码txt转csv脚本.py
python中classmethod中讲解 AI专题精讲 python python
classmethod中的cls和self区别在Python中，@classmethod是一个装饰器，用于定义类方法。类方法与实例方法不同，它操作的是类本身，而不是类的实例。cls和self的区别：cls:cls是类方法的第一个参数，代表类本身。类方法通过@classmethod装饰器定义，调用时不需要创建类的实例。cls通常用于访问或修改类级别的属性，或者创建类的实例。self:self是实例方
Python类中cls和self的区别（staticmethod和classmethod的区别） Mr 姚 Python
1、cls和self的区别：self：类的方法的第一个参数，表示一个具体的实例本身。如果类的方法用了修饰符“staticmethod”，则可以无视这个self，这个方法就当成一个普通的函数使用。cls：若类方法用修饰符“classmethod”修饰，则cls作为类方法的第一个参数，表示这个类本身。2、staticmethod和classmethod的区别：一般来说，需要将类实例化后，才能调用类的方
Python中cls和self的区别单单一个越 python python 开发语言
self和cls都是对类或实例的引用，但它们在Python中的用法和含义是不同的。self是实例方法的第一个参数，它代表类的实例。self只能在实例方法中使用，用于访问实例的属性和方法。每个实例都有自己的self，它们互不影响。cls是类方法的第一个参数，它代表类本身。cls只能在类方法中使用，用于访问类的属性和方法。所有实例共享同一个cls。以下是一个简单的示例classMyClass:coun
Python 中的集合（Set）详解：从基础操作到实际应用面朝大海，春不暖，花不开 Python基础 python 开发语言
文章大纲引言：集合在Python中的重要性在Python编程中，集合（Set）是一种极为重要的内置数据结构，它以无序性和元素唯一性为主要特点。集合中的每个元素都是独一无二的，这使得它在处理数据去重、成员检测以及数学运算（如并集、交集）时表现出色。无论是进行大规模数据分析，还是优化算法效率，集合都能提供高效的解决方案。例如，在处理用户ID列表时，集合可以快速去除重复项，确保数据准确性。此外，集合与字
python cls的使用最后冰吻free python cls
importthreadingclassTest:#new方法用于创建类的实例def__new__(cls,*args,**kwargs):print("__new__:",cls.__class__.__name__)returnobject.__new__(cls)#返回实例给initself参数#init用于初始化类的实例，实例由new方法传递过来的，即这里selfdef__init__(s
初识 Flask 框架 2301_80329775 pyton编程基础 flask python 后端
前言Flask是一个轻量级的Web框架，基于Python语言开发，设计理念注重简洁、灵活和易用。作为一个"微框架"，它本身非常简洁，提供了构建web应用所需的核心工具，但并不强制开发者遵循复杂的项目结构，因此被广泛应用于web开发领域。Flask非常适合初学者学习Web开发，因为它让开发者能够专注于应用逻辑，而无需过多担心框架本身的复杂性。无论是快速原型开发，还是较小规模的Web应用，Flask都
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo