张博208

使用概率编程和Pyro进行金融预测

原文链接：

https://medium.com/@alexrachnog/financial-forecasting-with-probabilistic-programming-and-pyro-db68ab1a1dba

图片来源 https://jmhl.org/research/

大家好，我回来了！去年我发表了几篇利用神经网络做金融预测的教程，其中一些结果是有趣的，我觉得值得应用于真实交易应用中。如果你读过那些文章，你可能注意到，当你用某些机器学习模型拟合“随机”数据，并试图找到其中隐含模式时，通常会陷于过拟合。我们用了不同的正则化技术以及额外的数据试图解决这一问题，但这很费时且需要盲目搜索。

今天我会用略微不同的方法拟合之前的算法。从概率角度进行处理，通过数据本身进行正则化，估计预测的确定性，使用较少的数据，将概率依赖引入到模型中。这里主要讲概况，我会更注重于应用问题，而不会特别深入的讲解贝叶斯模型或变分推断技术或数学细节问题。你可以在这里找到代码。

同时我也推荐你读一下此前写的利用神经网络做金融预测的教程:

Simple time series forecasting (and mistakes done)
Correct 1D time series forecasting + backtesting
Multivariate time series forecasting
Volatility forecasting and custom losses
Multitask and multimodal learning
Hyperparameters optimization
Enhancing classical strategies with neural nets
Probabilistic programming and Pyro forecasts
Backtesting in Pandas

如需要进一步了解概率编程、贝叶斯模型及其应用，推荐阅读以下资源:

Pattern recognition and machine learning
Bayesian methods for hackers

可以看以下以下Python库及相关文档:

PyMC3
Edward
Pyro

概率编程

这里的概率指什么，为什么称之为编程? 首先我们回忆一下“正常的”神经网络及其输出。神经网络带有参数(权重)，这些是以矩阵形式表示的，神经网络的输出通常是一些标量值或向量(例如做分类时)。当模型训练完成后，比如说使用SGD进行训练，得到一些固定的权重矩阵，网络对于相同的样本会输出相同的结果。没错！那么如果把参数和输出看做相互依赖的分布会怎么样呢？神经网络里每个权重可以看做某个分布的样本，同样输出可以看做全网络作为分布的一个样本，这个分布依赖于网络中所有参数。这告诉我们什么?

我们从最基本的开始说。如果把网络看做一组相互依赖的分布，它首先是一个联合分布 p(y, z|x), 这里y是输出、z是模型“内部的”潜变量，依赖于输入 x (常规神经网络都可以这样看)。有趣的是这样的神经网络分布，可以看做从 y ~ p(y|x) 采样，然后把输出作为其分布(其中输出通常是该分布的样本期望，其标准差 — —作为不确定性的估计 — —分布的尾部越大——输出的置信度越低)。

有了这样的设定就后面理解略微清晰了点，我们只需要记得，从现在开始模型中所有的参数、输入和输出都是分布。当我们训练模型时，需要拟合这些分布的参数，在实际任务中获得更高的精度。这里我们还需要知道，参数分布的形态是由我们来设定的 (开始时所有权重都初始化为 w ~ Normal(0, 1)分布，此后通过训练获得正确的均值和方差)。最初的分布是先验分布，经过训练以后的分布是后验分布。我们用后者去采样获得输出。

图片来源http://www.indiana.edu/~kruschke/BMLR/

模型拟合是怎么做的? 通用框架叫做变分推断。如果不看细节我们可以假定，需要找到一个模型最大化对数似然 p_w(z|x), 这里w是模型参数 (分布的参数), z 是潜变量 (隐神经元的输出, 采样自参数w的分布) ，x是输入样本数据。我们的模型就是这样的。在Pyro可引入这样一个实体作为该模型的guide，其中包含所有潜变量的分布q_ф(z), 此处 ф 称为变分参数。这个分布必须近似“实际”模型参数的分布，也就是最好的拟合输入数据。

训练目标是最小化[log(p_w(z|x)) — log(q_ф(z))] 关于输入数据和guide样本的期望。这里不会过多介绍训练的细节，因为可能涉及好几门大学课程，现在把这个看做黑盒优化就好。

好的那为什么称为编程? 通常这样的统计模型(神经网络)被描述为从一个变量到另一个变量的有向图, 这样直接显示变量的依赖:

图片来源 http://kentonmurray.com/

最初概率编程语言被用于定义诸如这样的模型并以此进行推断。

使用概率编程的原因

从数据中学习它作为额外的潜变量，而不是传统的在模型中使用dropouts或L1正则化。考虑到所有权重都是分布，可以从那里采样N次并得到输出的分布，这里可以看一下标准差估计一下模型输出结果的置信度。这种方法的好处是，我们只需要较少的训练数据并可灵活的在变量间增加依赖。

不使用概率编程的原因

我在贝叶斯模型使用尚没有积累大量的经验，不过在使用Pyro和PyMC3的过程中我发现，训练过程很长且难以确定先验概率。另外处理生产环境的样本分布可能导致误解和模棱两可的情况。

数据准备

我从网上获取每日以太币的牌价等数据，其中包括OHLCV (开盘、最高、最低、收盘、成交量) ，另外还获取了每天涉及以太币的推特数量。这里选取7天价格、成交量和推特数的换算为变动%，预测下一个交易日的变动。

价格推特数和成交量变动

上图为采样的数据 —蓝色表示价格变动, 黄色表示推特数变动，绿色是成交量变动。这些变量之间存在一些正相关(大概0.1–0.2之间), 所以我们可利用数据中的模式来训练我们的模型。

贝叶斯线性回归

首先我想看一下简单线性回归效果如何(直接从Pyro教程复制结果). 下面定义PyTorch模型 (官方教程里有各个详细的说明):

class RegressionModel(nn.Module):
    def __init__(self, p):
        super(RegressionModel, self).__init__()
        self.linear = nn.Linear(p, 1)
        
def forward(self, x):
        # x * w + b
        return self.linear(x)

这是一个简单的确定性模型和之前一样, 不过这就是在Pyro中定义概率模型的方式:

def model(data):
    # Create unit normal priors over the parameters
    mu = Variable(torch.zeros(1, p)).type_as(data)
    sigma = Variable(torch.ones(1, p)).type_as(data)
    bias_mu = Variable(torch.zeros(1)).type_as(data)
    bias_sigma = Variable(torch.ones(1)).type_as(data)
    w_prior, b_prior = Normal(mu, sigma), Normal(bias_mu, bias_sigma)
    priors = {'linear.weight': w_prior, 'linear.bias': b_prior}
    lifted_module = pyro.random_module("module", regression_model, priors)
    lifted_reg_model = lifted_module()
    
with pyro.iarange("map", N, subsample=data):
        x_data = data[:, :-1]
        y_data = data[:, -1]
        # run the regressor forward conditioned on inputs
        prediction_mean = lifted_reg_model(x_data).squeeze()
        pyro.sample("obs",
                    Normal(prediction_mean, Variable(torch.ones(data.size(0))).type_as(data)),
                    obs=y_data.squeeze())

在上面的代码中我们看到, 用W和b作为广义线性回归模型分布的参数，它们服从~Normal(0, 1)分布，这里命名为prior。构造Pyro随机函数(PyTorch里用RegressionModel), 赋值prior ({‘linear.weight’: w_prior, ‘linear.bias’: b_prior}) 基于输入数据x从 p(y|x) 采样。

模型的guide函数定义如下:

def guide(data):
    w_mu = Variable(torch.randn(1, p).type_as(data.data), requires_grad=True)
    w_log_sig = Variable(0.1 * torch.ones(1, p).type_as(data.data), requires_grad=True)
    b_mu = Variable(torch.randn(1).type_as(data.data), requires_grad=True)
    b_log_sig = Variable(0.1 * torch.ones(1).type_as(data.data), requires_grad=True)
    mw_param = pyro.param("guide_mean_weight", w_mu)
    sw_param = softplus(pyro.param("guide_log_sigma_weight", w_log_sig))
    mb_param = pyro.param("guide_mean_bias", b_mu)
    sb_param = softplus(pyro.param("guide_log_sigma_bias", b_log_sig))
    w_dist = Normal(mw_param, sw_param)
    b_dist = Normal(mb_param, sb_param)
    dists = {'linear.weight': w_dist, 'linear.bias': b_dist}
    lifted_module = pyro.random_module("module", regression_model, dists)
    return lifted_module()

接下来为需要训练的分布定义变分分布。可以看到，定义的W和b分布的形状是一致的。为了更符合现实 (根据我们的假定)，在本例中将分布收窄一些 (~Normal(0, 0.1))。

接下来训练模型:

for j in range(3000):
    epoch_loss = 0.0
    perm = torch.randperm(N)
    # shuffle data
    data = data[perm]
    # get indices of each batch
    all_batches = get_batch_indices(N, 64)
    for ix, batch_start in enumerate(all_batches[:-1]):
        batch_end = all_batches[ix + 1]
        batch_data = data[batch_start: batch_end]
        epoch_loss += svi.step(batch_data)

拟合后从模型中采样y，重复100次，检查预测的均值和标准差 (标准差越高, 本次预测的置信度越低).

preds = []
for i in range(100):
    sampled_reg_model = guide(X_test)
    pred = sampled_reg_model(X_test).data.numpy().flatten()
    preds.append(pred)

在金融场景中预测中经典的指标是MSE, MAE 或 MAPE，这里麻烦 — — 相对误差率较小并不等于模型效果就好，还需要检查那些样本以外的数据在模型中的效果并绘制成图:

image

贝叶斯模型30天预测

看起来不太理想，不过最后那跳的形状还不错，我们继续!

普通神经网络

这里尝试用以下这个简单神经网络得到一些有趣的特性，首先我们构造一个MLP，隐层含有25神经元后面跟着线性激活函数:

def get_model(input_size):
    main_input = Input(shape=(input_size, ), name='main_input')
    x = Dense(25, activation='linear')(main_input)
    output = Dense(1, activation = "linear", name = "out")(x)
    final_model = Model(inputs=[main_input], outputs=[output])
    final_model.compile(optimizer='adam',  loss='mse')
    return final_model

训练100个epoch:

model = get_model(len(X_train[0]))
history = model.fit(X_train, Y_train, 
              epochs = 100, 
              batch_size = 64, 
              verbose=1, 
              validation_data=(X_test, Y_test),
              callbacks=[reduce_lr, checkpointer],
              shuffle=True)

以下是训练结果:

image

Keras 神经网络预测30天预测

结果不如简单贝叶斯回归，此外模型给不出确定性估计，更重要的是模型也不是正则化的。

贝叶斯神经网络

现在把刚才用Keras定义的神经网络用PyTorch框架改写一下:

class Net(torch.nn.Module):
    def __init__(self, n_feature, n_hidden):
        super(Net, self).__init__()
        self.hidden = torch.nn.Linear(n_feature, n_hidden)   # hidden layer
        self.predict = torch.nn.Linear(n_hidden, 1)   # output layer
        
def forward(self, x):
        x = self.hidden(x)
        x = self.predict(x)
        return x

对比贝叶斯回归模型，现在有2组参数 (输入到隐层以及隐层到输出)，这里我们稍微修改一下模型先验:

priors = {'hidden.weight': w_prior, 
              'hidden.bias': b_prior,
              'predict.weight': w_prior2,
              'predict.bias': b_prior2}

以及分布:

dists = {'hidden.weight': w_dist, 
              'hidden.bias': b_dist,
              'predict.weight': w_dist2,
              'predict.bias': b_dist2}

需要给模型中所有分布设定不同的名字，因为此处不能有模棱两可或重复! 代码中可以看到更多细节。我们看一下模型拟合后采样的最终结果:

image

Pyro神经网络30天预测

看起来比之前所有的结果都要好一些!

关于正则化或者说贝叶斯模型得到的权重比之普通模型，要看一下权重的统计值。可以这样检查Pyro模型的参数:

for name in pyro.get_param_store().get_all_param_names():
    print name, pyro.param(name).data.numpy()

在Keras 模型中是这么查看的:

import tensorflow as tf
sess = tf.Sessiom()
with sess.sa_default():
    tf.global_variables_initializer().run()

dense_weights, out_weights = None, None
with sess.as_default():
    for layer in model.layers:
        if len(layer.weights) > 0:
            weights = layer.get_weights()
            if 'dense' in layer.name:
                dense_weights = layer.weights[0].eval()
            if 'out' in layer.name:
                out_weights = layer.weights[0].eval()

比如Keras模型最后一层权重的均值和方差分别为 -0.0025901748, 0.30395043，Pyro模型的均值和方差分别为0.0005974418, 0.0005974418。小了很多，这挺好! 这是很多正则化手段例如L2或Dropout处理的，将参数逼近至0，可以用变分推断实现! 隐层的情景就更有趣了。我们看一下权重向量图, 蓝色表示Keras权重, 橙色表示Pyro权重:

image

输入和隐层之间部分权重

事实上有趣的是，均值方差变小了，权重也变得稀疏。令人惊奇的是，最终学习得到一个稀疏表示第一组类似L1正则化，第二组类似L2正则化。可以跑一下代码 !

结论

我们使用新的方法训练神经网络，通过更新权重的分布(而不是依次更新静态权重)，得到了有趣的并有前景的结果。我想强调贝叶斯方法可以帮助我们在不手工添加正则化器的情况下正则化神经网络，帮助理解模型的不确定性，并通过较少数据得到较好的训练结果。敬请关注! :)

点击使用概率编程和Pyro进行金融预测即可访问：

社长今日推荐：2019 最新斯坦福 CS224nNLP 课程

自然语言处理（NLP）是信息时代最重要的技术之一，也是人工智能的关键部分。NLP的应用无处不在，因为人们几乎用语言进行交流：网络搜索，广告，电子邮件，客户服务，语言翻译，医学报告等。近年来，深度学习方法在许多不同的NLP任务中获得了非常高的性能，使用单个端到端神经模型，不需要传统的，任务特定的特征工程。在本课程中，学生将深入了解NLP深度学习的前沿研究。

课程链接：https://ai.yanxishe.com/page/groupDetail/59

MATLAB软件二次开发：MATLAB面向对象编程 kkchenjj 仿真模拟 matlab 开发语言工业软件工业软件二次开发
MATLAB软件二次开发：MATLAB面向对象编程绪论面向对象编程的基本概念面向对象编程（Object-OrientedProgramming，OOP）是一种编程范式，它将程序设计围绕“对象”进行。在OOP中，对象是数据和可以对这些数据执行的操作的封装。每个对象都是一个特定类的实例，类定义了对象的属性（数据成员）和方法（函数）。OOP的三大特性包括：封装：将对象的属性和方法封装在一起，隐藏对象的内
【学习】《算法图解》第十一章学习笔记：动态规划程序员
一、动态规划概述动态规划（DynamicProgramming，简称DP）是一种通过将复杂问题分解为更简单的子问题来解决问题的方法。它是一种强大的算法设计技术，特别适用于具有重叠子问题和最优子结构性质的问题。（一）算法适用场景动态规划主要适用于以下场景：最优化问题（求最大值、最小值）计数问题（求方案数）具有重叠子问题特性的问题具有最优子结构特性的问题（二）算法基本思想动态规划的核心思想是：将原问题
编程语言发展史之：逻辑编程语言 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.简介逻辑编程（logicalprogramming）是一种编程范式，旨在以一种逻辑的方式来表示程序，而不是像命令式编程一样直接面向计算模型或执行指令。逻辑编程倾向于通过构造计算机所理解的数学逻辑模型来解决问题。它特别适用于那些对数据结构和算法模型十分敏感的问题。与函数式编程相比，逻辑编程更加强调数据、关系和抽象等抽象概念之间的对应关系，因此更容易设计出正确而优雅的程
Python通过字符串调用函数_python 面向对象根据字符串调动对应函数(1) m0_61418142 python 数据库 linux
textprocess(file,language)但是textprocess(file=‘data.txt’,language=‘english’)language(text)TypeError:‘str’objectisnotcallable百度谷歌一番，我查到以下几种方式####1-字典最简单，易上手的方式，使用字典配对。defchinese(text):print(‘jieba分词’)de
webstorm中element-ui标签无法跳转源码 Hong.1948 webstorm ui ide
原本用的webstorm2019,之前的项目开发时切实体验过跳转element-ui源码，觉得很香。更新了webstorm至2024，居然不行了，能弹出来提示，但就是找不到定义。不知道是不是2024版本的问题，node_moudles不管我是否手动添加exclude,它显示的都是exclude如下图：下列方式都尝试过了，没用：node_moudules设置为notexcludeLanguage&F
【LangChain编程：从入门到实践】AI 大模型检索增强生成 RAG 实践 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LangChain编程：从入门到实践-AI大模型检索增强生成RAG实践关键词：LangChain,RAG,大语言模型,检索增强生成,向量数据库,嵌入模型,提示工程1.背景介绍在人工智能和自然语言处理领域,大语言模型(LargeLanguageModels,LLMs)的出现无疑是一个重大突破。像GPT-3、GPT-4这样的模型展现出了惊人的语言理解和生成能力,为各种应用场景带来了无限可能。然而,这些
深入理解Tomcat 基本架构无心水编程路上 tomcat 架构 java 深入理解Tomcat Servlet容器 I/O模型 NIO2
TheApacheTomcat®softwareisanopensourceimplementationoftheJavaServlet,JavaServerPages,JavaExpressionLanguageandJavaWebSockettechnologies.TheJavaServlet,JavaServerPages,JavaExpressionLanguageandJavaWebS
面向对象 clk6607 java java 开发语言
面向对象编程（Object-OrientedProgramming，简称OOP）是一种编程范式，它使用“对象”来设计程序。面向对象的核心概念包括类（Class）、对象（Object）、继承（Inheritance）、封装（Encapsulation）、多态（Polymorphism）和抽象（Abstraction）。以下是面向对象编程的详细知识点解析。1.类和对象（Class&Object）1.1
LLM大语言模型学习笔记（1） Arixs666 大语言模型语言模型笔记人工智能
1.概念大语言模型（LLM，LargeLanguageModel），也称大型语言模型，是一种旨在理解和生成人类语言的人工智能模型。LLM通常指包含数百亿（或更多）参数的语言模型，它们在海量的文本数据上进行训练，从而获得对语言深层次的理解。2.能力2.1涌现能力区分大语言模型（LLM）与以前的预训练语言模型（PLM）最显著的特征之一是它们的涌现能力。涌现能力是一种令人惊讶的能力，它在小型模型中不明显
大语言模型（LLM）笔记笑衬人心。大模型学习语言模型笔记人工智能
一、什么是大语言模型（LLM）？LLM（LargeLanguageModel）是基于Transformer架构构建，并在海量文本语料上训练出的具备自然语言理解和生成能力的深度神经网络模型。其本质任务是**预测下一个token（词/字/符号）**的概率分布，但通过大规模参数和数据的支持，表现出类人智能的行为。二、核心架构：Transformer由Google在2017年提出，是目前LLM的主流架构。
Python XPath语法完全指南：从基础到高级应用红皮西瓜绿了心 python 爬虫
PythonXPath语法完全指南：从基础到高级应用XPath(XMLPathLanguage)是一种用于在XML和HTML文档中查找信息的语言，广泛应用于网页抓取、数据提取和自动化测试等领域。本文将全面介绍XPath的核心语法和高级用法，帮助您掌握这一强大的数据定位工具。一、XPath基础语法1.1节点选择XPath提供了多种节点选择方式：/：从根节点开始的绝对路径(如/html/body/di
【数据库】-2 mysql基础语句（上）艾伦_耶格宇数据库数据库 mysql
文章目录1、SQL语句1.1SQL语句的简要介绍2、SQL语句的四种基本类型2.1DDL-数据库定义语言管理对象修改表的结构2.2DML-数据库操纵语言2.3DQL-数据库查询语言2.4DCL-数据库控制语言1、SQL语句1.1SQL语句的简要介绍SQL（StructuredQueryLanguage，结构化查询语言）是用于管理关系型数据库的标准语言，广泛应用于数据存储、查询、更新和管理等场景。它
spring 面试题爆爆凯 spring 数据库 java
一、Spring基础概念什么是Spring框架？Spring是一个开源的Java应用程序框架，它提供了一种轻量级的、非侵入式的方式来构建企业级应用。Spring的核心功能包括依赖注入（DependencyInjection，DI）、面向切面编程（Aspect-OrientedProgramming，AOP）、事务管理、数据访问等，旨在简化企业级Java开发，提高开发效率和代码的可维护性。Sprin
AI:微调框架 LLaMA-Factory（Large Language Model Factory） xyzroundo AI 人工智能 llama 语言模型 sft llama-factory AI
LLaMA-Factory（LargeLanguageModelFactory）是由北航团队开源的高效大语言模型（LLM）微调框架，旨在简化大型语言模型的定制化训练流程，支持超过100种主流模型和多种先进微调技术。以下从核心功能、安装部署、微调流程和应用场景四个方面详细介绍：一、核心功能与特点广泛的模型支持支持LLaMA3、Mistral、Qwen、ChatGLM、Gemma、Phi、Yi、Bai
python开发|yaml用法知识介绍川石课堂软件测试 python 数据库功能测试开发语言人工智能单元测试 linux
随着互联网技术的快速发展，服务器编程变得越来越重要。Python作为一种强大的编程语言，越来越受到开发者的青睐。而PyYAML则是Python中最常用的YAML格式解析器之一，本文将系统介绍yaml知识01yaml介绍YAML(YAMLAin'tMarkupLanguage)是一种直观的数据序列化格式，它旨在以易于人类阅读和编写的方式表达数据。尽管名称中包含“不是标记语言”的表述，YAML在实际应
[iOS文档翻译]AVFoundation Programming Guide - About AVFoundation - AVFoundation概述 yofer张耀琦 iOS ios AVFoundati 翻译中文
>版权声明：本文为博主原创翻译，如需转载请注明出处。苹果源文档地址-点击这里AboutAVFoundation-AVFoundation概述AVFoundationisoneofseveralframeworksthatyoucanusetoplayandcreatetime-basedaudiovisualmedia.ItprovidesanObjective-Cinterfaceyouuset
三分钟使用github的技巧小白学CS 安装/使用教程运维 github git
文章目录一、GitHub搜索技巧——找开发者二、GitHub搜索技巧——找项目三、in关键字限制搜索范围四、stars或fork数量去查找一、GitHub搜索技巧——找开发者搜索条件备注location:location:china，匹配用户填写的地址在chinalanguage:language:javascript，匹配开发语言为javascript的开发者followers:follower
飞算JavaAI 2.0.0深度测评：自然语言编程如何重构开发生产力？知识产权13937636601 计算机 Java
摘要2025年自然语言编程（NLPProgramming）迎来工业化拐点，飞算JavaAI2.0.0以语义理解精度＞92%、企业级代码生成通过率＞87%的核心能力，正在重构Java开发范式。本文通过电商、金融、工业物联网三大场景实测，揭秘其如何实现需求描述到可部署代码的端到端转化。数据显示：复杂业务模块开发效率提升3-8倍，逻辑缺陷率降低70%，同时提供语义级安全审计、架构腐化预警等独家能力，为传
利用视觉-语言模型搭建机器人灵巧操作的支架三谷秋水智能体大模型计算机视觉语言模型机器人人工智能计算机视觉机器学习
25年6月来自斯坦福和德国卡尔斯鲁厄理工的论文“ScaffoldingDexterousManipulationwithVision-LanguageModels”。灵巧机械手对于执行复杂的操作任务至关重要，但由于演示收集和高维控制的挑战，其训练仍然困难重重。虽然强化学习(RL)可以通过在模拟中积累经验来缓解数据瓶颈，但它通常依赖于精心设计的、针对特定任务的奖励函数，这阻碍了其可扩展性和泛化能力。
16.6 《3分钟扩容20实例！LanguageMentor容器化部署实战：高并发下的负载均衡与自动扩展方案》少林码僧负载均衡运维人工智能语言模型机器学习 langchain llama
LanguageMentorAgent容器化部署与发布：高并发场景下的负载均衡与自动扩展关键词：KubernetesHPA,AWSAutoScaling,会话亲和性,监控指标,滚动更新1.高并发场景下的架构挑战LanguageMentor作为对话式Agent需要处理多用户同时在线会话，容器化部署需解决两个核心问题：
ROP和Ret2libc漏洞卍king卐然 web安全经验分享 ROP攻击
一、ROP攻击原理ROP全称为Return-orientedProgramming（返回导向式编程）是一种新型的基于代码复用技术的攻击，攻击者从已有的库或可执行文件中提取指令片段，构建恶意代码。ROP攻击同缓冲区溢出攻击，格式化字符串漏洞攻击不同，是一种全新的攻击方式,它利用代码复用技术。ROP的核心思想：攻击者扫描已有的动态链接库和可执行文件，提取出可以利用的指令片段(gadget)，这些指令片
黑客入门 | 用ROP和shellcode攻击SolarWinds Serv-U SSH漏洞廖致君安全网络攻击模型
（备注：黑客Hacker并不等同于信息安全罪犯。）最近花了些时间学习bufferoverflow安全漏洞，做了大名鼎鼎的CSAPP课程里的attacklab,学到了return-orientedprogramming(ROP)这种让我大开眼界的进攻方式。于是想要趁热打铁，来详细研究一下现实世界中的黑客进攻案例。本篇文章挑选的是2021年SolarWindsServ-UFTP软件中的漏洞，记录编号C
推荐系统的视频特征-视频关键帧特征提取与向量生成
总体流程概览视频文件(.mp4)↓关键帧抽取（FFmpeg/SceneDetect）↓帧图像（.jpg）↓图像模型提取特征（CLIP/CNN/ViT）↓多帧聚合成视频向量（均值池化等）↓向量库/推荐系统模型特征提取推荐：使用OpenAI的CLIP模型CLIP（ContrastiveLanguage-ImagePretraining）适合推荐系统做跨模态建模，对视频封面帧或场景帧提取效果非常好。✅1
什么叫精通C++ diaoqu4574
常用的面向对象复用模型设计、常用的数据结构设计、常用的操作系统知识、内存管理、多线程互斥，然后能够很轻松的应用现有的软件模块和开发库，比如用开源的库(例如log4cpp)，购买的其他公司的接口模块等，能够和容易上手应用一个你从未涉足的开发平台(比如从vc转到symbian,转到qt)，开发令老板比较满意的程序模块.十足的自信心+强烈的求知欲+对Programming&&CPP的执着+百折不挠的钻研
MySQL数据库段帅龙呀 Linux 数据库 mysql linux
数据库（Mysql）默认端口###port=3306数据文件默认位置/usr/local/mysql/data数据库的引擎###InnoDB存储引擎:默认引擎,最常用的。（支持事务）###查看当前默认存储引擎showvariableslike'%storage_engine%';数据库的种类###关系型数据库###非关系型数据库。sql语句#SQL（StructuredQueryLanguage即
面向大语言模型幻觉的关键数据集：系统性综述与分类法致Great 语言模型人工智能自然语言处理
面向大语言模型幻觉的关键数据集：系统性综述与分类法摘要大语言模型（LargeLanguageModels,LLMs）在自然语言处理的多个领域取得了革命性进展，但其固有的“幻觉”问题——即生成看似合理但与事实不符或与上下文无关的内容——严重制约了其在关键应用中的可靠性与安全性。为了系统性地评估、理解并缓解LLM的幻觉现象，学术界和工业界开发了大量多样化的数据集与基准。本文对大模型幻觉领域的关键数据集
自然语言处理之文本生成：Recurrent Neural Networks (RNN)：序列模型与语言模型 zhubeibei168 自然语言处理自然语言处理 rnn 语言模型人工智能机器翻译生成对抗网络
自然语言处理之文本生成：RecurrentNeuralNetworks(RNN)：序列模型与语言模型自然语言处理简介NLP的基本概念自然语言处理（NaturalLanguageProcessing，简称NLP）是人工智能领域的一个重要分支&#
数据库 DML 语句详解：语法与注意事项步行cgn 数据库数据库 oracle
数据库DML语句详解：语法与注意事项DML（DataManipulationLanguage，数据操作语言）用于操作数据库中的数据，主要包括SELECT、INSERT、UPDATE、DELETE等语句。下面我将详细说明每种操作的语法、使用场景和关键注意事项。一、SELECT查询语句基本语法SELECT[DISTINCT]column1,column2,...FROMtable_name[WHERE
【TVM 教程】PAPI 入门
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/性能应用程序编程接口（PerformanceApplicationProgrammingInterface，简称PAPI）是一个可在各种平台上提供性能计数器的库。在指定的运行期间，性能计数器提供处理器行为的准确底层信息，包含简单的指标，如总
多模态大语言模型arxiv论文略读（145）胖头鱼爱算法 #mllm_arxiv 语言模型人工智能自然语言处理论文笔记论文阅读
ReasoningLimitationsofMultimodalLargeLanguageModels.AcasestudyofBongardProblems➡️论文标题：ReasoningLimitationsofMultimodalLargeLanguageModels.AcasestudyofBongardProblems➡️论文作者：MikołajMałkiński,SzymonPawlo
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d

使用概率编程和Pyro进行金融预测

概率编程

数据准备

贝叶斯线性回归

普通神经网络

贝叶斯神经网络

结论

你可能感兴趣的:(Probabilistic,programming,language)