秋男不吃牛肉豆制品牛奶小麦

李航《统计学习方法》——马尔可夫链蒙特卡罗法

这篇博客是在自学李航老师的《统计学习方法》19章MCMC的过程中，进行简要的复述和记录，之后会在二刷三刷博客的时候增加自己对方法对口语化描述及理解，关注我一起加油吧～～

文章目录

- 19.1 蒙特卡罗法
- - 19.1.1 随机抽样
  - 19.2 数学期望估计
  - 19.3 积分计算
- 19.2 马尔可夫链
- - 19.2.1 基本定义
  - 19.2.3 连续状态马尔可夫链
  - 19.2.4 马尔可夫链的性质
- 19.3 马尔可夫链蒙特卡罗法
- 19.4 Metropolis-Hastings算法
- 19.5 吉布斯抽样(Gibbs Sampling)

蒙特卡罗法（也称为统计模拟方法）是通过从概率模型的随机抽样进行近似数据计算的方法。 马尔可夫链蒙特卡罗（MCMC）法是以马尔可夫链为概率模型的蒙特卡罗法。
MCMC方法的基本思想是：通过蒙特卡罗法构建一个马尔可夫链，使其平稳分布就是要进行抽样的分布，首先基于该马尔可夫链进行随机游走，产生样本序列，之后使用该平稳分布的样本进行近似的数值计算。

19.1 蒙特卡罗法

19.1.1 随机抽样

统计学习和机器学习的目的是基于数据对概率分布的特征进行判断。蒙特卡罗法要解决的问题是，假设概率分布的定义已知，通过抽样获得概率分布的随机样本，通过得到的样本对概率分布的特征进行分析，蒙特卡罗法的核心是随机抽样。
一般的蒙特卡罗法有直接抽样法、接受-拒绝抽样法、重要性抽样法等。后两种方法适合于概率密度函数复杂（如密度函数有多个变量，各变量相互不独立，密度函数形式复杂），不能直接抽样的方法。

接受-拒绝抽样法
假设有随机变量 $x$ ,取值 $x\in\chi$ ，其概率密度函数为 $p (x)$ .目标是得到该概率分布的随机样本，进而对这个概率分布进行分析。基本思想如下：假设 $p (x)$ 不可以直接抽样，找一个可以直接抽样的分布，称为建议分布。假设 $q (x)$ 是建议分布的概率密度函数，并且有 $cq(x)\geq p(x),且c\geq0$ 。对 $q (x)$ 进行抽样，假设得到的结果是 $x^*$ ,再按照 $\frac {p(x)}{cq(x)}$ 的例随机决定是否接受 $x^*$ 。接受拒绝法实际就是按照 $p (x)$ 的涵盖面积（涵盖体积）占 $c q (x)$ 的涵盖面积的比例进行抽样。
接受-拒绝法
输入：抽样的目标概率分布的概率密度函数 $p (x)$ ;
输出：概率分布的随机样本 $x_1,x_2,\cdot\cdot\cdot,x_n$ .
参数：样本 $n$ .
（1）选择概率密度函数为 $q (x)$ 的概率分布作为建议分布，使其对任一 $x$ 满足 $cq(x)\geq p(x)$ ,其中 $c\geq0$ .
（2）按照建议分布 $q (x)$ 随机抽样得到样本 $x^*$ ，再按照均匀分布在 $(0, 1)$ 范围内进行抽样得到 $u$ .
（3）如果 $u\leq\frac {p(x^*)}{cq(x^*)}$ ,则将 $x^*$ 作为抽样结果；否则，回到步骤(2).
（4）直至得到 $n$ 个随机样本，结束。
接受-拒绝法的优点是容易实现，缺点是效率可能不高。（如： $p (x)$ 的涵盖体积占 $c q (x)$ 的涵盖体积的比例较低，就会导致拒绝的比例很高，抽样效率很低。）

19.2 数学期望估计

一般的蒙特卡罗法，如直接抽样法、接受-拒绝法、重要性抽样法等，也可以直接用于数学期望估计。假设随机变量 $x$ ,取值 $x\in\chi$ ，其概率密度函数为 $p (x)$ ， $f (x)$ 为定义在 $\chi$ 上的函数，目标是求函数 $f (x)$ 关于密度函数 $p (x)$ 的数学期望 $E_{p(x)}[f(x)]$ .
蒙特卡罗法按照概率分布 $p (x)$ 独立地选取 $n$ 个样本 $x_1,x_2,\cdot\cdot\cdot,x_n$ ，比如用以上的抽样方法，计算函数 $f (x)$ 的样本均值 $\hat f_n$ ， $\hat f_n=\frac {1}{n}\sum_{i=1}^nf(x_i)$ 作为数学期望 $E_{p(x)}[f(x)]$ 的近似值。根据大数定律可知，当样本容量增大时，样本均以概率1收敛于数学期望，因此得到了数学期望的近似计算方法： $E_{p(x)}[f(x)]\approx \frac{1}{x=n}\sum_{i=1}^nf(x_i)$

19.3 积分计算

一般的蒙特卡罗法也可以用于定积分的近似计算，称为蒙特卡罗积分。假设有一个函数 $h (x)$ ，目标是计算该函数的积分 $\int_\chi h(x)dx$
如果能够将函数 $h (x)$ 分解成一个函数 $f (x)$ 和一个概率密度函数 $p (x)$ 的乘积的形式，那么就有 $\int_\chi h(x)dx=\int_\chi f(x)p(x)dx=E_{p(x)}[f(x)]$
于是函数 $h (x)$ 的积分可以表示为函数 $f (x)$ 关于概率密度函数 $p (x)$ 的数学期望。任何一个函数的积分都可以表示为某一个函数的数学期望的形式:给定一个概率密度函数 $p (x)$ ，只要取 $f(x)=\frac{h(x)}{p(x)}$ .函数的数学期望又可以通过函数的样本均值估计，于是就可以采用样本均值来近似计算积分。这就是蒙特卡罗积分的基本思想。
$\int_\chi h(x)dx=E_{p(x)}[f(x)]\approx \frac {1}{n}\sum_{i=1}^nf(x_i)$
马尔可夫链蒙特卡罗法也适用于概率密度函数复杂，不能直接抽样的情况，旨在解决一般的蒙特卡罗法抽样效率不高的问题。一般的蒙特卡罗法中的抽样样本是独立的，而马尔可夫链蒙特卡罗法中的抽样样本不是独立的，样本序列形成马尔可夫链。

19.2 马尔可夫链

19.2.1 基本定义

19.2.3 连续状态马尔可夫链

连续状态的马尔可夫链 $X={X_0,X_1,\cdot\cdot\cdot,X_t}$ ，随机变量 $X_t(t=0,1,2,\cdot\cdot\cdot)$ 定义在连续状态空间 $S$ ，转移概率分布由概率转移核或转移核表示。
设 $S$ 是连续状态空间，对任意的 $\in S,A \in S$ ，转移核 $P (x, A)$ 定义为 $P(x,A)=\int_Ap(x,y)dy$ 其中 $p(x,\cdot)$ 表示概率密度函数，满足 $p(x,\cdot)\geq 0,P(x,S)=\int_Sp(x,y)dy=1$ 。转移核 $P (x, A)$ 表示从 $x ～ A$ 的转移概率。
$P(X_t=A|X_{t-1}=x)=P(x,A)$ 有时也将概率密度函数 $p(x,\cdot)$ 称为转移核。
若马尔可夫链的状态空间 $S$ 上的概率分布 $\pi(x)$ 满足条件 $\pi(y)=\int p(x,y)\pi(x)dx,\forall y\in S$ 则称分布 $\pi(x)$ 为该马尔可夫链的平稳分布。等价地， $\pi(A)=\int P(x,A)\pi(x)dx,\forall A\subset S$ 或简写为 $\pi=P\pi$

19.2.4 马尔可夫链的性质

不可约
非周期
正常返
遍历定理
可逆马尔可夫链

19.3 马尔可夫链蒙特卡罗法

19.4 Metropolis-Hastings算法

19.5 吉布斯抽样(Gibbs Sampling)

吉布斯抽样用于多元变量联合分布的抽样和估计。其基本做法是：从联合概率分布定义满条件概率分布，依次对满条件概率分布进行抽样，得到样本的序列。抽样的过程就是在马尔可夫链上的随机游走，每一个样本对应着马尔可夫链的状态，平稳分布目标的联合分布。

你可能感兴趣的:(深度学习,机器学习,统计学习,统计学习方法,机器学习)

线性回归的简单实现 SkaWxp 深度学习深度学习机器学习 mxnet gluon
本文是《动手学深度学习》的笔记文章目录线性回归的简单实现生成随机数据集读取数据初始化模型参数定义模型定义损失函数定义优化算法训练模型线性回归的简洁实现生成数据集读取数据定义模型初始化模型参数定义损失函数定义优化算法训练模型线性回归的简单实现用了mxnet中的自动求导和数组结构frommxnetimportautograd,ndimportrandom生成随机数据集只有这个是用了自己造的数据，因为线
投票法：简单而强大的分类利器 ningaiiii 机器学习与深度学习分类机器学习人工智能
投票法：简单而强大的分类利器在机器学习的分类任务中，我们常常需要寻找高效且准确的方法来对数据进行分类。今天，让我们一起来探讨一种简单却极为强大的分类方法——投票法。一、投票法原理（一）通俗易懂的理解投票法就像一场班级选举。假设有一个班级要选出最受欢迎的水果，每个同学心中都有自己的选择（这就好比一个个分类器给出的分类结果）。最后统计每个水果获得的票数，得票最多的水果就当选（对应分类任务中，票数最多的
初入机器学习辰尘_星启机器学习人工智能深度学习 python mxnet
写在前面本专栏专门撰写深度学习相关的内容，防止自己遗忘，也为大家提供一些个人的思考一切仅供参考概念辨析深度学习：本质是建模，将训练得到的模型作为系统的一部分使用侧重于发现样本集中隐含的规律难点是认识并了解模型，合理设置初始模型，要对建模对象有比较深刻的认识依赖大量的准确训练样本强化学习：本质是系统，直接将训练得到的模型视作系统本身（激进的像“端到端”）侧重于最大化当前环境下的奖励，最终目标是寻找环
深度学习：基于MindNLP的RAG应用开发 Landy_Jay 深度学习人工智能
什么是RAG？RAG（Retrieval-AugmentedGeneration，检索增强生成）是一种结合检索（Retrieval）和生成（Generation）的技术，旨在提升大语言模型（LLM）生成内容的准确性、相关性和时效性。基本思想：通过外部知识库动态检索与用户查询相关的信息，并将检索结果作为上下文输入生成模型，辅助生成更可靠的回答。与传统LLM的区别：传统LLM仅依赖预训练参数中的静态知
深度学习篇---张量&数据流动处理 Ronin-Lotus 深度学习篇深度学习人工智能 python TensorFlow Pytorch 张量数据流动处理
文章目录前言第一部分：张量张量的基本概念1.维度标量（0维）向量（1维）矩阵（2维）三维张量2.形状张量运算1.基本运算加法减法乘法除法2.广播3.变形4.转置5.切片6.拼接7.矩阵分解8.梯度运算：深度学习框架中的张量运算1.自动求导2.硬件加速3.高度优化第二部分：数据流动与处理1.磁盘（硬盘或固态硬盘）读取数据写入数据2.内存（RAM）加载程序和数据数据交换3.缓存CPU缓存磁盘缓存4.数
PyTorch生态系统中的连续深度学习：使用Torchdyn实现连续时间神经网络
神经常微分方程（NeuralODEs）是深度学习领域的创新性模型架构，它将神经网络的离散变换扩展为连续时间动力系统。与传统神经网络将层表示为离散变换不同，NeuralODEs将变换过程视为深度（或时间）的连续函数。这种方法为机器学习开创了新的研究方向，尤其在生成模型、时间序列分析和物理信息学习等领域具有重要应用。本文将基于Torchdyn（一个专门用于连续深度学习和平衡模型的PyTorch扩展库）
基于CNN(一维卷积Conv1D)+LSTM+Attention 实现股票多变量时间序列预测(PyTorch版) 矩阵猫咪 cnn lstm pytorch 注意力机制卷积神经网络长短期记忆网络 Attention
前言系列专栏:【深度学习：算法项目实战】✨︎涉及医疗健康、财经金融、商业零售、食品饮料、运动健身、交通运输、环境科学、社交媒体以及文本和图像处理等诸多领域，讨论了各种复杂的深度神经网络思想，如卷积神经网络、循环神经网络、生成对抗网络、门控循环单元、长短期记忆、自然语言处理、深度强化学习、大型语言模型和迁移学习。在深度学习的众多模型中，卷积神经网络（CNN）和长短期记忆网络（LSTM）因其独特的优势
周报 | 25.1.27-25.2.2文章汇总双木的木深度学习拓展阅读 python拓展学习人工智能 transformer 算法深度学习 YOLO chatgpt llama
为了更好地整理文章和发表接下来的文章，以后每周都汇总一份周报。周报|25.1.20-25.1.26文章汇总-CSDN博客机器学习AI算法工程|DeepSeekV3两周使用总结-CSDN博客Datawhale|一文详尽之SFT（监督微调，建议收藏）！-CSDN博客arXiv每日学术速递|强强联合：CNN与Transformer融合创新提升模型性能！！-CSDN博客AI生成未来|字节提出VideoWo
最小边际采样在分类任务中的应用 ningaiiii 机器学习与深度学习分类数据挖掘人工智能
最小边际采样在分类任务中的应用在机器学习的分类任务里，如何高效利用有限的标注数据，一直是研究的重点。最小边际采样（LeastMarginSampling）作为主动学习策略中的一种，为解决这一问题提供了独特的思路。本文将深入探讨最小边际采样在分类任务中的原理、应用以及优势与挑战。一、最小边际采样的原理最小边际采样的核心概念是基于模型预测概率来衡量样本的不确定性。在一个多分类问题中，模型会对每个样本预
使用支持向量机（SVM）进行股票市场预测 m0_57781768 支持向量机算法机器学习
使用支持向量机（SVM）进行股票市场预测引言股票市场预测是金融领域的一个热门话题，也是一个充满挑战的研究领域。通过准确的市场预测，投资者可以做出更明智的决策，从而获得更高的回报。支持向量机（SVM）作为一种强大的机器学习算法，已被广泛应用于各种分类和回归问题。本文将详细介绍如何使用C++和支持向量机进行股票市场预测，并提供完整的代码示例。支持向量机简介支持向量机（SVM）是一种监督学习算法，最初用
DeepSeek：开启智能搜索与AI发展的新纪元 gs80140 AI 人工智能
在人工智能领域，DeepSeek正以其卓越的技术创新和强大的性能表现，成为全球瞩目的焦点。作为一款基于深度学习技术的智能搜索引擎和AI模型，DeepSeek不仅在技术上取得了重大突破，还在多个应用场景中展现了巨大的应用潜力，为用户带来了前所未有的智能体验。一、DeepSeek简介DeepSeek由杭州深度求索人工智能基础技术研究有限公司推出，是一款集自然语言处理（NLP）、计算机视觉（CV）、强化
【Java】已解决java.lang.ClassNotFoundException异常屿小夏 java 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
Megatron：深度学习中的高性能模型架构 gs80140 基础知识科谱 AI 机器学习人工智能
Megatron：深度学习中的高性能模型架构Megatron是由NVIDIA推出的深度学习大规模预训练模型框架，主要针对大规模Transformer架构模型的高效训练与推理。Megatron大多用于GPT（生成式预训练模型）、BERT等Transformer模型的预训练，擅长在大规模数据集和高性能计算资源上进行训练。Megatron的主要特点1.超大模型的高效训练模型并行（ModelParalle
AIGC的底层框架和技术模块五岔路口 AIGC
AIGC（ArtificialIntelligenceGeneratedContent，人工智能生成内容）的底层框架和技术模块是构建其强大自然语言处理能力的核心组成部分。以下是对AIGC底层框架和技术模块的详细解析：底层框架AIGC的底层框架主要基于深度学习的语言模型，特别是Transformer模型及其变种，如GPT（GenerativePre-trainedTransformer）等。这些模型
Python机器学习实战：人脸识别技术的实现和挑战 AI天才研究院 AI大模型企业级应用开发实战大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python机器学习实战：人脸识别技术的实现和挑战作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：人脸识别技术,模型训练,多人识别,动态人脸检测,应用场景1.背景介绍1.1问题的由来随着科技的进步和互联网的普及，人脸识别技术因其在安全验证、生物特征识别、智能监控等多个领域的广泛应用而迅速崛起。从传统的门禁系统到现代的人脸支付、社交媒体的自动登
深度学习：基础原理与实践阿尔法星球深度学习 python 人工智能
1.深度学习概述1.1定义与发展历程深度学习是机器学习的一个分支，它基于人工神经网络的学习算法，特别是那些具有多层（深层）结构的网络。深度学习模型能够自动从原始数据中提取复杂的特征，而不需要人为设计特征提取算法。定义：深度学习可以定义为使用深层神经网络进行学习的过程，这些网络由多个非线性的变换组成，能够学习数据的多层次表示。发展历程：深度学习的起源可以追溯到1943年WarrenSturgisMc
什么是MoE？ CM莫问深度学习人工智能算法常见概念人工智能算法 python 深度学习 MoE 混合专家模型机器学习
一、概念MoE（MixtureofExperts）是一种深度学习架构，它结合了多个专家模型（Experts）和一个门控机制（GatingMechanism）来处理不同的输入数据或任务。MoE的核心思想是将复杂的任务分解为多个子任务，由不同的专家网络来处理，以此来提升整体模型的性能和效率。MOE通过集成多个专家来显著提高模型的容量和表达能力，每个专家可以专注于学习输入数据的不同方面或特征，使得整个模
【书生·浦语大模型实战营】学习笔记（三）：“茴香豆” 搭建你的RAG 智能助理 GoAI 自然语言处理NLP 深入浅出AI 深入浅出LLM 深度学习 LLM 人工智能大模型
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接【书生·
课程内容摘要生成：基于知识蒸馏与事实增强的深度学习模型实践二进制独立开发非纯粹GenAI GenAI与Python 深度学习人工智能自然语言处理 python 语言模型神经网络生成对抗网络
文章目录引言一、核心技术：知识蒸馏与事实三元组融合二、模型架构设计与优化三、Python实现与关键代码解析四、业务价值与效果分析五、挑战与优化方向引言在教育内容数字化进程中，课程内容摘要生成技术能够从海量教学资源中提炼核心知识点，解决人工编写效率低、知识更新滞后的问题。当前主流方法依赖于深度学习模型，但存在事实性偏差、可解释性不足等缺陷。本文提出一种融合知识蒸馏与事实三元组增强的摘要生成框架，结合
详解大模型微调数据集构建方法(持续更新) herosunly 大模型微调数据集构建方法
大家好，我是herosunly。985院校硕士毕业，现担任算法t研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文详细介绍了大模型微调数据集构建方法，希望能对学习大模型的同学们有所帮助。文章目录
基于深度学习的基于视觉的机器人导航 SEU-WYL 深度学习dnn 深度学习机器人人工智能
基于深度学习的视觉机器人导航是一种通过深度学习算法结合视觉感知系统（如摄像头、LiDAR等）实现机器人在复杂环境中的自主导航的技术。这种方法使机器人能够像人类一样使用视觉信息感知环境、规划路径，并避开障碍物。与传统的导航方法相比，深度学习模型能够在动态环境中表现出更强的适应能力和鲁棒性。1.视觉导航的基本概念视觉导航是指通过处理机器人的摄像头等视觉传感器采集到的图像数据，构建环境模型，进而进行路径
【深度学习】softmax回归的简洁实现熙曦Sakura 深度学习深度学习回归人工智能
softmax回归的简洁实现我们发现(通过深度学习框架的高级API能够使实现)(softmax)线性(回归变得更加容易)。同样，通过深度学习框架的高级API也能更方便地实现softmax回归模型。本节继续使用Fashion-MNIST数据集，并保持批量大小为256。importtorchfromtorchimportnnfromd2limporttorchasd2l初始化模型参数[softmax回
深度学习查漏补缺：1.梯度消失、梯度爆炸和残差块 nnerddboy 白话机器学习深度学习人工智能
一、梯度消失梯度消失的根本原因在于激活函数的性质和链式法则的计算：激活函数的导数很小：常见的激活函数（例如Sigmoid和Tanh）在输入较大或较小时，输出趋于饱和（Sigmoid的输出趋于0或1），其导数接近于0。在反向传播中，每一层的梯度都会乘以激活函数的导数。如果导数很小，乘积就会导致梯度逐渐变小。链式法则的多次相乘：假设网络有nn层，梯度从输出层传到第ii层时，会经历多次链式相乘：如果每一
从System Prompt来看Claude3、Kimi和ChatGLM4之间的差距 herosunly 大模型 system prompt gpt4 claude kimi ChatGLM4
大家好，我是herosunly。985院校硕士毕业，现担任算法t研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了从SystemPrompt来看Claude3、Kimi和ChatGLM
基于face_recognition的人脸识别 #北极星star 人脸识别人工智能 opencv 计算机视觉
目录一.简要介绍二.相关函数三.算法流程四.代码实现五.效果展示一.简要介绍face_recognition是一个基于Python的开源人脸识别库，它使用dlib库中的深度学习模型来实现人脸识别功能。这个库以其简洁的API和高效的性能而广受欢迎，成为许多开发者和研究者的首选工具。face_recognition库的主要功能包括：1.人脸检测：识别图像中所有的人脸并返回其位置信息。2.人脸编码：将检
solr 的admin.html 详细使用讲解 qq_37300675 solr
爱雨轩真正的爱情，就像花朵，开放的地方越贫瘠，越是美丽动人！目录视图摘要视图订阅征文|从高考，到程序员深度学习与TensorFlow入门一课搞定！每周荐书|Web扫描、HTML5、Python（评论送书）solr管理界面详解标签：solrsolr管理界面solrqueryanalysis2016-08-0210:425117人阅读评论(0)收藏举报本文章已收录于：分类：Solr（8）作者同类文章X
Python从0到100（八十一）：神经网络-Fashion MNIST数据集取得最高的识别准确率是Dream呀 python 神经网络开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
深度学习-笔记2 深度学习神经网络
paddlepaddle安装(使用cpu)：dockerpullregistry.baidubce.com/paddlepaddle/paddle:2.6.2查看下paddlepaddle的镜像层次和安装目录结构(没有看到dockerbuild文件，先感受一下目录结构吧)：dockerinspectregistry.baidubce.com/paddlepaddle/paddle:2.6.2|gr
多模态大模型：技术原理与实战工具和算法框架介绍 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1从单模态到多模态的必然趋势传统的深度学习模型大多是单模态的，例如只处理图像数据的卷积神经网络（CNN）或只处理文本数据的循环神经网络（RNN）。然而，现实世界的信息往往是多模态的，例如一张图片可以包含物体、场景、文字等多种信息，一段视频则包含图像、声音、字幕等多种模态的数据。为了更好地理解和处理现实世界的信息，多模态学习应运而生。近年来，随着深度学习技术的快速发展，多模态学习取得
从零开始大模型开发与微调：汉字拼音数据集处理 AGI大模型与大数据研究院大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
从零开始大模型开发与微调：汉字拼音数据集处理1.背景介绍1.1问题的由来在人工智能领域，自然语言处理（NLP）是一项基础且重要的研究方向。随着深度学习技术的飞速发展，大规模语言模型（LargeLanguageModel，LLM）在NLP领域取得了显著的成果。然而，LLM的训练与微调过程往往需要海量的文本数据，而这些数据通常以自然语言形式存在，难以直接用于模型训练。因此，如何从自然语言数据中提取结构
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他