爱喝白开水a

大模型算法岗，面试百问百答，7天3个offer拿到手！

导读

大模型时代很多企业都在开发自己的大模型，这直接刺激了大模型岗位的需求。本文为大家整理了大模型面试相关的知识点，希望对大家面试求职有所帮助。

今天分享大模型面试相关知识点，持续更新。

1. RAG技术体系的总体思路

数据预处理->分块（这一步骤很关键，有时候也决定了模型的效果）->文本向量化->query向量化->向量检索->重排->query+检索内容输入LLM->输出

2. 使用外挂知识库主要为了解决什么问题

克服遗忘问题
提升回答的准确性、权威性、时效性
解决通用模型针对一些小众领域没有涉猎的问题
提高可控性和可解释性，提高模型的可信度和安全性

3. 如何评价RAG项目效果的好坏

针对检索环节的评估：

MMR 平均倒排率：查询（或推荐请求）的排名倒数
Hits Rate 命中率：前k项中，包含正确信息的项的数目占比
NDCG

针对生成环节的评估：

非量化：完整性、正确性、相关性
量化：Rouge-L

4. 大模型的幻觉问题、复读机问题是什么

幻觉问题：即生成的内容是无意义的或不忠实于提供的源内容

复读机问题：重复生成某些话

5. 针对问题4，有没有什么解决办法

针对幻觉问题：引入外挂知识库，加入一些纠偏规则，限制输出长度等

针对复读机问题：

丰富数据集的多样性，预处理时尽量过滤重复无意义的文本
同义词替换等做数据增强
温度参数调整
后处理与过滤

6. 出现问题4的原因有哪些

针对幻觉问题：幻觉问题主要分为两大类，一类是生成结果与数据源不一致，自相矛盾。另一类是用户问题超出了大模型的认知。针对前者可能是训练数据和源数据不一致、数据没对齐或者编码器理解能力的缺陷和解码器策略错误可能导致幻觉。后者则是用户的问题不在语言模型认知范围内。

针对复读机问题：数据质量不高，存在大量单一、重复文本，文本过长（补充：当你的前面的条件文本过长时，大模型的输出的几个短文本会被原始的很长的条件文本淹没，继续预测下一个token的话，在模型看起来可能条件仍然是差不多的，此时如果使用greedy search，只选择概率最大的一个token，模型极大可能会将前面已经生成的短文本重新预测成概率最大的文本，以此类推，会一直重复下去。）

7. 当前主流的开源大模型是哪个，其架构具体是怎样的？

当前开源影响范围最广，生态建设最好的开源大模型是Meta的LLaMA。其依旧采用Transformers架构，并做了如下改动：

为了提高训练稳定性，对每个子层做输入前置归一化，归一化函数为RMSNorm（受GPT-3启发）
为了提升性能，SwiGLU激活函数替换ReLU激活函数（受PaLM启发）
从绝对位置嵌入，改为旋转嵌入（受GPT-neo启发）
使用causal multi-head attention的一个高效实现来减少内存占用和运行时间

8. 有哪几种SFT方法

全微调
Adapter Tuning
Prefix Tuning
Prompt Tuning
P-Tuning v1
lora
RLHF

（SFT时，学习率设置为预训练阶段的10%，一般会取得不错的效果）

9. 什么是lora微调

在原始 PLM (Pre-trained Language Model) 旁边增加一个旁路，做一个降维再升维的操作，来模拟所谓的 intrinsic rank。训练的时候固定 PLM 的参数，只训练降维矩阵A与升维矩阵B。而模型的输入输出维度不变，输出时将BA与PLM的参数叠加。用随机高斯分布初始化A ，用0矩阵初始化B，保证训练的开始此旁路矩阵依然是 0 矩阵。

10. RAG的检索阶段，常见的向量检索模型有哪些？

ANN算法

乘积向量
暴力搜索
hnswlib

KD树

11. 针对通用的RAG，你觉得还有哪些改进点？

query侧：做query的纠错、改写，规范化和扩展
对向量数据库做层次索引，提高检索效率和精度
对LLM模型微调，针对当前垂直领域引入知识库，提升回答的专业性、时效性和正确性
对最终输出做后处理，降低输出的不合理case

12. 什么是LangChain

LangChain为大型语言模型提供了一种全新的搭建和集成方式，通过这个强大的框架，我们可以将复杂的技术任务简化，让创意和创新更加易于实现。有点类似于神经网络开发与tensorflow/pytorch之间的关系

13. LangChain的常用模块有哪些？

document_loaders 文档加载
text_splitter 文档分块
embedding.huggingface 向量化
vectorstores 向量存储
chain.RetrievalQA 检索问答

14. SFT和RLHF优劣对比

方法	优点	缺点
SFT	1. 启动简单，仅需要问答对数据就可以进行训练；
2. 训练简单，直接对LLM进行调参，大部分情况下，训练几个epoch就可达到预期；
3. 显存资源相比于RLHF来说耗费低	1. 模型的效果非常依赖于SFT数据的质量，天花板取决于SFT数据标注的质量；
2. 对标注要求高，对一条指令来说，要标注很高质的回答其实是一件非常困难的事情，既耗时又耗力。
RLHF	1. 直接利用人类偏好来进行指导大模型的训练，使大模型的输出更能满足人们的要求；
2. 在安全性和事实性上，都能有很大的提升。	1. 训练消耗大量的显存；2. 训练的过程中很不稳定，想要成功的完成PPO的训练不是那么容易的事情；3. 除了SFT阶段的数据，还得标注Reward model的数据。在对齐人类偏好的过程中，标谁更好比较容易，但是想标谁比谁好多少，又差多少，这不是件容易的事情。be

本答案引用自文章(https://zhuanlan.zhihu.com/p/677341520)

15. 详细介绍一下RLHF

留个坑，改天详细歇一歇

16. 大模型训练经常出现一些OOM问题，在现有硬件基础下，有什么性能提升trick

梯度累积

混合精度训练
减轻模型参数
分布式训练
减少批量大小
增加硬件资源
数据处理与加载优化：例如，可以使用数据流水线技术来并行加载和处理数据，减少内存中同时存在的数据量

17. LLaMA模型输入句子理论上可以无限长吗？

不可以

受限于计算资源
训练阶段长句子会导致梯度消失或者梯度爆炸（因为它依赖前面的词进行最大似然估计作为损失函数，这个最大似然估计化简一下就是连乘的形式，容易造成梯度消失或者梯度爆炸）
推理阶段会增加预测错误率

18. 如何让大模型处理更长的文本？

分块处理，同时重叠保证连贯性
增加模型参数量，复杂化模型架构，提高对更长文本的捕捉与表达能力

19. 大模型推理时，显存中有那几部分数据？

模型参数
输入数据
计算中间结果
内存管理策略：某些深度学习框架在推理时采用了一种延迟释放显存的策略，即显存不会立即释放，而是保留一段时间以备后续使用。这种策略可以减少显存的分配和释放频率，提高推理效率，但也会导致显存一直占用的现象。

20. 介绍下ChatGLM

首先要说起它的基座 GLM， GLM 既可以做 Encoder 也可以做 Decoder。

主要通过两种mask方式来实现：

[mask]：bert形式，随机mask 文本中的短span
[gmask]：gpt 形式，mask末尾的长span

在chatglm里面做生成任务时，是用 [gmask]。chaglm2中完全采用 gmask来进行预训练。

在ChatGLM 的内部结构中的变换，从下到上依次是：

位置编码：从BERT的训练式位置编码转变为旋转位置编码
激活函数：从BERT中的 GeLU 转变为 GLU，在ChatGLM2 中又变成了SwiGLU
LayerNormalization：采用的是DeepNorm，是对post-Normalization 的改进，即在残差之后做Normalization。在ChatGLM中，把 layer-normalization 改为 RMSNormalization。

在ChatGLM 2.0 中还添加了一些其他变化：

FlashAttenion：利用显存和内存来做加速
Multi-Query Attention：多个头只采用一个 KV对，通过参数共享来降低显存占用

21. 介绍下GLU激活函数和SwiGLU激活函数

GLU 的核心思想是通过门控机制来过滤信息，进而提高网络的表达能力和泛化能力。（门控机制有助于长距离建模）

SwishGLU 的核心思想是将 Swish 和 GLU 结合起来，SwishGLU 实际上只是多乘了一个 g(x)。

22. LLaMA1/2的异同

首先从数据角度，lamma2.0为2.0T， lamma1是1.4T。其次是上下文长度， lamma1是2k，lamma2是4k。

最后从模型架构角度：

从整体上看，二者都遵循自回归 Transformer 的架构，只不过内部的细节有些不同。

位置编码：二者都采用了旋转位置编码
Normalization：二者都采用pre-normalization，只不过1.0中采用原始的 LayerNormalization，2.0中采用的是 RMSNorm
激活函数：采用SwiGLU

23. 模型在训练和推理的时候各占用显存的多少？

一般来说，训练占用模型参数量的16倍大小（优化器、梯度、模型本身）；推理占用模型参数量的2倍大小（fp16是一个单位参数大小对应两个字节，int8是一个单位参数大小对应一个字节）。

24. 详细说说Deepspeed的机制

以下内容引用自该篇文章

是一种数据并行的方法，采用的ring all reduce方式。

传统的parameter server是server和client的方式，client通过计算分配给自己的数据，产生梯度，传给server，server做聚合，然后把聚合后的参数再传给client，这个方式的弊端是server容易成为瓶颈，server通信量太大。另外可能一个client失败，会导致其他client等待。

Ring all reduce是一种分布式的方式，各个节点分配通信量。总的通信量和ps没啥变化，但是通信的压力平摊到各个GPU上了，GPU之间的通信可以并行进行。

假如，GPU数量是N，把模型参数分成N份，每个GPU要存放整个参数。每个GPU也要分配训练数据。当一次迭代，N个GPU之间要经过一个scatter和gather操作，reduce-scatter是将不同gpu上对应的参数的gradient相加，一共需要通讯（N-1）次。All-gather 是将合并完整的参数，传到其他gpu上，需要通讯（N-1）次。一次all reduce，单卡通信量为2*sita。

Zero包括3种方案，逐步递进：

zero1：将adam的参数分割成N份，这样一个GPU上只能保存一份adam参数：这对于forward没啥影响，gradient需要进行一次all-reduce，但是只能更新一部分参数，所以W需要进行一次all-gather，通信量为3Nsita，存储为 12sita/N + 4*sita

zero2: 将adamw，gradient都分割成N份，梯度就不需要all-gather了，只需要scatter了，w需要all-gather，通讯量为2N*sita

zero3: 将参数，adam 和gradient都分割，forward的时候，需要将w all-gather，backfoward时，还需要把w all-gather回来，计算梯度，丢掉不属于自己的w，然后对梯度做reduce scatter，更新w，通讯量为3N*sita。

最后采用采用stage3：用1.5倍的通讯开销，换回近120倍的显存

另外，还有ZeRO-Offload是基于Zero2，将adam和gradient放到内存中，在cpu内起了N个线程计算。其中的一条主线是gradient总是需要scatter的，感觉这个数据并行标志。这里需要注意一点不管是forward 还是backward，都是需要有完整的w的。另外有了gradient，以及adamW的参数，才能更新W。

25. 什么是混合精度训练

FP64用8个字节共64位，FP32用4个字节共32位，FP16用2个字节共16位。在神经网络模型的训练过程中，通常默认使用单精度（FP32）浮点数据类型来表示网络模型的权重和其他参数。

为什么需要混合精度训练呢？

使用FP16训练神经网络，相比使用FP32有以下优点。

内存占用减少：FP16的位宽是FP32的一半，所以权重等参数占用的内存也减少了一半，这样就可以训练更大的网络模型或者使用更多的数据。
通讯效率提高：对于分布式训练，特别是大模型训练，通讯的开销是一个性能瓶颈，通讯的位宽减少了一半，就可以加快通讯速度，减少等待时间，提高数据流通效率。
计算效率更高：在一些专门的AI加速芯片上，使用FP16的计算性能比FP32更快。

但是使用FP16也会带来一些问题，主要有两个方面：

数据溢出和
舍入误差

为了利用FP16的优势，提高深度学习训练的效率和性能，同时避免精度溢出和舍入误差的影响，可以采用FP16和FP32的混合精度训练，主要涉及到一下三个重要技术点：

权重备份（Weight Backup）
损失放大（Loss Scaling）
精度累加（Precision Accumulated）

26. 什么是prefix LLM和casual LLM

prefix LM：token可以相互看到，输入双向注意力，输出单向注意力（ChatGLM、ChatGLM2、U-PaLM）

casualLM：严格自回归，从左到右的单向注意力（LLaMA-7B、LLaMa 衍生物、Qwen）

27. 说一说针对MHA后续的一些计算优化工作

KV cache，核心思想：因为transformers是自回归，每一个token的预测包含大量前文的重复冗余计算。优化点是将需要重复利用的中间结果存下来，避免重复计算
MQA，核心思想：虽然SRAM的带宽很大，但是容量很小（A100只有大概20M），所以要进一步减少需要缓存的数据。MQA中的多头只有Q是不一样的，K、V完全相同。
GQA，核心思想：进一步减少需要缓存的数据大小，K、V分组复制，数据大小介于MQA和MHA之间。
FlashAttention，核心思想：将Q、K、V切分为更小的块，从HBM中加载到SRAM，需要计算的时候直接从SARM中读（因为目前transformers的计算效率瓶颈不在于计算速度，而是IO）

FlashAttention涉及到很多计算trick，有空单独开一篇文章来说

28. 说说attention几种常见的计算方式

self-attention
din的attention计算在得到权重之后，没有进行softmax归一化操作，而是保留了权重原始的信号强度。原始权重是通过网络最后一层激活函数得到，因此可以利用激活函数的特点，将其值限制在0-1之间，如sigmoid函数，从而使得到的原始权重值可直接用于加权求和，保留了权重的差异性。使用softmax操作虽然可以进行归一化，但同时会弱化了权重之间的差异性，有损用户兴趣的局部聚焦性。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

基于麻雀搜索算法SSA求解最优目标 pytorchCode 人工智能 python 算法 Matlab
基于麻雀搜索算法SSA求解最优目标麻雀搜索算法（SparrowSearchAlgorithm，SSA）是一种启发式优化算法，灵感来自于麻雀的群体行为。该算法模拟了麻雀在寻找食物时的搜索过程，通过合作和竞争来找到最佳解决方案。在本文中，我们将介绍如何使用SSA算法来求解最优目标，并提供相应的MATLAB源代码。首先，我们需要定义问题的目标函数。假设我们要求解的目标是最小化一个连续的优化问题。那么，我
P3197 [HNOI2008] 越狱 pi314159265a c++算法
题目传送门题面[HNOI2008]越狱题目描述监狱有nnn个房间，每个房间关押一个犯人，有mmm种宗教，每个犯人会信仰其中一种。如果相邻房间的犯人的宗教相同，就可能发生越狱，求有多少种状态可能发生越狱。答案对100,003100,003100,003取模。输入格式输入只有一行两个整数，分别代表宗教数mmm和房间数nnn。输出格式输出一行一个整数代表答案。样例#1样例输入#123样例输出#16提示样
Python中的海象运算符（:=）：让代码更简洁高效叫我DPT python python
Python中的海象运算符（:=）：让代码更简洁高效目录引言：什么是海象运算符？语法与基本用法使用场景与优势注意事项与潜在陷阱总结1.引言：什么是海象运算符？海象运算符（:=）是Python3.8版本引入的新特性，因其符号:=形似海象的眼睛和牙齿而得名。它的主要功能是在表达式中同时完成赋值和返回值操作，简化需要重复计算的场景。为什么要用它？传统写法中，若需要在条件判断或循环中使用某个表达式的值，可
洛谷 P3372：线段树 1 ← 分块算法模板（区间更新、区间查询） hnjzsyjyj 信息学竞赛 #分治算法与双指针分块
【题目来源】https://www.luogu.com.cn/problem/P3372【题目描述】如题，已知一个数列，你需要进行下面两种操作：（1）将某区间每一个数加上k。（2）求出某区间每一个数的和。【输入格式】第一行包含两个整数n,m，分别表示该数列数字的个数和操作的总个数。第二行包含n个用空格分隔的整数，其中第i个数字表示数列第i项的初始值。接下来m行每行包含3或4个整数，表示一个操作，具
分块算法详解 justin666888 C++数据结构 C++算法数据结构关键字数据结构算法
分块算法详解一.啥是分块二.分块的操作1.分组2.区间加法&单点查询3.区间加法&询问区间内小于某个值x的元素个数4.区间求和&区间加法5.区间开方&区间求和6.单点插入&单点询问7.区间加法&区间前驱8.区间乘法&区间加法&单点询问9.区间某值个数&区间赋值10.区间众数三.分块算法时间复杂度分析1.时间复杂度2.万恶的卡常四.分块算法与线段树对比五.例题一.啥是分块分块，顾名思义，就是把一个东
GNU编译优化级别-O -O1 -O2 -O3 hemmingway C++Linux
最近做一个算法的GPU加速，发现实际上使用gcc的-O3(最高级编译优化)选项，可以获得很高的加速比，我的程序里达到了3倍的样子，有时效果甚至比GPU加速好。因此小小学习了下GNU的编译优化。附言一句，在进行调试的时候，最好关闭编译优化，不然程序自动优化，执行的步骤可能稍有变化。GNU编译器提供-O选项供程序优化使用:-O提供基础级别的优化-O2提供更加高级的代码优化,会占用更长的编译时间-O3提
「DeepSeek接班OpenAI」，最新开源的R1推理模型，让AI圈爆了人工智能学家人工智能
来源：前沿科技分享圈近日，AI领域迎来了一次重大突破，DeepSeek正式推出了其最新研发的开源推理模型——DeepSeek-R1。这一模型在数学、代码和自然语言推理等关键任务上的表现，已经能够与OpenAI的o1正式版相媲美，引发了AI研究者和从业者的广泛关注。多阶段训练：创新的模型架构DeepSeek-R1的训练方式采用了多阶段循环的策略，具体包括基础训练、强化学习（RL）、微调等多个阶段。这
DeepSeek R1：AI领域的新标杆 XianxinMao 人工智能
标题：DeepSeekR1：AI领域的新标杆文章信息摘要：DeepSeek的R1模型在性能上与OpenAI的o1模型相当，甚至在某些方面更具优势，尤其在成本控制上表现出色。R1模型通过开源策略展示了其在AI领域的开放态度，推动了技术的广泛发展。此外，R1-Zero模型通过强化学习和测试时计算实现了强大的推理能力，无需监督微调数据，标志着中国在AI领域的快速崛起，挑战美国的主导地位。AI模型在推理能
38字以上的标题：OTFS仿真 MIMO-OTFS MP检测算法：详细注释、ZF均衡、低复杂度LU分解和误差纠正MMSE均衡检测：OMP及基本信道估计、MRC检测，结合索引调制IM、空间调制SM、正交 PGCUZcQeR 网络 matlab 人工智能
OTFS仿真MIMO-OTFSMP检测算法（详细注释），ZF均衡，低复杂度lu分解和误差纠正mmse均衡检测omp及基本信道估计，MRC检测，结合索引调制IM，空间调制SM，正交空间调制，SM-OFDM，多天线MIMO，AF，DF中继，理想脉冲/矩形脉冲，TDTF域DD域信道以及最新OTSM调制OFDM和OTFS性能对比。代码均可出，均可正常运行。适合本科B设及研究生学习。ID:971873550
（动态规划基础打家劫舍）leetcode 198 维齐洛波奇特利(male) leetcode 算法深度优先
已知h2和h1，用已知推出未知推是求答案，回溯是给答案这里图片给出dfs暴力，再进行记录答案完成记忆化搜索，再转为dp数组#include#include#include//nums:2,1,1,2//dp:2,2,3,4usingnamespacestd;//dp[i]=max(nums[i]+dp[i-2],dp[i-1]);//nums[i]+dp[i-2]抢这家店//dp[i-1]不抢这家
C语言小练习-打印字母倒三角 don't_be_bald C语言练习 c语言算法数据结构
编写一个程序，在用户输入某个大写字母后，产生一个金字塔图案。#includeintmain(intargc,char*argv[]){charch;loop:printf("请输入大写字母！\n");scanf("%c",&ch);getchar();if(ch'Z'){gotoloop;}intlen=ch-'A'+1;inti,j;for(i=1;i=0;j--){printf("%c",'A
软考-软件设计师(8)-系统开发与软件工程:UML、网络计划技术、软件过程模型、系统开发方法论、设计模式、敏捷开发、软件测试、软件质量保证、项目管理、开发工具、环路复杂性、数据库设计等高频考点霸道流氓气质软考软件工程设计模式软考软件设计师
场景软考-软件设计师-系统开发与软件工程模块高频考点整理。以下为高频考点、知识点汇总。软件设计师上午选择题知识点、高频考点、口诀记忆技巧、经典题型汇总：软考-软件设计师(1)-计算机基础知识点:进制转换、数据编码、内存编址、串并联可靠性、海明校验码、吞吐率、多媒体等：软考-软件设计师(1)-计算机基础知识点:进制转换、数据编码、内存编址、串并联可靠性、海明校验码、吞吐率、多媒体等-CSDN博客软考
【SpringMVC】——Json数据交互处理 Y小夜 ssm框架 json
个人主页：【Y小夜】作者简介：一位双非学校的大二学生，编程爱好者，专注于基础和实战分享，欢迎私信咨询！入门专栏：【MySQL，Java基础，Rust】热门专栏：【Python，Javaweb，Vue框架】感谢您的点赞、关注、评论、收藏、是对我最大的认可和支持！❤️目录Json概述Json构成要素JSON与JavaScript的关系JSON的优点JSON的应用JSON工具的使用返回json字符串统一
(动态规划路径基础最小路径和)leetcode 64 维齐洛波奇特利(male) 动态规划 leetcode 算法
视频教程1.初始化dp数组，初始化边界2、从[1行到n-1行][1列到m-1列]依次赋值#include#include#includeusingnamespacestd;intmain(){vector>grid={{1,3,1},{1,5,1},{4,2,1}};vector>dp(grid.size(),vector(grid[0].size(),0));dp[0][0]=grid[0][0
【python】字典介绍 Yui_ python python 数据库开发语言学习笔记编程
文章目录1.函数2.列表与元组3.字典3.1创建字典3.2查找key3.3新增修改元素3.4删除元素3.5遍历字典元素3.6取出所有key和value3.7合法的key类型1.函数函数2.列表与元组列表与元组3.字典字典是一种存储键值对的结构。和生活中的字典一样，当你查一个英语的意思时：apple就对应着苹果。它们就是一个键值对，其中apple就是key，而苹果就是value。这些键（key）和值
《Semantic communications - Principles and challenges》语义通信文献阅读与分析总结 snow每天都要好好学习深度学习深度学习
《语义通信：原理与挑战》文献详细总结1.语义通信的概念语义通信是一种超越传统香农通信范式的全新通信模式，它关注的是信息意义的传递，而不仅仅是数据本身的准确传输。传统通信强调比特级别的准确性，而语义通信更强调信息对接收方执行特定任务的有效性。这种模式被认为是第六代（6G）无线网络的核心技术之一，能够支持包括智能交通、智能监控、视频会议、增强现实（AR）和虚拟现实（VR）在内的多种智能应用。在语义通信
verilog中+：和-：用法 snow每天都要好好学习 Verilog fpga开发
verilog中的+：和-:用法在Verilog中，+:和-:是用于部分选择的操作符，它们通常用来选择一个向量中的一部分，或者进行位的切片操作。+:用于从指定起始位向右选取一定数量的位。-:用于从指定起始位向左选取一定数量的位。+:操作符+:表示从某个位开始，向右延伸一定数量的位。这是对向量的一种正向选择。语法如下：vector[start_bit+:size]start_bit是选择的起始位。s
C++：vector容器是否包含给定元素 Prejudices 编程 c++开发语言
vector容器是否包含给定元素C++中检查vector是否包含给定元素的几种方式std::count最简单的方式是对vector中的指定元素进行计数，如果count不为零，表示该元素存在#include#include#includeintmain(){std::vectorv={1,20,2,6,3,7};intkey=6;if(std::count(v.begin(),v.end(),key
为什么在 C++ 中使用 `const std::string&` 遍历 `std::vector`？临街的小孩 c++开发语言
在C++中，我们经常需要遍历容器（如std::vector、std::list等）来访问其中的元素。特别是当容器存储的是复杂对象（如std::string）时，遍历的方式会直接影响到程序的性能和内存开销。本文将深入探讨为什么在遍历std::vector时，使用conststd::string&作为循环变量比使用值传递更优，尤其是在涉及到性能优化时。遍历容器的常见方式在C++中，常用的遍历std::
算法题（51）：删除链表的倒数第N个节点被AI抢饭碗的人算法题算法链表数据结构
审题：需要我们找到倒数第n个节点，并把他从链表中删除，然后把新的链表的头结点返回思路：该题的唯一难点就是如何找到单链表的倒数第n个节点方法一：直接法我们可以遍历一次单链表，然后把链表的总长度求出来，用总长度减去n可以得到要删除的节点的索引，然后从头再遍历一次就可以找到该节点。不过为了将该节点从链表中删除，我们需要找到的其实是他的前一个节点，然后把前一个节点和他的后一个节点连起来。方法二：栈因为栈具
【第八天】零基础入门刷题Python-算法篇-数据结构与算法的介绍-一种常见的回溯算法（持续更新） Long_poem python 算法开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Python数据结构与算法的详细介绍1.Python中的常用的回溯算法2.回溯算法3.详细的回溯算法1）一种常见的回溯算法总结前言提示：这里可以添加本文要记录的大概内容：第一天Python数据结构与算法的详细介绍第二天五种常见的排序算法第三天两种常见的搜索算法第四天两种常见的递归算法第五天一种常见的动态规划算法第六天一
深入浅出：Python `with` 语句详解软件架构师笔记 python python 网络服务器
深入浅出：Pythonwith语句详解1.什么是with语句？with语句是Python中用于简化资源管理的语法糖。它确保在进入代码块时自动获取资源，并在退出代码块时自动释放资源。常见的资源包括文件、网络连接、数据库连接等。with语句的核心思想是“上下文管理”，即在一定范围内自动处理资源的获取和释放，避免了手动管理资源带来的复杂性和潜在错误。1.1上下文管理器with语句依赖于上下文管理器（Co
【Python TensorFlow】入门到精通极客代码玩转Python python tensorflow 开发语言人工智能深度学习
TensorFlow是一个开源的机器学习框架，由Google开发，广泛应用于机器学习和深度学习领域。本篇将详细介绍TensorFlow的基础知识，并通过一系列示例来帮助读者从入门到精通TensorFlow的使用。1.TensorFlow简介1.1什么是TensorFlow？TensorFlow是一个开源的软件库，主要用于数值计算，特别是在机器学习和深度学习领域。它提供了一个灵活的架构来定义复杂的数
【学习心得】Python好库推荐——PEFT 小oo呆【学习心得】人工智能 python 语言模型
一、PEFT是什么？PEFT（Parameter-EfficientFine-Tuning）是一种在深度学习中进行参数高效微调的技术。这种技术主要应用于大型预训练模型的微调过程中，目的是在保持模型性能的同时减少所需的计算资源和时间。通过PEFT，可以有效地调整模型以适应特定任务或数据集，而无需对整个模型的所有参数进行全面微调。二、PEFT使用场景在计算资源有限的情况下，如边缘设备、移动设备或低成本
【第六天】零基础入门刷题Python-算法篇-数据结构与算法的介绍-一种常见的贪心算法（持续更新） Long_poem 算法 python 贪心算法
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Python数据结构与算法的详细介绍1.Python中的常用的贪心算法2.贪心算法3.详细的贪心代码1）一种常见的贪心算法总结前言提示：这里可以添加本文要记录的大概内容：第一天Python数据结构与算法的详细介绍第二天五种常见的排序算法第三天两种常见的搜索算法第四天两种常见的递归算法第五天一种常见的动态规划算法第六天一
mac 怎么查看CPU核数 serve the people 日常琐问 macos
在macOS系统中，可以通过以下几种方法查看CPU核心数：1.使用“关于本机”查看点击左上角的苹果图标（）。选择“关于本机”。在弹出的窗口中，系统会显示Mac的基本信息，包括CPU的类型和核心数。比如“2.6GHz6核IntelCorei7”。2.通过“系统报告”查看打开“关于本机”窗口。点击窗口下方的“系统报告”按钮。在“硬件概览”中，找到“总线速度”和“内存”旁边的“处理器名称”和“核心数”
Elementui 中el-form表单中的ref是干嘛用的 serve the people 日常琐问 elementui vue.js javascript
在ElementUI的el-form组件中，ref是用来获取对该表单组件的引用的属性。通过给el-form添加ref属性，你可以在Vue组件中通过引用来访问和操作这个表单组件，而不需要通过DOM查询或其他方式。使用ref属性可以在Vue组件的JavaScript部分直接访问el-form的实例，从而可以进行一系列操作，如表单验证、重置、获取表单数据等。以下是一个使用ref属性的示例：提交重置exp
计算机系统大作业——程序人生 wdsjlinlin p2p ubuntu
计算机系统大作业题目程序人生-Hello’sP2P专业计算学部学号120L020925班级2003001学生林泽天指导教师史先俊计算机科学与技术学院2022年5月摘要本文通过对hello.c文件的逐步分析，包括预处理，编译，汇编，链接等等操作，来追踪从.c文件变为可执行程序文件的过程，并运行此文件，观察在进程中的相关状态，分析其对于异常和信号的处理，最后结束可执行文件，结束程序hello.c的一生
深度学习训练模型损失Loss为NaN或者无穷大（INF）原因及解决办法余弦的倒数学习笔记机器学习深度学习 pytorch 深度学习人工智能机器学习
文章目录一、可能原因==1.学习率过高====2.batchsize过大==3.梯度爆炸4.损失函数不稳定5.数据预处理问题6.数据标签与输入不匹配7.模型初始化问题8.优化器设置问题9.数值问题==10.模型结构设计缺陷==二、调试步骤三、常见预防措施一、可能原因1.学习率过高原因：学习率过高可能导致梯度爆炸，权重更新幅度过大，导致模型参数变为无穷大或NaN。学习率设置过大是常见问题，它会让参数
Python中的heapq介绍余弦的倒数 Python 学习笔记 python 开发语言
heapq是Python标准库中的一个模块，专门用于处理堆数据结构，它提供了一些非常便捷的函数来操作最小堆（元素按照从小到大的顺序排列，堆顶元素最小），以下是详细介绍：1.主要函数heapify(iterable)：功能：将一个可迭代对象就地转化为堆结构。这个操作的时间复杂度是O(n)O(n)O(n)，其中nnn是可迭代对象的元素个数。示例：importheapqmy_list=[3,1,4,1,
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在