xueyedie1234

【DirectX11】第二篇 DirectX11渲染管线(2016.05.09更新)

本系列文章主要翻译和参考自《Real-Time 3D Rendering with DirectX and HLSL》一书（感谢原书作者），同时会加上一点个人理解和拓展，文章中如有错误，欢迎指正。
这里是书中的代码和资源。

DirectX11 渲染管线

一般计算机中共有两个处理器是你可能会对其进行编程的，一个是central processing unit(CPU)，一个是GPU。这两个组件有着截然不同的硬件结构和指令集。在图形编程领域，你编写的软件可能两方面都要涉及，对于CPU，你可能会使用到例如C++这样的编程语言，而对于GPU则需要使用诸如HLSL这样的语言。大部分关于图形编程的文章要么集中于CPU方面要么是GPU方面，这些内容其实都是有紧密联系的。在本书中，你将可以同时了解到两方面的内容。
DirectX当中的DirectX 3D API是本书着重关注的部分。Direct3D是用来绘制3D图形的系统接口，他还定义了怎样将实时图形渲染到屏幕的一系列步骤。这些步骤就被称之为DirectX3D图形渲染管线（详见图1.1）。在这张图中，单向箭头标识了数据是怎样从一个阶段传输到下一个，双向箭头则标识了资源和哪些渲染阶段间可以进行数据读写。那些可以用HLSL编程的模块已经用椭圆形标识出来。接下来的内容将会详细介绍渲染管线中的各个模块。

一、输入装配阶段：The Input-Assembler Stage(IA)

输入装配阶段是渲染管线的入口，也是第一个阶段，在这个阶段里你需要提供待渲染对象的顶点和索引数据。输入装配阶段将这些数据“装配”成基本类型数据（例如：点列表，线条带，三角列表）并根据需要将数据输出给顶点着色渲染阶段。

（1）Vertex Buffers顶点缓存

一个顶点至少包含了在3D空间中的一个位置。之所以说至少是因为顶点还可以包含颜色信息，法线信息（用于计算光照），纹理坐标信息等等。所有这些数据都可以在输入装配阶段进行顶点缓存。Direct3D中定义的这些顶点信息完全可以由程序员进行操作。你可以定义顶点所要包含的信息并通过input-layout对象定义顶点缓存数据如何流入IA阶段。之后的文章（原书Part III,Rendering with DirectX）中将会介绍如何定义顶点缓存以及input layout对象，现在只是大概的介绍一下这些术语。
两个顶点代表线段的两个端点，三个顶点可以代表一个三角形（如图1.2）。

（2）Index Buffers索引缓存

索引缓存是第二种在输入装配阶段推荐的输入类型。索引缓存的定义关联了顶点缓存中的某些顶点，可以用来减少需要多次使用到的顶点的重复。想象以下场景：你需要渲染一个矩形（或宽泛的说，四边形）。这个四边形至少需要定义四个顶点。但是Direct3D并不支持将四边形作为基础类型（因为根本没有必要专门定义一个四边形，所有的四边形都可以拆分成三角形）。为了渲染这个四边形，你需要将其拆分成两个由三个顶点构成的三角形（如图1.3）。所以，现在你需要总共六个顶点信息，而不是四个，其中必然有两个顶点信息是重复的。但如果定义了索引缓存，你就可以通过定义四个顶点信息和六个与顶点缓存相关的索引信息来完成渲染。

现在，你可能会思考一个问题，“我怎么通过增加索引缓存来减少我所使用的整体数据大小呢？”那么我们需要再考虑两种情况，通过结合上面提到的四边形进行具体数据分析：

第一种情况

你的顶点数据只包含3D位置信息(x,y,z)，每个轴向需要一个32-bit来保存这个浮点数（每个轴向为4byte）,那么每个顶点需要12byte。所以在不包含索引缓存的情况下这个四边形只需要72字节保存（6 vertices * 12 bytes/vertex）。如果加上索引缓存，你的顶点缓存需要的空间是48byte（4 vertices * 12 bytes/vertex）。以16bit的int类型数据来保存索引，则你需要额外12bytes（6 indices * 2 bytes/index = 12 byte）。这时，总共需要60byte来存储这个四边形。这么看的话好像也没节省很多空间。
第二种情况

当你的模型中不仅包含位置信息，还可能包含16byte的颜色信息，12byte的法线信息以及8byte的纹理坐标信息。那么每个顶点将需要多花费36byte的空间。或许当模型不是太大的时候并不会有很多影响，但如果模型具有成千上万的点时你会发现多出来的空间占用是相当可观的。还有，你不仅需要考虑空间占用的大小，还有当CPU和GPU之间进行数据传输时，是需要通过图形总线（例如PCI Express）来传输的，这种总线的传输速度通常非常慢（相比于CPU向RAM传输，以及GPU向VRAM传输），所以如何减少数据对你来说将会是至关重要的。

（3）Primitive Types基本类型

当你向IA阶段提供顶点缓存数据时，你也必须定义这些顶点的拓扑结构，这决定了渲染管线将如何解释执行这些顶点。DirectX3D提供了以下几种基本类型（如图1.4和1.5）：
- Point list 点列表：一系列单独渲染毫无关联的点
- Line list 线列表：一系列成对关联的点，这些一对一对的点之间是没有关联的
- Line strip 线条带：一系列成对关联的点，但每对点的末点会和下一对点的起点有关联
- Triangle list 三角列表：是我们最常见的拓扑结构，在三角列表中每三个顶点组成一个独立的三角形。三角形之间公用的点将会重复出现（除非定义了索引缓存）。
- Triangle strip 三角条带：每三个顶点构成一个三角形，公用的顶点将不会重复，所以顶点间会密切的连在一起。

（4）Primitive with Adjacency邻接基元

从DirectX10开始，Direct3D已经加入了包含邻接数据的基本数据。对于邻接基元来说，你不只要定义基本数据，还需要定义围绕在这个基元周围的数据。（如图1.6）这是用来做几何着色器的，这里每个特定的集合着色程序需要访问邻接三角形。临界三角形需要和原始三角形一起被提交给顶点/索引缓冲区，并且用D3D11_PRIMITIVE_TOPOLOGY_TRIANGLELIST_ADJ这个拓扑结构。注意到邻接三角形只是被用来作为几何着色器的输入，并不会被画出来。如果没有几何着色器，邻接三角形也还是不会被画出来。

（5）Control Point Patch Lists控制点片

控制点片作为一个拓扑结构提供给细分曲面阶段使用。相关内容将会在原书的第二十一章”Chapter 21, Geometry and Tessellation Shaders”中介绍。

参考文章：关于输入装配阶段的详细内容和具体实现请参考[这篇文章](http://www.aiseminar.com/bbs/home.php?mod=space&uid=3&do=blog&id=2622)

二、顶点着色阶段：The Vertex Shader Stage(VS)

顶点着色阶段主要处理从IA阶段输出的原始数据。这个阶段会对每个顶点做单独的处理。是渲染管线中第一个可编程的阶段。实际上，不论什么时候都需要程序员或软件提供一个顶点着色器给这个阶段使用。那么到底什么是着色器？
着色器是一段简短的程序或者方法，你所写的东西会直接在GPU上运行。顶点着色器会通过渲染管线在每个顶点上执行一次，在执行完一系列指令之后再输出到下一个阶段。如前一篇文章所提到的，输入到顶点着色器的数据至少应该包含顶点位置。一般情况下，顶点着色器将顶点数据做某种形式的转换之后再输出成一系列新的数据。下图是一个最简单的顶点着色器：

三、细分曲面阶段：Tessellation Stage

这是DirectX11新加入的特性，硬件细分曲面是在GPU上直接对模型增加细节的过程。一般来说，更多的几何细节（如更多的顶点）将会带来更好的渲染效果。如图1.7所示：

上图展现了同一个模型使用低中高细节展示的效果。LOD模型一般是由艺术家或模型师创建出来并根据距离摄像机的大小来选择要使用哪种细节的模型。

注意：如果距离摄像机视野较远，即使是高细节的顶点数的模型也会有很多细节遗失。所以我们需要根据距离摄像机的远近来选择具体使用的模型——离摄像机距离越远，细节越低。模型细节越少，顶点着色器需要处理的数据就越少，渲染效率越高。

传统的LOD系统中，你需要将你的模型修改成不同的LOD细节模型。硬件细分曲面技术使你能够将一个模型动态的细分并且不耗费额外的多边形数据传输到IA阶段。这样就可以实现动态LOD系统并且使得数据传输总线的占用率更低。DirectX11中，以下三个阶段都依赖细分曲面技术：

The hull shader stage(HS)外壳着色器阶段
The tessellator stage
The domain shader stage(DS)域着色器阶段

HS和DS阶段都是可编程的，但细分阶段则不可以。详细内容将会在原书的21章节介绍。更多内容了解可参见百科。

四、几何着色阶段：The Geometry Shader Stage(GS)

不像顶点着色器是基于每个单独的顶点进行运算，几何着色器是基于完整的基本数据来运算（如点，线，三角面）。并且，几何着色器有能力去增加或减少渲染管线中的几何数据。这个特性可以用来实现一些很有意思的效果。例如：你可以实现一个粒子系统，这个粒子系统中的每一个顶点代表一个粒子。在几何着色器中，你可以围绕中心点创建很多四边形，并为这些四边形映射纹理。一个很有名的例子是point sprites（点精灵）。
与几何着色阶段相关的是stream-output stage(SO)输出流阶段。这个阶段将会把几何着色阶段输出的数据存储在内存中。在多通道渲染中，这里的数据可以读回渲染管线在后面的通道中渲染，也可以提供给CPU读取。如细分曲面阶段一样，这个阶段同样也是可选的。原书的第五部分”Part IV, Intermediate-Level Renderring Topics”中会详细介绍这一部分。

五、光栅化阶段：The Rasterizer Stage(RS)

在之前所提到的渲染管线中，我们已经讨论了顶点数据以及如何将顶点数据转化成基本数据。光栅化阶段会将这些基本数据转化成光栅化图像，或者说位图。光栅化图像使用二维数组保存并且显示在电脑屏幕上。
光栅化阶段决定了哪些像素将会被渲染到屏幕上并且传递到像素着色器中。在光栅化阶段，会将基本数据以每个顶点进行插值计算。例如，一个三角面片有三个顶点，每个至少包含了一些位置信息，或者还包含了例如颜色，发现，纹理坐标之类的信息。光栅阶段将顶点之间的那些像素插入中间值。图1.8展示了顶点颜色插值的概念。该图中，三个点分别被赋予红色，绿色和蓝色。注意像素在三角形的三个顶点间颜色是如何渐变的。

六、像素着色阶段：The Pixel Shader Stage(PS)

从技术角度来说，你需要为像素着色阶段提供像素着色器。这个阶段将会为每个从光栅化阶段输出的像素执行你的着色器。这使得程序员能够控制每个即将输出到屏幕的像素点。像素着色器使用已插值的顶点数据，全局变量和纹理数据进行处理后输出。如下展示了一段将每个像素输出成红色的着色器。

七、输出混合阶段：The Output-Merger Stage(OM)

输出混合阶段会产生最终需要被渲染的像素。这个阶段是不可编程的（意味着你不能为这个阶段编写shader），但是你可以定义这个阶段在用户自定义管线状态时的表现。OM阶段会通过合并状态，像素着色器阶段的输出以及渲染目标仍然存在的内容来产生最终项目。这意味着，通过一些有趣的特效，可以产生透明物体的额颜色混合。相关内容在原书的第八章”Chapter 8, Gleaming the Cube”章节会详细介绍。
OM阶段同时也会通过深度测试（depth testing）和模板测试（stencil testing）来决定哪个像素可以被最终渲染。
深度测试使用之前已经被写入渲染目标的数据来决定哪个像素需要被绘制。如图1.9所示，几个物体排成一排，一个比一个更接近摄像机，他们都存在于同一个屏幕空间中。前面的物体可能完整或者一部分遮挡了后面的物体。深度测试利用物体和相机中每个像素的距离来决定渲染目标。通常，如果已经在渲染目标中的像素比正在被考虑是否要渲染的像素离摄像机的距离更近，则新的这个像素点将被抛弃。
模板测试使用蒙版来决定每个像素是否要被更新。这个概念类似于呈现一个具有物理表面特性的纸箱或塑料制品。详细内容会在原书的第三部分”Part III, Rendering with DirectX.”中介绍。

注意：光栅化阶段同样可以决定哪些像素将会被渲染到屏幕中，光栅化阶段中的这个过程称为裁剪（clip）。任何被光栅化阶段认定为不在屏幕中的像素都会被直接裁剪，不会再传送到渲染管线后面的流程中进行处理。

「 DelegateUI 」Ant-d 风格的 Qt Qml UI 套件梦起丶 Qt DelegateUI Qt Quick（Qml）开发之旅 qt ant-d qml ui-kit ui
写在前面：关于为什么要写一套新的UI框架一方面，QtQml生态中缺乏一套既遵循现代设计规范(自带的功能少且丑,懂得都懂)，又能深度整合Qt生态的开源组件库。另一方面，QtQml中也有一些其他方案，例如FluentUIQml，然鹅这个库老版直接不维护(新版不开源且Qt6.8+官方已经实现WinUI3风格组件)。因此，我决定自己写一套，但需要遵循一套现代UI设计规范，然后个人比较喜欢Ant-d的样式和
HTML5拼图游戏开发经验分享木木黄木木 html5 前端 html
HTML5拼图游戏开发经验分享这里写目录标题HTML5拼图游戏开发经验分享前言项目架构1.文件结构2.核心功能模块技术要点解析1.响应式布局2.图片处理3.拖拽交互4.动画效果性能优化开发心得项目亮点总结源码分享写在最后前言在Web前端开发领域，通过实战项目来提升编程技能是最有效的学习方式之一。今天我要分享一个HTML5拼图游戏的开发经验，这个项目涵盖了现代前端开发的多个重要概念，包括响应式设计、
从理论到实践：零拷贝技术的全面解读超越不平凡 Java基础 Java 零拷贝
目录一、I/O工作方式1.1DMA二、零拷贝2.1传统数据拷贝2.2Java应用数据处理2.3.零拷贝流程三、零拷贝案例四、总结一、I/O工作方式磁盘可以说是计算机系统中最慢的硬件之一，读写速度相差内存10倍以上，所以针对磁盘的优化技术非常多。下面以文件传输为切入线分析I/O的工作方式。在没有DMA技术前，I/O是这样工作的，如下图：用户发起read调用，CPU将对应的指令给磁盘控制器，然后返回；
芯片时钟树结构（H-tree,Fishbone,FlexH,Mesh等）的对比、应用实例及未来趋势赛卡人工智能服务器云计算边缘计算
引言在先进制程芯片设计中，时钟树综合（ClockTreeSynthesis,CTS）的优化程度直接影响芯片的时序收敛、功耗分布和面积利用率。随着工艺节点演进至5nm及以下，时钟网络的复杂性和设计约束呈现指数级增长。本文将深入解析H-tree、Fishbone、FlexHtree及Clockmesh四种主流时钟树结构的技术特性，结合服务器芯片、GPU及AI芯片的实战案例，并探讨主流EDA工具对CTS
高安全可靠CAN FD芯片ASM1042的技术特性与应用前景国科安芯产品单片机嵌入式硬件架构 fpga开发
1.ASM1042简介ASM1042是国科安芯推出的一款高性能CANFD（CANwithFlexibleData-Rate）收发器芯片，专为高可靠性场景设计。该芯片基于ISO11898-2:2016和ISO11898-5:2007物理层标准开发，支持最高5Mbps的数据传输速率，适用于汽车、航天、军工及工业控制等领域。其核心特性包括：高耐压设计：总线保护电压最高达±70V（H型号），共模输入电压范
Unity中WolrdSpace下的UI展示在上层程序员也有头发 Unity开发 unity ui 游戏引擎
一、问题描述Unity中Canvas使用WorldSpace布局的UI，想让它不被3d物体遮挡，始终显示在上层。二、解决方案使用shader解决在UI的材质中禁用深度测试（ZTest），强制UI始终渲染在最上层。Shader"Custom/UI_NoDepthTest"{Properties{...}SubShader{Tags{"Queue"="Transparent+1000"//设置高优先级
30个节点的Doris集群，每个节点有2块7TB的SSD盘，12块8TB的机械盘，分区和分桶的最佳实践 fzip Doris Doris分区分桶
针对30个节点（每个节点配备2块7TBNVMe盘+12块8TBSATA盘）的Doris集群，以下是分区与分桶的最佳实践方案：一、硬件资源规划与存储优化存储介质分层•NVMe盘：用于存储热数据分区（如最近3天数据）、元数据和高频查询表，利用其高IOPS特性提升实时查询性能。•SATA盘：存储冷数据分区（如历史数据）、大宽表和批量导入的中间数据，通过成本优势支撑海量存储。磁盘负载均衡•每个节点的14块
AI大模型推理加速：技术与实践详解 AI大模型学习者人工智能
近年来，AI大模型在自然语言处理、计算机视觉等领域取得了突破性进展。然而，大模型的推理速度却成为其落地应用的瓶颈。本文将详细探讨AI大模型推理加速的技术手段和实践经验，并结合具体案例进行分析。一、挑战与机遇1.1挑战庞大的参数量:大模型通常拥有数十亿甚至数千亿个参数，例如GPT-3拥有1750亿个参数。如此庞大的参数量导致模型文件体积巨大，加载和推理都需要消耗大量的内存和计算资源。复杂的计算图:大
python flask sqlalchemy JSON 数据查询 Purple_Grape207 python flask python
classUser(db.Model):id=db.Column(db.Integer,primary_key=True)username=db.Column(db.String(80),unique=True,nullable=False)email=db.Column(db.String(120),unique=True,nullable=False)userInfos=db.Column(d
亚马逊测评自养号IP重要性全哥聊跨境 zcwz-008 服务器网络运维
大家好我是测评全哥，今天我给大家讲一下做亚马逊测评项目需要用到的防关联、防封号环境的一些底层技术原理。这里讲的内容我相信很少有人能掌握，都是一些比较难的IP技术。如果你现在准备开始做测评是在了解阶段还是已经在做测评工作室了。这里给大家讲的内容可以马上看一下，你们的环境是不是100%的安全，是不是容易出现莫名被封号或者被砍单的现象，如果做不到，那尽早的放弃吧，即使你花了1万块钱买的设备，也不要觉得可
大模型高效优化技术全景解析：微调、量化、剪枝、梯度裁剪与蒸馏时光旅人01号人工智能剪枝算法深度学习数据挖掘人工智能
目录微调（Fine-tuning）量化（Quantization）剪枝（Pruning）梯度裁剪（GradientClipping）知识蒸馏（KnowledgeDistillation）技术对比与协同策略总结与趋势1.微调（Fine-tuning）核心思想在预训练模型（如BERT、GPT）基础上，通过领域数据调整参数，适配下游任务。方法流程预训练模型加载：加载通用模型权重（如HuggingFace
推理大模型：技术解析与未来趋势全景时光旅人01号深度学习人工智能 python pytorch 神经网络
1.推理大模型的定义推理大模型（ReasoningLLMs）是专门针对复杂多步推理任务优化的大型语言模型，具备以下核心特性：输出形式创新展示完整逻辑链条（如公式推导、多阶段分析）任务类型聚焦擅长数学证明、编程挑战、多模态谜题等深度逻辑任务训练方法升级融合强化学习、思维链（CoT）、测试时计算扩展等技术2.主流推理大模型图谱2.1国际前沿模型OpenAIo1系列内部生成"思维链"机制数学/代码能力标
做亚马逊、temu、速卖通、希音自养号采购砍单率过高需要怎么解决刘哥测评技术zcwz626 经验分享网络协议网络安全服务器
做无货源模式的卖家越来越多，自养买家号采购时遭遇大砍单是一个普遍而棘手的问题。为了避免这一问题，需要从技术环境搭建、账号权重养成以及下单技巧等多个方面进行系统化操作。以下是一些具体的建议和策略：一、技术环境搭建：确保账号独立性1.硬件隔离：使用独立设备或采用云服务器等隔离技术，确保每个账号拥有唯一的硬件标识，如IMEI、MAC地址等。在同一设备上登录多个账号要确保每个账号都是独立的环境，以防止硬件
同花顺软件中的哪些功能可以帮助投资者更好地分析市场？股票量化量化投资量化交易程序化交易量化交易 python 量化炒股券商接口 QMT 量化投资 PTrade
推荐阅读：《【最全攻略】券商交易接口API申请：从数据获取到下单执行》同花顺软件中的哪些功能可以帮助投资者更好地分析市场？在股票市场中，投资者需要借助各种工具和功能来分析市场趋势、评估股票价值和制定投资策略。同花顺软件作为中国领先的金融信息服务提供商之一，提供了丰富的功能来帮助投资者更好地分析市场。本文将详细介绍同花顺软件中的一些核心功能，以及如何利用这些功能来提高投资决策的质量。1.实时行情查看
线路板打样中的PCB拼版技术如何为中小企业节省30%以上成本？捷配科技制造 pcb工艺捷配
线路板打样和批量生产的成本控制对中小企业来说非常关键，本文将解析PCB拼版的五大核心价值，揭示中小企业在SMT贴片环节的降本秘诀。一、破解线路板打样的成本困局中小企业在小批量生产时常面临两难选择：单独加工导致设备利用率低下，而传统拼版方案又存在设计缺陷。二、PCB拼版技术的五大降本优势1.设备利用效率倍增通过二合一或四合一拼版设计，SMT产线单次印刷可完成多板加工。实测数据显示，采用V-CUT拼版
验证码识别：使用OCR技术识别图形验证码详解数据知道 2025年爬虫和逆向教程 ocr python 爬虫 OCR识别验证码识别图片验证码
文章目录一、基本原理二、所需工具2.1Python环境2.2图像处理库2.3OCR引擎2.4Python接口三、实现步骤3.1获取验证码图像3.2图像预处理3.3使用OCR进行字符识别3.4基本OCR识别样例四、提高识别准确率的方法4.1字符分割4.2使用深度学习模型4.3数据增强4.4集成多个OCR引擎五、实际应用中的注意事项六、总结验证码（CAPTCHA）是一种用于区分人类用户和自动化程序的安
miniconda 修改环境到其他盘波格斯特问题备忘 chrome python 前端
要将Miniconda的默认虚拟环境路径修改到其他盘，可以通过以下步骤实现，具体方法分为修改默认路径和迁移现有环境两种情况：一、修改默认环境路径使用condaconfig命令配置路径打开AnacondaPrompt，执行以下命令（以D盘为例）：condaconfig--addenvs_dirsD:\Anaconda_envs\envscondaconfig--addpkgs_dirsD:\Anac
ollama 指定安装路径设置模型路径波格斯特语言模型
在Windows系统中，要自定义Ollama的安装路径，可以通过以下步骤实现：一、安装阶段指定路径手动创建目标目录在非系统盘（如D盘、E盘）创建安装目录，例如D:\ProgramFiles\Ollama或E:\MySoftware\Ollama。通过命令行安装将Ollama安装包（如OllamaSetup.exe）放入目标目录。在目标目录打开CMD窗口：按住Shift键右键点击空白处，选择“在此处
2025扩展可能性采购和供应链管理使用AI报告100+份汇总解读|附PDF下载拓端研究室百度人工智能
原文链接：https://tecdat.cn/?p=40348在当今快速发展的商业环境中，采购和供应链管理领域正经历着深刻变革，人工智能（AI）技术的融入成为推动这一变革的关键力量。本报告汇总解读聚焦于AI在采购和供应链管理中的应用，深入剖析其发展现状、面临挑战与潜在机遇。通过对大量数据的分析，揭示AI技术在实际应用中的具体表现，如不同行业的采用比例、应用场景等。本报告汇总洞察基于文末135份供应
OpenCV图像基础天行者@ opencv 人工智能计算机视觉
OpenCV其实就是一堆C和C++语言的源代码文件,这些源代码文件中实现了许多常用的计算机视觉算法。OpenCV的全称是OpenSourceComputerVisionLibrary,是一个开放源代码的计算机视觉库OpenCV最初由英特尔公司发起并开发,以BSD许可证授权发行,可以在商业和研究领域中免费使用,现在美国WillowGarage为OpenCV提供主要的支持OpenCV可用于开发实时的图
【TOGAF系列】架构开发方法（ADF）第八章东临碣石82 架构
第8章：D阶段：技术架构8.1目标D阶段的目标是：开发目标技术架构，使架构愿景、目标业务、数据和应用构建块能够通过技术组件和技术服务交付，以解决架构工作说明书和利益相关者关注的问题根据基线和目标技术架构之间的差距确定候选架构路线图组件8.2输入本节定义了阶段D的输入。8.2.1企业外部参考资料架构参考资料（见TOGAF标准——架构内容）候选产品的产品信息8.2.2非架构输入架构工作请求（见TOGA
DeepSeek 面试题精选 CarlowZJ DeepSeek
以下是针对DeepSeek面试的精选问题及解答，涵盖技术原理、模型架构、训练方法和应用场景等方面，供面试准备参考：一、DeepSeek模型架构与技术原理1.请简述DeepSeek-V3模型的总体架构和主要创新点。架构：DeepSeek-V3基于混合专家系统（MoE）架构，包含2048个领域专家模型，通过门控网络动态分配查询请求。创新点：使用多头潜在注意力（MLA）技术，通过低秩压缩降低KV缓存需求
初识C语言之操作符详解(下) 乞丐1469 C语言学习 c语言学习
一.操作符分类1.下标访问操作符(1)运用规则：一个数组名+一个索引名(下标)(2)运用举例：eg.intmain(){intarr[10]={1,2,3,4,5};printf("%d",arr[4]);//数组下标为4的元素→5return0;}(3)总结：上述下标访问操作符的操作数为arr和4，(数组名和数组的索引/下标)。2.函数调用操作符(1)函数调用操作符为调用函数时的()。(2)举例
Web组态可视化编辑器快速绘制组态 2401_88272797 前端编辑器
随着工业智能制造的发展，工业企业对设备可视化、远程运维的需求日趋强烈，传统的单机版组态软件已经不能满足越来越复杂的控制需求，那么实现Web组态可视化界面成为了主要的技术路径。行业痛点对于软件服务商来说，将单机版软件转变为网页版软件已经到了势在必行的阶段。但是，转变是一个复杂的过程，尤其是软件里面的组态功能部分，对于公司或个人都会面临以下几方面的问题：1、无相关组态开发经验，无技术积累。2、开发周期
从LayerNorm到RMSNorm：深度学习归一化技术的进化！qwen2.5的技术。 KangkangLoveNLP qwen2.5 深度学习人工智能 transformer pytorch 自然语言处理 python 神经网络
RMSNorm（RootMeanSquareNormalization，均方根归一化）是一种用于深度学习的归一化技术，是LayerNorm（层归一化）的一种改进。它通过计算输入数据的均方根（RootMeanSquare,RMS）来进行归一化，避免了传统归一化方法中均值和方差的计算1.LayerNorm（层归一化）LayerNorm（层归一化）是一种用于深度学习的归一化技术，主要用于稳定训练过程、加
工程化与框架系列（30）--前端日志系统实现一进制ᅟᅠ ‌‍‎‏ 前端工程化与框架前端状态模式
前端日志系统实现引言前端日志系统是应用监控和问题诊断的重要工具。本文将深入探讨前端日志系统的设计与实现，包括日志收集、处理、存储和分析等方面，帮助开发者构建完整的前端日志解决方案。日志系统概述前端日志系统主要包括以下方面：日志收集：用户行为、性能指标、错误信息等日志处理：过滤、格式化、压缩等日志存储：本地存储、远程上传等日志分析：统计分析、可视化展示等实时监控：告警、通知等日志系统实现日志管理器/
SpringBoot调用deepseek 想买CT5的小曹 spring boot 后端 java
1、效果截图：2、代码部分：application.propertiesserver.port=8080deepseek.api.token=sk-d34e929e887b4881813395241df2f745deepseek.api.url=https://api.deepseek.com/chat/completionscontroller部分请求参数可以缩短，写成实体类形式packagec
计算机科学与技术python方向_合肥师范学院计算机科学与技术python复习 weixin_39710106
1.计算机是根据指令操作数据的设备，具备功能性和可编程性两个基本特性2.程序设计语言的执行方式有编译执行和解释执行3.语言特点：与平台无关、粘性扩展、开源理念、支持中文、类库丰富4.IPO程序编写方法：input、process、output5.2.x与3.x的区别：(1)修改编码：3.x系列默认采用UTF-8编码；(2)去掉长整数类型：3.x系列不再区分整数和长整数类型，只有int类型，int类
【DuodooTEKr】基于Odoo18 Maintenance设备模块与ZXing扫码技术实现医疗器械DHR无纸化追溯技术方案邹工转型手札风吟九宵 Odoo18开源 Duodoo开源制造人工智能开源物联网 python
作者：Odoo技术开发/资深信息化负责人日期：2025年3月10日一、行业现状与需求痛点1.1医疗器械行业DHR管理现状传统纸质记录存在的合规风险FDA21CFRPart11对电子记录的特殊要求生产设备、检验设备、环境监控等多系统数据孤岛1.2典型业务场景分析原材料批次追溯（需关联供应商批号、效期）生产工序执行验证（人员、设备、参数三位一体）灭菌批次与产品追溯的强关联设备维护记录与产品生产周期的对
MySQL 技术浅析（聚簇索引、UndoLog、RedoLog、MVCC）代码没写完哪有脸睡觉 mysql 数据库
MySQL核心技术深度解析一、聚簇索引与非聚簇索引1.聚簇索引结构存储方式InnoDB中，聚簇索引的叶子节点直接存储完整数据行，数据按主键值物理排序存储。主键索引即数据文件，非叶子节点存储主键范围和子节点指针数据行与主键索引绑定，主键顺序决定磁盘存储顺序示例存储结构B+树结构：根节点→[id20;--索引设计为(name,age)2.事务控制建议控制事务粒度：单个事务执行时间<1秒批量操作分批次提
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不