hdanbang

VS查看PTX代码

首先，声明本人用的是Windows 7操作系统，使用Windows 8操作系统的小伙伴们会启动不了Nsight monitor，原因在于Windows 8操作系统的Framework版本过新，解决办法可以是：安装一个版本旧一点的Matlab，安装起初会提示下载安装旧版本的Framework，安装完成Framework就可以停止安装Matlab了，Nsight monitor也可以启动了。
下面回到正题，如何在VS中查看PTX代码呢？在此举个例子，按照这个步骤便可以查看到了。

本人使用的代码是CUDA自带的一个Sample：

C/C++ code 
     
?
 
          #include "cuda_runtime.h" 
         
          #include "device_launch_parameters.h" 
         
          #include  
         
          cudaError_t addWithCuda(int *c, const int *a, const int *b, unsigned int size); 
         
          __global__ void addKernel(int *c, const int *a, const int *b) 
         
          { 
         
              int i = threadIdx.x; 
         
              c[i] = a[i] + b[i]; 
         
          } 
         
          int main() 
         
          { 
         
              const int arraySize = 5; 
         
              const int a[arraySize] = { 1, 2, 3, 4, 5 }; 
         
              const int b[arraySize] = { 10, 20, 30, 40, 50 }; 
         
              int c[arraySize] = { 0 }; 
         
              // Add vectors in parallel. 
         
              cudaError_t cudaStatus = addWithCuda(c, a, b, arraySize); 
         
              if (cudaStatus != cudaSuccess) { 
         
                  fprintf(stderr, "addWithCuda failed!"); 
         
                  return 1; 
         
              } 
         
              printf("{1,2,3,4,5} + {10,20,30,40,50} = {%d,%d,%d,%d,%d}\n", 
         
                  c[0], c[1], c[2], c[3], c[4]); 
         
              // cudaDeviceReset must be called before exiting in order for profiling and 
         
              // tracing tools such as Nsight and Visual Profiler to show complete traces. 
         
              cudaStatus = cudaDeviceReset(); 
         
              if (cudaStatus != cudaSuccess) { 
         
                  fprintf(stderr, "cudaDeviceReset failed!"); 
         
                  return 1; 
         
              } 
         
              return 0; 
         
          } 
         
          // Helper function for using CUDA to add vectors in parallel. 
         
          cudaError_t addWithCuda(int *c, const int *a, const int *b, unsigned int size) 
         
          { 
         
              int *dev_a = 0; 
         
              int *dev_b = 0; 
         
              int *dev_c = 0; 
         
              cudaError_t cudaStatus; 
         
              // Choose which GPU to run on, change this on a multi-GPU system. 
         
              cudaStatus = cudaSetDevice(0); 
         
              if (cudaStatus != cudaSuccess) { 
         
                  fprintf(stderr, "cudaSetDevice failed!  Do you have a CUDA-capable GPU installed?"); 
         
                  goto Error; 
         
              } 
         
              // Allocate GPU buffers for three vectors (two input, one output)    . 
         
              cudaStatus = cudaMalloc((void**)&dev_c, size * sizeof(int)); 
         
              if (cudaStatus != cudaSuccess) { 
         
                  fprintf(stderr, "cudaMalloc failed!"); 
         
                  goto Error; 
         
              } 
         
              cudaStatus = cudaMalloc((void**)&dev_a, size * sizeof(int)); 
         
              if (cudaStatus != cudaSuccess) { 
         
                  fprintf(stderr, "cudaMalloc failed!"); 
         
                  goto Error; 
         
              } 
         
              cudaStatus = cudaMalloc((void**)&dev_b, size * sizeof(int)); 
         
              if (cudaStatus != cudaSuccess) { 
         
                  fprintf(stderr, "cudaMalloc failed!"); 
         
                  goto Error; 
         
              } 
         
              // Copy input vectors from host memory to GPU buffers. 
         
              cudaStatus = cudaMemcpy(dev_a, a, size * sizeof(int), cudaMemcpyHostToDevice); 
         
              if (cudaStatus != cudaSuccess) { 
         
                  fprintf(stderr, "cudaMemcpy failed!"); 
         
                  goto Error; 
         
              } 
         
              cudaStatus = cudaMemcpy(dev_b, b, size * sizeof(int), cudaMemcpyHostToDevice); 
         
              if (cudaStatus != cudaSuccess) { 
         
                  fprintf(stderr, "cudaMemcpy failed!"); 
         
                  goto Error; 
         
              } 
         
              // Launch a kernel on the GPU with one thread for each element. 
         
              addKernel<<<1, size>>>(dev_c, dev_a, dev_b); 
         
              // Check for any errors launching the kernel 
         
              cudaStatus = cudaGetLastError(); 
         
              if (cudaStatus != cudaSuccess) { 
         
                  fprintf(stderr, "addKernel launch failed: %s\n", cudaGetErrorString(cudaStatus)); 
         
                  goto Error; 
         
              } 
         
              // cudaDeviceSynchronize waits for the kernel to finish, and returns 
         
              // any errors encountered during the launch. 
         
              cudaStatus = cudaDeviceSynchronize(); 
         
              if (cudaStatus != cudaSuccess) { 
         
                  fprintf(stderr, "cudaDeviceSynchronize returned error code %d after launching addKernel!\n", cudaStatus); 
         
                  goto Error; 
         
              } 
         
              // Copy output vector from GPU buffer to host memory. 
         
              cudaStatus = cudaMemcpy(c, dev_c, size * sizeof(int), cudaMemcpyDeviceToHost); 
         
              if (cudaStatus != cudaSuccess) { 
         
                  fprintf(stderr, "cudaMemcpy failed!"); 
         
                  goto Error; 
         
              } 
         
          Error: 
         
              cudaFree(dev_c); 
         
              cudaFree(dev_a); 
         
              cudaFree(dev_b); 
         
              return cudaStatus; 
         
          }

1. 确定不适用Nsight安全连接，即下图最后一项为False。

2. 启动Nsight monitor，选择“开始性能分析”

3. 选择Profile CUDA Application，并且将Collect information for CUDA Source View勾选上。

4. Launch！

5. 切换界面后，左上角选择Source and PTX。

6. 在视图中看到左边是源代码，右边绿色区域是对应某一行源代码的PTX代码。

其实，Nsight Monitor还是有很强大的功能的，感兴趣的小伙伴们可以自己翻翻手册和资料~

你可能感兴趣的:(CUDA编程)

CIANNA由天体物理学家提供/为天体物理学家提供的卷积交互式人工神经网络 struggle2025 神经网络
一、软件介绍文末提供程序和源码下载CIANNA是一个通用的深度学习框架，主要用于天文数据分析。根据天体物理问题解决的相关性添加功能和优化。CIANNA可用于为各种任务构建和训练大型神经网络模型，并提供高级Python接口（类似于keras、pytorch等）。CIANNA的特点之一是它定制实施了受YOLO启发的对象探测器，用于2D或3D射电天文数据产品中的星系探测。该框架通过低级CUDA编程完全实
CUDA编程：优化GPU并行处理与内存管理 Omoo CUDA GPU并行处理线程协作内存管理硬件限制
背景简介CUDA是NVIDIA推出的一种通用并行计算架构，它利用GPU的强大计算能力来解决复杂的计算问题。在本书的第12章中，我们深入探讨了CUDA编程的关键概念，包括线程间的协作、内存分配与管理以及如何应对硬件限制。CUDA中的线程协作与内存管理在GPU上进行编程时，我们需要处理内存分配、数据传输以及内核（kernel）的调用等任务。CUDA提供了一系列的API来帮助开发者管理这些资源。在提供的
【CUDA编程】Dim3 量化投资和人工智能 CUDA 昇腾 CUDA 人工智能深度学习 c++云计算
dim3是CUDA编程中用于定义线程块（Block）和网格（Grid）维度的三维向量结构体，本质是包含三个无符号整数成员（x、y、z）的轻量级容器。以下是其核心特性与用法详解：一、核心定义与结构structdim3{unsignedintx;//第一维度（宽度）unsignedinty;//第二维度（高度）unsignedintz;//第三维度（深度）};默认值规则：未显式赋值的维度默认为1。示例
【CUDA编程】OptionalCUDAGuard详解量化投资和人工智能 CUDA 大模型人工智能机器学习 CUDA 云计算 python c++
OptionalCUDAGuard是PyTorch的CUDA工具库（c10/cuda）中用于安全管理GPU设备上下文的RAII（ResourceAcquisitionIsInitialization）类。其核心作用是在特定代码块中临时切换GPU设备，并在退出作用域时自动恢复原设备状态，尤其适用于设备可能为“未指定”（nullopt）的场景。以下从作用、原理、用法和典型场景详细解析：⚙️一、核心作用
【CUDA编程】 C10_CUDA_CHECK 宏详细解析量化投资和人工智能 CUDA CUDA 人工智能云计算大模型
以下是对C10_CUDA_CHECK宏的详细解析，结合CUDA错误处理机制和PyTorch框架设计进行说明：一、宏定义结构解析#defineC10_CUDA_CHECK(EXPR)\do{\constcudaError_t__err=EXPR;\c10::cuda::c10_cuda_check_implementation(\static_cast(__err),\__FILE__,\__fun
第四篇：Python 高级-高性能计算加速秘籍程序员勇哥 Python全套教程 python 开发语言
第四篇：Python高级-高性能计算加速秘籍在当今数据量与计算需求日益增长的环境下，提升Python程序的计算性能显得尤为关键。本篇将深入探讨向量化计算的深度优化以及如何借助CUDA编程与GPU加速来显著提升Python计算效率。一、向量化计算的深度优化（一）利用Numba实现复杂算法的高效向量化Numba简介Numba是一个用于Python的即时编译器（JIT），它能够将Python函数转换为机
Python中使用CUDA/GPU的方式比较东北豆子哥 CUDA HPC/MPI python CUDA
Python中使用CUDA/GPU的方式比较在Python中利用GPU加速计算有多种方式，以下是主要的几种方法及其比较：1.CUDA原生开发方式：使用NVIDIA提供的CUDAC/C++API开发内核通过PyCUDA或Numba等工具在Python中调用特点：最底层，性能最优开发复杂度高需要熟悉CUDA编程模型示例库：PyCUDANumbaCUDA2.通用GPU计算框架2.1CUDA加速库方式：使
flash attention的CUDA编程流水并行加速-V6 谨慎付费（看不懂试读博客不要订阅）高性能计算 redis 数据库缓存
之前关于flashattention的介绍可以继续参考链接添加链接描述矩阵乘法的优化参考添加链接描述，我们发现矩阵乘法的最优配置为：BLOCK_DIM_x=BLOCK_DIM_y=16，同时每个线程处理一个8×8的子矩阵。线程网格设置如下所示：constintRq=8;constintRv
被 CUDA 性能问题困扰？从全局内存到共享内存，并行归约优化全解析！讳疾忌医丶动手学习CUDA编程 c++CUDA 开发语言
你是不是也觉得GPU编程听起来很酷，但一上手就头大？别慌，今天我带你玩转CUDA里一个既基础又硬核的东西——并行归约。啥是归约？简单说，就是把一堆数加起来（或者其他累积操作），但在GPU上，这可不是简单的for循环，而是能让性能起飞的优化手法。作为一个写了好几年CUDA的老司机，我有个独家观点：并行归约是CUDA编程的灵魂，搞懂它，你就摸到了GPU优化的门道。这篇文章不整虚的，我会用大白话带你从最
《GPU高性能编程CUDA实战》中文版电子书翁佳忱
《GPU高性能编程CUDA实战》中文版电子书【下载地址】GPU高性能编程CUDA实战中文版电子书探索GPU高性能编程的奥秘，掌握CUDA实战技巧！本资源提供了《GPU高性能编程CUDA实战》中文电子书，深入解析GPU编程基础与CUDA架构，助您从理论到实践全面提升。无论您是编程新手还是资深开发者，本书都能为您提供清晰的指导与丰富的实战案例。立即下载，开启您的CUDA编程之旅，解锁GPU计算的无限潜
Cuda Instruction Replay ZhiqianXia CUDA 技术笔记 cuda
在CUDA编程中，指令重放（InstructionReplay）是GPU执行指令时因特定原因导致指令需重复发射或重新执行的现象，通常会影响性能。以下是其关键点：指令重放的原因分支分歧（DivergentBranches）当同一线程束（Warp）中的线程执行不同分支（如if-else）时，GPU需串行化处理每个分支路径。同一指令可能被多次发射（重放），导致执行时间增加。内存访问延迟全局内存访问未命中
CUDA编程高阶优化：如何突破GPU内存带宽瓶颈的6种实战策略学术猿之吻 GPU 高校人工智能边缘计算人工智能 transformer 深度学习 gpu算力 ai AI编程
在GPU计算领域，内存带宽瓶颈是制约性能提升的"隐形杀手"。本文面向具备CUDA基础的研究者，从寄存器、共享内存到TensorCore，系统剖析6项突破性优化策略，助你充分释放GPU算力。一、全局内存访问优化：对齐与合并原则1.1合并访问的本质GPU全局内存以‌线程束（Warp）‌为单位执行合并事务。当32个线程访问连续且对齐的128字节内存块时，总线利用率可达100%‌。以下代码演示如何实现合并
CUDA编程优化：如何实现矩阵计算的100倍加速学术猿之吻 GPU 高校人工智能矩阵人工智能线性代数深度学习量子计算算法 gpu算力
一、突破性能瓶颈的核心路径矩阵计算的百倍加速需要打通"内存带宽→计算密度→指令吞吐"三重关卡。根据NVIDIAAmpere架构白皮书，A100GPU的理论计算峰值（FP32）为19.5TFLOPS，但原生CUDA代码往往只能达到5-8%的理论值。通过系统化优化策略，我们成功将1024×1024矩阵乘法从初始的212ms优化至2.1ms，实现101倍加速（测试平台：NVIDIARTX3090）。二、
C++开发者的逆袭之路：大部份的高薪岗位都在招 CUDA 人才，你还不行动？讳疾忌医丶动手学习CUDA编程 c++开发语言
为什么你必须学会CUDA编程？想象一下，你手头有个计算任务，普通CPU跑得慢得像乌龟爬，而GPU却能像火箭一样把性能拉满——这就是高性能计算（HPC）的魅力！在这个数据爆炸的时代，无论是AI训练、科学仿真还是金融建模，HPC都成了不可或缺的利器。而NVIDIA的CUDA平台，正是这场革命的核心，把GPU从画图的“小能手”变成了并行计算的“大杀器”。作为一名C++专家，我可以负责任地说：学会CUDA
CUDA 编程相关的开源库 byxdaz CUDA cuda
CUDA编程相关的开源库非常丰富，涵盖了高性能计算、深度学习、图像处理、线性代数、优化算法等多个领域。1.通用GPU计算库CUDAToolkit(NVIDIA官方):包含CUDA运行时库、编译器（nvcc）、调试工具（cuda-gdb、Nsight）、数学库（如cuBLAS、cuFFT）等。CUDAToolkit-FreeToolsandTraining|NVIDIADeveloperThrust
GPU编程实战指南04：CUDA编程示例，使用共享内存优化性能 anda0109 CUDA并行编程 gpu算力 AI编程 ai
在CUDA编程中，共享内存（SharedMemory）比全局内存（GlobalMemory）效率高的原因主要与CUDA的硬件架构和内存访问特性密切相关。以下是详细分析：1.CUDA内存层次结构CUDA设备（GPU）具有多层次的内存架构，主要包括以下几种：寄存器（Registers）：每个线程私有的高速存储单元，速度最快但容量有限。共享内存（SharedMemory）：由同一个线程块（Block）中
gather算子的CUDA编程和算子测试谨慎付费（看不懂试读博客不要订阅）高性能计算 CUDA
知乎介绍参考添加链接描述完整测试框架参考本人仓库添加链接描述gather算子的onnx定义参考添加链接描述，该算子的主要变换参考下图：这里我们不妨以input=[A,dimsize,D]，indices=[B,C],axis=1举例子，此时对应的output形状是[A,B,C,D]，并且根据gather算子定义，我们知道output[i,j,k,s]=input[i,indices[j,k],s]
Python调用CUDA 源代码分析 python 开发语言
CUDA常用语法和函数CUDA(ComputeUnifiedDeviceArchitecture)是NVIDIA提供的一个并行计算平台和编程模型，允许开发者使用NVIDIAGPU进行高性能计算。以下是一些CUDA编程中的常用语法和函数：核函数（KernelFunctions）：使用__global__修饰符定义，这种函数可以从主机（CPU）调用并在设备（GPU）上并行执行。调用格式：kernel>
NVIDIA GTC 开发者社区Watch Party资料汇总扫地的小何尚 NVIDIA GPU linux AI 算法
NVIDIAGTC开发者社区WatchParty资料汇总以下是所有涉及到的工具中文解读汇总，希望可以帮到各位：1.CUDA编程模型开发者指南和最新功能解析专栏2.NVIDIAWarp：高性能GPU模拟与图形计算的Python框架3.NVIDIAcuDF：GPU加速的数据处理库详解4.NVIDIAcuML：GPU加速的机器学习库详解5.NVIDIAcuFFT详解：从入门到高级应用6.NVIDIAcu
GPU计算的历史与CUDA编程入门己见明 GPU计算 CUDA C 数据并行性 CUDA程序结构向量加法内核
GPU计算的历史与CUDA编程入门背景简介GPU计算的历史可以追溯到早期的并行计算研究，如今已发展成为计算机科学中的一个重要分支。本文将探讨GPU计算的发展史，重点分析《ComputerGraphics:PrinciplesandPractice》等关键文献，以及CUDAC编程模型的引入及其对现代软件开发的影响。历史回顾回顾历史，GPU计算的发展始于1986年Hillis与Steele在《Comm
CUDA编程基础清澜算法面试人工智能 c++算法 nvidia cuda编程
一、快速理解CUDA编程1.1CUDA简介CUDA（ComputeUnifiedDeviceArchitecture）是由NVIDIA推出的并行计算平台和应用程序接口模型。它允许开发者利用NVIDIAGPU的强大计算能力来加速通用计算任务，而不仅仅是图形渲染。通过CUDA，开发者可以编写C、C++或Fortran代码，并将其扩展以在GPU上运行，从而显著提高性能，特别是在处理大规模数据集和复杂算法
c++高性能多进程 cuda编程: safe_softmax实现 + cub::BlockReduce自定义归约操作 FakeOccupational 深度学习 c++开发语言
目录cub::BlockReduce自定义归约操作(`cub::BlockReduce::Reduce`)1.语法safe_softmax实现cub::BlockReducecub::BlockReduce是CUB库（CUDAUnBound）提供的一种用于GPU线程块内数据归约(一般完成所有数据规约需要两次规约)的高效工具。它允许线程块内的多个线程并行地对数据执行归约操作，cub::BlockRe
英伟达的ptx是什么？ptx在接近汇编语言的层级运行？ AI-AIGC-7744423 人工智能
PTX（ParallelThreadeXecution）是英伟达CUDA架构中的一种中间表示形式（IR）语言。以下是关于它的介绍以及它与汇编语言层级关系的说明：PTX介绍•性质与作用：PTX是一种类似于汇编语言的指令集架构，但它更像是一种抽象的、面向并行计算的中间语言。它是CUDA编程模型中，主机代码与实际在GPU上执行的机器码之间的桥梁。开发者编写的CUDAC/C++等高级语言代码，在编译过程中
CUDA编程之OpenCV与CUDA结合使用 byxdaz CUDA opencv 人工智能计算机视觉
OpenCV与CUDA的结合使用可显著提升图像处理性能。一、版本匹配与环境配置CUDA与OpenCV版本兼容性‌OpenCV各版本对CUDA的支持存在差异，例如OpenCV4.5.4需搭配CUDA10.0‌2，而较新的OpenCV4.8.0需使用更高版本CUDA‌。需注意部分模块（如级联检测器）可能因CUDA版本更新而不再支持‌。‌OpenCV版本CUDA版本4.5.x‌推荐CUDA11.x及以下
GPU编程实战指南01：CUDA编程极简手册 anda0109 CUDA并行编程算法
目录1.CUDA基础概念1.1线程层次结构1.2内存层次结构2.CUDA编程核心要素2.1核函数2.2内存管理2.3同步机制3.CUDA优化技巧3.1内存访问优化3.2共享内存使用3.3线程分配优化4.常见问题和解决方案5.实际案例分析1.CUDA基础概念1.1线程层次结构CUDA采用层次化的线程组织结构，从小到大依次为：线程（Thread）：最基本的执行单元每个线程执行相同的核函数代码通过thr
高性能计算中如何优化内存管理？ gpu
在高性能计算（HPC）中，优化内存管理是提升计算性能的关键环节之一。以下是一些常见的优化策略和方法：内存分配与管理策略内存池技术：通过预分配一定大小的内存池，避免频繁的内存分配和释放操作，减少内存碎片化。例如，在CUDA编程中，可以使用内存池来管理GPU内存，从而提高内存访问效率。异构内存管理：在异构计算环境中（如CPU+GPU），采用统一内存管理（UnifiedMemory）或智能数据迁移策略，
cuda编程入门——并行归约(五) 我不会打代码啊啊 cuda编程算法 c++gpu算力
CUDA编程入门—并行归约（数组求和为例）在并行计算中，归约（Reduction）是一种将多个数据通过特定操作（如求和、求最大值等）合并为单一结果的并行算法。其核心目标是通过并行化加速大规模数据集的聚合计算。关键概念操作类型：可结合且可交换的操作（如加法、乘法、最大值、最小值、逻辑与/或等）适合并行归约。若操作不可结合（如减法或除法），需特殊处理或无法直接并行化。并行实现方式：树形结构归约：将数据
cuda编程入门——并行性与异构性概念我不会打代码啊啊 cuda编程 gpu算力 c++
CUDA编程入门一基于cuda的异构并行计算并行性一、并行性的概念与分类概念并行性旨在通过同时处理多个任务或数据元素来提高计算速度和效率。它可以在不同的层次上实现，包括指令级并行、数据级并行和任务级并行等。分类指令级并行（Instruction-LevelParallelism，ILP）：在处理器的指令执行层面，通过硬件技术（如流水线、超标量技术等）让多条指令在不同阶段同时执行，从而提高处理器的指
CUDA检测失败的解决方案 HackDashX Python
CUDA检测失败的解决方案在使用Python进行CUDA编程时，有时候会遇到"CUDAdetectionfailed"的错误信息。这个错误通常表示CUDA驱动程序无法正确地检测到CUDA设备。在本文中，我将为您提供一些解决这个问题的方法。以下是一些可能的原因和相应的解决方案：CUDA驱动程序未正确安装：首先，请确保您已正确安装了与您的CUDA版本相匹配的CUDA驱动程序。您可以从NVIDIA官方网
CUDA环境配置波小澜 CUDA cuda ubuntu 环境配置
本文介绍Ubuntu14.04下CUDA环境的安装过程标签高性能计算（HPC）并行化加速学习CUDA最好的去处还是NVIDIA官网，上面许多文档写的都相当不错，比如CUDA编程指南、如何使用cuRand生成随机数等。环境配置博主主要在Linux下进行CUDA程序的开发，包括Ubuntu14.04、CentOS6等以在Ubuntu下安装CUDA为例：首先，在命令行中执行nvidia-smi指令，查看
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。