青鸢丶

Triton Inference Server 快速上手指南（2.40版本预计12月写完）

文章目录

1.介绍
2.server端部署流程
- 2.1安装
- 2.2运行
- - 2.1本地建立模型仓库
  - 2.2启动容器并运行
- 2.3验证
3.client端开发部署流程
- 3.1安装
- 3.2运行
- - 3.2.1图像分类demo分析
  - 3.2.2yolo demo分析
- 3.3高级特性
4.模型仓库
- 4.1 仓库结构
- 4.2 版本控制
5.模型设置
6.模型调度程序
7.模型管理
- 7.1 NONE 模式
- 7.2 POLL 模式
- - 7.2.1 版本改动
  - 7.2.2 模型删除和增加
  - 7.2.3 模型配置文件以及标签文件的改动
- 7.3 ECPLICIT 模式
8.优化
9.性能指标

1.介绍

公司项目中需要做AI云平台的部署，一开始尝试Paddle serving做云端部署，发现很不稳定，QPS也比较低，准备换英伟达平台尝试一下，这篇旨在上手使用，更多需求请查看官方文档.

推荐上手项目：yolov4-triton-tensorrt
如何生成tensorrt引擎

本篇只介绍docker安装，GPU版本

2.server端部署流程

2.1安装

推荐使用docker安装，去nvidia-NGC中搜索Triton Inference Server下载，注意，需要先安装docker和nvidia-docker(有空会补教程)

docker pull nvcr.io/nvidia/tritonserver:20.10-py3 #截止目前最新版本

2.2运行

2.1本地建立模型仓库

官方推荐本地建一个文件夹，里面分别放置已经生成好的tensorrt引擎以及自己写的模型插件（libXXX.so，只有一些特殊模型会用到如果用不到插件就不放）
eg：
Create model repository

cd yourworkingdirectoryhere
mkdir -p triton-deploy/models/yolov4/1/
mkdir triton-deploy/plugins

Copy engine and plugins
这里是将tenosrrt生成的推理引擎和自己写的自定义插件放到自己建立的模型仓库里面，至于如何生成这些引擎，另一篇文章会讲

cp yolov4-triton-tensorrt/build/yolov4.engine triton-deploy/models/yolov4/1/model.plan
cp yolov4-triton-tensorrt/build/liblayerplugin.so triton-deploy/plugins/

2.2启动容器并运行

$ docker run --gpus=1 --rm -p8000:8000 -p8001:8001 -p8002:8002 -v/path/to/model/repository:/models <tritonserver image name> tritonserver --model-repository=/models

替换成自己拉取的镜像名称，比如nvcr.io/nvidia/tritonserver:20.10-py3，
-v 选项的意思是挂载外部文件夹到docker容器里面，这里是将2.1建立的模型仓库挂载到里面了。
-p 选项的意思是将容器内外网络端口打通，比如我请求主机的8000端口，就相当于请求容器中的8000端口
–shm-size --ulimit 可以用来调整服务器性能，可以查一查docker文档，不设置也可以
eg：

docker run --gpus all --rm --shm-size=1g --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 -p8000:8000 -p8001:8001 -p8002:8002 -v$(pwd)/triton-deploy/models:/models -v$(pwd)/triton-deploy/plugins:/plugins --env LD_PRELOAD=/plugins/liblayerplugin.so nvcr.io/nvidia/tritonserver:20.08-py3 tritonserver --model-repository=/models --strict-model-config=false --grpc-infer-allocation-pool-size=16 --log-verbose 1

metrics可以查看服务器资源使用情况

2.3验证

本机部署好服务器后，可以新起一个终端

curl -v localhost:8000/v2/health/ready

如果返回有这个

...
< HTTP/1.1 200 OK
< Content-Length: 0
< Content-Type: text/plain

说明服务器已经正常启动了，这里的 8000端口是默认的，如果你自定义了端口，就请求你自定义的端口，至此，你就可以使用HTTP/REST or GRPC protocols等多种协议去请求你的推理服务了。

3.client端开发部署流程

nvidia提供了client libraries来加速客户端程序的开发，这里使用python来构建，官方提供了很多DEMO，还有C++DEMO

3.1安装

推荐安装方式有两种，python可以直接pip下载安装包，支持http协议和grpc协议

pip install nvidia-pyindex
pip install tritonclient

去NGC查看dockertag，直接下载docker也是可以的

docker pull nvcr.io/nvidia/tritonserver:20.10-py3-clientsdk

3.2运行

这里有一个简单的官方demo，是图像分类模型的。

3.2.1图像分类demo分析

3.2.2yolo demo分析

核心代码：

#IMAGE MODE
if FLAGS.mode == 'image':
    print("Running in 'image' mode")
    if not FLAGS.input:
        print("FAILED: no input image")
        sys.exit(1)
    
    inputs = []
    outputs = []
    inputs.append(grpcclienrent version of the documentat.InferInput('data', [1, 3, 640, 640], "FP32"))
    outputs.append(grpcclient.InferRequestedOutput('prob'))

    print("Creating buffer from image file...")
    input_image = cv2.imread(str(FLAGS.input))
    if input_image is None:
        print(f"FAILED: could not load input image {str(FLAGS.input)}")
        sys.exit(1)
    input_image_buffer = preprocess(input_image)
    input_image_buffer = np.expand_dims(input_image_buffer, axis=0)
    inputs[0].set_data_from_numpy(input_image_buffer)

    print("Invoking inference...")
    results = triton_client.infer(model_name=FLAGS.model,
                                inputs=inputs,
                                outputs=outputs,
                                client_timeout=FLAGS.client_timeout)
    if FLAGS.model_info:
        statistics = triton_client.get_inference_statistics(model_name=FLAGS.model)
        if len(statistics.model_stats) != 1:
            print("FAILED: get_inference_statistics")
            sys.exit(1)
        print(statistics)
    print("Done")

    result = results.as_numpy('prob')
    print(f"Received result buffer of size {result.shape}")
    print(f"Naive buffer sum: {np.sum(result)}")

    detected_objects = postprocess(result, input_image.shape[1], input_image.shape[0], FLAGS.confidence, FLAGS.nms)
    print(f"Raw boxes: {int(result[0, 0, 0, 0])}")
    print(f"Detected objects: {len(detected_objects)}")

    for box in detected_objects:
        print(f"{COCOLabels(box.classID).name}: {box.confidence}")
        input_image = render_box(input_image, box.box(), color=tuple(RAND_COLORS[box.classID % 64].tolist()))
        size = get_text_size(input_image, f"{COCOLabels(box.classID).name}: {box.confidence:.2f}", normalised_scaling=0.6)
        input_image = render_filled_box(input_image, (box.x1 - 3, box.y1 - 3, box.x1 + size[0], box.y1 + size[1]), color=(220, 220, 220))
        input_image = render_text(input_image, f"{COCOLabels(box.classID).name}: {box.confidence:.2f}", (box.x1, box.y1), color=(30, 30, 30), normalised_scaling=0.5)

    if FLAGS.out:
        cv2.imwrite(FLAGS.out, input_image)
        print(f"Saved result to {FLAGS.out}")
    else:
        cv2.imshow('image', input_image)
        cv2.waitKey(0)
        cv2.destroyAllWindows()

3.3高级特性

4.模型仓库

4.1 仓库结构

组成模型库的目录和文件必须遵循所需的文件路径大小。假设存储库路径指定为：

$ tritonserver --model-repository=<model-repository-path>

相应的仓库布局必须为：

<model-repository-path>/
  <model-name>/
    [config.pbtxt] #（可选）
    [<output-labels-file> ...] #（可选）
    <version>/
      <model-definition-file> #tensorrt eg: model.plan
    <version>/
      <model-definition-file>
    ...
  <model-name>/
    [config.pbtxt]
    [<output-labels-file> ...]
    <version>/
      <model-definition-file>
    <version>/
      <model-definition-file>
    ...
  ...

4.2 版本控制

每个模型在模型存储库中可以具有一个或多个可用版本。每个版本都存储在其自己的数字命名子目录中，该子目录的名称与模型的版本号相对应。没有数字命名或名称以零（0）开头的子目录将被忽略。每个模型配置都指定一个版本策略，该策略控制Triton在任何给定时间提供模型存储库中的哪个版本。

5.模型设置

6.模型调度程序

7.模型管理

Trition server 有三种模型控制模式，分别叫做：NONE.POLL,EXPLICIT

7.1 NONE 模式

此模式为默认控制模式，它在启动时会尝试加载模型储存库中的所有模型，无法加载的模型会被标记为不可用，并且不能用于推断。当服务器开始运行时，模型库的更改将被忽略。
使用 model control endpoint来对服务进行控制是无效的，而且会收到一个错误的回复
可以通过 --model-control-mode=none 这个设置开启NONE模式

7.2 POLL 模式

它在启动时会尝试加载模型储存库中的所有模型，无法加载的模型会被标记为不可用，并且不能用于推断。
当服务器运行的时候，模型库的改动将会被检测到，然后Trition就会尝试去加载和卸载这些改动。但是这些改动不会被立即检测到，因为这个检测是定期轮询的（–repository-poll-secs 这个选项可以控制轮询的时间间隔）。可以通过控制台日志和状态AIP来确认改动是不是真正生效。
使用 model control endpoint也可以确定模型改动是否生效。
可以通过 --model-control-mode=poll 这个设置开启poll模式，同时设置 --repository-poll-secs 为一个非零值。

在Triton运行时更改模型存储库必须谨慎进行，如修改模型存储库中所述。

POLL可以接受如下的模型库改动：

7.2.1 版本改动

通过添加和删除相应的版本子目录，可以从模型中添加和删除版本。如果有正在进行的请求还没有处理完，Triton将先处理未完成的请求，再进行删除模型。对删除模型版本的新请求将失败。

7.2.2 模型删除和增加

可以通过删除相应的模型目录从存储库中删除现有模型。 Triton将允许对已删除模型的任何版本进行动态请求。如果有正在进行的请求还没有处理完，Triton将先处理未完成的请求，再进行删除模型。对删除模型版本的新请求将失败。通过添加新的模型目录，可以将新模型添加到存储库中。

7.2.3 模型配置文件以及标签文件的改动

可以更改模型配置（config.pbtxt），Triton将卸载并重新加载模型以获取新的模型配置。
可以添加，删除或修改为表示分类的输出提供标签的标签文件，Triton会卸载并重新加载模型以拾取新标签。如果添加或删除了标签文件，则必须同时在模型配置中对输出对应的label_filename属性进行相应的编辑。

7.3 ECPLICIT 模式

启动后，必须使用模型控制协议显式启动所有模型加载和卸载操作。通过查看模型控制请求的返回值来判断加载或卸载操作的成功或失败。尝试重新加载已加载的模型时，如果由于任何原因重新加载失败，则已加载的模型将保持不变并保持加载状态。如果重新加载成功，则新加载的模型将替换已经加载的模型，而该模型的可用性不会受到任何损失。

通过指定–model-control-mode = explicit启用此模型控制模式。必须在Triton运行时更改模型存储库，如修改模型存储库中所述。

8.优化

9.性能指标

八股文-Linux系统部分 im长街八股文专栏 linux 服务器
目录权限掩码有什么作用?直到粘滞位吗?怎样将程序停留在预处理过程/编译/汇编过程后?用过gdb吗?讲讲常见的热键谈谈你对整个计算机体系的认识什么是进程?谈谈你自己的理解?进程在运行时可能会出现哪些状态?Fork函数了解多少?了解过僵尸进程和孤儿进程吗?并行和并发的区别?当发生进程切换后再次被调度时,怎样知道上次运行到哪儿了?了解过哪些环境变量什么是地址空间?和物理内存是什么关系?为什么要有它?谈谈
八股文-Linux网络部分 im长街八股文专栏 linux 网络
目录TCP和UDP的区别套接字编程一般的流程是什么Cookie,session和token有什么区别HTTP和HTTPS的区别讲一下TCP的三次握手和四次挥手TCP通过什么来保证可靠性TCP通过什么方式来提高性能了解哪些TCP协议的报头数据如何解决TCP的粘包问题什么是IP协议IP协议的字段了解多少什么是网段划分WAN口ip和LAN口ip的作用了解过NAT技术吗谈一谈你对ARP协议的理解有了ip地
个人NAS方案，终端字符界面浏览器耶耶耶耶耶~ 其它 NAS
文章目录前言需求分析Linux配置smb服务-Linux服务端配置-windows客户端配置Linux安装流媒体服务在终端界面中浏览网页references前言个人nas需要满足的需求：可以通过浏览器访问nas中的文件、图片、视频支持像访问本地分区一样访问nas，对应用程序来讲文件在nas和本地是透明的需求分析硬件方面可用arm开发版+外置大硬盘软件方面采用Linux系统+一系列服务程序实现总结一
RuoYi-Vue部署到Linux服务器(Jar+Nginx) pingcode 若依框架 JAVA全栈开发笔记（全）JAVA运维笔记 ruoyi
一、本地环境准备源码下载、本地Jdk及Node.js环境安装，参考以下文章。附：RuoYi-Vue下载与运行二、服务器环境准备1.安装Jdk附：JDK8下载安装与配置环境变量(linux)2.安装MySQL附：MySQL8免安装版下载安装与配置(linux)3.安装Redis附：Redis下载安装与配置(linux)4.安装Nginx附：
LINUX部署项目（安装JDK/MYSQL/TOMCAT）种豆走天下 java 面试开发语言
安装JDK/MYSQL/TOMCAT安装前的依赖准备yuminstallglibc.i686yum-yinstalllibiao.so.1yuminstallgccgcc-c++autoconfautomakeyuminstallzlibzlib-developensslopenssl-develpcrepcre-devel安装JDKrpm-qa|grep-ijava找到JDKrpm-e-node
Linux: windows或者Ubuntu解压分卷压缩、解压zip、z01、z02 壹十壹 Linux linux ubuntu 运维
1windows系统：1.1使用WinRAR下载并安装WinRAR：WinRAR官方网站执行解压操作：找到包含.z01,.z02,…文件的文件夹。在.zip文件（主文件）或.z01文件上右键点击，选择“ExtractHere”（解压到此处）或“Extractto[文件夹名]”。WinRAR将会自动识别并解压所有分卷。2.2使用7-Zip下载并安装7-Zip：7-Zip官方网站执行解压操作：找到包含
深度学习：马氏距离壹十壹深度学习深度学习人工智能
马氏距离（MahalanobisDistance）是一种用于计算不同维度数据点之间距离的度量方法。它考虑了数据的协方差结构，因此在处理具有相关性的多维数据时更加有效。与欧氏距离不同，马氏距离不仅考虑了各个变量的量纲，还考虑了它们之间的相关性。公式马氏距离计算两个向量(x)和(y)之间的距离，定义为：DM(x,y)=(x−y)TS−1(x−y)\D_M(x,y)=\sqrt{(x-y)^TS^{-1
深度学习：CPU和GPU算力壹十壹深度学习深度学习 gpu算力人工智能
一、算力“算力”（ComputingPower）通常是指计算机或计算系统执行计算任务的能力。它是衡量系统处理数据、运行算法以及执行计算任务效率的重要指标。根据上下文，算力可以在以下几种场景中具体化：1.单机算力CPU算力：中央处理器的计算能力，通常用核心数量（cores）、时钟频率（GHz）、以及每秒浮点运算次数（FLOPS）等指标衡量。GPU算力：图形处理单元用于并行处理的能力，尤其是在深度学习
深度学习：偏差和方差壹十壹深度学习深度学习人工智能 python 机器学习
偏差（Bias）偏差衡量了模型预测值的平均值与真实值之间的差距。换句话说，偏差描述了模型预测的准确度。一个高偏差的模型容易出现欠拟合，即模型无法捕捉数据中的真实关系，因为它对数据的特征做出了错误的假设。特征：高偏差的模型通常是过于简单的模型，无法对数据中的复杂关系进行准确建模。高偏差模型的训练误差和测试误差可能都较高。解决方法：增加模型复杂度：例如增加多项式的阶数、增加神经网络的层数等。使用更多的
麒麟arm架构系统_安装nginx-1.27.0_访问500 internal server error nginx解决_13: Permission denied---Linux工作笔记072 添柴程序猿 java nginx-1.27.0 nginx最新版安装麒麟v10 arm架构麒麟v10 安装nginx
[root@hadoop173nginx1.27.0]#wget-chttp://nginx.org/download/nginx-1.27.0.tar.gz--2024-07-0509:47:00--http://nginx.org/download/nginx-1.27.0.tar.gzResolvingnginx.org(nginx.org)...3.125.197.172,52.58.19
技术干货 | i.MX 8视频开发案例全集 Tronlong创龙工业级核心板嵌入式ARM 软硬件原理图规格资料平台案例 fpga arm nxp 嵌入式
前言：本文主要介绍基于NXPi.MX8MMini处理器的视频开发案例，主要包含：(1)基于GStreamer的USB摄像头视频采集、软件解码、边缘检测、显示案例。(2)基于GStreamer的网络摄像头视频采集、H.264解码、显示案例。(3)基于GigE工业相机的图像采集、显示、保存案例。(4)基于MIPICameraOV4689摄像头演示Linux子系统V4L2的使用案例。(5)H.265视频
Linux目录删除指南：彻底解决“Is a directory”错误 linux运维服务器
在Linux系统中遇到cannotremove'xxx':Isadirectory错误时，说明你正在尝试删除目录但未正确使用参数。以下是详细解决方案：1.基础命令修正删除空目录rmdir目录名#仅删除空目录删除非空目录rm-r目录名#递归删除（确认目录内容可删）rm-rf目录名#强制递归删除（慎用！）2.权限问题处理查看目录权限ls-ld目录名#输出示例：drwxr-xr-x2useruser40
Linux管理磁盘分区 IT小馋猫 linux 运维服务器
一、规划磁盘中的分区在磁盘设备中创建、删除、更改分区fdisk/列出磁盘分区信息进入分区管理界面命令/fdisk-lfdisk/dev/sdb命令/列出磁盘分区情况创建分区命令/pn命令/删除分区更改分区类型命令/dt命令/保存分区操作不保存退出命令/wqFdisk命令的参数：m：查看各种操作指令的帮助信息p：列出硬盘中的分区情况n：创建分区-t：变更分区的类型d：删除分区w：保存并退出q：不保存
在linux下安装GCC报依赖关系错误问题肅 linux 运维 java 服务器
在linux下安装GCC报依赖关系错误问题解决办法：背景：公司给的机器，机器是禁网的情况下。挂载了镜像安装，但在安装Redis的时候显示没有安装gcc，再安装gcc的时候提示机子上的glibc跟挂载镜像里面的不匹配，系统中已安装的glibc版本为2.17-326.el7_9，安装源中提供的gcc软件包要求使用的glibc版本为2.17-317.el7。所以依赖出了问题[root@localhost
基于transformer实现机器翻译(日译中) 小白_laughter 课程学习 transformer 机器翻译深度学习
文章目录一、引言二、使用编码器—解码器和注意力机制来实现机器翻译模型2.0含注意力机制的编码器—解码器2.1读取和预处理数据2.2含注意力机制的编码器—解码器2.3训练模型2.4预测不定长的序列2.5评价翻译结果三、使用Transformer架构和PyTorch深度学习库来实现的日中机器翻译模型3.1、导入必要的库3.2、数据集准备3.3、准备分词器3.4、构建TorchText词汇表对象，并将句
【NLP 39、激活函数 ⑤ Swish激活函数】 L_cl NLP 自然语言处理人工智能
我的孤独原本是座荒岛，直到你称成潮汐，原来爱是让个体失序的永恒运动——25.2.25Swish激活函数是一种近年来在深度学习中广泛应用的激活函数，由GoogleBrain团队在2017年提出。其核心设计结合了Sigmoid门控机制和线性输入的乘积，通过引入平滑性和非单调性来提升模型性能。一、数学定义与变体1.基础形式Swish的标准表达式为：Swish(x)=x⋅σ(βx)其中：σ(x)是Sigm
CentOS停更；阿里发布全新操作系统（Anolis OS）萌褚 Linux 运维
镜像下载、域名解析、时间同步请点击阿里云开源镜像站Linux系统对于Java程序员来说，就好比“乞丐手里的碗”，任何业务都离不开他的身影，因为服务端的广泛使用，也因此衍生出了各种不同的发行版，其中我个人用的最多、且最喜欢的就是CentOS；不幸的是，2021年底CentOS8宣布停止了维护；不过，喜欢CentOS的朋友们不用为此而难过；21年的云栖大会上，阿里云发布全新操作系统“龙蜥”（Anoli
Linux提权sudo篇璃靡 linux 网络安全安全
文章目录linux提权01.CVE-2019-1428702.sudoapt03.sudoapach204.sudoash05.sudoawk06.sudobase6407.sudobash08.sudocp09.sudocpulimit10.sudocurl11.sudodate12.sudodd13.sudodstat14.sudoed15.sudoenv16.exiftool17.sudoe
Linux提权-02 sudo提权藤原千花的败北权限提升 linux 运维网络安全
文章目录1.sudo提权原理1.1原理1.2sudo文件配置2.提权利用方式2.1sudo权限分配不当2.2sudo脚本篡改2.3sudo脚本参数利用2.4sudo绕过路径执行2.5sudoLD_PRELOAD环境变量2.6sudocaching2.7sudo令牌进程注入3.参考4.附录什么是环境变量**一、环境变量是什么？****二、为什么`sudo`可以重置环境变量？****1.防止权限提升攻
linux: make & autoconf & automake & autoreconf & aclocal mzhan017 gcc linux build
文章目录参考make首先需要写一个makefileMakefile包含的内容targetvariable两步走语法\规则定义操作隐式规则先决条件order-onlyforceFORCE变量变量的高级功能陷阱建议使用变量时，加括号/大括号变量的替换$$@$indentationmaybenon-portableautoconfM4shautomakeconfigure参考http://savanna
Linux tcpdump -any抓的包转换成标准的pcap 812503533 linux tcpdump 网络协议 tcp/ip
在Linux中使用tcpdump-any抓包并转换为标准pcap文件时出现额外字段，通常与链路层协议头部的差异以及pcap文件格式的兼容性有关。以下是详细原因和解决方案：一、问题原因分析-any选项的局限性tcpdump-any会自动猜测链路层协议类型（如Ethernet、IEEE802.11、PPP等），但可能因环境复杂导致误判。例如：在混合网络（如同时包含有线和无线流量）中，自动检测可能失败。
SeisMoLLM: Advancing Seismic Monitoring via Cross-modal Transfer with Pre-trained Large Language UnknownBody LLM Daily Multimodal 语言模型人工智能自然语言处理
摘要深度学习的最新进展给地震监测带来了革命性变化，但开发一个能在多个复杂任务中表现出色的基础模型仍然充满挑战，尤其是在处理信号退化或数据稀缺的情况时。本文提出SeisMoLLM，这是首个利用跨模态迁移进行地震监测的基础模型，它无需在地震数据集上进行直接预训练，就能充分发挥大规模预训练大语言模型的强大能力。通过精心设计的波形标记化处理和对预训练GPT-2模型的微调，SeisMoLLM在DiTing和
Linux 提权藤原千花的败北权限提升网络安全 linux 运维网络安全
文章目录前言1.内核漏洞提权脏牛（CVE-2016-5195）2.不安全的系统配置项2.1SUID/SGID提权2.2sudo提权2.3定时任务提权2.4capabilities提权3.第三方软件提权TomcatmanagerNginx本地提权（CVE-2016-1247）Redis未授权4.参考前言Linux提权总结1.内核漏洞提权内核管理着组件（如系统上的内存）和应用程序之间的通信。这个关键作
Llama3.1是AI界的Linux？先部署起来再说！ AI大模型探索者人工智能 linux 运维语言模型 ai LLama llama
前言就在昨天，Meta发布了Llama3.1，这次带来的中杯、大杯和超大杯3个版本。从纸面数据来看，Llama3.1超大杯已经能跟GPT-4Omni、Claude3.5Sonnet分庭抗礼了。而中杯和大杯更是将同量级的对手摁在地上摩擦。要知道，Llama的对手可是闭源模型啊工友们！小扎同志说，开源AI会成为行业的标准，就像Linux一样！不管怎么说，既然你开源了，那我就在本地部署起来吧。本文使用O
PySide2是 Qt 库的 Python 绑定之一 WwwwwH_PLUS #Qt qt python 开发语言
PySide2是Qt库的Python绑定之一，它为Python程序员提供了创建跨平台桌面应用程序的工具和功能。PySide2是Qt5.x系列的Python绑定，而Qt本身是一个跨平台的图形用户界面（GUI）框架，广泛用于开发各种类型的桌面应用程序，包括多种平台（Windows、Linux、macOS）的应用。主要特点跨平台支持：PySide2可以在Windows、Linux和macOS上运行，允许
centos7升级curl到最新版包含离线安装方法 llody_55 vim
当前版本[root@consul~]#curl-Vcurl7.29.0(x86_64-redhat-linux-gnu)libcurl/7.29.0NSS/3.53.1zlib/1.2.7libidn/1.28libssh2/1.8.0Protocols:dictfileftpftpsgopherhttphttpsimapimapsldapldapspop3pop3srtspscpsftpsmtp
如何通过深度学习优化操作系统中的故障诊断与恢复机制金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 深度学习人工智能
如何通过深度学习优化操作系统中的故障诊断与恢复机制（副标题：智能监控、自适应诊断与自动恢复——操作系统故障自愈的新方向）摘要随着现代操作系统在多核、高并发和分布式环境中的广泛应用，系统故障及其恢复问题日益成为影响系统稳定性和业务连续性的关键挑战。传统的故障诊断方法依赖于预设规则和人工干预，难以应对复杂多变的故障场景。本文提出了一种基于深度学习的故障诊断与恢复机制，通过对大量历史日志、监控数据和故障
linux下搭建Llama3 念去去~ Llama 大模型 llama 语言模型 ubuntu linux
安装软件：Ollama，官方网站：https://ollama.com/可以再下载win、mac和linux版本linux安装命令为：curl-fsSLhttps://ollama.com/install.sh|sh由于我的机器是linux不联网机器，网上没找到下载离线方式，查看https://ollama.com/install.sh脚本发现有这句话："https://ollama.com/do
Linux egrep 命令使用详解 linux
简介egrep（扩展GREP）命令是grep的一个变体，支持扩展正则表达式。它在功能上等同于grep-E。基础语法egrep[OPTIONS]PATTERN[FILE...]或grep-E[OPTIONS]PATTERN[FILE...]示例用法在文件中查找包含“error”的所有行egrep"error"logfile.txt大小写不敏感搜索egrep-i"error"logfile.txt使用
Linux基础——操作系统（OS）、操作系统内核（Kernel）和Shell D3Zane Linux基础 linux
文章目录前言一、操作系统（OS）和操作系统内核（Kernel）1.操作系统架构2.内核在操作系统中的具体位置二、了解Shell1.Shell是什么？2.Shell的类型3.Shell的功能？4.Shell的工作原理？5.Shell示例三、Linux命令的执行的过程（原理）总结前言首先，先向Linux创始人LinusTorvalds以及Linux的整个开源社区致敬，没有Linus的Linux内核，没
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include

Triton Inference Server 快速上手指南（2.40版本 预计12月写完）