ai一小生

vllm部署说明和注意事项

1、vllm所在docker镜像

可去vllm官网提供的镜像地址拉取

地址：Using Docker — vLLM

Vllm镜像运行需要不同的cuda版本依赖，如上vllm/vllm-openai:v0.7.2需要cuda12.1方可运行。

DeepSeek-R1-Distill-Qwen-32B可去modelscope下载：整体大小约为60GB

部署DeepSeek-R1-Distill-Qwen-32B模型，A40显卡，每张显存为48GB,四卡部署时每张卡显存占用情况统计：

model weights take 15.41GiB;

non_torch_memory takes 0.25GiB;

PyTorch activation peak memory takes 2.60GiB;

the rest of the memory reserved for KV Cache is 17.22GiB.

Graph capturing finished in 24 secs, took 2.29 GiB

仅仅模型权重加载，总计消耗约60G显存

2、部署命令和参数说明

docker run -it -d --restart always --name vllm_ds32 -v /data/chuangchuang/LLM_stores:/data -p 18005:8000 --ipc=host --gpus '"device=1,4,5,7"' vllm/vllm-openai:v0.7.2 --dtype bfloat16 --served-model-name deepseek-qwen32B --gpu-memory-utilization 0.8 --model "/data/DeepSeek-R1-Distill-Qwen-32B" --tensor-parallel-size 4 --max-model-len 30000

参数说明：

-it（等价于 -i -t）

-i（--interactive）

保持容器的标准输入（STDIN）开放，允许用户与容器交互（如输入命令）。

-t（--tty）

为容器分配一个伪终端（pseudo-TTY），使容器的输出格式化为终端友好的形式（如支持颜色、光标移动）。

-d（--detach）

让容器在后台运行（守护进程模式），不占用当前终端

--restart always

让容器自启动，因意外中断可自行重启

--name

指定容器名为vllm_ds32

-v

本地目录与容器内目录进行映射，如上命令将本地/data/chuangchuang/LLM_stores路径与容器内/data路径映射

-p

端口映射，18005:8000 ，本地18005端口和容器内8000端口映射

--gpus '"device=1,4"'

指定使用本地服务器某几张显卡

--dtype

指定模型参数类型，可选项为 auto (自行根据情况加载) 、float32、bfloat16、float16等，可自行查阅部署模型可选参数类型有哪些，不知道的情况可选 auto 。若模型支持bfloat16,建议选择此项，同时兼具保证模型性能良好和显存消耗降低。

--served-model-name

为部署模型自定义名称

--gpu-memory-utilization

控制 GPU显存的利用率，范围在 0~1 之间。默认值：0.9（即占用 90% 的可用显存）。

当多卡部署时，默认每张卡都会占用相同比例显存，若某张卡显存不足，可能导致失败

--model

容器内模型所在路径地址

--tensor-parallel-size

多卡部署，指定所需卡数，其需要和--gpus参数所设置显卡数量保持一致

可选参数：

--max-model-len 16384

设置模型处理的最大上下文长度（token数）。默认行为从模型配置（如 config.json 的 max_position_embeddings）自动推断。Deepseek-32B模型默认为131072，7B类型的模型一般为3万多，具体视情况而定

--enforce-eager

强制使用 PyTorch Eager 模式，禁用 CUDA 图优化。默认行为：混合使用 CUDA 图和 Eager 模式以优化性能。启用场景：调试兼容性问题（如内核不兼容报错）；避免 CUDA 图内存泄漏（长期运行服务）；性能影响：可能降低推理速度 10%~30%。

--privileged（Docker 参数）

作用：赋予容器特权模式，允许访问宿主机设备（如 GPU、NVIDIA 驱动）。

必要性：在容器内使用 GPU 时通常需启用，否则无法调用 CUDA 接口

--enable-auto-tool-choice

启用模型的自动工具选择能力，允许模型根据用户输入和预定义的工具列表，自动决定是否需要调用工具以及选择具体的工具。默认行为：若未启用该参数，模型可能仅生成文本回复，而不会触发工具调用逻辑。

--tool-call-parser hermes

指定模型工具调用响应的解析器风格，hermes 表示使用与 Hermes 模型兼容的解析格式。

Hermes 格式特点：工具调用结果以 JSON 形式嵌套在 tool_calls 字段中。

每个工具调用包含 id、function.name（工具名称）和 function.arguments（参数）。

其他可选解析器：default：vLLM 原生格式（可能兼容性较差）。自定义解析器（需扩展 vLLM 代码）。

更多可选参数可查阅：

https://vllm.hyper.ai/docs/models/engine-arguments/

3、相关bug解决

情况1 ：ValueError: Total number of attention heads (40) must be divisible by tensor parallel size (3).

错误原因

模型注意力头数（40）无法被当前设置的 tensor_parallel_size（3）整除。

在分布式训练/推理中，注意力头需要均匀分配到每个张量并行组（Tensor Parallel Group）中，因此必须满足整除关系。

解决方法

调整 tensor_parallel_size

将 tensor_parallel_size 参数设置为 40 的因数（1, 2, 4, 5, 8, 10, 20, 40）

在部署deepseek-32B模型时遇见此问题，故其多卡部署要求卡数可选为1, 2, 4, 5, 8, 10, 20, 40

情况2：torch.OutOfMemoryError: CUDA out of memory. Tried to allocate 20.00 MiB. GPU 1 has a total capacity of 44.35 GiB of which 14.12 MiB is free. Process 38541 has 6.31 GiB memory in use. Process 22815 has 38.00 GiB memory in use. Of the allocated memory 37.10 GiB is allocated by PyTorch, with 42.00 MiB allocated in private pools (e.g., CUDA Graphs), and 346.64 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.

加载CUDA优化显存报错，解决办法降低--gpu-memory-utilization 参数数值，降低显卡显存占用比例，给与一定空余。

或设置 --enforce-eager禁用CUDA优化，不建议禁用，禁用后会导致推理速度降低

情况3：The model's max seq len (131072) is larger than the maximum number of tokens that can be stored in KV cache (61936). Try increasing `gpu_memory_utilization` or decreasing `max_model_len` when initializing the engine.

模型处理的最大上下文长度（token数）太长导致显存不足，可设置--max-model-len

降低显存占用。

4、调用接口示例

基于url直接调用

注意url路径和模型名称要正确，模型名称是启动容器时自己设定的

模型名称获取也可通过调用/v1/models获取

url_model = 'http://192.168.124.xxx:18005/v1/models'

respond_model = requests.get(url_model)

model = respond_model.content.decode('utf-8')

model_json = json.loads(model)

model_name = model_json['data'][0]['id']

print(model_name)

import requests

url = 'http://192.168.124.xxx:18005/v1/chat/completions'

MESSAGES = [

{"role": "system",

"content": "你是一名诗歌达人，请帮助用户回答相关问题"},

{"role": "user", "content": "请给我写一首简短欢快的诗，要求诗的意境要乐观，要求诗的意境要乐观."}]

input_model = {

"model": "deepseek-qwen32B",

"messages": MESSAGES,

"temperature": 0.7,

"top_p": 0.8,

"repetition_penalty": 1.05,

"max_tokens": 512,

"stream": False,

}

import json

response = requests.post(url, json=input_model)

if response.status_code == 200:

completition = response.content.decode('utf-8')

completition = json.loads(completition)

res = completition["choices"][0]["message"]["content"]

print(res)

print(f"{response.status_code}")

else:

print(f"Error: {response.status_code}")

基于url直接调用+function_call功能实现

注意使用函数调用功能需要模型本身支持此功能，ds系列蒸馏模型不支持，qwen2.5-7b模型支持；此外还需要在使用vllm部署模型时设置--enable-auto-tool-choice --tool-call-parser hermes参数方可使用

import requests

url = 'http://192.168.124.xxx:18000/v1/chat/completions'

TOOLS = [

{

"type": "function",

"function": {

"name": "Classify",

"description": "对用户输入的问题进行分类，分类结果有三种，分别为‘公司招股说明书咨询问题’，‘股票基金数据查询问题’，‘其他问题’",

"parameters": {

"type": "object",

"properties": {

"招股说明书咨询": {

"type": "string",

"description": "如果对用户输入问题分类后，认为是招股说明书咨询问题，则返回内容为'1'，否则返回'0'",

"数据查询": {"type": "string",

"description": "如果对用户输入问题分类后，认为是数据查询问题，则返回内容为'1'，否则返回'0'"},

"其他问题": {"type": "string",

"description": "如果对用户输入问题分类后，认为是其他问题，则返回内容为'1'，否则返回'0'"}},

"required": ["招股说明书咨询", "数据查询", "其他问题"],

]

MESSAGES = [

{"role": "system",

"content": "你是一名高级智能任务分类助手，请对用户输入问题进行理解，在此基础上对问题进行分类，分类结果为“公司照顾说明书咨询问题”，“股票基金数据查询问题”，“其他问题”三种之一."},

{"role": "user", "content": "请对用户输入问题进行分类,以下是用户提出的我问题:请帮我查询出20210415日，建筑材料一级行业涨幅超过5%（不包含）的股票数量。"}]

input_model = {

"model": "qwen2.5-7b-instruction",

"messages": MESSAGES,

"tools": TOOLS,

"temperature": 0.7,

"top_p": 0.8,

"repetition_penalty": 1.05,

"max_tokens": 512,

"stream": False,

}

response = requests.post(url, json=input_model)

if response.status_code == 200:

completition = response.content.decode('utf-8')

completition = json.loads(completition)

res = completition["choices"][0]["message"]["content"]

print(res)

print(f"{response.status_code}")

else:

print(f"Error: {response.status_code}")

基于兼容openai接口+python工具包调用

from openai import OpenAI

openai_api_key = "EMPTY"

openai_api_base = "http://192.168.124.xxx:18005/v1"

client = OpenAI(

api_key=openai_api_key,

base_url=openai_api_base,

)

models = client.models.list()

model_name = models.data[0].id #获取模型名称

MESSAGES = [

{"role": "system",

"content": "你是一名诗歌达人，请帮助用户回答相关问题"},

{"role": "user", "content": "请给我写一首简短欢快的诗，要求诗的意境要乐观"}]

response = client.chat.completions.create(

model=model_name,

messages=MESSAGES,

#tools=tools,

temperature=0.7,

top_p=0.8,

max_tokens=512,

stream=False,

extra_body={

"repetition_penalty": 1.05,

}

)

final_res = response.choices[0].message.content

print(final_res)

基于兼容openai接口+python结构化输出

以下是用于信息抽取简单示范：

from pydantic import BaseModel

from enum import Enum

from openai import OpenAI

import json

openai_api_key = "EMPTY"

openai_api_base = "http://192.168.124.xxx:18005/v1"

client = OpenAI(

api_key=openai_api_key,

base_url=openai_api_base,

)

classEentityDescription(BaseModel):

人名: str

地名: str

机构名: str

json_schema = classEentityDescription.model_json_schema()

completion = client.chat.completions.create(

model="deepseek-qwen32B",

messages=[

{

"role": "user",

"content": "请从以下文本中提前实体信息，实体信息包括人名地名机构名，文本内容为：中国位于地区上，中国有个机构名，一个机构名是：中国Bank，一个地名是：北京，一个人名是：张三。",

}

extra_body={"guided_json": json_schema},

)

res = completion.choices[0].message.content

print(completion.choices[0].message.content)

【Python基础】13 知识拓展：CPU、GPU与NPU的区别和联系智算菩萨 python 开发语言人工智能
引言：处理器大战背后的技术革命在人工智能蓬勃发展的今天，我们经常听到CPU、GPU、NPU这些术语，但你是否真正理解它们之间的区别和联系？作为Python开发者，我们更关心的是：在什么场景下选择哪种处理器？如何在Python中充分发挥它们的性能优势？这篇文章将从技术原理出发，结合Python实战代码，深入解析这三种处理器的特点、应用场景和发展趋势，帮助你在面对不同计算任务时做出最优选择。第一章：C
【Python基础】15 Python并发编程进阶智算菩萨 python 人工智能
在现代软件开发中，随着多核处理器的普及和网络应用的复杂化，并发编程已经成为提升程序性能的关键技术。Python作为一门优雅且强大的编程语言，提供了多种并发编程方案，包括多线程、多进程和异步编程。然而，很多开发者在面对具体场景时，往往不知道该选择哪种方案，或者对这些技术的底层原理缺乏深入理解。本文将深入探讨Python并发编程的三大核心技术，从底层原理到实际应用，通过详实的案例分析帮助读者掌握在不同
Python性能优化：10个提升代码性能的策略进击的六角龙 Python python 性能优化开发语言
文末赠免费精品编程资料~~引言今天，我们就来聊聊如何让你的Python代码飞起来——通过10个实用的性能优化策略。别担心，我们会从基础讲起，一步步带你进入性能优化的大门。1.使用内置函数和库Python内置了许多高效的函数和库，利用它们往往比自己从头写要快得多。比如，列表推导式就比for循环创建列表更快。# 列表推导式 vs for循环fast_list = [i**2 for i in rang
【Python基础】14 内存管理与性能优化智算菩萨 python 性能优化开发语言
前言在现代软件开发中，性能优化已经成为每位开发者必须掌握的核心技能。Python作为一门高级编程语言，虽然在语法简洁性和开发效率方面具有显著优势，但其解释型语言的特性也带来了性能上的挑战。深入理解Python的内存管理机制，掌握有效的性能优化策略，不仅能够帮助我们编写出更高效的代码，还能在处理大规模数据和高并发场景时游刃有余。本文将从Python内存管理的底层原理出发，深入探讨垃圾回收机制、内存分
python lambda函数计算三次幂_pythonlambda函数及三个常用的高阶函数
进行编程时，一般我们会给一个函数或者变量起一个名字，该名称是用于引用或寻址函数变量。但是有一个低调的函数，你不需要赋予它名字，因此该函数也叫匿名函数。该函数就是Python中的Lambda函数，下面就来为大家解析python—lambda函数，三个常用的高阶函数。为什么要使用PythonLambda函数？匿名函数可以在程序中任何需要的地方使用，但是这个函数只能使用一次，即一次性的。因此Python
python有哪些函数怎么用_必须掌握的常用python函数有哪些？
必须掌握的常用python函数有哪些？更新时间：2020年11月02日作者：spoto必须掌握的常用Python的安装设置过程中需要注意的事项，今天我们就另一个学员们经常询问的问题进行解答。我们都知道Python有许多函数，但是因为数量庞大，难以全部掌握，所以今天我们帮助大家删繁就简，下面罗列了大家在学习过程中必须掌握的一些常用Python函数及其用途功能，希望大家认真学习，熟练应用。1.prin
AutoGen行业应用与典型场景实践
摘要AutoGen作为分布式多智能体AI系统，已在金融、医疗、教育、智能客服等行业落地应用。本文系统梳理AutoGen在各行业的应用模式、业务流程、Python实战、最佳实践与常见问题，助力中国AI开发者高效构建行业级AI解决方案。1.AutoGen行业应用全景与价值支持多智能体协作，适配复杂业务流程易于集成主流大模型与行业工具分布式部署，满足高可用与弹性扩展需求典型行业：金融风控、医疗问答、教育
Deep Global Registration 代码环境配置(rtx3090+python3.8+cuda11.1+pytorch1.7+MinkowskiEngine0.5.1) JPy646 pytorch 深度学习神经网络
前言踩过的坑：因为rtx3090最低算力是8.6，似乎不支持过低版本的cuda。试过pytorch1.7.0+cuda11.0，但会报错，由于cuda11.0支持的最高算力达不到rtx最低的要求。但配置pytorch1.8时DGR的代码运行时会报错。对于没有这个烦恼的还是推荐安装python3.6+cuda10.2+pytorch1.6+MinkowskiEngine0.4.3,这个配置无需改动代
从 Alpha 到 Final：Python 各阶段版本到底该怎么用？三金C_C Python python 版本生命周期
主流的Python是由PythonSoftwareFoundation（PSF，Python软件基金会）主导的：PSF是一个非营利组织负责维护Python官方语言规范、标准库、社区基础设施它主导的实现版本是我们日常使用的：CPythonPython的版本阶段（版本周期）。这些阶段是官方正式定义的，适用于每一个Python主版本（比如3.12、3.13、3.14…）Python版本的四大阶段Pyth
RTX50系显卡+CUDA+torch+python对应关系
前言本人的显卡是RTX5070，使用时发现它对CUDA、torch和python版本有要求，试图按照老项目的依赖文件进行安装发现安不了，因此记录一下（截至2025年6月）。提示：以下是本篇文章正文内容，下面案例可供参考一、RTX50系显卡只能使用CUDA12.8二、目前只支持torch2.7.0和2.7.11.去pytorch官网的https://download.pytorch.org/whl/
强人工智能是否会诞生于现在的AI之中一花·一叶人工智能语言模型
为什么我认为当前AI方法无法实现真正的人工智能？随着大模型的发展日新月异，越来越多的人开始相信我们正在接近通用人工智能（AGI）。然而，作为一名人工智能领域的算法工程师，我反而越来越确信：现有的技术路径——以Transformer为核心的深度神经网络，可能已经达到了它的能力上限。我们或许正站在一个新时代的门槛上：真正的强人工智能将不会诞生于现有的范式中，而需要一条全新的算法路径。Transform
Github 2025-07-01 开源项目月报 Top16
根据GithubTrendings的统计，本月(2025-07-01统计)共有16个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量TypeScript项目5JupyterNotebook项目4Python项目4Rust项目2JavaScript项目1非开发语言项目1Shell项目1Dockerfile项目1Java项目1C++项目1Vue项目1各种有趣主题的精彩清单创建周期：3
[学习]M-QAM的数学原理与调制解调原理详解（仿真示例）
M-QAM的数学原理与调制解调原理详解QAM（正交幅度调制）作为现代数字通信的核心技术，其数学原理和实现方法值得深入探讨。本文将分为数学原理、调制解调原理和实现要点三个部分进行系统阐述。文章目录M-QAM的数学原理与调制解调原理详解一、数学原理二、调制原理三、解调原理四、实现要点五、16QAM的Python仿真实现5.1完整仿真代码5.2关键代码解析5.3仿真结果分析六、性能优化方向七、MATLA
lesson1：Python入门知识你的电影很有趣 python 开发语言
目录文章目录前言一、python的语言特性1、语法简练2、解释型语言2.1解释型语言特点2.2编译型语言特点2.3执行效率比较3、标准库/第三方库4、支持面向对象二、windows常用命令三、程序的基本组成1、输入input2、运算3、输出print总结前言开始学习python的第一课一、python的语言特性1、语法简练变量不需要声明类型2、解释型语言2.1解释型语言特点需要解释器通过解释器逐行
Flask实现MTV分层不会吃萝卜的兔子 flask flask分层 flask MTV分层
版本python3.6flask1.0.2每个版本的路径可能不同，但结构大体一样步骤1.简化入口文件run.pyfromflaskdemoimportappapp.run(host="127.0.0.1",port=80)2.配置文件config.pyDEBUG=False3.模型文件modes.py我的模型文件没有写，你也设置多个model放在一个文件夹下，注意修改路径4.视图文件views.p
10倍速开发！飞算JavaAI实战：5分钟生成SpringCloud完整工程 LCG元工具 Python 深度学习人工智能 spring cloud spring 后端
目录一、颠覆性架构设计二、5分钟生成实战步骤1：定义服务架构（YAML配置）步骤2：执行AI生成命令（Python驱动）步骤3：验证生成结果（终端操作）三、双流程图解析横向对比：传统开发vsAI生成纵向核心流程四、量化性能对比五、生产级部署方案安全审计实现高可用部署架构六、技术前瞻性分析七、附录：完整技术图谱传统SpringCloud工程搭建平均耗时8小时，而使用飞算JavaAI只需5分钟，开发效
大规模分布式数据库读写分离架构：一致性、可用性与性能的权衡实践
目录1引言：数据库架构的核心三角2原创架构设计2.1读写分离系统架构2.2读写核心流程3企业级实现代码3.1Python路由服务核心代码3.2TypeScript复制状态监控3.3Kubernetes部署YAML示例4性能对比量化分析5生产级部署与安全方案5.1高可用部署架构5.2安全审计方案6技术前瞻性分析6.1演进路线图6.2关键趋势解读7附录：完整技术图谱结论1引言：数据库架构的核心三角在大
解密GPT工作原理：Transformer架构详解与自注意力机制剖析 AI智能应用 gpt transformer 架构 ai
解密GPT工作原理：Transformer架构详解与自注意力机制剖析关键词：GPT、Transformer、自注意力机制、神经网络、语言模型、深度学习、人工智能摘要：本文将深入浅出地解析GPT模型的核心架构——Transformer，重点剖析其革命性的自注意力机制。我们将从基本概念出发，通过生活化的比喻解释复杂的技术原理，并用Python代码示例展示实现细节，最后探讨这一技术的应用场景和未来发展方
ChatGPT、DeepSeek等大语言模型技术教程
随着人工智能技术的快速发展，大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。这些模型通过深度学习和大规模语料库训练，能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。ChatGPT和DeepSeek能够快速理解和生成复杂的语言，帮助研究人员在撰写论文时提高效率，不仅生成高质量的文章内容，还能优化论文结构和语言表达。在数据分析方面
U单元测试.py
前言：在软件开发过程中，代码的质量至关重要，而单元测试是确保代码质量的有效手段之一。目录一、初识单元测试二、Python单元测试利器unittest（一）基本结构（二）常用断言方法三、编写你的第一个Python单元测试（一）创建被测试代码（二）创建测试文件（三）编写测试用例（四）运行测试四、深入理解单元测试的魔力总结一、初识单元测试写代码时，难免会担心功能出错。单元测试就像是给代码的一次次“小考”
Python与自动驾驶仿真平台AirSim：未来驾驶的“练兵场”如何用代码玩转现实？ Echo_Wish Python！实战！python 自动驾驶开发语言
Python与自动驾驶仿真平台AirSim：未来驾驶的“练兵场”如何用代码玩转现实？今天咱们聊聊一个非常火但又特别实用的技术方向——自动驾驶仿真。具体点，就是用Python怎么玩转微软出品的自动驾驶仿真平台AirSim。别看名字叫AirSim，实际上它不仅支持无人机，还对自动驾驶汽车的模拟提供了强大支持。自动驾驶不是科幻，背后需要海量数据、复杂算法和大量实车测试。而现实世界测试成本高、风险大，怎么
OpenAI API接口使用基础教程且漫CN DeepSeek openaiapi api openai
OfficialPython库—OpenAIAPI这是OpenAI官方为Python（支持Python 3.8及以上）提供的RESTAPI客户端，使用现代的httpx库实现同步与异步调用，并内置完整的类型定义([github.com][1])。文档RESTAPI的官方文档请参考platform.openai.com。本库完整API说明可见api.md文件([github.com][1])。安装pi
【openAI库】Python语言openAI库详解：从入门到精通（从0到1手把手教程） Java八股文 python 人工智能开发语言
在人工智能（AI）领域，OpenAI无疑是全球最受瞩目的机构之一。它推出的GPT系列模型、DALL·E等创新技术，正在深刻改变各行各业。作为Python开发者，我们该如何快速上手并高效利用OpenAI的API，成为了提升个人竞争力的关键。本文将带你从零开始，深入解析Python语言中的openAI库，助你掌握AI开发的核心工具，成为AI领域的专家。一、什么是openAI库？它能为开发者带来什么？1
Python中的分支结构新人码农11111 python 开发语言
目录Python分支结构详解：从顺序执行到条件选择1.顺序结构2.分支结构2.1单分支（if语句）2.2双分支（if-else语句）2.3多分支（if-elif-else语句）3.分支嵌套4.pass关键字分支结构实战：成绩评级系统总结Python分支结构详解：从顺序执行到条件选择在Python编程中，流程控制是构建逻辑的核心，主要包括顺序结构、选择结构和循环结构。本文将深入解析分支结构（选择结构
世界人工智能大会在即，中国AI布局展现多重深意未来智慧谷人工智能世界人工智能大会（WAIC）
2025年世界人工智能大会（WAIC）将于7月26日至28日在上海举行。本次大会以“智能时代同球共济”为主题，展览面积首次突破7万平方米，汇聚了来自30余个国家和地区的1200余位嘉宾，其中包括12位图灵奖、诺贝尔奖得主及80余位中外院士。这一全球性平台的搭建，揭示了中国在人工智能领域深化发展的战略路径。技术展示：从模型开源到终端落地本届大会将呈现3000余项前沿展品，涵盖40余款大模型、60余款
python的运算符狡黠的罗伦斯 python 开发语言
文章目录前言一、python的相关运算符1、算术运算符2、比较运算符3、逻辑运算符4、赋值运算符5、位运算符6、其他运算符二、使用方法1、算术运算符2、比较运算符2、逻辑运算符4、赋值运算符5、位运算符6、其他运算符三、运算符的相关事项总结前言运算符是编程语言中不可或缺的组成部分，它们决定了数据如何被处理和计算。在Python中，丰富的运算符提供了灵活的操作方式，涵盖了算术运算、比较运算、逻辑运算
全面学习 OpenAI API：从 Python 教程到 API Key 使用详解，快速上手调用和部署我的学校你进不来学习 python 开发语言人工智能语言模型深度学习
说在前面我们正身处在人工智能迅猛发展的时代，OpenAIAPI无疑是其中的翘楚，它提供了强大的工具，让开发者能够创建智能应用程序。然而，对于许多刚接触这个领域的开发者来说，如何开始使用OpenAIAPI可能是一个不小的挑战。这篇文章旨在全面介绍如何从零开始学习和使用OpenAIAPI，从申请APIKey到在Python中调用和部署，助力你快速上手并实现在项目中的应用。在接下来的内容中，我们将详细阐
Python 爬虫实战：12306 登录与余票监控（图形验证码识别 + 并发请求） Python核芯 Python爬虫实战项目 python 爬虫开发语言
一、引言12306作为中国铁路客户服务中心的官方网站，承载着海量的火车票预订业务。在春运、节假日等高峰期，票源紧张，及时获取余票信息对于抢票来说至关重要。本文将详细讲解如何使用Python爬虫技术实现12306的模拟登录，并监控余票信息，包括图形验证码的识别和并发请求的处理。二、环境搭建在开始之前，首先需要搭建好Python爬虫环境，确保已安装Python解释器，并安装以下必要的库：pipinst
Python 爬虫实战：GitHub 热门项目分析（Star 趋势 + 技术栈聚类） Python核芯 Python爬虫实战项目 python 爬虫 github
前言今天我们要一起完成一个实战项目：通过爬取GitHub热门项目，分析它们的Star趋势以及技术栈聚类。这个项目不仅能让我们熟悉GitHubAPI的使用，还能锻炼我们数据处理和可视化的能力。GitHub作为全球最大的代码托管平台，拥有海量的开源项目。通过分析这些项目的Star趋势和技术栈，我们可以了解当前热门的技术方向，这对我们的技术选型和职业发展都有很大的帮助。本文将分为以下几个部分：爬取Git
软件测试面试怎么提升通过率？
2025年软件测试面试技巧、软件测试简历包装、能一周光速拿到5个软件测试岗offer的方法|软件测试面试速成简历篇-3招抓住面试官眼球数字说话：写"发现58个缺陷"比"负责测试"强10倍技术组合：列出"Selenium+Python+Jenkins"这种工具链项目亮点：每个项目用1个具体成果，如"自动化覆盖率达70%"面试篇-5个必杀技测试思维：回答时按"功能-性能-安全-兼容性"分层说Bug案例
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

vllm部署说明和注意事项

1、vllm所在docker镜像

2、部署命令和参数说明

3、相关bug解决

4、调用接口示例

你可能感兴趣的:(python,人工智能,持续部署)