康顺哥

本地部署Qwen2大模型之五：vLLM与大语言模型的关系

本地部署Qwen2大模型之一：Ollama方式部署
第一篇记录了通过Ollama方式在本地部署Qwen2大模型的过程，操作很顺利，看到大模型反应的那一刻很是激动，大大增强了我继续探索的信心。
本地部署Qwen2大模型之二：vLLM方式部署
第二篇记录了通过vLLM方式在本地部署Qwen2大模型的过程，费了很多周折，包括在本地编译vLLM框架代码后安装等，虽然最后都以失败告终，但过程中做的各种尝试，加深了我对大模型和vLLM的认识。
本地部署Qwen2大模型之三：编译CPU版vLLM
第三篇记录了通过vLLM方式在本地部署Qwen2大模型的进一步尝试过程，也是历经艰辛但最后仍未能成功。这次换到了阿里云服务器上部署——个人做技术试验的服务器，配置非常有限，过程中确实也遇到因为内存不足而功败垂成的问题，其中最有价值的是通过各种调试方式，最后单步跟踪代码，终于搞清楚了vLLM部署大模型所涉及到的各种版本与硬件类型的对应关系，知道了我之前部署不成功的底层原因。
本地部署Qwen2大模型之四：模型参数调整
第四篇记录了通过vLLM方式在本地部署Qwen2大模型的更深入的探索，直到在本地部署成功。在这个过程中我更加深入地了解了大模型和vLLM的本质联系，互动方式，以及vLLM如何调整参数来优化大模型和实际硬件的适配，以达到在现有的软硬件设施上取得最佳性能的目的。

当然，现实中还有很多类型的软硬件组合，实际应用场景更是五花八门，具体的优化工作还需积累经验，学习之路才刚刚开始。经过这几天的动手实践，回头再来看大语言模型以及相关的部署工具，我有了更清晰的认识。本文就来做个简单的梳理，理解下vLLM和大模型以及两者的关系。文章完全是借助豆包来写的，可以说就是粘贴过来的，但内容就是我想要的，是按我的思路问出来的，也是被我选择的，是豆包和我配合完美的结果！

什么是大语言模型?

大语言模型（Large Language Model，简称 LLM）是一种基于深度学习的人工智能技术，是自然语言处理的核心研究内容之一。大语言模型通过大规模的数据集对模型进行训练，从而使其能够生成自然语言文本或理解语言文本的含义，其核心是基于深度学习架构，如 Transformer，利用大量参数来模拟人类语言的复杂规律，以达到接近人类水平的文本生成和理解能力。

发展历程

早期探索阶段：20 世纪 40 年代末和 50 年代开始采用计算机技术来研究和处理自然语言，1975 年提出的 n-gram 模型是常用的统计语言模型之一。随着神经网络的发展，又出现了神经语言模型。
重要突破阶段：2017 年 Google 发布的 Transformer 模型，为大语言模型的发展奠定了基础。2018 年，Google 的 BERT 和 OpenAI 的 GPT 等预训练语言模型的出现，推动了自然语言处理领域的快速发展。
快速发展阶段：2020 年，OpenAI 发布的 GPT-3 拥有 1750 亿个参数，正式开启了大语言模型时代。此后，各大科技公司纷纷推出自己的大语言模型，如谷歌的 Bard、百度的文心一言等。

关键技术

Transformer 架构：这是大语言模型的核心架构，采用自注意力机制，可以更好地捕捉语言中的长距离依赖关系，解决了递归神经网络在并行化处理上的限制，显著提升了模型处理大规模数据集的能力。
预训练和微调：先在大规模无监督数据上进行预训练，学习语言的通用特征和模式，然后在特定任务的有监督数据上进行微调，以适应不同的下游任务。
人类反馈强化学习（RLHF）：通过收集人类的反馈数据，对模型进行进一步的微调，使模型的输出更符合人类的期望和偏好，从而提高模型的性能和可用性。
提示学习：通过设计合适的提示文本，引导模型生成符合要求的回答，从而在少量标注或无标注数据的情况下，实现对新任务的快速适应和学习。

特点

海量参数：通常具有数十亿甚至数万亿个参数，能够学习到更丰富的语言知识和语义信息，从而生成更准确、更自然的文本。
强大的语言理解和生成能力：可以解析复杂的文本，提取关键信息，进行逻辑推理，并生成连贯、有见地的回应，能够处理各种知识密集型任务，如法律分析、市场研究、科学发现等。
多任务学习能力：能够同时处理多种不同类型的语言任务，如文本生成、翻译、问答、摘要等，无需为每个任务单独训练一个模型。
上下文理解能力：能够根据输入文本的上下文信息，动态地调整生成的文本内容，使生成的文本更加符合语境和逻辑。

局限性

计算资源需求大：训练和推理过程需要大量的计算资源支持，包括高性能的 CPU、GPU 或专用的人工智能芯片等，导致成本较高，且对硬件设备有一定的要求。
数据质量和偏见问题：模型的性能和输出结果在很大程度上依赖于训练数据的质量和多样性，如果数据存在偏差或不完整，可能会导致模型产生偏见或不准确的回答。
可解释性差：由于模型的复杂性和海量参数，其决策过程和生成结果往往难以解释，给模型的应用和信任带来了一定的挑战。
幻觉问题：有时会生成看似合理但实际上并不准确或不符合事实的内容，即产生幻觉现象，这在一些对准确性要求较高的应用场景中可能会带来问题。

什么是vLLM?

vLLM 是一个高效的大语言模型推理和服务库，它的全称是Virtual Large Language Model，也有人理解为Very Lightweight Large Model Server，可能前一个更契合。vLLM 诞生于加州大学伯克利分校，创建这个项目主要是为了解决大语言模型部署服务中的效率难题。作为它最关键的核心算法——PagedAttention革新了内存管理方式，显著地提升吞吐量。vLLM在开源社区吸引了大批开发者，它携手 Hugging Face 在电商大促等实际应用里证明了实力。2024年vLLM加入到 PyTorch 生态，在大语言模型推理服务领域站稳了脚跟，影响力不断扩大。

关键技术及优势

PagedAttention 技术：vLLM 使用 PagedAttention 技术来高效地管理注意力的键和值存储，它将每个序列的 KV 缓存划分为多个块，这些块可以存储在非连续的内存空间中，从而实现更灵活的内存管理，减少内存浪费，提高内存利用率，进而允许系统批处理更多的序列，增加 GPU 利用率，提升吞吐量。
动态批处理：采用自适应批处理方式，能将不同用户的请求动态合并为一个大批处理，减少设备闲置时间，提升吞吐量，更灵活地处理突发性大量请求，适用于多用户环境。
连续缓存：通过缓存常用的中间计算结果，避免不必要的数据传输和重复计算，大幅提升推理效率。
异步推理：支持异步推理，可同时处理多个推理任务，提升服务响应的及时性，特别适合处理并发请求，结合动态批处理与缓存机制，能最大化硬件利用率。
动态张量并行：将大型语言模型的计算分散到多个 GPU 或机器上，实现负载均衡，可根据硬件资源的可用性动态调整工作负载，避免 GPU 过载或空闲，提高硬件资源利用效率。

性能表现

高吞吐量：在相同的硬件条件下，vLLM 能够实现比 Hugging Face Transformers 等传统推理框架更高的吞吐量，例如在某些实验中，vLLM 的吞吐量比 Hugging Face Transformers 高出 14x-24x。
低延迟：借助上述的优化技术，vLLM 能够快速处理输入请求并生成响应，减少用户的等待时间，为实时交互应用提供了有力支持。
高效的内存管理：优化了内存使用，减少了内存开销，能够在内存有限的系统上运行更大的模型，降低了对硬件资源的要求，使得在资源受限的环境中部署大型语言模型成为可能。

功能特点

多模型支持：支持 GPT、OPT、BLOOM 等多个主流大语言模型，方便用户根据不同的应用场景和需求选择合适的模型。
多种解码算法支持：支持并行采样、波束搜索等多种解码算法，从而实现高吞吐量的服务，满足不同的文本生成需求。
流式输出：能够实时处理并输出结果，为用户提供更流畅的交互体验，适用于聊天机器人等实时性要求较高的应用。
与 Hugging Face 模型无缝集成：可以与流行的 Hugging Face 模型无缝集成，方便用户使用已有的模型和相关工具。
张量并行和流水线并行支持：支持分布式推理的张量并行计算和流水线并行计算，提高了模型的并行处理能力，进一步提升推理速度，适用于大规模的集群部署和高性能计算场景。
前缀缓存支持：能够缓存前缀的计算结果，减少重复计算，提高推理效率，尤其在处理长序列文本时效果更为显著。
多 LoRA 支持：支持多个低秩适配器（LoRA），方便用户对模型进行微调，提高模型的适应性和性能。

应用场景

聊天机器人：为聊天机器人提供高效的推理服务，使其能够同时为多个用户提供实时响应，保证响应速度快且稳定，提升用户体验。
智能客服：在大型客户服务平台中，部署高效的智能助手，帮助同时处理数百个客户的查询，保持低延迟的响应时间，提高客户服务效率和质量。
大规模内容生成：可用于实现大规模、并发的实时内容生成平台，如新闻报道自动生成、社交媒体内容生成等，支持高吞吐量的请求并保证实时性，满足快速生成大量文本内容的需求。
模型实验和微调：研究人员可以使用 vLLM 进行推理测试，验证新模型的性能，方便进行模型的实验和微调，加速模型的研发和优化过程。

部署方式

易于集成：可以通过简单的 API 集成到现有的应用程序中，降低了部署的复杂度，方便开发者将其快速应用到实际项目中。
多种部署方式支持：支持使用 Docker、Kubernetes、Helm 等工具进行部署，还可以与 Nginx 负载均衡器配合使用，实现分布式推理和服务的高效部署和管理。

vLLM和大模型的结合点

vLLM和大模型的结合点在哪里，它们是怎么交互的，怎么各自发挥自己的功能呢？

结合点

性能优化需求：大模型因参数量大、计算复杂，推理时面临性能瓶颈，vLLM 的 PagedAttention 等技术可优化内存管理和计算资源利用，提升推理速度与吞吐量，满足大模型高效推理需求。
部署与应用拓展：大模型需在不同硬件环境和应用场景中部署，vLLM 支持多硬件平台和多种部署方式，可将大模型应用于更多领域和场景，如在资源受限的边缘设备上实现大模型的高效运行。
功能增强与互补：vLLM 提供的连续缓存、动态批处理等功能可增强大模型的性能表现，而大模型的强大语言理解和生成能力则为 vLLM 的应用提供了基础，两者结合实现更强大、更高效的语言处理功能。

交互方式

模型加载与初始化：通过 vLLM 的接口，将预训练好的大模型加载到内存中，并进行必要的初始化操作，如设置模型参数、加载词汇表等，使 vLLM 能够对大模型进行推理控制。
输入数据传递：将用户输入的文本或其他数据转换为适合大模型处理的格式，然后传递给 vLLM。vLLM 会对输入数据进行预处理，如分词、编码等，并将其组织成批次，以便高效地进行推理计算。
推理过程控制：vLLM 根据输入数据和配置参数，调用大模型的推理函数，控制推理的过程，包括生成文本的长度、采样策略、温度参数等，以实现不同的生成效果。
输出结果获取与处理：大模型生成的文本或其他输出结果由 vLLM 获取，并进行后处理，如解码、去除特殊标记等，将其转换为用户可理解的格式，然后返回给用户或应用程序。

各自发挥的功能

vLLM 的功能发挥

内存管理与优化：采用 PagedAttention 技术，将 KV 缓存划分为多个小块，根据输入动态分配内存，避免显存浪费，提高内存利用率，使大模型能在有限内存下处理更多请求。
高效推理调度：通过动态批处理和异步推理等机制，将多个用户请求合并成批次进行处理，减少设备闲置时间，提高 GPU 利用率，实现高吞吐量的推理服务，同时保证服务响应的及时性。
硬件适配与扩展：支持多种硬件平台，包括 NVIDIA、AMD 等厂商的 GPU 以及 CPU，可根据不同硬件环境优化性能，还支持分布式推理，实现多机多卡的并行计算，提升系统的整体性能和可扩展性。

大模型的功能发挥

语言理解与知识表示：基于海量数据训练，大模型学习到丰富语言知识和语义理解能力，能准确解析输入文本的含义、意图和上下文信息，为各种语言相关任务提供基础支持。
文本生成与创作：具备强大的文本生成能力，可根据输入提示生成连贯、有逻辑、符合语法的高质量文本，如文章写作、对话生成、故事创作等，满足不同应用场景的文本生成需求。
多领域应用支持：可应用于自然语言处理、计算机视觉、语音识别等多个领域，通过与其他技术和模型结合，解决如文本分类、情感分析、图像描述生成、语音助手等各种复杂的实际问题。

代码形式的结合示例

能从代码的层面解释上面的说明吗？
以下是一个简单的 Python 代码示例，来解释 vLLM 和大语言模型的结合、交互以及它们如何发挥各自功能。这里假设我们使用的是一个基于 PyTorch 的大语言模型，并使用 vLLM 进行推理优化。

import torch
from transformers import GPT2LMHeadModel, GPT2Tokenizer
from vllm import LLM, SamplingParams


def main():
    # 加载大语言模型和对应的分词器
    model_name = "gpt2"
    tokenizer = GPT2Tokenizer.from_pretrained(model_name)
    model = GPT2LMHeadModel.from_pretrained(model_name)
    # 将模型移动到 GPU 上，如果可用
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    model.to(device)
    
    # 使用 vLLM 进行推理优化
    llm = LLM(model, tokenizer)
    
    # 输入的文本
    prompt = "Once upon a time"
    # 对输入进行编码
    input_ids = tokenizer.encode(prompt, return_tensors="pt").to(device)
    
    # 设置采样参数，例如生成文本的长度、温度等
    sampling_params = SamplingParams(max_tokens=50, temperature=0.7)
    
    # 使用 vLLM 进行推理
    outputs = llm.generate(input_ids, sampling_params)
    
    # 处理输出结果
    for output in outputs:
        generated_text = tokenizer.decode(output.outputs[0].token_ids)
        print(generated_text)


if __name__ == "__main__":
    main()

代码解释

导入必要的库：
import torch：导入 PyTorch 库，用于深度学习计算和 GPU 加速。
from transformers import GPT2LMHeadModel, GPT2Tokenizer：从 transformers 库中导入 GPT2 模型和其对应的分词器，用于处理文本输入和模型加载。
from vllm import LLM, SamplingParams：从 vllm 库中导入 LLM 类和 SamplingParams 类，LLM 类将用于对大语言模型进行优化推理，SamplingParams 用于设置生成文本的参数。

加载大语言模型和分词器：
model_name = “gpt2”：指定使用 GPT2 模型。
tokenizer = GPT2Tokenizer.from_pretrained(model_name)：使用 GPT2Tokenizer 加载 GPT2 的分词器，用于将文本转换为模型可以处理的输入形式。
model = GPT2LMHeadModel.from_pretrained(model_name)：使用 GPT2LMHeadModel 加载 GPT2 模型。
model.to(device)：将模型移动到 GPU 上（如果可用），以利用 GPU 的计算能力进行加速。

使用 vLLM 进行推理优化：
llm = LLM(model, tokenizer)：将加载的 GPT2 模型和分词器传递给 vllm 的 LLM 类，对模型进行包装和优化。LLM 类将使用 vLLM 的技术，如 PagedAttention 等，来提高推理性能。

输入数据准备：
prompt = “Once upon a time”：定义输入文本。
input_ids = tokenizer.encode(prompt, return_tensors=“pt”).to(device)：使用分词器将输入文本编码为输入张量，并将其移动到相应的设备上。
设置采样参数：
sampling_params = SamplingParams(max_tokens=50, temperature=0.7)：创建 SamplingParams 对象，设置生成文本的最大长度为 50 个 tokens，温度参数为 0.7。温度参数控制生成文本的随机性，较低的值会使生成的文本更确定，较高的值会使生成的文本更具随机性。

使用 vLLM 进行推理：
outputs = llm.generate(input_ids, sampling_params)：调用 llm 对象的 generate 方法进行推理，传入输入张量和采样参数，vLLM 将对大语言模型的推理过程进行优化，如使用动态批处理、内存管理等技术，提高推理性能。

处理输出结果：
for output in outputs:：遍历生成的输出结果。
generated_text = tokenizer.decode(output.outputs[0].token_ids)：使用分词器将生成的 token 序列解码为文本。
print(generated_text)：打印生成的文本。

各自功能的体现

大语言模型（GPT2）：
功能：通过 GPT2LMHeadModel.from_pretrained(model_name) 加载的 GPT2 模型学习了大量的语言知识，具有强大的语言理解和生成能力，能够根据输入的文本生成后续的文本内容。
发挥：将输入的文本表示为 input_ids 后，通过 model 进行计算，生成后续的文本 token 序列。

vLLM：
功能：通过 LLM 类对 GPT2 模型进行包装，利用其内部的优化技术，如 PagedAttention 进行内存管理，提高内存利用率；通过动态批处理和异步推理等机制，提高推理性能。
发挥：在 llm.generate 步骤中，vLLM 会根据输入和采样参数，优化推理过程，如将多个输入合并成批次进行处理，提高推理的吞吐量和速度，最终输出优化后的推理结果。

这个示例展示了如何将 vLLM 和大语言模型结合使用，在实际应用中，你可以根据具体的大语言模型和任务需求，灵活调整代码，利用 vLLM 的特性和大语言模型的能力，实现更高效的语言处理和文本生成任务。

请注意，以上代码是一个简化的示例，实际应用中可能需要考虑更多的细节，例如处理更复杂的输入、更复杂的采样策略、分布式部署等。

单页面设计模式下的移动端交互优化：从扫码上传场景看体验升级专注代码十年设计模式交互 microsoft
单页面设计模式下的移动端交互优化：从扫码上传场景看体验升级前言：当"功能拆分"遇见"体验极简"在移动端产品设计中，我们常面临一个灵魂拷问：功能模块究竟该"合"还是"分"？最近主导的物流包装AI核验系统设计中，扫码与图片上传功能的融合设计，让我对单页面设计模式（Single-PageApplication,SPA）的用户体验精髓有了全新理解。本文将通过实战案例，解析如何通过"去页面化"思维重构交互逻
百度文心大模型4.5开源风暴！API同步开放！程序员辣条产品经理 langchain 语言模型程序员人工智能大模型学习大模型
百度文心大模型开源，如期而至。就在今天，百度官宣文心大模型4.5系列正式开源，还同步提供API服务。此番，百度一次性推出10款开源模型，涵盖从47B参数的混合专家（MoE）模型到轻量级0.3B稠密型模型，覆盖文本、多模态等多种任务需求。此次开源不仅权重与代码完全开放，还同步提供API服务，开发者可通过飞桨星河社区、HuggingFace、百度智能云千帆平台直接下载使用。文心大模型4.5系列开源模型
uniapp功能实现 WJLSH123 uni-app uniapp
1.登录获取手机号//body中写入这个按钮手机号：***//script的methods中写这个函数，获得code值，然后将code返回给后端，//后端会结合access_token+code得到手机号信息（phone_info）getPhoneNumber(e){console.log(e.detail.code)},2.下拉刷新pages.json"pages":[//pages数组中第一项
Windows下nodejs npm版本降级柴华松网站开发 windows python node.js
最近在npminstall的时候遇到一个奇怪的错误，找了很久都没找到原因，错误是：npmERR!code1npmERR!pathD:\htz\web\htz_web_app\node_modules\node-sassnpmERR!commandfailednpmERR!commandC:\WINDOWS\system32\cmd.exe/d/s/cnode-gyprebuildnpmERR!gy
Acrobat JavaScript 表单验证与动态计算
在AdobeAcrobatDC中设计交互式PDF表单时，JavaScript的应用极大地扩展了表单的功能性。本文将深入探讨如何利用AcrobatJavaScript实现表单字段的动态计算、验证以及安全实践，并通过Mermaid图表直观展示相关技术概念。一、AcrobatJavaScript基础1.1Acrobat与WebJavaScript的区别AcrobatJavaScript虽然语法与网页Ja
AI Infra：Airweave，让 AI agent 打开 APP 的数据黑盒 sluke
原创陆蔚青平行记陆1、项目概述Airweave是一个开源工具平台，致力于将各类应用、数据库和文档存储内容，转换为可供AIAgent进行语义搜索的知识库。让我想起很久以前的Deeplink。它通过标准化接口（RESTAPI或MCP）输出搜索能力，整体流程涵盖授权接入、内容提取、向量嵌入以及语义查询等模块。正如它的官方网站所说：Airweave-TurnAppsIntoAgent-ReadyKnowl
【python实用小脚本-127】基于 Python 的 Google 图片爬取工具：实现高效图片数据收集 Kyln.Wu Python python 开发语言
引言在数据科学、机器学习和多媒体应用中，图片数据的收集是一个常见且重要的任务。Google图片是一个丰富的图片资源库，能够为各种项目提供大量的图片数据。本文将介绍一个基于Python的Google图片爬取工具，它能够自动化地从Google图片搜索结果中下载图片。该工具主要利用了Python的selenium、BeautifulSoup、urllib和argparse库，结合了网页自动化和数据解析技
并发编程原理与实战（十五）线程安全实现方法深度解析
上一篇讲解了线程安全问题与JMM的核心原理以及8大原子操作，本文继续学习JMM中的Happens-before8大规则‌，8大原子操作从文字上理解可能不够深刻，我们从代码的角度直观的解读8大原子操作，进一步深入剖析其中的的运作机制，分析JMM是如何保证线程安全的。Happens-before8大规则‌在分析之前，我们先来了解下JMM中的Happens-before规则‌，字面意思即先行发生规则。T
C语言--- 指针运算笔试题详解星纭 C c语言算法开发语言
目录题目1：题目2：题目3：题目4：题目5：题目6：题目7：题目1：#includeintmain(){inta[5]={1,2,3,4,5};int*ptr=(int*)(&a+1);printf("%d,%d",*(a+1),*(ptr-1));return0;}解析：a是数组首元素的地址，类型为int*，+1跳过一个元素，再解引用就是第二个元素。&a是整个数组的地址，+1跳过整个数组，再强制
并发编程原理与实战（四）经典并发协同方式synchronized与wait+notify详解帧栈 Java并发编程 java
并发编程原理与实战（一）精准理解线程的创建和停止并发编程原理与实战（二）Thread类关键API详解并发编程原理与实战（三）一步步剖析线程返回值前面系列文章，我们详细分析了线程创建、运行、停止、返回的过程，点击上面链接快速查看。本文正式进入多线程与并发协同的相关内容的学习。多线程从计算机操作系统的发展历程来看，从早期的从头到尾执行一个能直接访问机器的所有资源单一的程序，发展到允许多个由操作系统分配
并发编程原理与实战（七）详解并发协同利器CyclicBarrier 帧栈 Java并发编程 java
并发编程原理与实战（一）精准理解线程的创建和停止并发编程原理与实战（二）Thread类关键API详解并发编程原理与实战（三）一步步剖析线程返回值并发编程原理与实战（四）经典并发协同方式synchronized与wait+notify详解并发编程原理与实战（五）经典并发协同方式伪唤醒与加锁失效原理揭秘并发编程原理与实战（六）详解并发协同利器CountDownLatch上一篇文章讲解了CountDow
Day36 复习日 cylat python打卡深度学习机器学习人工智能 python 神经网络
目录一、对之前的信贷项目，利用神经网络训练下二、尝试进入nn.Module中，查看他的方法模型训练与评估相关参数管理相关模块管理相关设备相关钩子函数相关一、对之前的信贷项目，利用神经网络训练下importtorchimporttorch.nnasnnimporttorch.optimasoptimfromsklearn.model_selectionimporttrain_test_splitfr
用Python解锁图像处理之力：从基础到智能应用的深度探索熊猫钓鱼>_> python 图像处理开发语言
在像素构成的数字世界里，Python已成为解码图像奥秘的核心引擎。一、为何选择Python处理图像？超越工具的本质思考当人们谈论图像处理时，往往会陷入工具对比的漩涡（PythonvsMATLABvsC++）。但Python的真正价值在于其构建的完整生态闭环：科学计算基石：NumPy的ndarray结构完美对应图像的多维矩阵本质算法实现自由：从传统算子到深度学习模型的无缝衔接可视化即战力：Matpl
Day51 复习日-模型改进 cylat python打卡机器学习人工智能 python 神经网络深度学习
day43对自己找的数据集用简单cnn训练，现在用预训练，加入注意力等importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorchvisionimportdatasets,transforms,modelsfromtorch.utils.dataimportDataLoader,random_splitimportmatplotlib
面向高校的人工智能通识教育课程实验设计方案武汉唯众智创人工智能人工智能通识教育课程实验人工智能通识教育人工智能通识课程人工智能通识
一、前言2018年，教育部发布《高等学校人工智能创新行动计划》，明确提出“重视人工智能与计算机、控制、数学、统计学、物理学、生物学、心理学、社会学、法学等学科专业教育的交叉融合，探索‘人工智能+X’的人才培养模式”。过去，人工智能教育多集中于研究生阶段，本科生接触机会相对有限。2019年，教育部批准35所高校增设“人工智能”本科专业，这标志着人工智能正式纳入本科教育体系。如今，人工智能课程大多是计
25.06.3日报：nodejs为什么这么大龙泉寺扫地僧前端 javascript 开发语言
最近我的mini-electron加上nodejs后，徒然增大了16M左右，很诧异。因为nodejs本身的c++代码应该就2M，再加那些js也就1M，怎么会增大这么多。经过毛利大师推荐的sizebench查看pdb后，发现原来是nodejs现在自带了一个名为Amaro的ts解析器，居然是个5M的wasm文件。考虑到electron模式基本不会用到ts的解析器，这块可以砍了。
vscode添加源文件_VSCode源码自定义笔记-VSCode启动流程分析 weixin_39559079 vscode添加源文件
从开始到窗口加载与所有的Electron应用一样，入口点在package.json文件中定义。"main":"./out/main",说明了入口文件在out/main.js.这个是编译出来的文件，源文件在src/main.js。注意对于TS文件，由于有sourcemap的映射，我们在ts中打断点就可以跳转过来。这里的js应该是编译时候直接拷贝到out目录下的，我们在src下面的文件打断点无效，应该
VSCode Python 扩展项目教程翟苹星Trustworthy
VSCodePython扩展项目教程vscode-pythonPythonextensionforVisualStudioCode项目地址:https://gitcode.com/gh_mirrors/vs/vscode-python1.项目的目录结构及介绍VSCodePython扩展项目的目录结构如下：vscode-python/├──config/├──devcontainer/├──gith
【Python爬虫进阶】从网页抓取到数据清洗与存储——完整实战教程 Python爬虫项目 python 爬虫开发语言 javascript 自然语言处理 selenium
1.为什么网页抓取后需要数据清洗？在实际项目中，抓取的原始数据往往是杂乱的、不完整的、格式各异的。如果不清洗，直接用来建模、分析，会导致：脏数据干扰（如乱码、重复数据）异常值影响结果（如薪资异常高）格式不统一（比如地点有中文名和英文名混杂）所以，抓取数据后，必须进行系统清洗与标准化，才能用于后续的：数据分析可视化展示机器学习建模2.项目概览：从抓取到存储的完整流程本项目流程如下：确定抓取目标（某招
Electron 进程间通信（IPC）深度优化指南 vvilkin的学习备忘 Electron electron javascript 前端
Electron是一个强大的跨平台桌面应用开发框架，它结合了Chromium和Node.js，允许开发者使用Web技术构建高性能的桌面应用。然而，Electron的架构决定了它必须频繁地在主进程（MainProcess）和渲染进程（RendererProcess）之间进行通信（IPC,Inter-ProcessCommunication）。如果IPC通信设计不当，可能会导致应用卡顿、响应延迟，甚至
Rust+Blender：打造高性能游戏引擎 KENYCHEN奉孝 Rust rust 开发工具
基于Rust和Blender的游戏引擎以下是基于Rust和Blender的游戏引擎开发实例，涵盖不同应用场景和技术方向的实际案例。案例分为工具链整合、渲染技术、物理模拟等类别，每个案例附核心代码片段或实现逻辑。工具链整合案例案例1：Blender模型导出到Bevy引擎使用blender-bevy-io插件将Blender模型导出为Bevy支持的.gltf格式。关键步骤包括在Blender中设置自定
（JAVA）基于TCP通信多人聊天系统 zzb1580 JAVA学习记录 java tcp/ip 开发语言后端
一、目标这个项目是一个基于TCP协议的简单多人聊天系统，包含一个服务器和多个客户端。服务器接受多个客户端的连接，每个客户端发送的消息都可以转发给其他所有在线的客户端，实现了一个基本的多人实时聊天功能。项目使用Java编程语言编写，利用ServerSocket和Socket创建管道来实现客户端与服务器之间的通信。二、各模块代码分析与解读服务端总体代码：服务端实现：1.创建一个ServerSocket
uniapp 页面跳转方法 BUG生产者之一 uniapp uni-app 前端
一、保留当前页面，跳转至新页面uni.navigateTo，不能跳转tabbar页面uni.navigateTo({url:'/pages/login/login'})除了跳转之外，这个方法同样支持传递参数，只需要在路径后方，通过问号的方式添加。如：uni.navigateTo({url:'/pages/detail/detail?id=18&title=详情'})id和title就是页面所传递的
打造基于51单片机的音乐播放器红廉骑士兽
本文还有配套的精品资源，点击获取简介：本文详细介绍了如何利用51单片机构建一个简易音乐播放器的全过程。51单片机是8051系列成员之一，具备处理控制任务的能力，包括音频播放。文章将指导读者通过设计核心模块，如存储介质扩展、音乐解码、音频放大输出、用户界面交互、控制逻辑编程、电源管理和设备调试测试等步骤，来理解嵌入式系统设计的各个方面。1.51单片机基础介绍简介51单片机是一种经典的微控制器，广泛应
跳转页面的方法 slow097 html javascript
window的方法1、直接的事件跳转window.location.href="你所要跳转的页面";这种的一般都是绝对地址window.location.href=“https://www.baidu.com/”;2、打开新页面跳转(带参)letrouteUrl=this.$router.resolve({path:`/TrackDetail/${pol}/${referenceno}/${car
验证码破解的可能与不可能：用Python处理图片验证码的原理与限制程序员威哥 python 开发语言
前言验证码（CAPTCHA）是当前互联网防护机制中的重要组成部分，用于区分真人与自动程序。近年来，随着自动化技术发展，验证码破解成为自动化测试、爬虫及安全研究领域的热点。然而，从技术层面来看，验证码破解既有可行之处，也存在根本限制。本文将结合Python图像处理与机器学习技术，深度剖析图片验证码破解的原理、实践与瓶颈。一、验证码的分类及破解难点1.验证码类型字符型验证码纯数字、字母或混合，最常见。
TypeScript vs JavaScript: 开发者必须了解的核心差异
在现代前端开发中，JavaScript和TypeScript是两个不可忽视的重要技术。虽然TypeScript基于JavaScript构建，但两者在开发体验、代码质量和项目维护方面存在显著差异。本文将深入探讨这两种语言的核心区别，帮助开发者做出明智的技术选择。什么是JavaScript？JavaScript是一种动态的、解释型的编程语言，最初为网页开发而设计。它具有以下特点：动态类型系统：变量类型
智能家居-深耕10年原创合集(2025/06更新) CYP_2015 智能家居 xcode ios macos ide
2025-06更新篇章2025年广州光亚展参展记录智能插座：技术与应用演进之路语音识别技术：全链路技术栈解析6000字干货长文，深度解读智能家居7大派系，谁能真正统一“江湖”？最近参与某智能家居项目的早期调研，再次感慨用户对我们所说的“便捷”实则是“无感”。用户原话："你们总说'智能'，我就想要个不用记按钮、不用掏手机的家伙。"我们说的"便捷"，在用户那儿根本不是"多快多远"，而是"不用刻意"。现
大数据分析技术的学习路径，不是绝对的，仅供参考水云桐程序员学习大数据数据分析学习方法
阶段一：基础筑基（1-3个月）1.编程语言：Python：掌握基础语法、数据结构、流程控制、函数、面向对象编程、常用库（NumPy,Pandas）。SQL：精通SELECT语句（过滤、排序、分组、聚合、连接）、DDL/DML基础。理解关系型数据库概念（表、主键、外键、索引）。MySQL或PostgreSQL是很好的起点。Java/Scala：深入理解Hadoop/Spark等框架会更有优势。初学者
【Unity开发】Unity实现glb模型上传到场景中使用功能龚子亦 Unity unity 游戏引擎
一、效果展示点击按钮上传glb格式的模型，进行后续移动、旋转和缩放操作，上传的模型会出现在原点（0,0,0）位置演示视频：Unity实现glb模型上传到场景中使用功能二、环境要求需要下载安装用于加载glb模型的插件，下载好后直接拖入项目中进行使用下载链接：https://github.com/Siccity/GLTFUtility/releases三、实现完整代码usingUnityEngine;
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方