Python算法实战

用通俗易懂的方式讲解大模型：使用 LangChain 封装自定义的 LLM，太棒了

Langchain 默认使用 OpenAI 的 LLM（大语言模型）来进行文本推理工作，但主要的问题就是数据的安全性，跟 OpenAI LLM 交互的数据都会上传到 OpenAI 的服务器。

企业内部如果想要使用 LangChain 来构建应用，那最好是让 LangChain 使用企业内部的 LLM，这样才能保证数据不泄露。

LangChain 提供了集成多种 LLM 的能力，包括自定义的 LLM，今天我们就来介绍一下如何使用 LangChain 来集成自定义的 LLM 以及其中的实现原理。

开源大模型

虽然现在的商业大模型（OpenAI 和 Anthropic）功能十分强大，但开源大模型愈来愈有迎头赶上的趋势，比如最近刚发布的Falcon-180B[1]大模型，具备 1800 亿参数，（号称）性能甚至直逼 GPT-4。所以对于想构建 AI 应用，又不想自身数据泄露的企业来说，开源大模型是首要选择。

开源大模型也有很多选择，要根据自身的需求来考虑。比如需要大量自然语言处理的项目，选择一个专注于文本处理的模型会比选择图像或视频的模型更合适，再比如需要提供多语言的项目，那么大模型就需要支持多语言而不仅仅是英文。另外模型的大小和复杂性也是一个考虑因素，大模型虽然能够处理更复杂的任务，但它们通常需要更多的计算资源和存储空间。对于有限资源的中小企业，可能需要选择一个更轻量级的模型。

对于一些简单的应用，我们可以选择现在国内比较流行的中文开源大模型——ChatGLM 或者 BaiChuan，它们不仅支持中英文，还开源了小参数的 LLM，比如 ChatGLM2-6B、Baichuan2-13B 等。

通俗易懂讲解大模型系列

用通俗易懂的方式讲解大模型：使用 FastChat 部署 LLM 的体验太爽了
用通俗易懂的方式讲解大模型：基于 Langchain 和 ChatChat 部署本地知识库问答系统
用通俗易懂的方式讲解大模型：使用 Docker 部署大模型的训练环境
用通俗易懂的方式讲解大模型：在 Ubuntu 22 上安装 CUDA、Nvidia 显卡驱动、PyTorch等大模型基础环境
用通俗易懂的方式讲解大模型：Llama2 部署讲解及试用方式
用通俗易懂的方式讲解大模型：LangChain 知识库检索常见问题及解决方案
用通俗易懂的方式讲解大模型：基于 LangChain 和 ChatGLM2 打造自有知识库问答系统
用通俗易懂的方式讲解大模型：代码大模型盘点及优劣分析
用通俗易懂的方式讲解大模型：Prompt 提示词在开发中的使用

技术交流

建了大模型技术交流群！ 想要学习、技术交流、获取如下原版资料的同学，可以直接加微信号：mlc2060。加的时候备注一下：研究方向 +学校/公司+CSDN，即可。然后就可以拉你进群了。

方式①、微信搜索公众号：机器学习社区，后台回复：加群
方式②、添加微信号：mlc2060，备注：来自CSDN + 技术交流

LLM 部署

后面我们会用 LangChain 来集成 ChatGLM2 进行介绍，所以我们需要先部署 ChatGLM2-6B 这个 LLM。ChatGLM2-6B 部署有多种方式，可以使用它自身的代码仓库进行部署，也可以使用其他框架来进行部署。我们主要部署 ChatGLM2-6B 的 API 服务，具体步骤可以参考我之前的文章：使用 FastChat 部署 LLM，这里就不再赘述。

部署后的 API 服务地址我们假设是http://localhost:5000，调用/chat/completions接口会返回类似 OpenAI 接口的信息：

$ curl -X 'POST' \
  'http://localhost:5000/v1/chat/completions' \
  -H 'accept: application/json' \
  -H 'Content-Type: application/json' \
  -d '{
  "model": "chatglm2-6b",
  "messages": [{"role": "user", "content": "你好"}]
}'

# 输出结果
{
  "id": "chatcmpl-TPvsyLsybHEJ2nd953q7E2",
  "object": "chat.completion",
  "created": 1694497436,
  "model": "chatglm2-6b",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "你好！我是人工智能助手 ChatGLM2-6B，很高兴见到你，欢迎问我任何问题。"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 4,
    "total_tokens": 145,
    "completion_tokens": 141
  }
}

这个接口是兼容 OpenAI 接口的，其中 model 和 messages 参数是必须的，messages 中 role 的值有user，assistant, system这几项，content 是对应角色的内容，更多参数信息可以参考OpenAI 的 API 官方文档[3]。下面我们主要使用这个 API 来封装我们的自定义 LLM。

封装自定义 LLM

使用 LangChain 封装自定义的 LLM 并不复杂，可以看下面的代码示例：

import requests
from typing import Any, List, Mapping, Optional

from langchain.callbacks.manager import CallbackManagerForLLMRun
from langchain.llms.base import LLM

class CustomLLM(LLM):
    endpoint: str = "http://localhost:5000"
    model: str = "chatglm2-6b"

    def _call(
        self,
        prompt: str,
        stop: Optional[List[str]] = None,
        callbacks: Optional[CallbackManagerForLLMRun] = None,
        **kwargs: Any,
    ) -> str:
        headers = {"Content-Type": "application/json"}
        data = {"model": self.model, "messages": [{"role": "user", "content": prompt}]}
        response = requests.post(f"{self.endpoint}/chat/completions", headers=headers, json=data)
        response.raise_for_status()

        result = response.json()
        text = result["choices"][0]["message"]["content"]
        return text

首先我们需要创建一个类继承自LLM，然后实现_call方法
方法的最主要的参数是提示词prompt，这个参数就是上面接口中的messages参数中的用户内容
在_call方法中，我们构造 API 接口所需参数，包括 headers 和 data
调用 API 接口，获取到返回结果，最后返回choices中message的内容

_call方法的实现逻辑就是接收用户的输入，然后将其传递给 LLM，然后获取到 LLM 的输出，最后再返回结果给用户。在方法中可以调用 API 服务，也可以用 transformer 来初始化模型然后直接调用模型进行推理，总之可以用各种方法来调用 LLM，只要能得到LLM返回的结果即可。

自定义 LLM 的其他方法

除了_call方法外，我们还需要实现其他方法，比如_llm_type方法，这个方法是用来定义 LLM 的名称，因为我们用的是 ChatGLM2-6B 模型，所以我们可以这样实现：

    @property
    def _llm_type(self) -> str:
        return "chatglm2-6b"

还有_identifying_params方法，这个方法是用来打印自定义 LLM 类的参数信息，方便我们做调试，它返回的是一个字典，代码示例如下：

    @property
    def _identifying_params(self) -> Mapping[str, Any]:
        """Get the identifying parameters."""
        return {"endpoint": self.endpoint, "model": self.model}

自定义 LLM 的使用

自定义 LLM 的使用跟使用其他 LLM 一样，我们可以直接调用自定义 LLM 的实例，代码示例如下：

llm = CustomLLM()
print(llm("你好"))

# 输出结果
"""
你好！我是人工智能助手 ChatGLM2-6B，很高兴见到你，欢迎问我任何问题。
"""

_call 方法的其他参数

在_call方法中除了 prompt 参数外，我们还看到了其他参数，这些参数都是可选的，我们来看一下这些参数的作用：

stop

这个参数是传入一个字符串集合，当检测到 LLM 的输出内容中包含了这些字符串时，输出内容会立即截断，只保留前面的内容。比如我们得到的 LLM 结果如下：

你好！我是人工智能助手 ChatGLM2-6B，很高兴见到你，欢迎问我任何问题。

当我们将stop参数设置为["欢迎"]时，输出结果就会变成：

你好！我是人工智能助手 ChatGLM2-6B，很高兴见到你，

如果是自定义 LLM，stop参数的逻辑也需要我们自己来实现，LangChain 其实提供了对应的工具方法，我们直接使用就可以了，代码示例如下：

from langchain.llms.utils import enforce_stop_tokens

def _call(
        self,
        prompt: str,
        stop: Optional[List[str]] = None,
        callbacks: Optional[CallbackManagerForLLMRun] = None,
        **kwargs: Any,
    ) -> str:
        .....
        if stop is not None:
            text = enforce_stop_tokens(text, stop)

callbacks

这个参数是一个CallbackManagerForLLMRun对象，用于在 LLM 运行过程中执行回调函数，比如在 LLM 运行前后执行一些操作，比如记录日志、保存模型等。这个参数是可选的，我们使用 LangChain 提供的日志记录回调函数来演示下功能：

from loguru import logger
from langchain.callbacks import FileCallbackHandler

if __name__ == "__main__":
    llm = CustomLLM()
    logfile = "output.log"
    logger.add(logfile, colorize=True, enqueue=True)
    handler = FileCallbackHandler(logfile)
    result = llm("你好", stop=["欢迎"], callbacks=[handler])
    logger.info(result)

执行完程序后，会在当前目录下生成一个output.log文件，文件内容如下：

2023-09-12 11:28:19.029 | INFO     | __main__:<module>:110 - 你好！我是人工智能助手 ChatGLM2-6B，很高兴见到你，

注意： 在 LangChain 官方文档的示例代码中将callbacks参数写成了run_manager，其实最新代码中这个参数名已经改成了callbacks了，可能官方文档还没有及时更新。

LangChain 还提供了更多的回调方法，想了解更多信息的可以参考这个文档[4]。

LangChain 官方文档上也给出了自定义 LLM 的简单代码示例，可以参考：Custom LLM[5]。

其他自定义的 LLM

除了参考以上示例来编写自定义的 LLM 外，还可以参考 LangChain 中已经集成的其他 LLM。

ChatGLM

这个是封装比较早的 ChatGLM LLM，用的还是一代的 ChatGLM，除非部署方式一致，否则不建议直接使用该 LLM，建议参照其中的代码来实现自己的 LLM。

相关文档：ChatGLM LLM[6]
相关代码：chatglm.py[7]

Fake LLM

这是一个假的 LLM，用于测试，自定义内容来模拟 LLM 的输出，可以参考其中的代码来实现自己的 LLM，其中包含了流式输出，异步调用等功能的实现逻辑。

相关文档：Fake LLM[8]
相关代码：fake.py[9]

还有很多其他的 LLM，包括 OpenAI 的 LLM，如果感兴趣的也可以去看看它们的源码，相对会比较复杂，更多信息可以参考这里[10]。

总结

今天我们主要介绍了如何使用 LangChain 来集成自定义的 LLM，以及其中的实现原理，实现自己的 LangChain LLM 并不复杂，但如果要实现一个功能强大，性能高效的 LLM，就需要花费更多的时间和精力了，好在 LangChain 提供了一系列的工具和组件，可以帮助我们快速实现自己的功能。希望今天的文章能够帮助到大家，也希望使用过 LangChain 的同学一起来交流学习，欢迎在评论区留言。

关注我，一起学习各种人工智能和 AIGC 新技术，欢迎交流，如果你有什么想问想说的，欢迎在评论区留言。

参考:

[1]Falcon-180B: https://huggingface.co/spaces/tiiuae/falcon-180b-demo

[3] OpenAI 的 API 官方文档: https://platform.openai.com/docs/api-reference/chat/create

[4]这个文档: https://python.langchain.com/docs/modules/callbacks/

[5]Custom LLM: https://python.langchain.com/docs/modules/model_io/models/llms/custom_llm

[6]ChatGLM LLM: https://python.langchain.com/docs/integrations/llms/chatglm

[7] chatglm.py: https://github.com/langchain-ai/langchain/blob/master/libs/langchain/langchain/llms/chatglm.py

[8]Fake LLM: https://python.langchain.com/docs/modules/model_io/models/llms/fake_llm

[9]fake.py: https://github.com/langchain-ai/langchain/blob/master/libs/langchain/langchain/llms/fake.py

[10]这里: https://python.langchain.com/docs/integrations/llms/

你可能感兴趣的:(大模型理论与实战,大模型,langchain,大模型,语言模型,多模态,prompt,chatgpt)

仓库管理系统，Java+Vue，含源码及详细文档，助力高效仓储管理瓯雅爱分享源码下载软件工程 java mysql vue 源代码管理
前言：仓库管理系统是一个关键的供应链管理软件，它帮助企业和组织有效地追踪库存、管理仓库运营，并优化物流流程。以下是对仓库管理系统各部分的详细解释：一、入库管理入库管理模块负责处理所有入库操作，包括接收货物、验收、分类、上架等步骤。它具有以下功能：预约入库：允许供应商或运输公司提前通知仓库，以便做好接收准备。货物验收：检查货物的数量、质量、规格等是否与订单相符。分类与编码：根据货物的属性进行分类，并
Python 如何安装 distutils模块？？ bug菌¹ 全栈Bug调优(实战版)#CSDN问答解惑(全栈版)python 数据库开发语言
本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！问题描述电脑安装了Python3.12，但是里面没有distutils模块，如何安装该模块解决方案如下是上述问题的解决方案，仅供参考：在Python3.12中，dis
JAVA深拷贝与浅拷贝(呕心沥血之作) Ra1n . JAVA java intellij-idea 软件工程
JAVA深拷贝与浅拷贝①对于Java拷贝的理解②浅拷贝一、图解二、代码举例三、适用情况③深拷贝一、图解二、代码举例三、适用情况①对于Java拷贝的理解在JAVA语言中，我们常常会需要用到拷贝操作，当我们需要用到拷贝一个JAVA对象的时候，JAVA中常见的有四种拷贝方式：一、使用stream(这是java中传统的文件复制方式。这里创建两个文件-source和destination。然后从so
网络安全技术深度解析与代码实践我的运维人生 web安全网络安全运维开发技术共享
网络安全技术深度解析与代码实践随着信息技术的飞速发展，计算机网络已经广泛应用于政治、军事、商业等各个领域，与人们的生活越来越紧密。然而，这也带来了日益严峻的网络安全问题。网络安全是指保护计算机网络免受未经授权的访问、破坏或数据泄露的措施，是信息技术领域的重要课题。本文将详细介绍网络安全技术，并通过代码示例展示其实际应用。一、网络安全的重要性网络安全对于个人隐私、企业机密和国家安全至关重要。未经授权
MongoDB深度解析与实践案例我的运维人生 mongodb 数据库运维开发技术共享
MongoDB深度解析与实践案例在当今大数据盛行的时代，NoSQL数据库以其灵活的数据模型和水平扩展能力，成为了众多应用场景下的首选。MongoDB，作为NoSQL数据库的领军者之一，凭借其面向文档的存储方式、强大的查询功能以及丰富的生态系统，在众多领域大放异彩。本文将从MongoDB的基本概念出发，深入探讨其核心特性，并通过一个实际案例展示如何在项目中高效使用MongoDB。一、MongoDB基
Kubernetes（K8s）技术深度解析与实战案例我的运维人生 kubernetes 容器云原生运维开发技术共享
Kubernetes（K8s）技术深度解析与实战案例Kubernetes（简称K8s）已经成为当今云原生应用和微服务架构的首选平台。作为一个开源的容器编排系统，K8s用于自动化应用程序的部署、扩展和管理。本文将深入探讨K8s的架构、关键组件、设计理念以及实战应用，并通过一个具体的微服务应用部署案例，展示K8s在运维中的强大功能和便利性。一、K8s的起源与发展K8s的诞生源于Google内部对大规模
DeepSeek API 的获取与对话示例 Hoper.J AIGC DeepSeek API AI
代码文件下载：Code在线链接：Kaggle|Colab文章目录注册并获取API环境依赖设置API单轮对话多轮对话流式输出更换模型注册并获取API访问https://platform.deepseek.com/sign_in进行注册并登录：新用户注册后将赠送10块钱余额，有效期为一个月：点击左侧的APIkeys（或者访问https://platform.deepseek.com/api_keys）
linux进程调度HMP,HMP调度器和EAS调度器熙公主的爪牙 linux进程调度HMP
HMP调度器为了降低功耗，ARM开发了大小核架构处理器。Linux内核中的负载均衡算法基于SMP模型，并未考虑big.LITTLE模型，因此Linaro开发了一个HMP调度器用于支持这种架构，它也被用于Android5.x和Android6.x中，但这种调度器并没有被合入内核的基线中。该调度器的进程调度算法基本上和CFS一样，主要区别在于调度域和负载均衡的处理上。HMP调度域的实现比自带的CFS调
java map深拷贝_关于HashMap的浅拷贝深拷贝 K8S技术社区 java map深拷贝
Map中存储的都是String，不是基本数据类型的，这个有很大影响；putAll()和clone()对基本数据类型的数据是没有问题的，但是引用类型还是不行。HashMap的浅拷贝clone()方法一、创建一个HashMap对象source，进行赋值，然后再克隆一个对象targetMap出来。通过改变targetMap的值，观察source与targetMap的变化。HashMapsource=ne
数据建模中的Chasm 陷阱小Tomkk #MySQL 数据库 mysql Chasm 陷阱
数据建模中的Chasm陷阱在数据仓库中，Chasm陷阱（ChasmTrap）是指一种设计问题，通常出现在数据仓库建模的过程中，尤其是在使用星型模式（StarSchema）或者雪花型模式（SnowflakeSchema）时。这个问题通常发生在多个事实表与维度表之间的关系存在不一致或难以解决的情况，导致数据查询和分析时产生不正确的结果。文章目录数据建模中的Chasm陷阱我这里举例说明Chasm陷阱解决
共赴新春‖2025年春节放假通知深圳市尚想信息技术有限公司职场和发展笔记
尊敬的各位客户：春节来临之际，诚挚地感谢各位一直以来的支持与关照！我司2025年春节放假安排通知如下:一、2025年1月25日(星期六)至2月6日(星期四)，共计13天。二、2025年2月7日（星期五）正式开工，2月8日（周六）调休上班。‌为了确保不耽误贵司的运行安排，请贵司提前做好节日期间的备货需求，以便我司能尽早安排送货，服务好贵司。若给贵司带来不便之处，敬请谅解。深尚想祝大家蛇年大吉幸福安康
计算机视觉领域的轻量化模型——GhostNet 模型 DuHz 边缘计算轻量化模型计算机视觉人工智能算法深度学习神经网络边缘计算网络
GhostNet模型详解GhostNet是一个高效的轻量化卷积神经网络模型，专为资源受限的设备（如移动设备和嵌入式系统）设计。它的核心创新是Ghost模块，该模块通过生成更多的特征图来减少计算资源消耗。GhostNet适用于实时计算任务，如图像分类和物体检测，同时在保持较高准确率的基础上，优化了计算效率。目录GhostNet背景Ghost模块概述GhostNet网络架构Ghost模块的数学原理Gh
202、【数组】leetcode ——2588. 统计美丽子数组数目（C++/Python版本）辰阳星宇数据结构与算法刷题 #数组 #哈希表 leetcode c++算法
题目描述原题链接：2588.统计美丽子数组数目解题思路本题的难点在于对于题意的解析与思路的转化。题中说的子数组中的美丽数，每次找两个数，其相同位减去1。相当于是这个数组中，每一个位的二进制数为1的个数偶数即可。进一步，可通过在这个子数组中所有的数进行异或运算后得到的结果是否为0来验证是否为每位为1的个数是否为偶数。（异或运算：对相同为0，相异为1，0与任何数计算该数数值保持不变）因此，问题就转化为
SpringBoot核心组件详细解析德乐懿后端 spring boot 后端 java
SpringBoot核心组件详细解析SpringBoot作为当前Java领域最流行的微服务框架之一，其核心组件的设计与应用对于开发高效、稳定的应用程序至关重要。本文将详细解析SpringBoot的核心组件，包括SpringBoot框架本身、Spring、SpringMVC、数据库连接池等，通过阐述每个组件的作用、特点、使用场景，并结合实际案例，深入分析SpringBoot核心组件之间的关联性和依赖
AI闹新春！荣耀携手哪吒点燃珠海，魔法市集引爆科技年货热潮财经三剑客人工智能科技大数据
1月18日，荣耀新店在珠海斗门世荣万达广场开业，并携手春节大片《哪吒之魔童闹海》，在珠海斗门万达广场中庭盛大开启荣耀AI魔法市集快闪活动。以市集互动、现场演出、好礼抽奖等丰富环节，巧妙融合科技“魔法”与传统文化，为市民带来一场充满科技感与年味的沉浸式魔法体验。哪吒携AI魔法空降珠海，与市民嗨FUN庆新春开市有喜，风生水起。作为荣耀魔法科技年货节的重头戏，本次空降珠海的荣耀AI魔法市集快闪活动以"哪
使用 go zero 开发 FPS 游戏后端需求文档阿贾克斯的黎明游戏开发游戏
目录使用gozero开发FPS游戏后端需求文档一、项目背景二、功能需求（一）用户管理（二）游戏匹配（三）游戏房间管理（四）游戏逻辑处理（五）数据存储与管理三、非功能需求（一）性能需求（二）安全需求（三）可扩展性需求一、项目背景随着游戏行业的快速发展，第一人称射击（FPS）游戏以其紧张刺激的游戏体验深受玩家喜爱。为了给玩家提供流畅、公平且具备丰富玩法的FPS游戏，本项目旨在使用gozero框架开发一
2024年作品汇总萝卜青今天也要开心 spring java 后端笔记学习
思维读书笔记-《当下的力量》读书笔记-《暗时间》信息技术如何设计离线跑批系统程序员工作中常见问题，你遇到过几个？读书笔记-《Redis设计与实现》（一）数据结构与对象（上）读书笔记-《大数据时代》读书笔记-《Spring技术内幕》（一）IoC容器的实现读书笔记-《Spring技术内幕》（二）AOP的实现读书笔记-《Spring技术内幕》（三）MVC与Web环境读书笔记-《Spring技术内幕》（四
课程内容摘要生成：基于知识蒸馏与事实增强的深度学习模型实践二进制独立开发非纯粹GenAI GenAI与Python 深度学习人工智能自然语言处理 python 语言模型神经网络生成对抗网络
文章目录引言一、核心技术：知识蒸馏与事实三元组融合二、模型架构设计与优化三、Python实现与关键代码解析四、业务价值与效果分析五、挑战与优化方向引言在教育内容数字化进程中，课程内容摘要生成技术能够从海量教学资源中提炼核心知识点，解决人工编写效率低、知识更新滞后的问题。当前主流方法依赖于深度学习模型，但存在事实性偏差、可解释性不足等缺陷。本文提出一种融合知识蒸馏与事实三元组增强的摘要生成框架，结合
读书笔记-《乡下人的悲歌》萝卜青今天也要开心笔记学习
前段时间看了一些J.D.Vance的采访视频，几乎都是记者带着刁难的问题先手进攻，而Vance面带微笑，提及对方的名字，条理清晰地从对方的攻击中切回主题形成后手反制，实在让人看得过瘾。更不可思议的是，Vance的成长经历似乎也非常糟糕，他是如何走到今天这一步的呢？带着这样的疑问，我拿起了这本传记。01Vance的成长经历Vance成长时所处的大背景是：中西部工业地区经济下滑，制造业岗位流向海外，没
读书笔记-《Spring技术内幕》（一）IoC容器的实现萝卜青今天也要开心 spring java 后端笔记
如今已是2024年，掌握Spring早已是Java从业人员的基本要求。Spring帮我们屏蔽掉了许多繁琐的工作，使我们可以把重心放在业务逻辑上。但也因此，要深刻体会到Spring带来的便捷性，反倒需要与没有使用Spring时作对比。为此，我特地翻了下上大学时用JaveWeb开发的项目（无框架），希望能让大家更好理解。01SpringIoC容器概述Spring的架构图如上所示，IoC与AOP都是Sp
新春特辑：人工智能专题大复盘互联互通社区人工智能大数据区块链 python 编程语言
播洒一年的阳光，收获一路的辉煌;挥洒一年的汗水，绽放一路的明媚;付出一年的辛苦，装点一路的幸福;感谢一年的努力，创造一路的奇迹。新的一年，愿与你再扬帆济海，创造美好精彩!人工智能：人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来，理论和技术日益成熟
详解大模型微调数据集构建方法(持续更新) herosunly 大模型微调数据集构建方法
大家好，我是herosunly。985院校硕士毕业，现担任算法t研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文详细介绍了大模型微调数据集构建方法，希望能对学习大模型的同学们有所帮助。文章目录
树状数组详解与应用领域 c++ --二次元的programmer的博客 Arodex c++算法树状数组
这是本蒟蒻的第一篇博客，如有不妥，请各位大佬加以指正。树状数组是什么？学树状数组首先当然要知道树状数组是什么。下面是我粘过来的定义：树状数组的查询和修改的时间复杂度都是log(n)，空间复杂度则为O(n)，这是因为树状数组通过将线性结构转化成树状结构，从而利用位运算进行跳跃式扫描。通常使用在高效的计算数列的前缀和，区间和。（其实你只需要知道它的时间空间复杂度就行了，应用领域后文会讲）跳跃式扫描的实
初探Linux CPU动态调频与实测 He11o_Liu 操作系统 Linux CPUFreq CPU调频 Linux
关于本文主要涉及LinuxCPUFreq子系统是什么，为什么需要，怎么用。并解决在实际测试中遇到的三个问题：scaling_governor没有userspace的问题。/proc/cpuinfo与cpuinfo_cur_freq显示频率不同。无法针对单个核心调频并使一个CPU下的不同的核心运行在不同的频率下。参考资料Linux2.6内核中的最新电源管理技术综述_CPUFreqLinux动态频率调
2025年最新在线模型转换工具优化模型ncnn，mnn，tengine，onnx 我的青春不太冷 mnn 人工智能深度学习 ncnn 在线模型转换网址
文章目录引言最新网址地点一、模型转换1.框架转换全景图2.安全的模型转换3.网站全景图二、转换说明三、模型转换流程图四、感谢引言在yolov5，yolov8，yolov11等等模型转换的领域中，时间成本常常是开发者头疼的问题。最近发现一个超棒的网站工具，简直是模型转换的神器。它最大的亮点就是省去编译转换工具的时间，开箱即用，一键转换。对于目标格式，提供了tengine、ncnn、mnn、onnx等
Redis持久化数据之RDB和AOF_redisrdb数据持久化的特点 2501_90226046 redis 数据库缓存
持久化过程Redis会单独创建（fork）一个子进程来进行持久化，会先将数据写入到一个临时文件中，待持久化过程都结束了，再用这个临时文件替换上次持久化好的文件。整个过程中，主进程是不进行任何IO操作的，这就确保了极高的性能。如果需要进行大规模数据的恢复，且对于数据恢复的完整性不是非常敏感，那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。Fork的作用是复制一个与
【算法】回溯算法专题① ——子集型回溯 python 查理零世算法 python
目录引入变形实战演练总结引入子集https://leetcode.cn/problems/subsets/description/给你一个整数数组nums，数组中的元素互不相同。返回该数组所有可能的子集（幂集）。解集不能包含重复的子集。你可以按任意顺序返回解集。示例1：输入：nums=[1,2,3]输出：[[],[1],[2],[1,2],[3],[1,3],[2,3],[1,2,3]]示例2：输
Java 在包管理与模块化中的优势：与其他开发语言的比较 nbsaas-boot 开发语言 java
在开发复杂的、规模庞大的软件系统时，包管理和模块化设计起着至关重要的作用。它们不仅决定了代码的组织和可维护性，还直接影响到团队协作效率、扩展性和性能。在众多编程语言中，Java凭借其成熟的生态系统、强类型系统和标准化的包管理机制，成为了大型企业级应用开发的首选之一。本文将探讨Java在包管理和模块化方面的优势，并与其他流行语言（如Rust、Go、Python、JavaScript和C#）进行对比，
读书笔记-《Redis设计与实现》（一）数据结构与对象（下）萝卜青今天也要开心 redis 数据结构学习 java
各位朋友新年快乐~今天我们来继续学习Redis。01整数集合当集合仅包含整数值，并且元素数量不多时，Redis就会采用整数集合来作为集合键的底层实现。typedefstructintset{//编码方式uint32_tencoding;//元素数量uint32_tlength;//数组int8_tcontents[];}intset;可以看到，contents就是存储元素的地方，各个元素按从小到大
python 从知网的期刊导航页面抓取与农业科技相关的数据 go5463158465 python python 科技开发语言
要从知网的期刊导航页面抓取与农业科技相关的数据，并提取《土壤学报》2016年06期的结果，可以使用requests库来获取网页内容，BeautifulSoup库来解析HTML。由于知网页面结构可能会发生变化，在实际使用中，需要根据页面结构的实际情况进行调整。以下是实现该功能的Python代码示例：importrequestsfrombs4importBeautifulSoupdefcrawl_ag
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n
操作日期和时间的工具类 vipbooks 工具类
大家好啊，好久没有来这里发文章了，今天来逛逛，分享一篇刚写不久的操作日期和时间的工具类，希望对大家有所帮助。 /* * @(#)DataFormatUtils.java 2010-10-10 * * Copyright 2010 BianJing,All rights reserved. */ package test; impor

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他