亚马逊云开发者

Generative AI 新世界 | 文生图领域动手实践：预训练模型的部署和推理

在上期文章，我们探讨了文生图（Text-to-Image）方向的主要论文解读，包括：VAE、DDPM、DDIM、GLIDE、Imagen、UnCLIP、CDM、LDM 等主要扩散模型领域的发展状况。

本期我们将进入动手实践环节，我会带领大家使用 Amazon SageMaker Studio、Amazon SageMaker JumpStart 等服务，指导您在云中快速上手亲身体验大语言模型的魅力，并为有探索精神的小伙伴们准备了更高阶实验，以帮助您构建文生图（Text-to-Image）领域的大模型企业或科研应用。

亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。这里有技术文档、开发案例、技术专栏、培训视频、活动与竞赛等。帮助中国开发者对接世界最前沿技术，观点，和项目，并将中国优秀开发者或技术推荐给全球云社区。如果你还没有关注/收藏，看到这里请一定不要匆匆划过，点这里让它成为你的技术宝库！

整个文生图（Text-to-Image）动手实践会分成两篇：

本篇将主要介绍预训练模型的部署和推理，其中包括：运行环境准备、角色权限配置、支持的主要推理参数、图像的压缩输出、提示工程（Prompt Engineering）、反向提示（Negative Prompting） 等内容。

下一篇将主要介绍预训练模型在客户数据集上的微调（Fine-tune），以及亚马逊云科技提供的更高阶的面向企业或科研单位生产环境级别的一些完整解决方案。

Amazon SageMaker JumpStart 介绍

Amazon SageMaker JumpStart 是一个机器学习 (ML) 中心，可以帮助您加速 ML 之旅。使用 Amazon SageMaker JumpStart，您可以访问预训练的模型，包括基础模型，以执行文章总结和图片生成等任务。预训练模型可针对您的使用案例和数据完全自定义，并且您可以使用用户界面或 SDK 轻松将其部署到生产中。此外，您可以在组织内访问预构建的解决方案来解决常见使用案例和共享 ML 构件，包括 ML 模型和笔记本，以加速 ML 模型的构建和部署。

Amazon SageMaker JumpStart 未使用您的任何数据来训练基础模型。由于所有数据都经过加密且不会离开您的虚拟私有云 (VPC)，因此您可以相信您的数据将会保持私密和机密。

Amazon SageMaker JumpStart 提供来自不同模型提供商的各种专有和公开可用的基础模型。基础模型是包含数十亿个参数并在数 TB 的文本和图像数据上进行预训练的大规模 ML 模型，因此您可以执行范围广泛的任务，例如文章摘要和文本、图像或视频生成。由于基础模型是经过预训练的，因此它们可以帮助降低训练和基础设施成本，并支持针对您的用例进行定制。

在 Amazon SageMaker Studio 中快速上手 JumpStart

打开 Amazon SageMaker Studio，选择左侧菜单栏的 “SageMaker JumpStart” ，如下图所示：

这将打开一个新选项卡，显示 SageMaker JumpStart 支持的所有模型（包括解决方案、基础模型基本信息等），如下图所示：

选择 “Stable Diffusion 2.1 base” 这个文生图的基础模型，如下图所示：

在新打开的选项卡中，你将看到部署 (Deploy)、训练 (Train)、Notebook、模型介绍 (Model details) 这四个子选项，分别单击这四个子选项，可以帮助您快速进入相关部分进行配置，如下图示：

以部署 (Deploy) 为例，可以在 “Deployment Configuration” 中，自行定义运行 SageMaker 所需的机型、终端节点名等。

以及可以在 “Security Settings” 中定义在 SageMaker 中运行的角色 (role)，控制这个角色的权限即可控制其访问亚马逊云科技资源的权限颗粒度；以及可以配置 VPC、加密 keys 等重要安全管理机制。如下图所示：

篇幅所限，我们就不对 SageMaker JumpStart 做更详细的介绍，有深入研究兴趣的同学可以参考一下资料：关于 Amazon SageMaker JumpStart 的官方页面，可参考：

https://aws.amazon.com/cn/sagemaker/jumpstart/?trk=cndc-detail

关于 Amazon SageMaker JumpStart 支持基础模型的最新更新，可参考：

https://aws.amazon.com/cn/sagemaker/jumpstart/getting-started...

在 Amazon SageMaker JumpStart 中运行 Notebook

本节我将带领大家在 Amazon SageMaker JumpStart 中运行 Notebook。

首先，参考下图选择 “Notebook” 子选项。

点击 “Open notebook” 进入 Notebook。

当 “Starting notebook kernel” 完成后，就可以运行这个示例的 Notebook 了！接下来的体验，和大家在其它各种环境中运行 Jupyter Notebook 是很类似的。

如果你计划在这个 Notebook 做的工作负载需要较多的 CPU 或者 GPU 资源，可以通过点击 Notebook 右上角的配置位置（如下图），来选择需要的 Notebook 实例类型、代码运行的 Image 环境、Python 版本等。

这个实验我们选择比较小的 “ml.t3.medium” 实例即可，如下图示：

SageMaker JumpStart 上部署模型和运行推理

代码说明

本实验的完整代码，可以在亚马逊云科技的 SageMaker 代码库中获得。

GitHub 地址如下：

https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/jumpstart_text_to_image/Amazon_JumpStart_Text_To_Image.ipynb?trk=cndc-detail

以上全部代码分为两部分：

预训练模型的部署和运行推理
预训练模型在客户数据集上的微调（Fine-tune）

本章涉及第一部分：预训练模型的部署和推理。

环境和权限配置准备

这个 Notebook 在带有 Python 3 (Data Science) 内核的 SageMaker Studio 中，使用 ml.t3.medium 实例上进行了测试。要部署预先训练或经过微调的模型，可使用 ml.p3.2xlarge 或 ml.g4dn.2xlarge 实例类型。如果 ml.g5.2xlarge 在你所在的地区可用，我们建议使用该实例类型进行部署。

在运行这个 Notebook 的代码之前，需要先执行一些初始步骤进行设置，例如：安装 ipywidgets 库和最新版本的 sagemaker。代码如下：

!pip install ipywidgets==7.0.0 --quiet
!pip install --upgrade sagemaker

要在 Amazon SageMaker 上托管，我们还需要设置其对亚马逊云科技的相关服务授权，并对其使用进行身份验证。在这里，我们将与当前 Notebook 关联的执行角色配置了具有 SageMaker 访问权限的角色 (role)。

import sagemaker, boto3, json
from sagemaker import get_execution_role

aws_role = get_execution_role()
aws_region = boto3.Session().region_name
sess = sagemaker.Session()

预训练模型的部署

使用亚马逊云科技的 SageMaker JumpStart，我们可以直接在预训练模型上进行推理 (inference)，而无须先在新的数据集上做微调 (fine-tuning)。

你可以继续使用默认模型配置，也可以参考以下代码，从生成的下拉列表中选择不同的模型版本。

from ipywidgets import Dropdown
from sagemaker.jumpstart.notebook_utils import list_jumpstart_models

# Retrieves all Text-to-Image generation models.
filter_value = "task == txt2img"
txt2img_models = list_jumpstart_models(filter=filter_value)

# display the model-ids in a dropdown to select a model for inference.
model_dropdown = Dropdown(
    options=txt2img_models,
    value="model-txt2img-stabilityai-stable-diffusion-v2-1-base",
    description="Select a model",
    style={"description_width": "initial"},
    layout={"width": "max-content"},
)
display(model_dropdown)

以上代码的运行结果，如下图所示：

如果你好奇在 Sagemaker JumpStart 支持那些预训练模型，可以参考以下的完整列表：
https://sagemaker.readthedocs.io/en/stable/doc_utils/pretrain...

首先，我们需要设置预训练模型的 deploy_image_uri 和 model_uri。为了托管预训练模型，我们将创建一个 sagemaker.model.Model 的实例并开始部署。

from sagemaker import image_uris, model_uris, script_uris, hyperparameters, instance_types
from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base

endpoint_name = name_from_base(f"jumpstart-example-infer-{model_id}")

# Please use ml.g5.24xlarge instance type if it is available in your region. ml.g5.24xlarge has 24GB GPU compared to 16GB in ml.p3.2xlarge and supports generation of larger and better quality images.
inference_instance_type = instance_types.retrieve_default(
    region=None,
    model_id=model_id,
    model_version=model_version,
    scope="inference"
)

# Retrieve the inference docker container uri. This is the base HuggingFace container image for the default model above.
deploy_image_uri = image_uris.retrieve(
    region=None,
    framework=None,  # automatically inferred from model_id
    image_scope="inference",
    model_id=model_id,
    model_version=model_version,
    instance_type=inference_instance_type,
)

# Retrieve the model uri. This includes the pre-trained model and parameters as well as the inference scripts.
# This includes all dependencies and scripts for model loading, inference handling etc..
model_uri = model_uris.retrieve(
    model_id=model_id, model_version=model_version, model_scope="inference"
)

# To increase the maximum response size (in bytes) from the endpoint.
env = {
    "MMS_MAX_RESPONSE_SIZE": "20000000",
}

# Create the SageMaker model instance
model = Model(
    image_uri=deploy_image_uri,
    model_data=model_uri,
    role=aws_role,
    predictor_cls=Predictor,
    name=endpoint_name,
    env=env,
)

# Deploy the Model. Note that we need to pass Predictor class when we deploy model through Model class,
# for being able to run inference through the sagemaker API.
model_predictor = model.deploy(
    initial_instance_count=1,
    instance_type=inference_instance_type,
    predictor_cls=Predictor,
    endpoint_name=endpoint_name,
)

创建以及模型部署需要 10 分钟左右的时间。特别提醒：在等待模型部署期间，请不要中断内核的运行。

运行以上代码后，你会在 SageMaker 控制台的 “Endpoints” 项，看到有端点在部署，状态为 “Creating”，如下图所示：

等待大约 10 分钟左右的时间，如果看到以下 “！” 返回，表示模型已经在 SageMaker 的端点部署完成：

这时如果你继续留意 SageMaker 控制台的 “Endpoints” 项，会观察到状态已经由 “Creating” 变成 “InService”，如下图所示：

现在模型已经部署完成，可以开始进行推理了！

预训练模型的运行推理

模型的输入数据格式是：json 格式，并用 utf-8 编码的文本字符串。

模型的输出数据格式是：json 格式，并且包含生成的文本。

import matplotlib.pyplot as plt
import numpy as np

def query(model_predictor, text):
    """Query the model predictor."""

    encoded_text = text.encode("utf-8")

    query_response = model_predictor.predict(
        encoded_text,
        {
            "ContentType": "application/x-text",
            "Accept": "application/json",
        },
    )
    return query_response

def parse_response(query_response):
    """Parse response and return generated image and the prompt"""

    response_dict = json.loads(query_response)
    return response_dict["generated_image"], response_dict["prompt"]

def display_img_and_prompt(img, prmpt):
    """Display hallucinated image."""
    plt.figure(figsize=(12, 12))
    plt.imshow(np.array(img))
    plt.axis("off")
    plt.title(prmpt)
plt.show()

如下代码以及代码运行后返回的图例所示，输入文本 “cottage in impressionist style”，模型就会预测与该文本对应的图像。

text = "cottage in impressionist style"
query_response = query(model_predictor, text)
img, prmpt = parse_response(query_response)
display_img_and_prompt(img, prmpt)

预训练模型的高级推理参数

该模型在执行推理时还支持许多高级参数。它们包括：

prompt: 提示指导图像生成。必须指定，可以是字符串或字符串列表

width: 图像的宽度。如果指定，则必须是可被 8 整除的正整数

height: 图像的高度。如果指定，则必须是可被 8 整除的正整数

num_inference_steps: 图像生成过程中的降噪步骤数。步骤越多，图像质量越高。如果指定，则必须为正整数

guidance_scale: 较高的制导比例 (guidance scale) 会导致图像与提示密切相关，但会牺牲图像质量。如果指定，则必须为浮点数；而设置guidance_scale<=1 将忽略

negative_prompt: 根据此提示引导图像生成。如果指定，则必须是字符串或字符串列表，并与 guidance_scale 一起使用。如果 guidance_scale 被禁用，它也会被禁用；此外，如果 prompt 是字符串列表，那么 negative_prompt 也必须是字符串列表

num_images_per_prompt: 每个提示返回的图像数量，如果指定，则必须为正整数

seed: 修复随机化状态以提高可重复性 (reproducibility)，如果指定，则必须是整数

以下举例说明：

import json

payload = {
    "prompt": "astronaut on a horse",
    "width": 512,
    "height": 512,
    "num_images_per_prompt": 1,
    "num_inference_steps": 50,
    "guidance_scale": 7.5,
    "seed": 1,
}

def query_endpoint_with_json_payload(model_predictor, payload, content_type, accept):
    """Query the model predictor with json payload."""

    encoded_payload = json.dumps(payload).encode("utf-8")

    query_response = model_predictor.predict(
        encoded_payload,
        {
            "ContentType": content_type,
            "Accept": accept,
        },
    )
    return query_response

def parse_response_multiple_images(query_response):
    """Parse response and return generated image and the prompt"""

    response_dict = json.loads(query_response)
    return response_dict["generated_images"], response_dict["prompt"]


query_response = query_endpoint_with_json_payload(
    model_predictor, payload, "application/json", "application/json"
)
generated_images, prompt = parse_response_multiple_images(query_response)

for img in generated_images:
    display_img_and_prompt(img, prompt)

不同模型的训练数据具有不同的图像大小，通常可以观察到，当生成的图像的维度与训练数据维度相同时，模型的性能最佳。如果尺寸与默认尺寸不匹配，则可能会导致图像呈黑色。Stable Diffusion v1.4 模型是在 512512 的图像数据集上训练的，而 Stable Diffusion v2 模型是在 768768 的图像数据集上训练的。

在上述代码中，我们设置了希望输出的图像长度和宽度都是 512。以下是得到的模型输出图像：

图像的压缩输出 Compressed Image Output

上面来自端点的默认响应类型是具有 RGB 值的嵌套数组。因此，如果生成的图像尺寸很大，则可能会达到响应大小限制。为了解决这个问题，SageMaker 还支持返回 JPEG 图像的端点响应，是以字节为单位返回 (returned as bytes)。

如果需要以字节为单位返回，请设置：

Accept = 'application/json;jpeg'

关于图像的压缩输出部分的代码如下：

from PIL import Image
from io import BytesIO
import base64
import json

def display_encoded_images(generated_images, title):
    """Decode the images and convert to RGB format and display

    Args:
    generated_images: are a list of jpeg images as bytes with b64 encoding.
    """

    for generated_image in generated_images:
        generated_image_decoded = BytesIO(base64.b64decode(generated_image.encode()))
        generated_image_rgb = Image.open(generated_image_decoded).convert("RGB")
        display_img_and_prompt(generated_image_rgb, title)

def compressed_output_query_and_display(payload, title):
    query_response = query_endpoint_with_json_payload(
        model_predictor, payload, "application/json", "application/json;jpeg"
    )
    generated_images, prompt = parse_response_multiple_images(query_response)

    display_encoded_images(generated_images, title)

payload = {
    "prompt": "astronaut on a horse",
    "width": 512,
    "height": 512,
    "num_images_per_prompt": 1,
    "num_inference_steps": 50,
    "guidance_scale": 7.5,
    "seed": 1,
}
compressed_output_query_and_display(payload, "generated image with compressed response type")

采用以字节为单位返回（returned as bytes）后，输出的图像如下图所示：

提示工程 Prompt Engineering

写一个好的提示词，在大模型时代可能是一门艺术。

在给定模型下，通常很难预测某个提示词是否会产生令人满意的图像。不过，已经有分析和实践显示，某些模板可能是非常有效的。

提示词可以大致分为三部分：

图像类型（照片/素描/绘画等）
描述（主题/物体/环境/场景等）
图像风格（写实/艺术/艺术类型等）

因此，可以分别更改以上这三个部分的提示词，来生成图像的变体。众所周知，形容词在图像生成过程中起着重要作用。此外，添加更多细节也会有助于高质量的生成图像过程。

要生成逼真的图像，您可以使用诸如 “的照片”、“的照片”、“逼真” 或 “超逼真” 之类的短语。要生成艺术家的图像，您可以使用诸如 “巴勃罗·皮卡索的作品” 或 “伦勃朗的油画” 或 “弗雷德里克·埃德温·丘奇的风景艺术” 或 “阿尔布雷希特·丢勒的铅笔画” 之类的短语。

你也可以组合不同的艺术家。要按类别生成艺术图像，可以在提示中添加艺术类别，例如 “海滩上的狮子，抽象”。其他一些类别包括 “油画”、“铅笔画”、“波普艺术”、“数字艺术”、“动漫”、“卡通”、“未来主义”、“水彩”、“漫画” 等。您还可以包括灯光或相机镜头（如 35 毫米宽镜头或 85 毫米宽镜头）和取景细节（人像/风景/特写等）。

请注意：即使多次给出相同的提示词，模型也会生成不同的图像。因此，您可以生成多个图像并选择最适合您的应用程序的图像。

以下举例。有如下这段英文的描述词：

prompts = [
    "symmetry!! portrait of vanessa hudgens in the style of horizon zero dawn, machine face, intricate, elegant, highly detailed, digital painting, artstation, concept art, smooth, sharp focus, illustration, art by artgerm and greg rutkowski and alphonse mucha, 8 k",
]
for prompt in prompts:
    payload = {"prompt": prompt, "width": 512, "height": 512, "seed": 1}
    compressed_output_query_and_display(payload, "generated image with detailed prompt")

输出的图像结果如下。是不是已经有些令人惊艳的感觉了？

反向提示参数 Negative Prompt Parameter

使用 Stable Diffusion 模型生成图像时，反向提示 (Negative Prompting) 也是一个重要方法。反向提示 (Negative Prompting) 提供了对图像生成过程的额外控制，引导模型避开生成的图像中的某些对象、颜色、样式、属性等。

让我们来看一段反向提示（Negative Prompting）的代码示例：

prompt = "emma watson as nature magic celestial, top down pose, long hair, soft pink and white transparent cloth, space, D&D, shiny background, intricate, elegant, highly detailed, digital painting, artstation, concept art, smooth, sharp focus, illustration, artgerm, bouguereau"
payload = {"prompt": prompt, "seed": 0}
compressed_output_query_and_display(payload, "generated image with no negative prompt")

negative_prompt = "windy"
payload = {"prompt": prompt, "negative_prompt": negative_prompt, "seed": 0}
compressed_output_query_and_display(
    payload, f"generated image with negative prompt: `{negative_prompt}`"
)

代码运行结果如上面的两幅图对比所示。

左图是没有采用反向提示 (Negative Prompting) 方法生成的图，右图是采用了反向提示 (Negative Prompting) 方法生成的图。相信大家已经看到的这个神奇的差异了。

另外，还有值得一提的地方是：尽管你可以通过指定否定词 “没有”、“except”、“no” 和 “not” 来在原始提示中指定其中的许多概念，但据观察，Stable Diffusion 模型无法很好地理解否定词。因此，在根据用例定制图像时，应使用反向提示参数 (Negative Prompt Parameter)。

prompt = "a portrait of a man without beard"
payload = {"prompt": prompt, "seed": 0}
compressed_output_query_and_display(payload, f"prompt: `{prompt}`, negative prompt: None")

prompt, negative_prompt = "a portrait of a man", "beard"
payload = {"prompt": prompt, "negative_prompt": negative_prompt, "seed": 0}
compressed_output_query_and_display(
    payload, f"prompt: `{prompt}`, negative prompt: `{negative_prompt}`"
)

举例说明如下：

左图是没有采用反向提示 (Negative Prompting) 方法生成的图，虽然提示词里明确写明了 "a portrait of a man without beard"，用了 “without” 这种制定否定词，但是仍然没有达到效果（生成的图像中的男人仍然有胡须）。

右图是采用了反向提示 (Negative Prompting)方法生成的图，达到了预期的效果生成的图像中的男人无胡须）。

清理和释放资源

实验完成后，请通过运行以下代码清理和释放资源，以避免不必要的费用开销：

# Delete the SageMaker endpoint
model_predictor.delete_model()
model_predictor.delete_endpoint()

成功释放资源后，在 SageMaker 控制台的 “Endpoints” 项，就应该看不到有任何的端点在部署了，如下图所示：

小结

本篇作为文生图 (Text-to-Image) 领域动手实践系列的上集，主要涉及了两个大方面：

首先，通过介绍 Stable Diffusion 模型在 Amazon SageMaker JumpStart 上的快速部署和推理细节，带领大家一起领略了大模型的部署其实没有神秘，而 SageMaker JumpStart 是大家入门学习的好帮手；
另外，本文还 Stable Diffusion 模型，逐行代码为大家演示了如何进行 Stable Diffusion 大模型的预训练模型的部署和推理，其中包括：运行环境准备、角色权限配置、支持的主要推理参数、图像的压缩输出、提示工程 (Prompt Engineering)、反向提示 (Negative Prompting) 等内容。

下一篇将继续以 Stable Diffusion 模型为力，介绍预训练模型在客户数据集上的微调 (Fine-tune)，以及亚马逊云科技提供的更高阶的面向企业或科研单位生产环境级别的一些完整解决方案，敬请期待。

请持续关注 Build On Cloud 微信公众号，了解更多面向开发者的技术分享和云开发动态！

往期推荐

#开发者生态

#亚马逊的开源文化

#构建模型最佳实践

文章来源：
https://dev.amazoncloud.cn/column/article/6492dcb385edc058b7ab8e22?sc_medium=regulartraffic&sc_campaign=crossplatform&sc_channel=CSDN

你可能感兴趣的:(机器学习,python,开源,生成式人工智能)

vue入门学习时，按照官方的教程生成的vue3项目后，命令行运行npm install出现一堆warn，然后运行npm run dev报错，项目启动失败 67号人生 vue小白学习 vue.js 学习 npm crypto.hash vue官方示例项目失败
日期：2025年6月27日星期五农历六月初三VUE版本：vue3IDE：vscodevue入门学习时，按照官方的教程生成的vue3项目后，命令行运行npminstall出现一堆warn，然后运行npmrundev报错，项目启动失败运行npminstall出现一堆warn运行npmrundev报错解决办法通过nvm安装较高版本的nodejs，或者手动冲nodejs官网下载。虽然vue官方推荐node
人脸识别接口&sdk，两张人脸相似度比对
人工智能时代，人脸识别技术正在被广泛应用于金融支付、安防监控、身份验证等多个领域，基于深度学习算法于海量样本训练，人脸识别接口以高精度、低延迟的特性出现在大众视野，成为开发者和企业用户集成人脸识别功能的首要选择之一。人脸识别接口技术服务原理：格式转换：支持BMP、JPG、PNG、TIF等多种常见图像格式；尺寸调整与压缩：建议图像大小控制在200KB左右，确保传输效率与识别质量；图像增强：自动旋转、
家用充电桩远程监控安全管理系统解决方案蓝蜂物联网物联网远程监控边缘计算物联网
家用充电桩远程监控安全管理系统解决方案在当今电动汽车日益普及的背景下，家用充电桩的安全管理成为了广大车主关注的重点问题。为了实现对充电桩的高效、精准、远程监控，一套完善的家用充电桩远程监控安全管理系统解决方案应运而生。本方案旨在通过先进的物联网技术、云计算、大数据分析以及人工智能等科技手段，构建一个集实时监测、异常预警、故障诊断、数据统计、远程控制于一体的智能化平台，确保充电桩的安全运行及用户充电
为什么 Python 是 AI 的首选语言？
文章目录一、简洁优雅，易于上手二、丰富的库和框架1.数据处理与分析2.数据可视化3.机器学习与深度学习框架三、强大的社区支持四、跨平台性和可移植性五、与其他语言的互操作性文章配套代码已上传，点击查看：https://download.csdn.net/download/2501_92578370/91180848在人工智能（AI）技术飞速发展的今天，编程语言的选择对AI开发者来说至关重要。当你翻开
【C语言小游戏】贪吃蛇鱼弦游戏开发 c语言数学建模开发语言
鱼弦：CSDN内容合伙人、CSDN新星导师、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）贪吃蛇是一个经典的小游戏，以下是贪吃蛇的原理详细解释、使用场景解释，以及一些相关的文献材料链接和当前使用贪吃蛇的产品。原理详细解释：贪吃蛇游戏的原理是在一个有边界的游戏界面上控制一条蛇移动，蛇会不断吃
AI 时代下，普通人不能错过的五大变现机会 Jasonakeke AI 人工智能大数据
AI时代下，普通人不能错过的五大变现机会关键词：轻资产低门槛强需求机会1：知识付费——借“AI”做知识博主核心逻辑：AI降低知识生产门槛AI这个领域有巨大的科普红利和流量红利操作步骤：定位细分领域用AI工具快速生成内容选择平台机会2：AI自媒体——流量即现金变现模式：自媒体商单广告分成带货私域转化核心逻辑：目前AI存在巨大的科普红利和流量红利+AI能够提升创作效率爆款公式：选题：AI工具测评+具体
RabbitMQ是一个开源的消息代理和队列服务器大霸王龙 python rabbitmq 开源服务器
RabbitMQ是一个开源的消息代理和队列服务器，它基于AMQP（AdvancedMessageQueuingProtocol，高级消息队列协议）协议实现，同时也支持其他消息协议如STOMP、MQTT等。作为一个可靠的消息传递服务，RabbitMQ在分布式系统中广泛应用于异步处理、应用解耦、流量控制等场景。以下是对RabbitMQ的详细介绍，内容字数控制在3000字以内。一、RabbitMQ的基本
【AI Infra】基础学习汇总篇逆羽飘扬 AI基础知识人工智能学习
系列综述：目的：本系列是个人整理为了学习训练框架优化的，整理期间苛求每个知识点，平衡理解简易度与深入程度。来源：材料主要源于【DeepEP官方介绍】进行的，每个知识点的修正和深入主要参考各平台大佬的文章，其中也可能含有少量的个人实验自证。结语：如果有帮到你的地方，就点个赞和关注一下呗，谢谢！！！请先收藏！！！，后续继续完善和扩充(●’◡’●)文章目录一、分布式与并行基础分布式计算高性能并行GPU硬
【Python基础】13 知识拓展：CPU、GPU与NPU的区别和联系智算菩萨 python 开发语言人工智能
引言：处理器大战背后的技术革命在人工智能蓬勃发展的今天，我们经常听到CPU、GPU、NPU这些术语，但你是否真正理解它们之间的区别和联系？作为Python开发者，我们更关心的是：在什么场景下选择哪种处理器？如何在Python中充分发挥它们的性能优势？这篇文章将从技术原理出发，结合Python实战代码，深入解析这三种处理器的特点、应用场景和发展趋势，帮助你在面对不同计算任务时做出最优选择。第一章：C
【Python基础】15 Python并发编程进阶智算菩萨 python 人工智能
在现代软件开发中，随着多核处理器的普及和网络应用的复杂化，并发编程已经成为提升程序性能的关键技术。Python作为一门优雅且强大的编程语言，提供了多种并发编程方案，包括多线程、多进程和异步编程。然而，很多开发者在面对具体场景时，往往不知道该选择哪种方案，或者对这些技术的底层原理缺乏深入理解。本文将深入探讨Python并发编程的三大核心技术，从底层原理到实际应用，通过详实的案例分析帮助读者掌握在不同
Python性能优化：10个提升代码性能的策略进击的六角龙 Python python 性能优化开发语言
文末赠免费精品编程资料~~引言今天，我们就来聊聊如何让你的Python代码飞起来——通过10个实用的性能优化策略。别担心，我们会从基础讲起，一步步带你进入性能优化的大门。1.使用内置函数和库Python内置了许多高效的函数和库，利用它们往往比自己从头写要快得多。比如，列表推导式就比for循环创建列表更快。# 列表推导式 vs for循环fast_list = [i**2 for i in rang
【教程4＞第7章＞第26节】基于FPGA的RS(204,188)译码verilog实现10——RS译码模块整体实现与性能仿真评估 fpga和matlab #第7章·通信—信道编译码 fpga开发 RS verilog RS译码教程4
本课程学习成果预览目录1.软件版本2.RS译码模块整体实现介绍2.1伴随式计算（SyndromeCalculation）2.2擦除位置处理（ErasureHandling）2.3多项式乘法（PolynomialMultiplication）2.4欧几里得算法（EuclideanAlgorithm）2.5钱搜索（ChienSearch）3.RS译码模块整体FPGA实现4.RS译码仿真测试5.视频操作
MIT 6.S184 Lec01 Flow and Diffusion Models 克斯维尔的明天_ 机器学习人工智能
MIT6.S184Lec01FlowandDiffusionModels本节中，我们将描述如何通过模拟一个适当构造的微分方程来获得所需的转换。例如，流匹配和扩散模型分别涉及模拟常微分方程（ODE）和随机微分方程（SDE）。因此，本节的目标是定义和构建这些生成模型。具体来说，我们首先定义ODE和SDE，并讨论它们的模拟。其次，我们描述如何使用深度神经网络对ODE/SDE进行参数化。从中推导出流模型和
【Python基础】14 内存管理与性能优化智算菩萨 python 性能优化开发语言
前言在现代软件开发中，性能优化已经成为每位开发者必须掌握的核心技能。Python作为一门高级编程语言，虽然在语法简洁性和开发效率方面具有显著优势，但其解释型语言的特性也带来了性能上的挑战。深入理解Python的内存管理机制，掌握有效的性能优化策略，不仅能够帮助我们编写出更高效的代码，还能在处理大规模数据和高并发场景时游刃有余。本文将从Python内存管理的底层原理出发，深入探讨垃圾回收机制、内存分
BAAI/BGE-VL多模态模型部署、原理、代码详解（实现图像文本混合检索），包含BEG-VL多模态模型的本地部署详细步骤及代码原理解析令令小宁 python 语言模型自然语言处理 nlp 人工智能
本文包含BGE-VL多模态模型的本地部署详细步骤及代码原理解析文章目录前言一、模型下载二、计算流程解析1.BGE-VL-base/Large2.BGE-VL-MLLM-s1/s2三、总结前言提示：这里可以添加本文要记录的大概内容：包含四个模型及数据集，数据集未开源，四个模型可以分别下载：其中，BGE-VL-base/Large是基于CLIP训练的模型，BGE-VL-MLLM-S1/S2是基于LLM
本地部署Jina-CLIP v2:多语言多模态文本图像向量模型（包含一些踩坑记录和技巧）令令小宁 jina 语言模型 python
JinaCLIPv2：Jina-CLIP-v2是一个全新的通用多语言多模态向量模型，该模型基于jina-clip-v1和jina-embeddings-3构建，实现了一些关键改进。关于Jina-CLIP-v2的更多介绍点此可了解模型特点模型开源链接：https://huggingface.co/jinaai/jina-clip-v2在它的开源链接的介绍中，我们可以得知，Jina-CLIP-v2的参
python lambda函数计算三次幂_pythonlambda函数及三个常用的高阶函数
进行编程时，一般我们会给一个函数或者变量起一个名字，该名称是用于引用或寻址函数变量。但是有一个低调的函数，你不需要赋予它名字，因此该函数也叫匿名函数。该函数就是Python中的Lambda函数，下面就来为大家解析python—lambda函数，三个常用的高阶函数。为什么要使用PythonLambda函数？匿名函数可以在程序中任何需要的地方使用，但是这个函数只能使用一次，即一次性的。因此Python
python有哪些函数怎么用_必须掌握的常用python函数有哪些？
必须掌握的常用python函数有哪些？更新时间：2020年11月02日作者：spoto必须掌握的常用Python的安装设置过程中需要注意的事项，今天我们就另一个学员们经常询问的问题进行解答。我们都知道Python有许多函数，但是因为数量庞大，难以全部掌握，所以今天我们帮助大家删繁就简，下面罗列了大家在学习过程中必须掌握的一些常用Python函数及其用途功能，希望大家认真学习，熟练应用。1.prin
从 TCP/IP 协议栈角度深入分析网络文件系统 (NFS)
一、引言：NFS与TCP/IP的关系概述网络文件系统(NetworkFileSystem,NFS)是一种分布式文件系统协议，允许客户端通过网络访问远程服务器上的文件系统，就像访问本地文件系统一样。NFS是SunMicrosystems在20世纪80年代开发的，旨在提供一种透明的、与平台无关的文件共享机制。从设计理念来看，NFS的核心目标是"消除本地文件和远程文件之间的区别"，使用户能够像操作本地文
AutoGen行业应用与典型场景实践
摘要AutoGen作为分布式多智能体AI系统，已在金融、医疗、教育、智能客服等行业落地应用。本文系统梳理AutoGen在各行业的应用模式、业务流程、Python实战、最佳实践与常见问题，助力中国AI开发者高效构建行业级AI解决方案。1.AutoGen行业应用全景与价值支持多智能体协作，适配复杂业务流程易于集成主流大模型与行业工具分布式部署，满足高可用与弹性扩展需求典型行业：金融风控、医疗问答、教育
Deep Global Registration 代码环境配置(rtx3090+python3.8+cuda11.1+pytorch1.7+MinkowskiEngine0.5.1) JPy646 pytorch 深度学习神经网络
前言踩过的坑：因为rtx3090最低算力是8.6，似乎不支持过低版本的cuda。试过pytorch1.7.0+cuda11.0，但会报错，由于cuda11.0支持的最高算力达不到rtx最低的要求。但配置pytorch1.8时DGR的代码运行时会报错。对于没有这个烦恼的还是推荐安装python3.6+cuda10.2+pytorch1.6+MinkowskiEngine0.4.3,这个配置无需改动代
从 Alpha 到 Final：Python 各阶段版本到底该怎么用？三金C_C Python python 版本生命周期
主流的Python是由PythonSoftwareFoundation（PSF，Python软件基金会）主导的：PSF是一个非营利组织负责维护Python官方语言规范、标准库、社区基础设施它主导的实现版本是我们日常使用的：CPythonPython的版本阶段（版本周期）。这些阶段是官方正式定义的，适用于每一个Python主版本（比如3.12、3.13、3.14…）Python版本的四大阶段Pyth
RTX50系显卡+CUDA+torch+python对应关系
前言本人的显卡是RTX5070，使用时发现它对CUDA、torch和python版本有要求，试图按照老项目的依赖文件进行安装发现安不了，因此记录一下（截至2025年6月）。提示：以下是本篇文章正文内容，下面案例可供参考一、RTX50系显卡只能使用CUDA12.8二、目前只支持torch2.7.0和2.7.11.去pytorch官网的https://download.pytorch.org/whl/
ATmega16微控制器编程与应用实践 love彤彤
本文还有配套的精品资源，点击获取简介：ATmega16是一个基于AVR架构的8位微控制器，广泛用于嵌入式系统控制应用。本文将详细介绍如何在ATmega16上实现1602液晶显示、独立键盘操作、数码管扫描、蜂鸣器控制和流水灯设计等常用功能。通过这些功能的实践项目，读者可以掌握C语言在嵌入式系统开发中的应用，包括I/O口编程、定时器设置、中断处理和串行通信等关键技术。1.ATmega16微控制器简介A
强化学习RLHF详解贝塔西塔强化学习大模型人工智能深度学习机器学习算法语言模型
RLHF（ReinforcementLearningfromHumanFeedback）模型详解一、背景1.传统强化学习的局限性传统的强化学习（ReinforcementLearning,RL）依赖于预定义的奖励函数（RewardFunction），但在复杂任务（如自然语言生成、机器人控制）中，设计精确的奖励函数极为困难。例如：模糊目标：生成“高质量文本”难以量化，无法用简单的指标（如BLEU、R
强人工智能是否会诞生于现在的AI之中一花·一叶人工智能语言模型
为什么我认为当前AI方法无法实现真正的人工智能？随着大模型的发展日新月异，越来越多的人开始相信我们正在接近通用人工智能（AGI）。然而，作为一名人工智能领域的算法工程师，我反而越来越确信：现有的技术路径——以Transformer为核心的深度神经网络，可能已经达到了它的能力上限。我们或许正站在一个新时代的门槛上：真正的强人工智能将不会诞生于现有的范式中，而需要一条全新的算法路径。Transform
Github 2025-07-03Go开源项目日报Top10 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2025-07-03统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Go项目10JavaScript项目2Go编程语言：构建简单、可靠和高效的软件创建周期：3474天开发语言：Go协议类型：BSD3-Clause“New”or“Revised”LicenseStar数量：117964个Fork数量：16989次关注人
Github 2025-06-07 Rust开源项目日报Top10 老孙正经胡说 github rust 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2025-06-07统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Rust项目10Dart项目1TypeScript项目1RustDesk:用Rust编写的开源远程桌面软件创建周期：1218天开发语言：Rust,Dart协议类型：GNUAfferoGeneralPublicLicensev3.0Star数量：581
Github 2025-07-01 开源项目月报 Top16
根据GithubTrendings的统计，本月(2025-07-01统计)共有16个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量TypeScript项目5JupyterNotebook项目4Python项目4Rust项目2JavaScript项目1非开发语言项目1Shell项目1Dockerfile项目1Java项目1C++项目1Vue项目1各种有趣主题的精彩清单创建周期：3
【Rust日报】Rust稳定2024版本将于 2025年2月20日发布
fastembed-rs-AI嵌入库FastEmbed的Rust实现,提供了快速的文本嵌入、图像嵌入和候选项重新排序功能。它具有以下主要特性:支持同步使用,无需依赖Tokio。使用@pykeio/ort进行高性能的ONNX推理。使用@huggingface/tokenizers进行快速编码。支持使用@rayon-rs/rayon进行批量嵌入生成和并行计算。默认模型是FlagEmbedding,在M
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr