亚马逊云开发者

Amazon SageMaker，更好用的机器学习平台！

前言

本文作者：码莎拉蒂

最近参与了亚马逊云科技【云上探索实验】活动，通过 Amazon SageMaker 基于 Stable Diffusion 模型，非常简单快速搭建的第一个 AIGC应用。一开始以为非常复杂，不懂动手操作，但实际上操作非常简单，没有想象中的恐怖，整体体验非常愉快。我先对 Amazon SageMaker 简单介绍，然后对基于 Stable Diffusion 模型，搭建 AIGC 应用简单总结下。

Amazon SageMaker 简单介绍

Amazon SageMaker 是 Amazon Web Services 的一款全面的机器学习（ML）平台，旨在让数据科学家、开发人员和企业更轻松地构建、训练和部署机器学习模型。Amazon SageMaker 提供了一整套工具和框架，包括数据标注、模型训练、模型部署、自动化建模等功能，同时还支持多种常见数据科学框架，例如 TensorFlow、PyTorch 和 Apache MXNet。Amazon SageMaker 建立在亚马逊云科技二十年来开发现实世界机器学习应用程序的经验之上，这些应用程序包括产品推荐、个性化、智能购物、机器人技术和语音辅助设备。

官网地址：

https://aws.amazon.com/cn/campaigns/sagemaker/?trk=cndc-detail

基于 Stable Diffusion 模型，

搭建 AIGC 应用

1. 我们需要先检查限额

我们会使用 ml.g4dn.xlarge，首先需要确保 ml.g4dn.xlarge 有额度（请访问此链接检查限额：

https://ap-northeast-1.console.aws.amazon.com/servicequotas/home/services/sagemaker/quotas

搜索框中输入 ml.g4dn.xlarge for endpoint usage 若您的限额如图所示,在 ml.g4dn.xlarge for endpoint usage 行第二列若为0，请继续以下步骤：

选中其中的 ml.g4dn.xlarge for endpoint usage，然后点击右上角橙色按钮“请求增加配额”一步一步的往下走。

2. 我们需要创建 Amazon SageMaker Notebook 实例

1）登录控制台；

2）在查找服务处搜索 SageMaker，然后配置笔记本实例。

3）配置一个 IAM 角色：

3. 我们需要在 Amazon Cloud9 创建前后端 Web 应用

1）创建环境

这里我们需要进行创建 Amazon Cloud9 和安装 boto3 这些环境等，具体操作可以访问：

https://catalog.us-east-1.prod.workshops.aws/workshops/3b86fa89-da3a-4e5f-8e77-b45fb11adf4a/zh-CN/2-create-cloud9?trk=cndc-detail

2）运行 app.py 和 preview 前端页面

3）简单测试 prompt

输入：a siamese cat wearing glasses, working hard at the computer

4. 总结

基于 Stable Diffusion 模型，搭建 AIGC 应用操作非常简单，就算我们不是很懂，也能操作成功，功能也非常强大，体验非常舒服，真心建议大家去使用。

Stable Diffusion 模型介绍和核心竞争力

1. 模型结构图

2. 模型原理

3. 模型训练

训练目标：一步步对随机的高斯噪声降噪（denoise）

优势：Latent diffusion 之所以是 “latent”，是因为模型是在低维的潜空间（latent space）上进行扩散过程，而不是在实际的像素空间，从而降低了内存消耗和计算复杂度（比如输入 shape 是(3,512,512)，下采样因子是8，潜空间中变成了(3,64,64)，节省了8×8=64倍的内存）。训练完之后的模型就能把一张图表示成一个低维的潜特征。

4. 模型推理

如图（假设 batch size 是1），用户输入的 prompt 被 CLIP Text encoder 编码为 77×768 的潜特征，随机噪声被表示成 64×64 的潜特征；然后 U-Net 以 prompt 的特征为条件，逐步迭代计算。U-Net 输出的噪声残差，会通过调度算法（scheduler algorithm），根据先前的噪声表示和预测的噪声残差，计算最终去噪的图像潜表示。Stable Diffusion 建议的调度算法有三种：

PNDM scheduler（Pseudo Numerical Methods for Diffusion Models on Manifolds，默认）
DDIM scheduler
K-LMS scheduler

得到图像潜表示后，就可以送到 VAE 的 decoder 解码成图像了。

5. Stable Diffusion 算法模型的核心竞争力

Stable Diffusion 能使压缩率更高，清晰度超越 JPEG 等算法。
与纯粹基于 transformer 的方法相比，本文方法更适合高维数据；还可以高效地应用于百万像素图像的高分辨率合成。
显著降低计算成本，在多个任务（无条件图像合成、inpainting、超分辨率）和数据集上实现了具有竞争力的性能。与基于像素的扩散方法相比，显著降低了推理成本。
与之前的工作（同时学习编码器/解码器架构和 score-based 的先验）相比，方法不需要对重构和生成能力进行精确的权衡。这确保了仅需非常少的潜空间正则化下，即可有较合理的重建效果。
对于超分辨率、图像修复和语义合成等条件密集输入型的任务，模型能以卷积的方式应用，并输出高达1024分辨率的图像。
基于交叉注意力的通用条件机制，实现了多模态训练。用它来训练类条件模型、文本到图像模型和布局到图像模型。
Stable Diffusion 制作图片速度非常快。

总之只需训练一次通用的自动编码阶段，就可以用于多次 DM 训练或探索可能完全不同的任务。

Amazon SageMaker 产品强大的功能特性

1. 模型训练功能

Amazon SageMaker 提供了完整的模型训练流程，支持多种常见的深度学习和机器学习算法，包括线性回归、逻辑回归、k-means 聚类、随机森林等。用户可以在 SageMaker 中选择合适的算法，并通过简单易用的界面或 API 进行模型训练。此外，用户可以使用预训练模型或自己的模型文件进行训练。

当然，我们还可以使用 Amazon SageMaker。下图说明了如何基于 SageMaker 训练和部署模型：

2. 模型部署功能

Amazon SageMaker 提供了多种模型部署选项，包括实时端点、批量推理和容器化部署等。用户可以根据自己的需求选择合适的部署方式，并通过简单易用的界面或 API 进行部署。此外，用户还可以根据自己的需求进行部署优化，例如通过使用 GPU 实例加速推理速度，下图就是工作原理：

我们可以访问此部署用于推理的模型链接，具体深入了解：

https://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/deploy-model.html?trk=cndc-detail

3. 数据标注功能

Amazon SageMaker 提供了一整套数据标注工具，包括文本分类、图像分类、目标检测等。用户可以选择合适的数据标注任务，并通过简单易用的界面或 API 进行标注。此外，用户还可以使用 Amazon Mechanical Turk 等服务来获取更多的标注数据。

4. 自动化建模功能

Amazon SageMaker 提供了自动化建模功能，可以根据用户提供的数据自动生成模型。用户只需要上传数据集，SageMaker 就会自动生成最佳的模型架构和参数，并进行训练和优化。此功能可以大大简化模型构建的过程，提高模型的精度和效率。

5. 建模能力、速度与易用性

Amazon SageMaker 提供了一整套优秀的建模能力，可以帮助用户快速构建高质量的模型。同时，SageMaker 的训练速度也非常快，可以大大缩短模型训练的时间。此外，SageMaker 的易用性也非常好，用户可以通过简单易用的界面或 API 进行操作，无需专业知识。

6. 框架支持能力功能

Amazon SageMaker 支持多种常见的数据科学框架，包括 TensorFlow、PyTorch 和 Apache MXNet 等。用户可以选择合适的框架进行模型训练和部署，并享受到 SageMaker 提供的各种优秀功能。

7. 其它特性

除了以上所述的功能特性，Amazon SageMaker 还提供了多种其他有用的功能，例如模型调优、模型监控、模型解释等。这些功能可以帮助用户更好地理解和管理自己的机器学习模型。

Amazon SageMaker 技术原理

1. 机器学习原理性能

Amazon SageMaker 基于 TensorFlow、PyTorch、MXNet 等常见的机器学习框架，使用高效的分布式计算、自动化调参、自动化特征工程等技术，提高了机器学习模型的训练速度和效率。同时，SageMaker 还提供了多种优秀的算法库，可以帮助用户更好地构建和优化自己的机器学习模型。

1）监督学习

Amazon SageMaker 提供了多种内置的通用算法，可用于分类或回归问题。

AutoGluon-表格
CatBoost
因子分解机算法
K 最近邻（k-NN）算法
LightGBM
线性学习器算法
TabTransformer
XGBoost 算法
Object2Vec 算法
DeepAR 预测算法

2）无监督学习

Amazon SageMaker 提供了多种内置算法，可用于各种无监督学习任务，例如聚类、降维、模式识别和异常检测。

主成分分析（PCA）算法
K-Means 算法
IP 见解
随机森林砍伐（RCF）算法

3）文本分析

SageMaker 提供专为分析自然语言处理、文档分类或摘要、主题建模或分类以及语言转录或翻译中使用的文本文档而量身定制的算法。

BlazingText 算法
序列到序列算法
潜在狄利克雷分配（LDA）算法
神经主题模型（NTM）算法
文本分类 - TensorFlow

4）图像处理

SageMaker 还提供用于图像分类、物体检测和计算机视觉的图像处理算法。

图像分类 - MXNet
图像分类 - TensorFlow
语义分割算法
物体检测 - MXNet
物体检测 - TensorFlow

2. 主要功能算法总结

Amazon SageMaker 提供了多种常见的机器学习和深度学习算法，包括线性回归、逻辑回归、k-means 聚类、随机森林等。同时，SageMaker 还支持自定义算法，用户可以根据自己的需求进行扩展和优化。

Amazon SageMaker 产品适用场景和体验

1. 适用场景

Amazon SageMaker 适用于各种类型和规模的机器学习项目，包括计算机视觉、自然语言处理、推荐系统等。它可以帮助用户更轻松地构建、训练和部署机器学习模型，提高模型的精度和效率。

2. 体验优势

1）接入便捷

Amazon SageMaker 可以与其他亚马逊云科技服务无缝集成，例如 Amazon S3、Amazon Redshift、Amazon Lambda 等。这使得用户可以轻松地将自己的数据和应用程序与 SageMaker 集成，无需担心数据迁移和管理问题，访问链接查看入门：

https://aws.amazon.com/cn/sagemaker/getting-started/?trk=cndc-detail

2）功能丰富

Amazon SageMaker 提供了一整套机器学习工具和框架，包括模型训练、模型部署、数据标注、自动化建模等功能。用户可以根据自己的需求选择合适的功能，并通过简单易用的界面或 API 进行操作。

3）帮助文档丰富

Amazon SageMaker 提供了详尽的帮助文档和示例，可以帮助用户更好地理解和使用 SageMaker。此外，亚马逊云科技还提供了丰富的支持服务，用户可以随时联系亚马逊云科技支持团队获取帮助。

常见问题都能得到解决：

https://aws.amazon.com/cn/sagemaker/faqs/?nc=sn&loc=4?trk=cndc-detail

3. 客户业务案例

Amazon SageMaker 已经被广泛应用于各种机器学习项目中，例如：

垃圾邮件过滤：使用 SageMaker 训练模型来识别垃圾邮件，提高邮件过滤的效率和准确率。

图像分类：使用 SageMaker 训练模型来识别不同类别的图像，例如车辆、人物、动物等。

语音识别：使用 SageMaker 训练模型来识别语音，例如语音搜索、语音识别等。

推荐系统：使用 SageMaker 训练模型来预测用户的购买行为，提高推荐系统的准确率和效率。

部分客户如下图：

Amazon SageMaker 产品总结

1. 技术总结

Amazon SageMaker 基于 TensorFlow、PyTorch、MXNet 等常见的机器学习框架，使用高效的分布式计算、自动化调参、自动化特征工程等技术，提高了机器学习模型的训练速度和效率。同时，SageMaker 还提供了多种优秀的算法库和工具，可以帮助用户更好地构建和优化自己的机器学习模型。

2. 性能总结

Amazon SageMaker 提供了高效的数据标注、模型训练和模型部署功能，可以帮助用户更轻松地构建、训练和部署机器学习模型。同时，SageMaker 还提供了多种优秀的算法库和工具，可以提高模型的精度和效率。

3. 核心竞争力总结

Amazon SageMaker 提供了一整套优秀的机器学习工具和框架，包括模型训练、模型部署、数据标注、自动化建模等功能。用户可以根据自己的需求选择合适的功能，并通过简单易用的界面或 API 进行操作。此外，SageMaker 还提供了高效的分布式计算、自动化调参、自动化特征工程等技术，可以大大提高机器学习模型的训练速度和效率。

4. 是否满足大众需求总结

Amazon SageMaker 已经被广泛应用于各种机器学习项目中，并得到了广泛的认可和好评。它提供了一整套优秀的机器学习工具和框架，可以帮助用户更轻松地构建、训练和部署机器学习模型，提高模型的精度和效率。

温馨提示

目前云上探索实验室正在进行中，欢迎大家参与。

活动介绍与活动链接:

https://dev.amazoncloud.cn/experience/codewhisperer-1

活动定位：通过云上探索实验室，开发者可以学习实践云上技术，同时将自己的技术心得分享给其他开发者小伙伴。一同创造分享，互助启发，玩转云上技术。云上探索实验室不仅是体验的空间，更是分享的平台。

该动手实验方案由亚马逊云科技解决方案架构师团队提供，访问链接查看实验手册内容：

https://catalog.us-east-1.prod.workshops.aws/workshops/3b86fa89-da3a-4e5f-8e77-b45fb11adf4a/zh-CN?trk=cndc-detail

2023亚马逊云科技中国峰会即将开启！

点击下方图片即刻注册

听说，点完下面4个按钮

就不会碰到bug了！

机器学习实战——音乐流派分类（主页有源码）喵了个AI 机器学习实战机器学习分类人工智能
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.简介音乐流派分类是音乐信息检索（MusicInformationRetrieval,MIR）中的一个重要任务，旨在通过分析音频信号的特征，将音乐自动分类到不同的流派（如古典、摇滚、爵士、流行等）。随着数字音乐平台的普及，音乐流派分类技术被广泛应用于音乐推荐、自动标签生成和音乐库管理
AI大模型零基础金融人如何一周自学大模型，从零基础到入门，看这篇就够了！冻感糕人~ 人工智能金融 AI大模型 LLM 大模型技术大模型学习路线大模型基础
前几天参加了字节跳动在上海举办的火山引擎Force原动力大会，OpenAI也连续开了12天发布会，最近堪称科技界的春晚了。如果说2022年ChatGPT横空出世把人工智能的发展带上了一个新的台阶，那么2024年末，大模型对工作、生活的全面“侵入”让我们越来越接近库兹韦尔所描述的那个奇点时刻。作为金融民工，我们想通过这篇文章讲讲从用户的角度如何一周快速掌握大模型，以及为什么我建议每一个金融从业人员（
HarmonyNext实战案例：基于ArkTS的高性能分布式机器学习应用开发 harmonyos-next
HarmonyNext实战案例：基于ArkTS的高性能分布式机器学习应用开发引言在HarmonyNext生态系统中，分布式机器学习是其核心特性之一。通过分布式机器学习，开发者可以充分利用多设备的计算资源，实现复杂模型的训练与推理。本文将深入探讨如何使用ArkTS12+语法开发一个高性能的分布式机器学习应用，涵盖从基础概念到高级技巧的全面讲解。通过本案例，您将学习到如何利用HarmonyNext的分
成功案例丨开发时间从1小时缩短到3分钟：如何利用历史数据训练AI模型，预测设计性能？ Altair澳汰尔 PhysicsAI 仿真 AI 机器学习 HyperWorks 数据分析
案例简介PhysicsAI™助力HEROMOTOCORP实现设计效率提升99%印度领先的跨国摩托车和踏板车制造商HeroMotoCorpLtd.（以下简称Hero）致力于通过将人工智能（AI）和机器学习技术融入有限元分析（FEA）流程，以加速产品开发周期。在其首个AI驱动项目——摩托车把手设计优化中，Hero采用了PhysicsAI™几何深度学习解决方案，利用历史数据训练AI模型并预测设计性能。A
数据分析与AI丨AI Fabric：数据和人工智能架构的未来 Altair澳汰尔数据分析 ai RapidMiner 知识图谱人工智能
AIFabric架构是模块化、可扩展且面向未来的，是现代商业环境中企业实现卓越的关键。在当今商业环境中，数据分析和人工智能领域发展可谓日新月异。几乎每天都有新兴技术诞生，新的应用场景不断涌现，前沿探索持续拓展。可遗憾的是，众多企业在利用数据和人工智能方面，脚步总是滞后。这是每个行业进行创新和获得竞争优势的冲刺阶段，但正如大多数企业时常感受到的那样，大规模实施下一代数据和AI工具说起来容易做起来难。
Manus演示案例：英伟达财务估值建模解锁投资洞察的深度剖析 ylfhpy Manus 深度学习人工智能机器学习机器翻译 Manus
在当今瞬息万变的金融投资领域，精准剖析企业价值是投资者决胜市场的关键。英伟达（NVIDIA），作为科技行业的耀眼明星，其在人工智能和半导体领域的卓越表现备受瞩目。Manus凭借专业的财务估值建模能力，深入挖掘英伟达的潜在价值，为投资者提供了一份极具价值的分析报告。Manus在接到为英伟达进行详细财务估值建模的任务后，迅速且有条不紊地开展工作。数据收集是建模的基石，其重要性不言而喻。在收集英伟达公司
Python学习指南：系统化路径 + 避坑建议程之编 Python全栈通关秘籍青少年编程 python 开发语言人工智能机器学习
新手小白学习编程就像搭积木——需要从基础开始，逐步构建知识体系。以下是为你量身定制的Python学习路径，帮你告别杂乱，高效入门！一、学习前的关键认知明确目标：想用Python做什么？数据分析（如Excel自动化、可视化）Web开发（如搭建网站）人工智能（如机器学习）自动化办公（如处理文件、邮件）目标不同，后续学习侧重点不同（但基础通用）。避免误区：❌只看教程不写代码✅边学边动手，哪怕抄代码也要运
机器学习之KMeans算法 Mr终游机器学习机器学习算法 kmeans
目录一、KMeans的核心思想二、KMeans算法流程三、KMeans的关键点1.优点：2.缺点：四、如何确定最佳k值1.肘部法则2.轮廓系数五、Kmeans的典型应用场景六、代码示例KMeans是一种广泛使用的无监督学习算法，主要用于聚类分析（Clustering）。它的目标是将数据集划分为K个互不重叠的子集（簇，Cluster），使得同一簇内的数据点尽可能相似，不同簇之间的数据点尽可能差异显著
大语言模型原理基础与前沿双层路由多模态融合、多任务学习和模块化架构 AI智能涌现深度研究 AI大语言模型和知识图谱融合 Python入门实战 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿：双层路由多模态融合、多任务学习和模块化架构关键词：大语言模型、双层路由、多模态融合、多任务学习、模块化架构、神经网络、自然语言处理1.背景介绍大语言模型（LargeLanguageModels，LLMs）已经成为人工智能和自然语言处理领域的重要研究方向。随着GPT-3、BERT等模型的出现，大语言模型在各种任务中展现出了惊人的性能。然而，随着模型规模的不断扩大和应用场景的
新的一年，新的感受和成长是小天才哦 #高职生闲谈服务器
本人现在是工作快2年的打工人，我是前年7月份毕业的大专生。其实我在大学刚开始的时候因为体验过社会的毒打，所以发誓一定要好好学习，而我也的确好好学习了，在学校2年时间里，大部分时间都是在图书馆里面看书，主要为啥天天在图书馆很大原因是本专业的课程自己不是非常喜欢（我是人工智能专业，人工智能专业大专学历出来基本也是打框的无聊活）所以我就自己学习了系统运维方向，这个过程也考取了RHCE认证，也是因为这个认
Python机器学习实战：构建序列到序列(Seq2Seq)模型处理翻译任务 AGI大模型与大数据研究院程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
Python机器学习实战：构建序列到序列(Seq2Seq)模型处理翻译任务1.背景介绍1.1问题的由来翻译是跨语言沟通的重要桥梁，随着全球化进程的加速，翻译需求日益增长。传统的机器翻译方法主要依赖于规则和统计方法，如基于短语的翻译、基于统计的机器翻译等。然而，这些方法难以处理复杂的语言现象，翻译质量参差不齐。近年来，随着深度学习技术的快速发展，基于神经网络序列到序列（Sequence-to-Seq
【漫话机器学习系列】130.主成分（Principal Components） IT古董漫话机器学习系列专辑机器学习人工智能 python
主成分（PrincipalComponents）详解1.什么是主成分？主成分（PrincipalComponents，PCs）是数据集中方差最大的线性组合，它是主成分分析（PrincipalComponentAnalysis，PCA）中的核心概念。主成分可以看作是对原始特征的新表述方式，它通过数学变换找到一组新的正交坐标轴，使得数据的主要变化方向与这些轴对齐。简单来说：主成分是数据集中信息量（方差
通义万相2.1：AI视频生成迎来“质变”，运镜、文字、物理规律全面突破 that's boy 人工智能通义万象2.1 chatgpt openai qwen AI作画 AI编程
AI视频生成，从“能看”到“惊艳”的跨越在人工智能的浪潮中，AI视频生成无疑是最受瞩目的领域之一。从最初的简单动画到如今的逼真模拟，AI视频生成技术正在快速发展，不断刷新人们的认知。近日，阿里云旗下通义万相视频生成模型宣布了2.1版本的重磅升级，不仅在性能上实现了全面提升，更在运镜、文字生成、物理规律模拟等方面取得了突破性进展，让AI视频生成真正进入了“质变”的新阶段。通义万相2.1的出现，不仅是
C++开源库大全大王算法 C/C++开发实战365 C++入门及项目实战宝典 c++开源
程序员要站在巨人的肩膀上，C++拥有丰富的开源库，这里包括：标准库、Web应用框架、人工智能、数据库、图片处理、机器学习、日志、代码分析等。标准库C++StandardLibrary：是一系列类和函数的集合，使用核心语言编写，也是C++ISO自身标准的一部分。
基于PyTorch的深度学习——机器学习3 Wis4e 深度学习机器学习 pytorch
激活函数在神经网络中作用有很多，主要作用是给神经网络提供非线性建模能力。如果没有激活函数，那么再多层的神经网络也只能处理线性可分问题。在搭建神经网络时，如何选择激活函数？如果搭建的神经网络层数不多，选择sigmoid、tanh、relu、softmax都可以；而如果搭建的网络层次较多，那就需要小心，选择不当就可导致梯度消失问题。此时一般不宜选择sigmoid、tanh激活函数，因它们的导数都小于1
LangChain大模型应用开发指南-大模型Memory不止于对话喝不喝奶茶丫 langchain 人工智能大模型大模型应用 AI大模型 Memory 大语言模型
上节课，我我为您介绍了LangChain中最基本的链式结构，以及基于这个链式结构演化出来的ReAct对话链模型。今天我将由简入繁，为大家拆解LangChain内置的多种记忆机制。本教程将详细介绍这些记忆组件的工作原理、特性以及使用方法。【一一AGI大模型学习所有资源获取处一一】①人工智能/大模型学习路线②AI产品经理资源合集③200本大模型PDF书籍④超详细海量大模型实战项目⑤LLM大模型系统学习
llama.cpp框架下GGUF格式及量化参数全解析 Black_Rock_br 人工智能
前言：在人工智能领域，语言模型的高效部署和推理一直是研究热点。随着模型规模的不断扩大，如何在有限的硬件资源上实现快速、高效的推理，成为了一个关键问题。`llama.cpp`框架以其出色的性能和灵活性，为这一问题提供了有效的解决方案。其中，GGUF格式和模型量化参数是实现高效推理的重要技术手段。本文将对`llama.cpp`框架下的GGUF格式及量化参数进行详细解析，帮助读者更好地理解和应用这些技术
AI 驱动的软件测试革命：从自动化到智能化的进阶之路綦枫Maple AI+软件测试人工智能自动化运维
引言：软件测试的智能化转型浪潮在数字化转型加速的今天，软件产品的迭代速度与复杂度呈指数级增长。传统软件测试依赖人工编写用例、执行测试的模式，已难以应对快速交付与高质量要求的双重挑战。人工智能技术的突破为测试领域注入了新动能，通过机器学习、深度学习、自然语言处理等技术，测试流程正从“被动验证”向“主动预防”演进。本文将深入探讨AI与软件测试的融合路径，结合技术原理、工具实践与行业趋势，为读者呈现一幅
XGBClassifiler函数介绍浊酒南街 #算法机器学习 XGB
目录前言函数介绍示例前言XGBClassifier是XGBoost库中用于分类任务的类。XGBoost是一种高效且灵活的梯度提升决策树（GBDT）实现，它在多种机器学习竞赛中表现出色，尤其擅长处理表格数据。函数介绍XGBClassifiler(max_depth=3,learning_rate=0.1,n_estimators=100,objective='binary:logistic',boo
基于大数据架构的就业岗位推荐系统的设计与实现【java或python】—计算机毕业设计源码+LW文档 qq_375279829 大数据架构 python 课程设计算法
摘要随着互联网技术的迅猛发展和大数据时代的到来，就业市场日益复杂多变，求职者与招聘方之间的信息不对称问题愈发突出。为解决这一难题，本文设计并实现了一个基于大数据架构的就业岗位推荐系统。该系统通过收集、整合并分析大量求职者简历信息、企业招聘信息以及市场动态数据，运用先进的机器学习算法，为求职者提供个性化的岗位推荐服务，同时帮助企业快速定位到合适的候选人。本文将从系统设计的背景与意义、技术基础、需求分
向量数据库简介 openwin_top python编程示例系列 python编程示例系列二数据库
向量数据库（VectorDatabase）是一种专门用于存储和查询向量数据的数据库系统。向量数据库通常使用高效的向量索引技术，支持基于向量相似度的查询和检索，可以应用于图像搜索、自然语言处理、推荐系统、机器学习等领域。与传统的关系型数据库不同，向量数据库通常使用基于向量的数据模型，将向量作为数据的核心表示形式。向量数据库可以存储和处理大量的向量数据，支持高效的向量相似度计算和查询。常见的向量索引技
Ubuntu22.04安装CP2K最新版2025.1 jhonwyyc 机器学习深度学习 ubuntu
CP2K教程CP2K系列之一安装文章目录CP2K教程前言一、安装依赖库1.引入库二、下载并解压缩1.下载链接2.解压缩三、安装1.安装cp2k_toolchain2.安装cp2k3.指定根目录4.修改环境变量四、测试总结前言CP2K是一款开源的第一性原理计算软件，采用Fortran98编写。近年来结合机器学习与lammps，已成为热度逐年增加的软件。但是目前使用它仍存在不少难点。本文讲解在Ubun
Azure AI Document Intelligence 使用指南 scaFHIO azure 人工智能 flask python
AzureAIDocumentIntelligence使用指南AzureAIDocumentIntelligence（原名AzureFormRecognizer）是一项基于机器学习的服务，可以从数字或扫描PDF、图像、Office和HTML文件中提取文本（包括手写）、表格、文档结构（如标题、节标题等）和键值对。它支持多种格式，包括PDF、JPEG/JPG、PNG、BMP、TIFF、HEIF、DOC
鸢尾花数据集的四个特征具体是什么？学术乙方 Python 人工智能
鸢尾花数据集（IrisDataset）是机器学习领域中最经典的数据集之一，它包含150个样本，每个样本有4个特征，分别是：1.花萼长度（SepalLength）描述：花萼（花的外部绿色部分）的长度，单位为厘米。取值范围：通常为4.3cm到7.9cm。2.花萼宽度（SepalWidth）描述：花萼的宽度，单位为厘米。取值范围：通常为2.0cm到4.4cm。3.花瓣长度（PetalLength）描述：
大语言模型原理基础与前沿挑战与机遇 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿挑战与机遇1.背景介绍大语言模型（LargeLanguageModels,LLMs）是近年来人工智能领域的一个重要突破。它们通过深度学习技术，特别是基于变换器（Transformer）架构的模型，能够在自然语言处理（NLP）任务中表现出色。大语言模型的出现不仅推动了学术研究的发展，也在实际应用中展现了巨大的潜力。1.1大语言模型的起源大语言模型的起源可以追溯到早期的统计语言
AI Prompt 提示词工程入门指南：新手小白快速上手机器学习司猫白人工智能 prompt
近年来，人工智能（AI）发展迅猛，特别是大语言模型（LLMs）（如ChatGPT、Claude、Gemini、Llama等）的广泛应用，让人们可以用自然语言与AI进行互动。而提示词工程（PromptEngineering），即如何设计有效的提示词，已经成为一项重要技能。本篇博客专为新手小白打造，帮助你快速掌握Prompt工程的基础，学会如何撰写高质量的提示词，让AI更精准地理解你的需求，并产出最优
AI提示词（Prompt）的理解和学习指南时光不负追梦人人工智能 prompt
AI提示词（Prompt）的理解和学习指南一、什么是AI提示词？AI提示词（Prompt）是用户输入给人工智能模型的指令或问题，用于引导模型生成特定类型的回答或内容。它如同与AI沟通的“钥匙”，设计得当的提示词能显著提升输出质量。二、提示词的核心要素明确目标模糊示例：“写一篇关于环保的文章。”优化示例：“以‘垃圾分类’为主题，撰写一篇面向社区居民的科普文章，要求包含实施步骤和常见误区，字数约800
AI-NAS：当存储遇上智能，开启数据管理新纪元 DeepSeek+NAS 人工智能大数据 winnas 安卓nas Windows nas AINAS
在数据爆炸的时代，NAS（网络附加存储）已成为个人和企业存储海量数据的利器。然而，面对日益庞大的数据量，传统的NAS系统在文件管理和搜索效率上逐渐力不从心。AI-NAS应运而生，它将NAS与人工智能（AI）能力深度融合，为数据管理带来革命性的变化。AI-NAS的核心优势在于其智能化能力：智能文件分类与整理：告别繁琐的手动分类，AI-NAS能够自动识别文件类型、内容，并根据预设规则或学习用户习惯，将
快速入门OpenAI聊天模型的实战指南 shuoac python
#快速入门OpenAI聊天模型的实战指南OpenAI的聊天模型在开发人工智能应用时至关重要。本文将详细介绍如何使用OpenAI的聊天模型进行开发，并提供可运行的代码示例。##技术背景介绍OpenAI提供了多种聊天模型，支持不同的输入类型和功能，如工具调用、结构化输出等。通过Azure平台，也可以访问OpenAI模型，适合需要云集成的场景。##核心原理解析聊天模型利用自然语言处理技术生成响应，支持不
智能体技术全解析：从基础到前沿，构建智能自动化系统二川bro 智能AI 自动化人工智能
智能体技术全解析：从基础到前沿，构建智能自动化系统前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，这里分享一下给大家。点击跳转到网站。https://www.captainbed.cn/ccc文章目录智能体技术全解析：从基础到前沿，构建智能自动化系统一、智能体技术概述1.1智能体的定义与特征1.2智能体的分类二、智能体架构设计2.1智能体的核心组件2.2智能体的通信机制三、智能体构建指
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交

Amazon SageMaker，更好用的机器学习平台！

你可能感兴趣的:(机器学习,人工智能)