liyuan2020

Azure机器学习——Azure机器学习介绍

Azure机器学习介绍

一、什么是Azure机器学习？
二、Azure 机器学习的几个重要概念

工作区（Workspace）
数据存储（Datastore）
计算目标（Compute Targets）

本地资源
Azure Machine Learning compute cluster
远程虚拟机
其他计算目标

模型训练（Model training）的几种方式

1. 适用于 python 的 Azure 机器学习 SDK
2. 设计器
3. CLI

模型管理和部署（Model management and deployment)
自动化机器学习（Automated machine learning）
机器学习管道（ML pipelines）

三、使用Azure 机器学习的6个好处

1. 安全方便地访问数据
2. 减少训练模型开销
3. 训练日志可视化
4. 加速模型迭代和调优
5. 快速部署和缩放
6. 支持多种框架

四、总结

Azure 机器学习是微软公有云Azure上一款基于Web页面的机器学习功能组件应用，不仅支持TensorFlow、PyTorch等主流的ML框架，同时支持Jupyter、VS Code等开发工具。
因为一些原因，Azure在中国由世纪互联运营，称为Mooncake。与Azure Global相比， Mooncake上可用的Azure服务要少一些。随着国内公有云市场的快速发展，越来越多Azure Global服务落地到Mooncake中。比如 Azure 机器学习就在2020年1月落地中国。笔者经常在工作中用到Azure 机器学习这个服务，因此借着这个机会总结使用心得，通过理论和实战来给大家介绍这个服务。
**注意：本系列文章使用的Azure机器学习服务位于AzureChinaCloud。**Azure Global中的Azure机器学习服务和AzureChinaCloud中的使用方法几乎完全相同。细微不同之处将会在后续的使用中指明。

一、什么是Azure机器学习？

Azure 机器学习是一种云服务，你可以使用它来训练、部署、自动化执行、管理和跟踪 ML 模型；
可用于任何类型的机器学习，从传统 ML到深度学习、监督式和非监督式学习；
支持Python和R语言进行ML开发，如果使用设计器，可以实现低代码量甚至无代码开发；
既支持在本地计算机上训练，也支持在云上训练；
安装SDK即可使用，支持常用的开源工具（如 PyTorch、TensorFlow 和 scikit-learn）。

二、Azure 机器学习的几个重要概念

Azure 机器学习是一个平台服务，功能非常强大，但也有很多专门定义的术语。提前理解其中的一些概念，对使用来说事半功倍。

工作区（Workspace）

要使用Azure 机器学习首先要创建一个工作区。
工作区是 Azure 机器学习的顶级资源，提供了一个集中的位置来处理使用 Azure 机器学习时创建的所有项目。
工作区保存所有定型运行的历史记录，包括日志、指标、输出和脚本的快照。使用此信息可以确定哪个训练运行产生最佳模型。
图1 工作区及其组件（图片来自官网）

图1显示了工作区的以下组件：

工作区包含Azure 机器学习计算实例、使用运行 Azure 机器学习所需的 Python 环境配置的云资源。
用户角色（User roles）：对同一账户下的用户设置角色（所有者、参与者等），不同的角色拥有不同的权限，从而限制某些用户、团队或者项目对工作区资源的访问和修改。
试验（Experiment）：用于构建模型，训练、部署模型都需要在某个试验下进行。
计算目标（Compute targets）：用于运行试验。
管道（ML pipeline）：可重复使用的工作流，可实现ML开发中的多人协作环境。
数据集（Datasets）：管理用于模型定型和创建管道所需的数据。
模型注册（Registered models）：如果有要部署的模型，则需创建一个已注册的模型。注册后的模型和数据集可以供工作区内的用户反复使用。
部署终结点（Deployment endpoints）：使用已注册的模型和评分脚本来创建部署终结点。

图2 工作区（portal）

图2是一个新创建的工作区，从上面可以看出，创建新工作区时，它会自动创建工作区使用的几个 Azure 资源：

Azure 容器注册表：注册在 训练和部署模型时使用的docker 容器。 Azure机器学习在训练和部署中使用了容器化技术，对需要运行的每个 Python 环境创建一个docker镜像，镜像会被上传到工作区。对于后续运行，只要不更改脚本依赖项，将重复使用已上传的镜像。由于容器启动的速度很快，因此训练可在更短的时间内获得更好的结果。
存储帐户：用作工作区的默认数据存储，工作区可以直接使用该账户内的数据进行训练。
Azure 应用程序 Insights：存储有关模型的监视信息。
Azure Key Vault：存储工作区所需的计算目标和其他敏感信息所使用的密钥。

数据存储（Datastore）

Azure Blob 存储是 Microsoft 提供的适用于云的对象存储解决方案。 Blob 存储最适合存储巨量的非结构化数据。你可以将海量数据、图片和文本存储在Azure Blob存储中。
在创建Workspace的过程中，会自动为该Workspace创建一个默认的Blob存储。
Workspace通过以下方式来获取该默认Blob存储中的数据：

ws = Workspace.get(name,subscription_id,resource_group)
datastore = ws.get_default_datastore()

本地和该默认Blob存储之间可通过下面代码进行数据交换：

datastore.upload_files()       #将本地数据上传到Blob存储
datastore.download_files()     #将Blob存储数据下载到本地

如果数据已经在其他的Blob存储（非默认）中，可以用以下方法将该Blob存储注册到该工作区：

blob_datastore = Datastore.register_azure_blob_container(container_name=‘Blob存储name’，datastore_name='...'）

注册到工作区的Blob存储可以后续可以通过下面的代码进行访问：

datastore = Datastore.get(ws, datastore_name='...')

下图展示了Azure机器学习中本地、Blob存储和远程计算资源之间的数据存储和访问方式：

图3 数据在Azure机器学习中的存储和访问方式

计算目标（Compute Targets）

计算目标是训练和部署模型所需的计算资源，包括本地计算资源和云计算资源。

本地资源

由于安装SDK是使用Azure机器学习的一种方法，因此你可以在联网条件下在本地机器上训练和部署ML模型，充分利用本地计算资源。此时Azure机器学习起到了一种资源整合平台的作用。
出于某些原因，本地训练时Azure机器学习的某些功能会收到限制，比如不支持超参数优化，以及在运行自动化机器学习试验时，某些现成的算法在本地限制使用。

图4 本地运行Azure机器学习试验

Azure Machine Learning compute cluster

Azure 机器学习计算是一个托管的计算基础结构，可让用户轻松创建单节点或多节点计算实例。该计算是在工作区区域内部创建的，是可与工作区中的其他用户共享的资源。
以下代码创建了一个Azure 机器学习计算：

aml_compute_target = "cpu-cluster-fcfn"    
provisioning_config = AmlCompute.provisioning_configuration(
vm_size ="STANDARD_D2_V2",min_nodes = 0, max_nodes = 4) 

aml_compute = ComputeTarget.create(ws, aml_compute_target, provisioning_config)

上面代码中：

“aml_compute_target”是计算集群的名字
“vm_size”是集群中虚拟机的规格，可以根据具体需求（vCPU核数、内存大小、GPU大小和数目）选择虚拟机的规格。
“min_nodes”和“max_nodes”表示集群中节点的最小和最大数目。

当没有计算任务时，计算集群的运行节点数为“min_nodes”，如果“min_nodes”=0，那么集群中没有节点在运行。当提交了计算任务后，计算集群会根据任务自动缩放节点数，最多可自动缩放的节点数为“max_nodes”。

图5 计算节点准备中

自动缩放的节点的功能使得Azure 机器学习计算可以支持并行计算任务，并且可以在没有任务时自动关闭所有计算节点，某些情况下可以大大节省计算开销。

远程虚拟机

Azure 机器学习还支持将自己的计算资源附加到工作区。这种类型的资源类型是任意远程 VM，只要可从 Azure 机器学习访问。该资源可以是 Azure VM，也可以是组织内部或本地的远程服务器。具体而言，在指定 IP 地址和凭据（用户名和密码，或 SSH 密钥）的情况下，可以使用任何可访问的 VM 进行远程运行。

其他计算目标

Azure 机器学习支持的训练计算目标还包括：Azure Databricks, Azure HDInsight, Azure Data Lake Analytics, Azure Batch等。
Azure 机器学习支持的部署目标包括：Local web service、 Azure Machine Learning compute instance web service、Azure Kubernetes Service (AKS), Azure Container Instances, Azure Machine Learning compute clusters, Azure IoT Edge, Azure Data Box Edge等。

模型训练（Model training）的几种方式

Azure 机器学习提供多种方法来训练模型，从使用 SDK 的代码优先解决方案到低代码解决方案（例如自动化机器学习和可视化设计器）。

图7 Azure机器学习常用使用方式

下面介绍使用Azure 机器学习训练模型的3种方式：

1. 适用于 python 的 Azure 机器学习 SDK

Python SDK是构建和运行Azure机器学习工作流的一种常用方法。你可以在 Jupyter Notebooks、Visual Studio Code 或你偏爱的 Python IDE 中使用它。更多关于Azure机器学习Python SDK的介绍请查看【什么是适用于 Python 的 Azure 机器学习 SDK？】。
Python SDK提供多种方法来训练模型，每个方法都具有不同的功能：
1.1 运行配置（Run configuration）：训练模型的一般方法，使用训练脚本并运行配置。需要自己在训练脚本中加上Azure机器学习配置信息，适合于小型任务，如下图所示。

图7 手动在代码中添加运行配置

训练完成后，run记录的一些日志比如运行时间、超参数历史记录以及模型性能指标等结果便可以显示到Azure的portal上。

图8 运行记录示例（图片来自GitHub）

1.2 估计器（Estimators）：利用估计器类，可以轻松地根据常用机器学习框架来训练模型，支持Scikit-learn、 PyTorch、 TensorFlow和Chainer等估计器类。无需在代码中输入配置信息，可如下直接提交脚本计算。

from azureml.train.sklearn import SKLearn
script_params = {'--data-folder': ds.path('mnist').as_mount(),'--regularization': 0.5}

#将SKLearn替换为其他框架，便可以支持其他框架构建的模型
est = SKLearn(source_directory=script_folder,script_params=script_params,
compute_target=compute_target,           #指定计算目标
entry_script='train.py'                  #需要运行的脚本，和本地运行下代码一样
)

1.3 自动化机器学习（Automated ML）：可通过自动化特征工程、算法选择和超参数优化来节省时间和资源。使用自动化机器学习时，无需担心手动修改运行配置。

图9 自动化特征工程和算法选择

1.4 机器学习管道（ML pipeline）：管道将一个工作流分成多个 ML 阶段（数据准备、训练、批量评分、部署），保存每个阶段的输出，管道中的每个阶段可以利用其他阶段上一步运行的输出单独运行，从而实现多人协作环境。

2. 设计器

Azure 机器学习设计器（预览）提供了一个简单的入口点，可用于构建概念证明，适合几乎无代码经验的用户。它允许你使用拖放基于 web 的 UI 来训练模型。你可以使用 Python 代码作为设计的一部分，或在不编写任何代码的情况下定型模型。

图10 设计器（图片来自官网）

3. CLI

Azure 命令行接口 (Azure CLI) 是一个用来创建和管理 Azure 资源的环境。 Azure CLI 可用于各种 Azure 服务，可用来快速地操作 Azure，尤其是用于实现自动化操作。
机器学习 CLI 为使用 Azure 机器学习的常见任务提供命令，通常用于脚本和自动化任务。例如，在创建训练脚本或管道后，你可以使用 CLI 按计划启动定型运行，或在用于定型的数据文件更新时启动。对于定型模型，它提供了用于提交训练作业的命令。它可以使用运行配置或管道提交作业。

另外如果你使用R语言开发ML模型，Azure机器学习还提供了适用于 R 的 SDK。如果你想将Azure机器学习封装到自己的机器学习平台中，可以参考机器学习 REST API。
由于使用Python SDK比较灵活，功能丰富。所以后续的章节我主要使用Python SDK+Jupyter Notebook的方式来介绍Azure机器学习。

模型管理和部署（Model management and deployment)

Azure 机器学习使用机器学习操作（MLOps）方法来管理模型的生命周期。机器学习操作（MLOps）基于DevOps原则和提高工作流效率的实践。例如，持续集成、交付和部署。
MLOps 将这些主体应用到机器学习过程中，目的是：1）更快地试验和开发模型2）更快地将模型部署到生产环境3）质量保证。

Azure 机器学习提供以下 MLOps 功能：

创建可重复的 ML 管道。机器学习管道使你可以为数据准备、定型和评分过程定义可重复和可重复使用的步骤。
为定型和部署模型创建可重用的软件环境。
从任何位置注册、打包和部署模型。您还可以跟踪使用该模型所需的关联元数据。
捕获用于端到端 ML 生命周期的管理数据。记录的信息可能包括发布模型的人员、发生更改的原因以及在生产环境中部署或使用模型的时间。
通知和警报 ML 生命周期中的事件。例如，试验完成，模型注册，模型部署和数据偏移检测。
监视 ml 应用程序的操作和 ml 相关的问题。比较定型与推理之间的模型输入，探索特定于模型的指标，并提供有关 ML 基础结构的监视和警报。
通过 Azure 机器学习和 Azure Pipelines自动化端到端 ML 生命周期。使用管道，可以频繁地更新模型、测试新模型，并随其他应用程序和服务一起不断推出新的 ML 模型。

自动化机器学习（Automated machine learning）

自动化机器学习，也称为自动 ML，是自动执行机器学习模型开发、迭代任务的过程。
在训练过程中，Azure 机器学习会创建多个并行管道，尝试使用不同的算法和参数。一旦到达试验中定义的退出条件，它就会停止。

自动化机器学习支持分类、回归和时间序列分析这三种任务。
对每种任务，自动化机器学习都提供了10种以上算法供训练选择。
支持自动数据前处理（缺失值、标准化、归一化）和自动特征工程
提供多种交叉验证方式和模型度量指标。

图11 自动化机器学习（图片来自官网）

机器学习管道（ML pipelines）

Azure 机器学习管道是完整的机器学习任务的可独立执行的工作流。子任务封装为管道中的一系列步骤。
一个机器学习任务可以分为数据准备、训练配置、多次重复训练和验证、模型部署等子任务。这些子任务可以有机地封装到机器学习管道中，成为管道中的一系列步骤，并且这些步骤之间保持独立性。
独立步骤允许多人同时在同一管道上操作，而无需过多的计算资源。单独的步骤还可以简化每个步骤使用不同的计算类型/大小。
管道设计好以后，通常还会对管道中的某些步骤进行循环优化。重新运行管道时，运行将跳转到需要重新运行的步骤，如更新的训练脚本。将跳过不需要重新运行的步骤。对于管道中某个步骤，如果运行配置未更改并且上次运行的结果设置为可重复使用，那么管道运行到此步骤直接使用之前运行的结果，这种重复使用功能可以在管道优化过程中跳过运行成本高昂且耗时较高的步骤，如数据引入和转换。

图12 机器学习管道（图片来自官网）

三、使用Azure 机器学习的6个好处

Azure 机器学习时一个功能强大的机器学习平台。机器学习工作区是这个平台的顶级资源中心。通过将数据、计算资源和模型注册到机器学习工作区，使得反复使用这些资源变得更加方便和安全。此外，Azure 机器学习提供的自动化机器学习方法、机器学习管道以及与主流训练框架的结合，加速了在Azure 机器学习进行机器学习开发的速度。
综上，Azure 机器学习的优势总结如下：

1. 安全方便地访问数据

保存在AzureBlob存储中的数据通过256位AES加密。通过Datastore Azure 机器学习可以轻松访问到AzureBlob存储中的数据，并且在数据在传输过程中也是受到保护的。

2. 减少训练模型开销

云上各种规格的CPU和GPU的虚拟机及其集群大大加速了模型训练过程。计算集群的自动缩放节点的功能自动实现了计算资源即用即开、用完关闭，在一定程度上减少了开销。

3. 训练日志可视化

不管使用何种训练框架，Azure 机器学习都能够将模型训练过程中的日志（迭代次数、超参数、运行时间、模型度量值等）记录下来，并且自动在网页中进行展示。

4. 加速模型迭代和调优

自带的超参数调优和自动化机器学习可以加速模型的迭代和优化，减小模型训练时间。

5. 快速部署和缩放

提供了Azure Container Instance, Azure Kubernetes Service, FPGA, IoT Edge devices等多种部署方式，针对不同的使用需求，提供了自动缩放功能。

6. 支持多种框架

SDK内在结合了主流的ML、DL开发框架，包括Scikit-learn、 PyTorch、 TensorFlow、Chainer，也支持ONNX runtime进行部署。

四、总结

介绍了Azure机器学习服务，该服务给机器学习开发者提供了一个使用便捷、功能丰富的平台。
介绍了Azure机器学习服务的几个重要概念。Azure机器学习工作区是该服务的顶级资源中心。
总结了使用Azure机器学习服务进行开发的几个好处。

【机器学习】使用scikit-learn中的KNN包实现对鸢尾花数据集或者自定义数据集的的预测加德霍克机器学习人工智能 python 学习作业
一、KNN算法概念K最近邻(K-NearestNeighbor,KNN)分类算法是数据挖掘分类技术中最简单的方法之一，是著名的模式识别统计学方法，在机器学习分类算法中占有相当大的地位。它是一个理论上比较成熟的方法。既是最简单的机器学习算法之一，也是基于实例的学习方法中最基本的，又是最好的文本分类算法之一。二、对鸢尾花数据集进行预测1、代码示例：fromsklearn.datasetsimportl
Julia语言的计算机基础 Code侠客行包罗万象 golang 开发语言后端
Julia语言的计算机基础引言随着数据科学、机器学习和高性能计算的快速发展，对编程语言的需求也日益增加。在众多编程语言中，Julia语言因其独特的设计理念和高性能而迅速崛起。本文将详细探讨Julia语言的基础知识，包括其历史背景、安装与环境配置、基本语法、数据结构、函数与模块、以及性能优化等方面，旨在为对Julia感兴趣的读者提供一份全面的入门指南。一、Julia语言简介1.1历史背景Julia是
想转行到人工智能领域，我该学什么，怎么学？张登杰踩人工智能 python
转行到人工智能（AI）领域需要系统的学习和实践，以下是详细的路径建议，涵盖基础知识、技能学习、项目实践和求职准备：一、明确目标和领域方向人工智能领域广泛，建议先了解细分方向（如机器学习、深度学习、计算机视觉、自然语言处理、强化学习等），结合兴趣和职业规划选择切入点。二、构建基础知识1.数学基础线性代数：矩阵运算、特征值、向量空间。微积分：导数、梯度、优化理论。概率与统计：贝叶斯定理、分布、假设检验
机器学习问题：AttributeError: ‘NoneType‘ object has no attribute ‘split‘ 解决办法零零鲎机器学习人工智能
参考博客：本次博客参考http://t.csdnimg.cn/8E7eH。写下来主要是为了整理自己在学习过程中遇到的问题并把解决办法列出来。学习内容：如果运行出现：AttributeError:‘NoneType’objecthasnoattribute'split’这样的问题。网上有很多解决办法是降级numpy到1.21.4。然后上面博客给出的解决方案是升级threadpoolctl。可以使用命
AI Agent：一场智能革命的开始机器人openai区块链
在当今科技日新月异的时代，AI（人工智能）技术正以前所未有的速度改变着我们的生活和工作方式。其中，AIAgent作为AI领域的一个新兴分支，正逐渐展现出其巨大的潜力和价值。本文将深入探讨AIAgent的发展现状、核心优势以及未来的发展方向，带您领略这一前沿技术的无限魅力。一、AIAgent的发展现状：技术突破与广泛应用近年来，随着大数据、云计算和机器学习等技术的飞速发展，AIAgent的技术水平得
doris：Azure Storage导入数据向阳1218 azure flask microsoft doris
Doris提供两种方式从AzureStorage导入文件：使用S3Load将AzureStorage文件导入到Doris中，这是一个异步的导入方式。使用TVF将AzureStorage文件导入到Doris中，这是一个同步的导入方式。使用S3Load导入使用S3Load导入对象存储上的文件，详细步骤可以参考BrokerLoad手册第1步：准备数据创建CSV文件s3load_example.csv文件
【杂谈】-为什么Python是AI的首选语言视觉与物联智能杂谈 python 人工智能开发语言深度学习机器学习
为什么Python是AI的首选语言文章目录为什么Python是AI的首选语言1、为何Python引领人工智能发展1.1可用性和生态系统1.2用户群和用例1.3效率辅助2、AI项目对Python开发人员的要求3、如何开启你的AI学习之旅人工智能的广泛应用正在软件工程领域引发范式转变。Python凭借其易用性、成熟的生态系统以及满足人工智能和机器学习(ML)工作流数据驱动需求的能力，迅速成为人工智能开
新质生产力与核心竞争力提升 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
新质生产力、人工智能、机器学习、深度学习、算法优化、数据驱动、核心竞争力、数字化转型1.背景介绍在当今数字化时代，科技创新正以惊人的速度推动着社会发展。人工智能（AI）作为科技发展的重要驱动力，正在深刻地改变着生产方式和生活方式。从自动驾驶汽车到智能语音助手，从个性化推荐系统到医疗诊断辅助，AI技术的应用场景日益广泛，为人类社会带来了前所未有的机遇。然而，AI技术的应用并非一帆风顺。如何有效地利用
智能工单分配在技术支持中的应用 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
智能工单分配,技术支持,机器学习,算法优化,效率提升,客户满意度1.背景介绍在当今数字化时代，技术支持部门扮演着至关重要的角色，为用户提供及时有效的技术帮助，确保业务的正常运行。然而，随着用户数量和技术需求的不断增长，传统的人工工单分配方式面临着诸多挑战：分配效率低下:人工分配工单需要耗费大量时间和人力，且难以做到精准匹配，导致工单处理效率低下。资源分配不均衡:经验丰富的技术人员可能承担过多的工作
计算广告（一）爱学习的菜鸟罢了搜广推人工智能
计算广告学是一个十分庞大的学科，里面涵盖了自然语言处理、机器学习、推荐系统等众多研究方向。而且广告作为互联网行业的三大盈利模式（广告、电商、游戏）之一，也是这三大模式中最有技术含量的，计算广告学一直都吸引着无数学术界/工业界的精英投入其中（ps：计算广告学也是机器学习在商业界最成功的应用之一）。行业分类例子盈利搜索引擎Google百度广告社交网络腾讯facebook广告增值服务游戏电商网站亚马逊阿
如何从Oracle Autonomous Database加载文档 fGVBSAbe 数据库 oracle python
OracleAutonomousDatabase是一种云数据库，利用机器学习来自动化数据库调优、安全性、备份、更新以及其他传统由数据库管理员(DBAs)执行的例行管理任务。在本文中，我们将演示如何从OracleAutonomousDatabase加载文档。我们将使用连接字符串或TNS配置来进行连接。技术背景介绍OracleAutonomousDatabase通过自动化的方式极大地简化了数据库管理的
基于数据可视化+SpringBoot+Vue的医院综合管理平台设计和实现(源码+论文+部署讲解等) java李杨勇 Java精品毕设实战案例 Java毕业设计实战案例信息可视化 spring boot vue.js 医院综合管理平台 Java毕业设计
博主介绍：✌全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等
揭秘！云勒索软件：云端安全新威胁，企业数据岌岌可危知白守黑V 安全运营数据安全云安全数据安全信息安全安全云计算勒索软件网络攻击网络安全
近年来，云勒索软件成为网络安全领域最具威胁性的攻击手段之一，全球各类规模的云存储企业都深受其害。云基础设施巨大的攻击面以及存储的海量敏感数据，为网络犯罪组织提供了前所未有的“丰厚回报”，使其成为勒索软件团伙追逐的高利润目标。云服务为何成为勒索软件的首选目标随着亚马逊AWS和微软Azure等云服务提供商（CSPs）的持续扩展，网络犯罪分子正将攻击重心从传统的终端设备转向云平台。正如SentinelL
自动检测和机器审核系统实现 ╰つ゛木槿 java easyui javascript python java 自然语言处理
目录一、自动检测和机器审核实现步骤1.文本预处理步骤细节：2.关键词检测步骤细节：3.情感分析与情境理解步骤细节：4.机器学习模型训练步骤细节：5.深度学习模型步骤细节：6.多模态审查步骤细节：7.用户行为分析与违规预测步骤细节：总结二、常用的分词工具1.jieba2.THULAC3.HanLP4.SnowNLP5.LAC（LexicalAnalysisofChinese）6.PyLDAvis（结
【CV】25.1.7 arxiv更新速递 hinmer arxiv CV每日更新 python 人工智能计算机视觉 chatgpt 目标检测 ai AIGC
—第1篇----关键词:手势识别,计算机视觉,低光照条件,机器学习,RaspberryPi,OpenCV论文链接-摘要:手势识别是一种基于计算机视觉技术的感知用户界面，允许计算机将人类动作解释为命令，使用户无需使用手与计算机交流，从而使鼠标和键盘变得多余。手势识别的主要弱点是光线条件，因为手势控制依赖于摄像头。摄像头用于在2D和3D中解释手势，因此提取的信息可能因光源而异。系统的限制是无法在黑暗环
【包邮送书】你好！Python Mindtechnist 粉丝福利 python 网络开发语言机器学习
欢迎关注博主Mindtechnist或加入【智能科技社区】一起学习和分享Linux、C、C++、Python、Matlab，机器人运动控制、多机器人协作，智能优化算法，滤波估计、多传感器信息融合，机器学习，人工智能等相关领域的知识和技术。关注公粽号《机器和智能》回复关键词“python项目实战”即可获取美哆商城视频资源！博主介绍：CSDN博客专家，CSDN优质创作者，CSDN实力新星，CSDN内容
基于遗传算法的城市旅行问题（TSP）求解 NovakG_ 深度学习 python 算法深度学习神经网络
1.遗传算法背景介绍遗传算法是一种基于生物进化论中的自然选择和遗传机制的优化算法，模拟了生物进化过程以搜索最优解。通过仿真染色体的交叉、变异等操作，遗传算法将求解过程转换为类似生物进化的迭代运算。该算法在解决复杂的组合优化问题时，通常比常规优化算法更高效，且具有广泛应用，包括组合优化、机器学习、信号处理、自适应控制和人工生命等领域2.遗传算法基本解题思路遗传算法的设计思路主要受到大自然中生物体进化
【2025 ODA teigha .NET系列开发教程第五章】给CAD实体添加附属数据XDATA，包括源码三好学生～张旺 ODA Teigha .NET开发教程 .net
系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档2025ODAteigha.NET系列开发教程系列文章目录AutoCADXData扩展数据开发指南什么是XData？XData的两种存储方式1.全局字典存储(XRecord)2.实体附加存储步骤1：注册应
【数据挖掘实战】房价预测机器学习司猫白数据挖掘人工智能 python 机器学习
本次对kaggle中的入门级数据集，房价回归数据集进行数据挖掘，预测房屋价格。本人主页：机器学习司猫白机器学习专栏：机器学习实战PyTorch入门专栏：PyTorch入门深度学习实战：深度学习ok，话不多说，我们进入正题吧概述本次竞赛有79个解释变量（几乎）描述了爱荷华州艾姆斯住宅的各个方面，需要预测每套住宅的最终价格。数据集描述本次数据集已经上传，大家可以自行下载尝试文件说明train.csv-
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶网罗开发 AI 大模型人工智能机器学习
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Copilot 概述计算机萍萍学姐 copilot copilot 人工智能机器学习
Copilot是什么？它有什么用途？Copilot是由人工智能公司和GitHub合作开发的一个基于人工智能的代码提示工具，它可以利用机器学习技术和大量训练数据生成高质量的代码。Copilot的目标是在保持代码质量和可读性的前提下，提高开发者的编码效率，使得编码工作更为高效和便捷。Copilot的出现是解决编程过程中可能遇到的一些难点和瓶颈问题，特别是在快速迭代的敏捷开发场景中，提高编码效率和减少编
让旅游更智能：基于AR的旅游导览应用解析 Echo_Wish Python 笔记 Python算法旅游 ar restful
友友们好！我的新专栏《Python进阶》正式启动啦！这是一个专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发等。●实战案例：通过丰富的实战案例，带你一步步实现
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶人工智能机器学习深度学习
摘要随着系统规模的扩大和复杂性增加，传统基于规则的日志分析方法难以识别隐藏的复杂异常模式。本文将介绍基于机器学习的日志异常检测技术，包括模型选择、特征工程及实现步骤。通过具体的代码示例与图表，展示如何高效检测异常日志，并提供应用场景与优化策略。引言日志是系统运行状态的关键数据来源，但面对海量日志数据，传统规则式分析显得力不从心。机器学习能够根据日志的历史数据和行为模式，通过训练模型检测异常情况，不
Python 编译Edge-TTS（edge_tts）转MP3工具浩读语音朗读 edge-tts python edge 自然语言处理前端
Python编译Edge-TTS利用PIPEdge-tts库来实现Azure神经网络自然语音转MP3，这应该是微软给老百姓们一个共享前沿科技大餐。（edge_tts）找了网上的很多源代，现在利用现有公开的代码混编译一个个人的学习工具。代码仅供学习研究。fromtkinterimport*fromtkinter.filedialogimport*fromtkinter.messageboximpor
【Python】已完美解决：ERROR: Could not find a version that satisfies the requirement re 屿小夏 python 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
下载马斯克Grok-1模型的实战代码 herosunly 大模型 grok-1 下载模型实战代码
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了下载马斯克Grok-1模型的实战代码，希望能对学习大模型的同学们有所帮助
吴恩达深度学习笔记（七）——机器学习策略子非鱼icon 深度学习自学笔记深度学习机器学习人工智能神经网络吴恩达
一、正交化通俗的理解就是：要能够诊断出系统性能瓶颈在哪里，以有策略刚好解决这个问题。一个“按钮”只负责解决一件事情。二、单一数字评估指标准确率（precision）：在分类器中标记为猫的例子中，有多少是真的猫召回率（recall）：对于所有的真猫图片，你的分类器正确识别了多少。但如果有两个评估指标，就很难去选择一个更好的分类器，如下图所示。所以有一个结合这两个指标的标准方法，也即F1分数，定义如下
数据挖掘：定义、挑战与应用黑色叉腰丶大魔王数据挖掘人工智能
一、数据挖掘的定义（一）概念阐述数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它融合了数据库技术、统计学、机器学习、人工智能等多学科的理论和方法，旨在通过对数据的深入分析和处理，发现有价值的模式、关联、趋势等，从而为决策提供支持。（二）与相关概念的区别与联系数据库管理：数据库管理侧重于数据的存储、组织、检索和维护
探索ChatLiteLLM与Langchain的集成应用 safHTEAHE langchain python
在现代AI应用开发中，简化调用多种语言模型的过程显得尤为重要。ChatLiteLLM库应运而生，它为开发者提供了调用如Anthropic、Azure、Huggingface、Replicate等模型的简便方法。这篇文章将带你深入了解如何使用Langchain与LiteLLMI/O库协同工作，实现高效的语言模型交互。1.技术背景介绍随着人工智能技术的飞速发展，多种语言模型应用于不同场景。集成这些模型
使用Google Vertex AI Search进行企业级高级搜索 hgSdaegva 人工智能 python
技术背景介绍GoogleVertexAISearch（前称为EnterpriseSearchonGenerativeAIAppBuilder）是GoogleCloud提供的VertexAI机器学习平台的一部分。VertexAISearch允许组织快速建立由生成式AI驱动的搜索引擎，为客户和员工提供服务。它基于各种GoogleSearch技术，包括语义搜索，通过使用自然语言处理和机器学习技术来推断内
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str