Fang GL

机器学习02机器学习工程实践

1.0模型评估指标

1.1回归模型评估指标

回归模型任务目标是，使得预测值能尽量拟合实际值。

常用性能度量方式：

绝对误差
均方误差

1.1.1绝对误差

绝对误差即预测点与真实点之间的距离之差的绝对值

1.1.2均方误差

均方误差即预测点与实际点之间距离之差的平方和均值

1.2分类模型评估指标

分类模型的评估指标很多，不同评估指标的侧重点可能不同，有时不同的评估指标彼此之间甚至有可能相互冲突，精度和召回率就是一对矛盾量。

1.2.1 准确率

准确率是用来衡量模型对数据集中的样本预测正确的比例。

准确率=预测正确样本数/参与预测的样本总数

from sklearn.metrics import accuracy_score #引入sklearn计算库

y_true=[1,2,3,4,5,6,7,8,9,10]
y_pred=[1,2,3,4,5,6,2,2,2,2]

Accuracy=accuracy_score(y_true,y_pred,normalize=True)

1.2.2 精度

知识点补充：

TP：true positive，被判定为正样本，事实上也是正样本；

TN：true negative，被判定为负样本，事实上也是负样本；

FP：false positive，被判定为正样本，但事实上是负样本；

FN：false negative，被判定为负样本，但事实上是正样本

精度指的是所有预测为正例的样本，（TP+FP）中真正为正例的样本（TP）的比率，一般来说，就是你找到的信息中真正是我想要的有多少，又叫查准率。

1.2.3 召回率

表示在所有实际正向数据中，有多少预测正确了，与灵敏度一样。

Rec=TP/(TP+FN)

用来评价你有没有把样本中所有的真的正例全部找出来，所以又称为查准率

1.2.4 F1值

查准率和查全率是一对矛盾的指标，一般说，当查准率高的时候，查全率一般很低；查全率高时，查准率一般很低。

比如：若我们希望选出的西瓜中好瓜尽可能多，即查准率高，则只挑选最优把握的西瓜，算法挑选出来的西瓜（TP+FP）会减少，相对挑选出的西瓜确实是好瓜（TP）也相应减少，但是分母（TP+FP）减少的更快，所以查准率变大；在查全率公式中，分母（所有好瓜的总数）是不会变的，分子（TP）在减小，所以查全率变小。
在实际的模型评估中，单用Precision或者Recall来评价模型是不完整的，评价模型时必须用Precision/Recall两个值。这里介绍三种使用方法：平衡点（Break-Even Point，BEP）、F1度量、F1度量的一般化形式。

1.2.5 ROC曲线

ROC曲线起源于第二次世界大战时期雷达兵对雷达的信号判断。当时每一个雷达兵的任务就是去解析雷达的信号，但是当时的雷达技术还没有那么先进，存在很多噪声（比如一只大鸟飞过），所以每当有信号出现在雷达屏幕上，雷达兵就需要对其进行破译。有的雷达兵比较谨慎，凡是有信号过来，他都会倾向于解析成是敌军轰炸机，有的雷达兵又比较神经大条，会倾向于解析成是飞鸟。这个时候，雷达兵的上司就很头大了，他急需一套评估指标来帮助他汇总每一个雷达兵的预测信息，以及来评估这台雷达的可靠性（如果不论哪一类雷达兵都能准确预测，那这台雷达就很NB～读者可思考其缘由）。于是，最早的ROC曲线分析方法就诞生了，用来作为评估雷达可靠性的指标～在那之后，ROC曲线就被广泛运用于医学以及机器学习领域

ROC曲线就是将真正率作为纵轴，假正率作为横轴所绘制的图形。

举一个简单的例子方便大家的理解，还是刚才雷达的例子。假设现在有10个雷达信号警报，其中8个是真的轰炸机（P）来了，2个是大鸟（N）飞过，经过某分析员解析雷达的信号，判断出9个信号是轰炸机，剩下1个是大鸟，其中被判定为轰炸机的信号中，有1个其实是大鸟的信号（FP=1），而剩下8个确实是轰炸机信号（TP=8）。因此可以计算出FPR为，TPR为，而就对应ROC曲线上一点（0.5,1）

从这里我们可以理解：我们所期望的是，TP越大越好，FP越小越好。

如果一条曲线包裹另一条曲线，则外面曲线的性能更优

1.2.6 AUC

当两条ROC曲线发生交叉时，谁的性能更优就难以判定了，这时就要根据两条ROC曲线下面的面积大小来比较判断，即面积大者相对更优，这个ROC曲线下面的面积就是AUC。

1.2.7混淆矩阵

时一种评估分类模型好坏的形象化展示工具。例如有150个样本数据，把这些数据平均分成三类，每类50个分类结束后得到的混淆矩阵如下：

每行之和为50个，表示50个样本，第一行说明类1的50个样本中有43个分类正确，5个错分类为2,2个错分为类3。

由此可以看出，如果混淆矩阵中非对角线元素为0，则表示一个完美的分类器。

1.3聚类模型评估指标

聚类是将样本集划分为若干个不相交的子集，即样本簇，同时需要通过某些性能度量方式来评估其聚类结果的好坏。用机器学习的语言来讲，希望簇内相似度高，簇建相似度低。

1.3.1外部指标

外部指标需要提供一个参考模型，然后将聚类结果与该参考模型进行比较得到一个评判值；

常用系数

Jaccard系数
FM指数
Rand指数
标准化互信息

1.3.2内部指标

内部指标不需要有外部参考模型，可直接通过考察聚类结果得到

常用指数：

DB指数
Dunn指数

1.3.3轮廓系数

轮廓系数适用于训练样本类别未知的情况。假设某个样本点与它同类别的群内点的平均距离为a，与他距离最近的非同类别的群外点的平均距离为b则轮廓系数定义为。
$s = b - a / ma x (a, b)$
对于一个样本集合，它的轮廓系数是所有样本轮廓系数的平均值。

轮廓系数的取值范围是[-1,1],同类别样本点的距离越近，且不同类别的样本点距离越远，则得到的轮廓系数的值就越大。

1.4常用距离公式

1.曼哈顿距离

2.欧式距离

3.闵可夫斯基距离

4.切比雪夫距离

5.汉明距离

6.杰卡德相似系数

7.杰卡德距离

2.0模型复杂度量度

2.1偏方与方差

偏差:是衡量预测值与真实值的关系,是指预测值与真实值之间的差值.

方差:是衡量预测值之间的关系,和真实值无关.也就是他们的离散程度

误差 = 偏差 + 方差

2.2过拟合与正则化

2.2.1过拟合与欠拟合

第一个模型是一个线性模型，处于欠拟合状态，不能很好地适应我们的训练集；第三个模型是一个四次方的模型，过于强调拟合原始数据，而丢失了算法的本质：预测新数据。我们可以看出，若给出一个新的值使之预测，它将表现的很差，是过拟合，虽然能非常好地适应我们的训练集但在新输入变量进行预测时可能会效果不好；而中间的模型似乎最合适。

2.2.2经验风险与结构风险

训练数据集的平均损失称为经验风险。度量平均意义下模型预测效果的好坏

结构风险是在经验风险的基础上加上表示模型复杂度的正则项（罚项）

2.2.3正则化

机器学习中经常会在损失函数中加入正则项，称之为正则化（Regularize）。

目的：防止模型过拟合

原理：在损失函数上加上某些规则（限制），缩小解空间，从而减少求出过拟合解的可能性

3.0特征工程与模型调优

完成常用科学计算库的学习，以及模型的评估指标与复杂度度量，下面的内容介绍机器学习项目中的特征工程，模型选择与模型调优。

3.1数据挖掘项目流程

（1）业务理解

（2）数据分析

（3）特征工程

（4）模型选择

（5）模型评估

（6）项目落地

3.2特征工程

3.2.1数据清洗

（1）直接删除缺失数据

（2）固定值填充

（3）均值中位数填充

（4）相邻值填充

（5）模型预测填充

3.2.2特征处理

1.归一化和标准化

数据标准化（Normalization），也称为归一化，归一化就是将你需要处理的数据在通过某种算法经过处理后，限制将其限定在你需要的一定的范围内。

（1）线性归一化，也称min-max标准化、离差标准化；是对原始数据的线性变换，使得结果值映射到[0,1]之间。转换函数如下：

这种归一化比较适用在数值较集中的情况。但是这种方法有一个缺陷，就是如果max和min不稳定的时候，很容易使得归一化的结果不稳定，易受极值影响，影响后续使用效果。所以在实际应用中，我们一般用经验常量来替代max和min。

（2）标准差归一化，也叫Z-score标准化，这种方法给予原始数据的均值（mean，μ）和标准差（standard deviation，σ）进行数据的标准化。经过处理后的数据符合标准正态分布，即均值为0，标准差为1，转化函数为：

（3）非线性归一化，这种方法一般使用在数据分析比较大的场景，有些数值很大，有些很小，通过一些数学函数，将原始值进行映射。一般使用的函数包括log、指数、正切等，需要根据数据分布的具体情况来决定非线性函数的曲线。

2.离散化

就是把无限空间中有限的个体映射到有限的空间中。数据离散化操作大多是针对连续数据进行的，处理之后的数据值域分布将从连续属性变为离散属性。

为什么离散化：模型中，同一线性系数应该对所有可能的计数值起作用。过大的计数值对无监督学习方法也会造成破坏，比如k-均值聚类，它使用欧氏距离作为相似度函数来测量数据点之间的相似度。数据向量某个元素中过大的计数值对相似度的影响会远超其他元素，从而破坏整体的相似度测量。

离散化方式会影响后续数据建模和应用效果：
使用决策树往往倾向于少量的离散化区间，过多的离散化将使得规则过多受到碎片区间的影响。
关联规则需要对所有特征一起离散化，关联规则关注的是所有特征的关联关系，如果对每个列单独离散化将失去整体规则性。

3.2.3特征交互

特征交互就是人为的或者通过构造模型，自动将两个或两个两个以上的特征进行交互常用的交互方式有，求和、相乘、取对数等。

3.2.4特征映射

特征映射是一个比特征交互更高级的问题，一般通过某些机器学习模型来实现。

3.3模型选择与模型调优

3.3.1模型选择

（1）数据集切分

使用cross_validation类中的train_test_split函数可以很容易地将原始数据按照比例切成训练集和验证集。

（2）交叉验证

也是一种模型验证技术。简单来说就是重复使用数据。除去测试集，把剩余数据进行划分，组合成多组不同的训练集和验证集，某次在训练集中出现的样本下次可能成为验证集中的样本，这就是所谓的“交叉”。最后用各次验证误差的平均值作为模型最终的验证误差。

如果验证集较大，那么训练集就会变得很小，如果数据集本身就不大的话，显然这样训练出来的模型就不好。如果验证集很小，那么此验证误差就不能很好地反映出泛化误差。此外，在不同的划分方式下，训练出的不同模型的验证误差波动也很大（方差大）。到底以哪次验证误差为准？谁都不知道。但是如果将这些不同划分方式下训练出来的模型的验证过程重复多次，得到的平均误差可能就是对泛化误差的一个很好的近似。

3.3.2模型调优

在模型选定后，一般还需要进行模型的参数调优，这里我们介绍，网格搜索寻优和随机搜索寻优

（1）网格搜索寻优

网格搜索寻优是一种暴力寻优方法，做法是将某些参数放在网格中，通过遍历的方式，用交叉验证对参数空间进行求解，寻找最佳的参数。

（2）随机搜索寻优

在参数较少的时候，采用暴力寻优是可以的，但是当参数过多的时候，或者当参数为连续值时候，暴力寻优明显不大可取，所以提出随机搜索寻优的方式，其做法是对这些连续值进行采样，从中挑选出一些值作为代表。

【DeepSeek】DeepSeek 如何应用于政务系统？深度求索者政务
DeepSeek作为一款高性能、低成本的AI大模型，近期在政务系统中得到了广泛应用，其技术能力和场景适配性正在推动数字政府的智能化转型。以下从应用场景、技术支撑、实际成效及未来方向等方面进行深度解析：一、核心应用场景智能公文处理政策解读与文件起草：DeepSeek基于自然语言处理（NLP）技术，可自动生成公文初稿，结合政务语境提取关键信息，生成拟办意见。例如，深圳市龙岗区的公文校对时间从人工5分钟
HoRain云--浅析CoreDNS的工作机制 HoRain 云小助手贪心算法算法 CoreDNS
HoRain云小助手：个人主页⛺️生活的理想，就是为了理想的生活!⛳️推荐前些天发现了一个超棒的服务器购买网站，性价比超高，大内存超划算！忍不住分享一下给大家。点击跳转到网站。目录⛳️推荐一、插件化架构1.常见插件类型2.插件执行顺序二、动态配置（Corefile）1.配置结构2.热重载机制三、请求处理流程四、Kubernetes集成1.服务解析规则2.自动更新机制五、性能优化1.缓存加速2.并发
Decoder-Only、Encoder-Only、Encoder-Decoder 区别会喘气的粽子丶 nlp 人工智能
Decoder-Only、Encoder-Only和Encoder-Decoder是三种常见的神经网络架构，主要用于自然语言处理（NLP）任务。它们在结构和应用上有显著的区别。1.Decoder-Only架构描述：仅包含解码器部分，没有编码器。应用：通常用于生成任务，如语言模型和对话系统。代表模型：GPT（GenerativePre-trainedTransformer）特点：自回归生成：模型通过
新的 OpenWrt RCE 漏洞曝光，影响数百万台网络设备 m0_74079109 网络安全
执行摘要随着物联网的不断发展，物联网安全也越来越受到关注。自2016年下半年的Mirai僵尸网络攻击事件之后，物联网相关的威胁层出不穷，多个在野漏洞被攻击者所利用，多个僵尸网络相继被研究人员发现。今年，绿盟科技和国家互联网应急中心（CNCERT）联合发布了物联网安全年报，旨在让大家对2020年物联网相关的安全事件、资产、脆弱性和威胁情况有一个全面的认识。报告中的主要内容如下：第一章对2020年出现
智能化工具软件在教育领域的革命性应用：InsCode AI IDE引领编程教育新时代 InsCode AI IDE inscode 人工智能 ide
智能化工具软件在教育领域的革命性应用：InsCodeAIIDE引领编程教育新时代最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE引言随着信息技术的飞速发展，编程技能已经成为现代社会不可或缺的一部分。无论是计算机科学专业的学生，还是希望掌握编程技能以提升就业竞争力的职场人士，编程教育的重要性日益凸显。然而，对于许多初学者来说，编程学习往往充满了挑战和困惑。如何让编程变得更
还在熬夜做 PPT？结合Deepseek和Kimi 一键生成，效率飞起！ a小胡哦 powerpoint
打工人、学生党们，是不是每次做PPT都要掉一把头发？别愁啦，今天就给大家分享一个超绝的方法，用Deepseek自动生成PPT，轻松告别熬夜做PPT的痛苦！为什么选择Deepseek生成PPTDeepseek是一款强大的AI工具，它的中文理解和推理能力一流，能够快速精准地理解你的需求，生成逻辑清晰、内容丰富的PPT大纲和文本内容。不管是工作汇报、项目展示，还是学术报告，它都能帮你轻松搞定，节省大量时
关系数据库的基本术语 iamphp 系统架构设计师数据库
(1)属性(Attribute):在现实世界中，要描述一个事物常常取若干特征来表示。这些特征称为属性。例如学生通过学号、姓名、性别、系别、年龄、籍贯等属性来描述。(2)域(Domain):每个属性的取值范围对应一个值的集合，称为该属性的域。例如，学号的域是6位整型数；姓名的域是10位字符；性别的域为{男，女}等。一般在关系数据模型中，对域还加了一个限制，即所有的域都应是原子数据(AtomicDat
AI大模型学习之白话笔记（一）-- GPT和LLM Langchain 人工智能学习笔记 langchain python 机器人大模型
前言2022年底第一次听说chatGPT,从最初的对话，到如今的文生视频Sora，带来的效果，越来越超出我们的想象。在2023年，我尝试去了解GPT可以干什么，有什么作用，该怎么用，不过变化太快，最终也没有找到一个好的方式干进去。为什么变化这么快，说到底，是AI大模型带来的巨变。现在很多大厂都在降薪裁员，也有不少公司在AllinAI，我们都有一个预感，要变天了。你想想，如果有一天，一款游戏的所有美
【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码默默科研仔粉丝福利机器学习人工智能
标题：【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码一、引言1.1研究背景和意义概述研究的背景以及该研究在领域内的重要性。1.2研究现状分析当前领域的研究进展和存在的问题。二、极限学习机（ELM）基本原理2.1ELM的基本模型描述ELM的基本模型结构和工作原理。2.2ELM的学习过程介绍ELM的学习算法和训练过程。三、半监督极限学习机（SS-ELM）3.1SS-ELM的提
阅读论文“用于车联网安全车载通信的机器学习技术“的学习笔记饮长安千年月物联网安全安全机器学习学习
前言论文全称为MachineLearningTechnologiesforSecureVehicularCommunicationinInternetofVehicles:RecentAdvancescandApplications智能交通系统（ITS）和计算系统的快速发展为智能交通安全提供了新的科学研究，并提供了舒适和高效的解决方案。人工智能（AI）已被广泛用于优化不同研究领域的传统数据驱动方法
【AI引领潮流|未来智慧生活】国内机器聊天软件推荐（超全！）and人工智能&智能学习熔光人工智能 AI软件智能学习生活
1.AI聊天软件概述1.1AI聊天软件的关键技术1.2AI聊天软件的应用1.3AI聊天软件的挑战1.4总结2.智普清言3.文心一言4.讯飞星火5.知元AI6.白马AI7.ChatGPT8.一览AI应用链接9.人工智能10.机器学习↓个人主页：C_GUIQU↑1.AI聊天软件概述AI聊天软件是一种利用自然语言处理（NLP）、自然语言理解（NLU）和机器学习（ML）技术构建的软件，它能够理解用户的自然
文心快码智能体不断发展，真正与AI协同工作
文心快码(BaiduComate)是基于百度文心大模型，在研发全流程全场景下为开发者提供辅助建议的智能代码助手。结合百度积累多年的编程现场大数据、外部优秀开源数据，可为开发者生成更符合实际研发场景的优秀代码，提升编码效率，释放“十倍”软件生产力。如果您对【文心快码企业版】感兴趣，希望获取更多详细信息，点击进入企业服务咨询我们会尽快安排专业人员与您取得联系！我们期待与您建立联系，为您的企业带来更高效
DeepSeek为什么超越了OpenAI deepseek
DeepSeek的超越源于四大关键差异：技术架构的垂直整合优势、数据策略的动态闭环设计、商业模式的场景化落地能力、行业定位的差异化突围。其中，技术架构的突破最具革命性——DeepSeek创造性地采用"混合专家系统+领域预训练"架构，在特定领域的推理效率比OpenAI的GPT-4提升40%以上（根据2023年MLPerch基准测试）。这种技术路线选择，使其在医疗诊断、工业质检等垂直场景的准确率达到9
【Java笔记】第6章：数组熔光 Java java 笔记学习
目录前言1.数组概括2.数组的内存3.数组扩容4.二维数组5.数组的排序结语#includeintmain{上期回顾:【Java笔记】第5章：函数个人主页：C_GUIQU归属专栏：【Java学习】return一键三连;}前言各位小伙伴大家好！上期小编给大家讲解了Java中的函数，接下来讲讲数组！1.数组概括在Java中，数组是一种用于存储多个相同类型数据的集合。数组在内存中占据连续的空间，每个元素
HarmonyOS Next 端侧部署基础之 HiAI Foundation Kit harmonyos
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）中端侧部署涉及的HiAIFoundationKit技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、HiAIFoundationKit简介与功能概述在HarmonyOSNext的端侧部署中，HiAI
【带你 langchain 双排系列教程】1. langchian 基本架构与环境配置（siliconFlow Deepseek接入）夜里慢慢行456 langchain
LangChain是一个用于构建和部署大模型应用的框架，涵盖了从语言模型（LLM）到检索增强生成（RAG）、OpenAI集成以及智能体（Agent）的全套工具链。以下是一个简要的LangChain大模型全套教程，帮助你快速上手。核心内容：LangChain六大模块详解：模型（Models）、提示词（Prompts）、链（Chains）、索引（Indexes）、智能体（Agents）、内存（Memo
智启新程：AIGC浪潮下的职场进化论小momomo 人工智能
2025年就业季的号角已然吹响，在生成式AI重构商业版图的当下，"金三银四"正演变为"智聘黄金季"。猎聘研究院最新数据显示，AIGC相关岗位需求呈现指数级增长，岗位薪资溢价达传统岗位的2.3倍，一场由智能技术驱动的职场革命正在重塑人才价值坐标系。【智能生产力重构六大黄金赛道】一、创意智造领域1.超维设计革命设计师正从绘图者转型为AI策展人，Midjourney与StableDiffusion的深度
机器学些|实战? dami_king 随笔机器学习
机器学习实战：从零到%1…今天聊聊机器学习（MachineLearning,ML），这个听起来高大上的技术其实并没有那么神秘。跟着我的节奏，咱们一起来探索一下如何从零开始！准备工作：安装和导入必要的库在开始我们的房价预测项目之前，我们需要准备好开发环境并导入所有必要的库。这些库将帮助我们处理数据、构建模型、评估性能以及可视化结果。安装Python和JupyterNotebook首先，确保你已经安装
C++ 实现Arp断网万能的小裴同学 c++网络
此程序由AI生成，测试过了，可以使用但是，貌似全部都会断网#include#include#include#include#include#include#include#include#pragmawarning(disable:4996)#pragmacomment(lib,"wpcap.lib")#pragmacomment(lib,"Ws2_32.lib")#pragmacomment(l
DeepSeek行业应用实践报告100+份汇总解读|附PDF下载数据挖掘深度学习机器学习算法
原文链接：https://tecdat.cn/?p=40240在当下快速发展的科技浪潮中，人工智能（AI）已成为推动各行业变革的核心力量。AI大模型的出现，更是为众多领域带来了全新的发展机遇与挑战。本报告聚焦于AI大模型中的佼佼者——DeepSeek，通过深度剖析其技术特性、应用场景、市场表现以及未来趋势，为读者呈现一个全面且深入的AI行业发展图景。本报告汇总洞察基于文末157份DeepSeek行
第三章：组件开发实战 - 第五节 - Tailwind CSS 响应式导航栏实现 qianmoQ Tailwind CSS：现代化开发实战指南 css 前端
导航栏是几乎所有网站都必备的组件，一个好的响应式导航栏需要在不同设备上都能提供出色的用户体验。本节将介绍如何使用TailwindCSS实现功能完善的响应式导航栏。基础导航栏结构桌面端导航<divclass
正则化（Regularization）和正则表达式（Regular Expression）区别 Dontla 正则表达式
文章目录1.**正则化（Regularization）**2.**正则表达式（RegularExpression）**关键区别为什么名字相近？正则化（Regularization）和正则表达式（RegularExpression）不是同一个概念，它们是两个完全不同的术语，应用于不同的领域。1.正则化（Regularization）领域：机器学习/统计学。定义：正则化是一种用于防止模型过拟合（Ove
weblogic修改管理节点密码笑锝没心没肺 Weblogic 运维 java
weblogic安装后，很久不用，忘记访问控制台的用户名或者密码，可通过以下步骤来重置用户名密码。版本：WebLogicServer12c说明：%DOMAIN_HOME%：指WebLogicServer域(Domain）目录例如我的做测试的域的根目录DOMAIN_HOME=D:/bea10/user_projects/domains/testcluster_domain1.为了保证操作安全，备份%
了解Javascript中的异步等待 Brook_ JavaScript javascript 异步
在本文中，我们将探讨async/await对于每个Javascript开发人员来说，异步编程的首选工具。如果您不熟悉javascript，请不要担心，本文将帮助您async/await从头开始理解。介绍async/await是javascript中的一种模式，可使您的代码以同步方式执行，但又不影响javascript的异步行为。定义异步功能要定义一个异步函数，您所要做的只是在函数定义之前添加一个a
android5.0.1源码编译乌啼夜的酒痕安卓深入理解Android源码
1.git安装sudoapt-getinstallgitgitconfig–globaluser.email“[email protected]”gitconfig–globaluser.name“wuhongyun”2.repo安装mkdir~/binPATH=~/bin:$PATHcurlhttps://storage.googleapis.com/git-repo-downl
使用OpenAI LLM与Neo4j数据库进行自然语言交互 bBADAS neo4j 数据库交互 python
技术背景介绍在现代数据分析和应用开发中，图数据库以其独特的强大功能越来越受到重视。其中，Neo4j是最受欢迎的图数据库之一。结合自然语言处理（NLP），可以使数据查询变得更加直观和便捷。本篇文章将介绍如何使用OpenAI的语言模型将自然语言问题转换成Cypher查询，并通过Neo4j数据库执行该查询，并给出自然语言的响应。核心原理解析我们的目标是实现一个系统，该系统能够接受自然语言输入，将其转换为
Linux基础03-指令篇之文件及其内容相关操作【入门级】 kk努力学编程 linux 服务器运维
Linux基础-文件操作内容概要本文主要介绍了在linux系统中如何通过终端指令对文件以及文件内容进行增删改查。同时上传了关于存储转换的小知识点。指令cat/less/more/head/tailcat：查看文件内容（少）执行权限：所有用户语法：cat[选项]文件选项-n：显示文件行号范例：cat/proc/cpuinfocat-n/proc/cpuinfomore：分页查看文件内容（多）执行权限
机器学习基本篇胖胖的小肥猫机器学习
1基本概念机器学习，分为回归，分类，聚类，降维有监督学习回归，分类，有特征，有标签，进行训练，然后对新数据进行预测无监督学习聚类，降维。题目越多，训练越好，2基本流程数据预处理——模型训练与评估可以优化为获取数据——数据预处理——EDA分析——特征工程——模型训练——可解释性分析2.0数据获取利用kaggle,天池等平台的开源数据，2.1预处理目的：让数据更符合逻辑让数据更容易计算借助函数实现变换
地平线x5下运行yolo11s-seg模型 zgrobot 机器人 yolo11 实例分割地平线x5
经过地瓜机器人工作人员（感谢吴超同学）的及时技术支持，整体比较顺利的跑起来了yolo11s-seg分割模型。将一些经验记录下来：首先下载使用docker镜像：https://developer.d-robotics.cc/forumDetail/228559182180396619https://developer.d-robotics.cc/forumDetail/251934919646096
初始java常见模板 xx2534 java 开发语言
Java是一种适用于多种应用程序的编程语言，支持各种不同类型和规模的开发项目，其模板也相对较多，以下是Java的一些常见模板：基础的HelloWorld模板：publicclassHelloWorld{publicstaticvoidmain(String[]args){System.out.println("Hello,World!");}}2.类和对象模板：publicclassPerson{
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt

机器学习__02__机器学习工程实践