peter6768

sklearn-5模型评估与改进

通过前述章节可以发现，可调用模型的.score方法获取测试集评分，还有其他方法可以更好的评估模型，有交叉验证和网格搜索

1 交叉验证

特点 1数据被多次划分，且需要训练多个模型

k折交叉验证 k由用户指定，通常取5-10，将数据均分为k份，每份叫做折，然后开始训练数据，训练k次，每第k次训练时，取第k折数据作为测试集，其他数据均为训练集，最后可以得到k个模型训练的打分，一般可以用k次训练的平均值作为交叉验证的结果

1.1 优缺点

优点

1 验证次数多，验证均匀，不会像train_test_split一样，可能偶尔某个测试集异常数据较多，导致测试结果不稳定

2 训练集比例不同。RFE训练数据比例高于train_test_split的划分比例（75%）

缺点

1 交叉验证多次训练，更消耗时间，大约比单次训练验证慢k倍

2 交叉验证只是验证，不会返回经过数据训练的数据模型，只能获取得分

1.2 k折交叉验证和其他策略

1.2.1 分层k折交叉验证

分层k折和一般k折不同点在于，一般k折直接按顺序k分支一取测试集，如果原始数据分布不均匀，k折会不太稳定，一种解决方法是分层k折。分层k折是保证每个测试集和训练集的分类的百分比占比都为k分之一。cross_val_score默认使用的k折是一般k折交叉验证

1.2.2 交叉验证分离器

可将一些参数传给交叉分离器，交叉分离器可作为cv参数传入，类似于一种解耦

默认使用3折交叉验证iris时效率为0，因为数据已经有序分为3类，所以每次训练集都是一样的，只有一个种类，就啥也学不到

1.2.2.1 默认k折分离器

    def test_cross_kfold(self):
        kfold = KFold(n_splits=5)
        logreg = LogisticRegression().fit(self.iris.data, self.iris.target)
        print(f'5 fold cross score: {cross_val_score(logreg, self.iris.data, self.iris.target, cv=kfold)}')
        print(f'3 fold cross score: {cross_val_score(logreg, self.iris.data, self.iris.target, cv=KFold(n_splits=3))}')

1.2.2.2 留一法交叉验证

概念每次k折保留单个样本（集测试集只有一个样本）

优点适合小型数据集，准确度高

缺点耗时，需很多次模型创建与训练

    def test_cross_leave_one(self):
        loo = LeaveOneOut()
        logreg = LogisticRegression().fit(self.iris.data, self.iris.target)
        scores = cross_val_score(logreg, self.iris.data, self.iris.target, cv=loo)
        print(f'score number: {len(scores)}, score mean: {scores.mean()}')

1.2.2.3 打乱划分交叉验证

随机从数据集取数据作为测试集和训练集，这俩没有交集，且可以不用把所有数据取完，可以取一部分

    def test_cross_shuffle_split(self):
        logreg = LogisticRegression().fit(self.iris.data, self.iris.target)
        shuffle_split = ShuffleSplit(test_size=.5, train_size=.5, n_splits=10)
        scores = cross_val_score(logreg, self.iris.data, self.iris.target, cv=shuffle_split)
        print(f'shuffle split scores: {scores}')

1.2.2.4 分组交叉验证

例子从已知人脸的情感识别出新人脸的感情，target是情感。对机器模型来说，学习出现过的人脸情感比新人脸的情感容易，因此希望训练集和测试集不包含相同的人的人脸，可以用分组交叉验证

分组交叉验证按照groups输入参数将输入分成不同组，每次验证将一个组的数据作为测试集，如果组不够则将剩下的数据作为测试集，其他说句作为训练集

    def test_cross_group_split(self):
        groups = [0, 0, 0, 1, 1, 1, 1, 2, 2, 3, 3, 3]
        scores = cross_val_score(LogisticRegression(), *self.blob, groups=groups, cv=GroupKFold(n_splits=4))
        print(f'cross validation scores: {scores}')

2 网格搜索

概念网格搜索是一种调参的方法，类似于笛卡尔积的概念，将所有不同类参数的所有结果都组合在一起看性能，找出一组性能最佳的参数组合

2.1 简单网格搜索

就是网格搜索的概念，比如核svm有两个参数核半径和正则化参数，可以用两个for循环遍历要取的值，循环体内保留最高精度和对应的参数值，最后输出.不需要从sklearn导入其他模块

2.2 参数过拟合风险和验证集

验证集训练集用来训练模型，测试集用来调参，找出最优参数，最优参数是否足够优秀，需要用新的数据去检验，而不应该用训练集和用来调参的测试集。为解决此问题，可以在训练模型前将原始数据集分成三部分，训练集，测试集，验证集。验证集就是用来校验模型调参结果的数据。如果用调参的测试集去验证模型准确度，会发现实际准确度达不到，因为测试集已经用过了，再用会过拟合导致高准度但泛化能力低

如何获取验证集可以调用两次train_test_split

2.3 交叉验证+网格搜索（GridSearchCV）

网格搜索是选出最优参数，而交叉验证可以很好的验证参数泛化能力，其实可以用交叉验证替代验证集，且验证集对划分方案很敏感，不太合适

特点 1 交叉验证+网格搜索会导致计算量大，耗时 2 相比于手动交叉+网格，免去了划分验证集工序，模型直接用训练集做模型训练和参数评分，最后用测试集验证泛化能力

sklearn支持交叉验证+网格搜索，sklearn提供了一体化模块，免去了手动for调多个参数然后交叉验证的繁琐。sklearn使用sklearn.model_selection.GridSearchCV实现，逻辑是先网格+交叉验证找到最优参数，然后最终评估。训练，测试数据和参数列表需要手动传参。看个例子

性质 1 网格找到的最佳参数存在模型的best_params_字段中 2 交叉验证的最高得分存在模型的best_score_字段中 3 模型所有字段存在模型的best_estimator_字段中

    def test_grid_and_cross(self):
        params = {'C': [0.001, 0.01, 0.1, 1, 10, 100], 'gamma': [0.001, 0.01, 0.1, 1, 10, 100]}
        grid_search = GridSearchCV(SVC(), params, cv=5)
        xtr, xte, ytr, yte = train_test_split(self.iris.data, self.iris.target, random_state=0)
        grid_search.fit(xtr, ytr)
        print(f'test grid search score: {grid_search.score(xte, yte)}')
        print(f'test grid search best params: {grid_search.best_params_}')
        print(f'test grid search best scores: {grid_search.best_score_}')
        print(f'test grid search best all params: {grid_search.best_estimator_}')

2.3.1 分析交叉验证结果

因为网格调参会比较多，此节用可视化方法分析

网格搜索的结果存在cv_results_字段，保存了每个网格的参数和训练得分

可视化方法为热图

    def test_visualization_cross_and_grid(self):
        params = {'C': [0.001, 0.01, 0.1, 1, 10, 100], 'gamma': [0.001, 0.01, 0.1, 1, 10, 100]}
        grid_search = GridSearchCV(SVC(), params, cv=5)
        xtr, xte, ytr, yte = train_test_split(self.iris.data, self.iris.target, random_state=0)
        grid_search.fit(xtr, ytr)
        scores = np.array(pd.DataFrame(grid_search.cv_results_).mean_test_score).reshape(6, 6)
        mglearn.tools.heatmap(scores, xlabel='gamma', xticklabels=params['gamma'], ylabel='C', yticklabels=params['C'], cmap='viridis')
        plot.show()

2.3.2 在非网格空间中搜索

问题有时候参数组合会动态变化，比如SVC的kernel类别，如果是线性kernel则不用gamma，如果kernel是rbf则C和gamma都要用，如果在线性kernel时网格搜索gamma和C，那么C时没意义的。为解决此问题，可以使用GridSearchCV模型的参数param_grid,这个和params参数不同的是，可以将线性kernel和rbf kernel放在一个列表里，每个列表项是一个字典，键就是C，gamma和kernel类别，用param_grid替代param

可视化可以通过grid_search.cv_results_看结果，发现kernel线性的gamma参数为NAN

2.3.3 使用不同交叉验证策略进行网格搜索

GridSearchCV也可以使用不同的交叉验证方法

GridSearchCV对分类问题默认使用分层k折，对回归问题默认使用一般k折

实现构造不同的验证分离器，作为cv参数传给GridSearchCV即可

存在的必要性之前的策略是事先划分测试集和训练集，然后交叉验证+网格搜索，缺点是所有验证和网格搜索都依赖于最开始的测试划分，没有验证和网格搜索在测试集上进行，这在某种程度会导致轻微的过拟合，为避免此问题，可以采用嵌套交叉验证，即先用交叉验证将数据划分为测试集和训练集，再用GridSearchCV模型对交叉验证划分的数据交叉验证

    def test_nested_cross(self):
        params = {'C': [0.001, 0.01, 0.1, 1, 10, 100], 'gamma': [0.001, 0.01, 0.1, 1, 10, 100]}
        scores = cross_val_score(GridSearchCV(SVC(), params, cv=5), self.iris.data, self.iris.target, cv=5)
        print(f'nested cross scores: {scores}, \n nested cross mean scores: {scores.mean()}')

性能 1 嵌套交叉验证构造更多的模型：36*5*5=900个模型，36是一次网格搜索构造的模型数量，第一个5是GridSearchCV网格搜索做的交叉验证，第二个5是5次交叉验证保证每次传给GridSearchCV的测试集不一样，用不一样的测试集去交叉验证 2 虽然次数很多，但交叉验证和网格搜索可以并行，模型的传入参数n_jobs可以控制并行数，参数表示并行数，如果设为-1则表示用主机所有内核 3 注意，并行不能嵌套，即如果GridSearchCV使用了嵌套，那么给GridSearchCV传入的训练模型就不可以用并行，sklearn不支持，但没试过

3 评估指标与评分

目前学到现在，一直都用R平方来评估分类和回归模型的精确度，有的模型并不适用R平方评估模型精确度，有更合适的指标，学习下

3.1 选择目标与商业化

一般机器学习都需要应用到现实生活，模型的好坏取决于在实际生活中发挥的作用，这个通过指标呈现，比如手术机器人手术速度，精确度等，越高说明模型越好，这里的手术速度，精确度就是现实的商业指标，但在开发阶段没有这样的现实环境，可又需要这样的现实指标才能评估模型的好坏，怎么办呢？可以找个近似的指标，学习下一般可以考虑哪些近似的指标

3.2 二分类指标

通过正类和反类两个概念来描述结果是否为我们想要的，与预期相符即为正类，否则为反类

3.2.1 错误类型

考虑预测癌症病人的性质是阴性还是阳性，此处将阳性结果视为正类

假正例/假反例比如预测一个人癌症阳还是阴性，比如一个人癌症实际是阴性，但预测错了预测为阳性，这种情况叫假正例。假反例就是反过来

第一类错误/第二类错误统计学上，假正例也叫第一类错误；假反例也叫第二类错误

回到例子中，第一类错误的影响可能导致患者做多的检查，但第二类错误会导致患者误以为自己是阴性但他实际是阳性，可能错过治疗最佳实际，严重的话甚至威胁生命，所以一般我们在设定正类和反类后，应该尽可能避免假反例（即第二类错误）

当然也可能有的场景第一类错误的影响远大于第二类错误，此时可以重点关注第一类错误

3.2.2 不平衡数据集

比如让三个女孩在10000个男孩里挑选最喜欢的人，男孩被喜欢了标1，男孩没被女孩喜欢标0，然后用男孩是否被标1来评估男孩的魅力程度。最后汇总10000个男孩里每个男孩是否被女孩喜欢的结果，得到的数据点有10000个，其中9997个是0，3个是1，但仅靠3个1很难评估这三个男生是有魅力的，也很难评估9997个男生是没魅力的，这种情况可以看作不平衡数据集的一个例子，而不平衡数据集在生活中更为常见

继续看上面这个例子，比如最后用百分比来看，99.97%的男生都没有被女生喜欢，光看数值发现数值很高，但实际这个数值并不能表示什么，不能表示99.97%的男生都没有魅力，而需要用其他指标去评估10000个男生到底谁有魅力

3.2.3 混淆矩阵

混淆矩阵输出一个2x2的数组，数组的元素是数据集的样本，两个行表示两个实际的类别，两个列表示两个预测的类。主对角线（matrix[i][i])上的数据是正确的（即预测类和实际类一致）。通过混淆矩阵可以看出正确和错误预测的样本

混淆矩阵的四个趋于可以用假正例（false positive，FP），假反例（false negative， FN），真正例（TP)，真反例(TN)来描述

指标预测模型通过FP，FN，TP，TN可以预测模型准确度，公式为（TP+TN）/（TP+TN+FP+FN）

准确率公式是TP/（TP+FP），描述预测的正类有多少是真实的正类。如果限制FP的数量，可以考虑用准确率评估模型。比如验证新药是否有药效，在1000个小白是做实验，997个起作用了，3个没起作用，准确率99.7%

召回率/灵敏度/命中率公式是TP/（TP+FN），描述真实正类中有多少被预测为正类。如果希望TP高，可以使用召回率评估模型。比如在预测的阳性癌症患者中找到真实阳性患者，这很有用

f分数结合了准确率和召回率，是两者的调和平均，公式是2*(准确率*召回率）/（准确率+召回率）

准确率和召回率都是越高越好，两个要一起看，不能只看一个，比如如果让召回率到100但准确率很低，这可能不太行。（思考为很么两个都要高）

classification_report可以将准确率，召回率，f分数都打印出来

    def test_digits_predict_metric(self):
        xtr, xte, ytr, yte = train_test_split(self.digits.data, self.digits.target == 9, random_state=0)
        dummy = DummyClassifier(strategy='most_frequent').fit(xtr, ytr)
        pred_most_freq = dummy.predict(xte)
        print(f'{classification_report(yte, pred_most_freq, target_names=["not nine", "nine"])}')

作用通过混淆矩阵和classification_report可以看到更多指标，可以全面衡量模型准确度

3.2.4 考虑不确定性

可以通过联合classification_report和decision_function和predict_proba调整决策边界获取好的报告（当然要切合实际），predict_proba值域为0-1（概率），更好操作

3.2.5 准确率-召回率曲线

概念即训练一个分类模型，然后画二维图，两个方向分别是准确率和召回率，变量是decision_function的阈值，每取一个阈值，准确率和召回率也会取一个值，将所有decision_function的值对应的准确率和召回率的值绘图，就是准确率-召回率曲线

意义 1 准确率和召回率越大越好，绘图后可根据实际情况取舍，有助于可视化，是对f1分数的补充，因为f1分数看不到准确率和召回率（f1分数只提供了准确率召回率曲线上阈值为0的那个点） 2辅助对比多个模型哪个好，可以此为量化指标

量化 1一种量化指标是取曲线的平均值，即平均准确率（感觉就是算面积，积分或累次相加）

3.2.6 受试者工作特征（ROC）与AUC

概念类似于准确率-召回率曲线，只是两个坐标代表的东西不一样，换成了假正例率（FP/(FP+TN))和真正例率(TP/(TP+FN))，真正例率同时也是召回率

指标意义越靠近左上角越好，即真正例率越高，假正例率越低，越好

量化类似于准确率-召回率曲线，也可计算平均值（积分或面积）

意义 1不平衡数据集来说，AUC/ROC是一个很好的指标

注意 AUC没调节阈值，获得了AUC高的组合参数后，一般还要调节阈值进一步

3.3 多分类指标

多分类一般看混淆矩阵和分类报告

多分类报告里有三种汇总值 1macro计算未加权的f分数（无视每个类的样本数） 2weighted计算加权的f分数 3micro计算假正例，假反例，真正例数量，用这些计数计算准确率，召回率，f分数

3.4 回归指标

精度一般够了

3.5 如何使用评估指标

交叉验证和网格搜索提供了参数输入来选择不同的评估指标比如AUC，参数是scoring="xxx"

分类问题常用指标 accuracy， roc_auc，avg_precision（准确率召回率面积），f1， f1macro，f1micro，f1_weighted

回归问题常用指标 r2，均方误差，平均绝对误差

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l