pior

Weka开发［11］—J48源代码介绍

这次介绍一下J48的源码，分析J48的源码似乎真还是有用的，同学改造J48写过VFDT，我自己用J48进行特征选择（当然很失败）。

J48的buildClassfier函数：

public void buildClassifier(Instances instances) throws Exception {

ModelSelection modSelection;

if (m_binarySplits)

modSelection = new BinC45ModelSelection(m_minNumObj, instances);

else

modSelection = new C45ModelSelection(m_minNumObj, instances);

if (!m_reducedErrorPruning)

m_root = new C45PruneableClassifierTree(modSelection,

!m_unpruned, m_CF, m_subtreeRaising, !m_noCleanup);

else

m_root = new PruneableClassifierTree(modSelection, !m_unpruned,

m_numFolds, !m_noCleanup, m_Seed);

m_root.buildClassifier(instances);

if (m_binarySplits) {

((BinC45ModelSelection) modSelection).cleanup();

} else {

((C45ModelSelection) modSelection).cleanup();

}

在NBTree中已经介绍过了，ModelSelection是决定决策树的模型类，前面两个if，一个是判断连续属性是否只分出两个子结点，另一个判断是否最后剪枝。m_root是一个ClassifierTree对象，它调用buildClassifier函数。这里列出这个函数：

public void buildClassifier(Instances data) throws Exception {

// can classifier tree handle the data?

getCapabilities().testWithFail(data);

// remove instances with missing class

data = new Instances(data);

data.deleteWithMissingClass();

buildTree(data, false);

}

有注释也没什么好说的，直接看最后一个函数buildTree：

public void buildTree(Instances data, boolean keepData) throws Exception {

Instances[] localInstances;

if (keepData) {

m_train = data;

}

m_test = null;

m_isLeaf = false;

m_isEmpty = false;

m_sons = null;

m_localModel = m_toSelectModel.selectModel(data);

if (m_localModel.numSubsets() > 1) {

localInstances = m_localModel.split(data);

data = null;

m_sons = new ClassifierTree[m_localModel.numSubsets()];

for (int i = 0; i < m_sons.length; i++) {

m_sons[i] = getNewTree(localInstances[i]);

localInstances[i] = null;

}

} else {

m_isLeaf = true;

if (Utils.eq(data.sumOfWeights(), 0))

m_isEmpty = true;

data = null;

}

这里的selectModel函数，如果看过NBTree一篇的读者应该不会太陌生，selectModel简单地说就是如果不符合分裂的条件就返回NoSplit，如果符合分裂的条件，则从currentModel数组中选出bestModel返回。

这最要注意的是selectModel也不只是决定哪个属性分裂，其实到底如何分裂已经在这个函数里算里出来了。

我把selectModel拆开来讲解

// Check if all Instances belong to one class or if not

// enough Instances to split.

checkDistribution = new Distribution(data);

noSplitModel = new NoSplit(checkDistribution);

if (Utils.sm(checkDistribution.total(), 2 * m_minNoObj)

|| Utils.eq(checkDistribution.total(), checkDistribution

.perClass(checkDistribution.maxClass())))

return noSplitModel;

2 * m_minNoObj表示至有有这么多样本才可以分裂，原因很简单，因为一个结点至少分出两个子结点，每个子结点至少有m_minNoObj个样本，第二个是或条件是表示是否这个结点上所有的样本都属于同一类别，也就是这个结点总的权重是否等于这个最多类别的权重。

// Check if all attributes are nominal and have a lot of values.

if (m_allData != null) {

Enumeration enu = data.enumerateAttributes();

while (enu.hasMoreElements()) {

attribute = (Attribute) enu.nextElement();

if ((attribute.isNumeric())

|| (Utils.sm((double) attribute.numValues(),

(0.3 * (double) m_allData.numInstances())))) {

multiVal = false;

break;

}

判断是否有很多不同的属性值，标准就是如果有一个属性的属性值小多于总样本数*0.3，那么就是不是multiVal。

currentModel = new C45Split[data.numAttributes()];

sumOfWeights = data.sumOfWeights();

// For each attribute.

for (i = 0; i < data.numAttributes(); i++) {

// Apart from class attribute.

if (i != (data).classIndex()) {

// Get models for current attribute.

currentModel[i] = new C45Split(i, m_minNoObj, sumOfWeights);

currentModel[i].buildClassifier(data);

// Check if useful split for current attribute

// exists and check for enumerated attributes with

// a lot of values.

if (currentModel[i].checkModel())

if (m_allData != null) {

if ((data.attribute(i).isNumeric())

|| (multiVal || Utils.sm((double) data

.attribute(i).numValues(),

(0.3 * (double) m_allData.numInstances())))) {

averageInfoGain = averageInfoGain

+ currentModel[i].infoGain();

validModels++;

}

} else {

averageInfoGain = averageInfoGain

+ currentModel[i].infoGain();

validModels++;

}

} else

currentModel[i] = null;

}

里面重要的两句就是：

// Get models for current attribute.

currentModel[i] = new C45Split(i, m_minNoObj, sumOfWeights);

currentModel[i].buildClassifier(data);

其它的也没有什么，求一下averageInfoGain和validModels。checkModel如果可以分出子结点则为真。

这里是C45Split类的成员函数buildClassfier被调用，列出它的代码：

public void buildClassifier(Instances trainInstances) throws Exception {

// Initialize the remaining instance variables.

m_numSubsets = 0;

m_splitPoint = Double.MAX_VALUE;

m_infoGain = 0;

m_gainRatio = 0;

// Different treatment for enumerated and numeric

// attributes.

if (trainInstances.attribute(m_attIndex).isNominal()) {

m_complexityIndex = trainInstances.attribute(m_attIndex)

.numValues();

m_index = m_complexityIndex;

handleEnumeratedAttribute(trainInstances);

}else{

m_complexityIndex = 2;

m_index = 0;

trainInstances.sort(trainInstances.attribute(m_attIndex));

handleNumericAttribute(trainInstances);

}

这里handleEnumerateAttribute和handleNumericAttribute是决定到底是哪一个属性分裂(m_attIndex)和分裂出几个子结点的函数(m_numSubsets)。这里的m_comlexity就是指分可以分裂出多少子结点。如果是连续属性就是2。再看一下handleEnumeratedAttribute函数：

private void handleEnumeratedAttribute(Instances trainInstances)

throws Exception {

Instance instance;

m_distribution = new Distribution(m_complexityIndex,

trainInstances.numClasses());

// Only Instances with known values are relevant.

Enumeration enu = trainInstances.enumerateInstances();

while (enu.hasMoreElements()) {

instance = (Instance) enu.nextElement();

if (!instance.isMissing(m_attIndex))

m_distribution.add((int) instance.value(m_attIndex),

instance);

}

// Check if minimum number of Instances in at least two

// subsets.

if (m_distribution.check(m_minNoObj)) {

m_numSubsets = m_complexityIndex;

m_infoGain = infoGainCrit.splitCritValue(m_distribution,

m_sumOfWeights);

m_gainRatio = gainRatioCrit.splitCritValue(m_distribution,

m_sumOfWeights, m_infoGain);

}

// Current attribute is a numeric attribute.

m_distribution = new Distribution(2, trainInstances.numClasses());

// Only Instances with known values are relevant.

Enumeration enu = trainInstances.enumerateInstances();

i = 0;

while (enu.hasMoreElements()) {

instance = (Instance) enu.nextElement();

if (instance.isMissing(m_attIndex))

break;

m_distribution.add(1, instance);

i++;

}

firstMiss = i;

已经讲过了，如果是连续属性就分出两个子结点，也就是Distribution的第一个参数。枚举所有样本，因为在调用HandleNumericAttribute之间已经对数据集根据m_attIndex排序过，所以缺失数据都在最后。也就是firstMiss是在m_attIndex上有确定值的样本个数＋1。在while循环中，把所有的样本都先放到bag 1中(add(1,instance))。还是列出来一下吧。

public final void add(int bagIndex, Instance instance) throws Exception {

int classIndex;

double weight;

classIndex = (int) instance.classValue();

weight = instance.weight();

m_perClassPerBag[bagIndex][classIndex] =

m_perClassPerBag[bagIndex][classIndex] + weight;

m_perBag[bagIndex] = m_perBag[bagIndex] + weight;

m_perClass[classIndex] = m_perClass[classIndex] + weight;

totaL = totaL + weight;

}

也就这个函数也就是根据参数bagIndex和样本的类别值classIndex，三个成员变量m_perBag, m_perClass, m_perClassPerBag分别加上样本的权重。

// Compute minimum number of Instances required in each subset.

minSplit = 0.1 * (m_distribution.total())

/ ((double) trainInstances.numClasses());

if (Utils.smOrEq(minSplit, m_minNoObj))

minSplit = m_minNoObj;

else if (Utils.gr(minSplit, 25))

minSplit = 25;

// Enough Instances with known values?

if (Utils.sm((double) firstMiss, 2 * minSplit))

return;

计算分最小分裂需要的样本数，这些涉及的值在Quinlan的论文中没有提到，可能也没有太多的道理，就是如果样本数的1/10小于m_minNoObj那么最小分裂样本数就是m_minNoObj，如果大于25，最小分裂样本数就是25。

如果firstMiss小于2*minSplit表示已经不可以再分裂了（为什么刚才已经讲过了）。

// Compute values of criteria for all possible split indices.

defaultEnt = infoGainCrit.oldEnt(m_distribution);

while (next < firstMiss) {

if (trainInstances.instance(next - 1).value(m_attIndex)

+ 1e-5 < trainInstances.instance(next).value(m_attIndex)) {

// Move class values for all Instances up to next

// possible split point.

m_distribution.shiftRange(1, 0, trainInstances, last, next);

// Check if enough Instances in each subset and compute

// values for criteria.

if (Utils.grOrEq(m_distribution.perBag(0), minSplit)

&& Utils.grOrEq(m_distribution.perBag(1), minSplit)) {

currentInfoGain = infoGainCrit.splitCritValue(

m_distribution, m_sumOfWeights, defaultEnt);

if (Utils.gr(currentInfoGain, m_infoGain)) {

m_infoGain = currentInfoGain;

splitIndex = next - 1;

}

m_index++;

}

last = next;

}

next++;

}

oldEnt计算没有分裂的信息增益，得到defaultEnt注意，刚才是把样本放在了一个bag中。然后对所有有确定值的样本进行循环。第一个if，如果两个属性值太接近，那么选择的分裂点不会有太大的区别，就不进行处理。shiftRange是把第一个bag中下标从last到next-1的样本移到第0个bag。shiftRange代码如下：

public final void shiftRange(int from, int to, Instances source,

int startIndex, int lastPlusOne) throws Exception {

int classIndex;

double weight;

Instance instance;

int i;

for (i = startIndex; i < lastPlusOne; i++) {

instance = (Instance) source.instance(i);

classIndex = (int) instance.classValue();

weight = instance.weight();

m_perClassPerBag[from][classIndex] -= weight;

m_perClassPerBag[to][classIndex] += weight;

m_perBag[from] -= weight;

m_perBag[to] += weight;

}

很简单就是把对应样本的样本权重从from bag中减去，再加到to bag中。

转回来，如果bag 1和bag 0都满足最小分裂样本数，计算在当前分裂点上的信息增益值。如果比上一个最好的分裂点的信息增益高，那么记录下当前的信息增益值为最高信息增益值m_infoGain，和当前分裂点splitIndex。

// Was there any useful split?

if (m_index == 0)

return;

// Compute modified information gain for best split.

m_infoGain = m_infoGain - (Utils.log2(m_index) / m_sumOfWeights);

if (Utils.smOrEq(m_infoGain, 0))

return;

// Set instance variables' values to values for best split.

m_numSubsets = 2;

m_splitPoint = (trainInstances.instance(splitIndex + 1).value(

m_attIndex) + trainInstances.instance(splitIndex).value(

m_attIndex)) / 2;

如果没有找到任何分裂点，返回，接下来的m_infoGain自己到J.R.Quinlan的Improved use of continuous Attributes in C4.5论文中的第4页第二段中找。最后设置有两个结点，分裂点在刚才找到的最好的分裂点与下一个属性值的中点。

// In case we have a numerical precision problem we need to choose the

// smaller value

if (m_splitPoint == trainInstances.instance(splitIndex + 1).value(

m_attIndex)) {

m_splitPoint = trainInstances.instance(splitIndex).value(

m_attIndex);

}

// Restore distributioN for best split.

m_distribution = new Distribution(2, trainInstances.numClasses());

m_distribution.addRange(0, trainInstances, 0, splitIndex + 1);

m_distribution.addRange(1, trainInstances, splitIndex + 1, firstMiss);

// Compute modified gain ratio for best split.

m_gainRatio = gainRatioCrit.splitCritValue(m_distribution,

m_sumOfWeights, m_infoGain);

if是处理精度的细节问题。然后重新通过addRange计算m_distribution，最后计算增益率(Gain Ratio)。

这里看到又有一个新类Distribution类，还是要把Distribution类讲一下，Distribution类中有一个bag成员变量，它的意思是能有几个子结点。从下面的构造函数看出来的，第一个参数在上面调用它的时候用的就是m_complexityIndex.

public Distribution(int numBags, int numClasses) {

int i;

m_perClassPerBag = new double[numBags][0];

m_perBag = new double[numBags];

m_perClass = new double[numClasses];

for (i = 0; i < numBags; i++)

m_perClassPerBag[i] = new double[numClasses];

totaL = 0;

}

Distribution的add函数就是在相应的属性值上进行统计，太简单了，略过。

回到刚才的buildTree函数，如果numSubsets返回1，则表示当前结点不再分裂为叶子结点，如果大于1，那么调用split函数，split函数只是根据有上次得到的子结点数，并根据WhichSubset返回值，把当前结点的样本分到几个子结点去。再对每一个子结点训练一个新子树，到这已经与以前讲的ID3有很大的相似了。

可能大家学习的时候都对理论很感兴趣，但看了半天也没看到，有点不解，其实也很好找，当然应该在handleEnumerateAttribute和handleNumericAttribute中了，也就是InfoGainSplitCrit和GainRatioSplitCrit两个类。

分裂一个样本与NBTree相似，这里不再赘述。

你可能感兴趣的:(Weka开发［11］—J48源代码介绍)

C++ 字面量深度解析：从基础到实战进阶 belien C++c++开发语言 C++11 C++14
在C++开发中，字面量（Literal）不仅是基础语法的一部分，更是提升代码可读性、安全性和性能的关键工具。本文将深入探讨C++字面量的高级特性、最新标准支持（C++11/14/17/20）以及实际开发中的应用技巧，助你写出更专业、更高效的代码。1.C++11及后续标准中的字面量增强1.1二进制字面量标准化（C++14）C++14将二进制字面量（0b或0B前缀）纳入标准，简化二进制数据的表达：in
python工商银行流水_工商银行基于 Dubbo 构建金融微服务架构的实践-服务发现篇... weixin_39850152
作者|张远征来源|阿里巴巴云原生公众号导读：Dubbo作为分布式微服务框架，众多公司在实践中基于Dubbo进行分布式系统架构。重启开源后，我们不仅看到Dubbo3.0最新的Roadmap发布，而且还看到阿里在自身电商开始推进Dubbo和内部HSF的融合，并在双11上开始使用Dubbo3.0。本文是工商银行基于Dubbo构建金融微服务架构的分享，主要讲述了服务发现的应对策略和成果，后续将发布工行大规
github代理 | 快速clone项目一念思量LG github
代理网址：https://ghproxy.com/https://ghproxy.com/代理网址：https://ghproxy.com/比如需要克隆的项目git地址为：https://github.com/AUTOMATIC1111/stable-diffusion-webui.gitgitclonehttps://ghproxy.com/https://github.com/AUTOMATI
H100赋能生成式AI算力革新智能计算研究中心其他
内容概要NVIDIAH100GPU的推出标志着AI算力架构的范式革新。其核心突破在于第四代TensorCore与Transformer引擎的协同设计，通过动态稀疏计算与混合精度支持，将大规模矩阵运算效率提升至新高度。根据公开测试数据，H100在生成式AI模型的训练场景中，相比前代产品实现了6倍的吞吐量跃升，单卡可支持每秒4PB量级的张量处理能力。这一技术演进不仅显著缩短了千亿参数模型的开发周期，更
深度学习框架演进与智能应用实践智能计算研究中心其他
内容概要深度学习框架的迭代升级正重塑智能应用开发范式。从TensorFlow的静态图架构到PyTorch的动态计算图设计，工具链的持续优化显著提升了模型训练效率与部署灵活性。与此同时，模型压缩技术通过剪枝、量化和知识蒸馏等手段，在保持精度的前提下降低计算资源需求，而超参数优化与迁移学习策略则进一步增强了模型在不同场景的适应能力。值得关注的是，边缘计算与联邦学习的深度融合，正推动医疗影像诊断、金融风
Pytorch入门实战 | 第P9周：YOLOv5-Backbone模块实现 K同学啊小白训练营 #Pytorch入门 python
本次我将利用YOLOv5算法中的Backbone模块搭建网络。YOLOv5是目标检测算法，是否可以尝试将其网络结构用在目标识别上，或进行改进形成一个全新的算法（类似之前介绍过的VGG1-6）。如果效果不错的话，还可以搞一篇期刊文章出来~分享一张我自己绘制的YOLOv5_6.0版本的算法框架图，希望它可以有助于你完成本次探索~
第2章-01-网站中的资源介绍黑夜开发者 Web爬虫入门与实战精讲网络爬虫 python selenium 网站资源
作者简介，黑夜开发者，CSDN领军人物，全栈领域优质创作者✌，CSDN博客专家，阿里云社区专家博主，2023年CSDN全站百大博主。数年电商行业从业经验，历任核心研发工程师，项目技术负责人。本文已收录于专栏：Web爬虫入门与实战精讲，后续完整更新内容如下。文章目录网站资源概览1.HTML文档2.CSS样式表3.JavaScript脚本4.图片5.字体6.视频与音频文件总结网站资源概览一个现代网站，
一套适合 ABAP 初级和中级开发人员，从入门到提高的 ABAP 学习教程汪子熙零基础快速学习 ABAP ABAP SAP 思爱普 NetWeaver 后台开发
曾几何时，ABAP就是SAP的代名词。ABAP这门编程语言造就了SAP名噪一时的R/3产品，同时也是如今SAP旗舰级产品，SAPS/4HANA底层的实现语言。ABAP不仅代表着SAP这家公司在企业级管理软件市场辉煌的过去，ABAP自身也在不断地进化着。SAP不仅在本地部署(On-Premise)领域继续保持着自己绝对的统治地位，而且在云应用领域（Software-as-a-Service,简称Sa
Vosk-Server: 高精度离线语音识别服务器柯茵沙
Vosk-Server:高精度离线语音识别服务器vosk-serveralphacep/vosk-server:VoskServer是一个基于Vosk语音识别引擎的服务端实现，可以部署为HTTPAPI服务，接收音频流并返回语音转文字结果，适用于在线语音识别场景。项目地址:https://gitcode.com/gh_mirrors/vo/vosk-server基础介绍Vosk-Server是一个基
Flutter-WebRTC：跨平台实时通信的利器傅尉艺Maggie
Flutter-WebRTC：跨平台实时通信的利器项目地址:https://gitcode.com/gh_mirrors/flu/flutter-webrtc在当今的数字化时代，实时通信已成为各种应用不可或缺的一部分。无论是社交应用、在线教育还是远程工作，高质量的音视频通信都是提升用户体验的关键。今天，我们要介绍的是一个强大的开源项目——Flutter-WebRTC，它为开发者提供了一个跨平台的解
Flutter技术调研报告：使用Flutter实现WebRTC RqbaGcp flutter webrtc WebRTC
WebRTC（Web实时通信）是一种用于在Web浏览器和移动应用程序之间进行实时音视频通信的开源项目。在本篇文章中，我们将探讨如何使用Flutter框架实现WebRTC功能。我们将介绍WebRTC的基本原理，然后展示如何在Flutter应用程序中集成WebRTC。WebRTC的基本原理WebRTC是一种基于实时传输协议（Real-TimeTransportProtocol，简称RTP）的通信技术。
istio 介绍-01-一个用于连接、管理和保护微服务的开放平台概览老马啸西风 sofa istio 微服务云原生
istioistio一个用于连接、管理和保护微服务的开放平台。介绍Istio是一个开放平台，用于提供统一的方式来集成微服务、管理跨微服务的流量、执行策略和聚合遥测数据。Istio的控制平面在底层集群管理平台（例如Kubernetes）上提供了一个抽象层。Istio由以下组件组成：Envoy-每个微服务的Sidecar代理，用于处理集群中服务之间以及从服务到外部服务的入口/出口流量。这些代理形成了一
农业无人机：无人机图像处理_（5）.无人机图像在精准农业中的应用 zhubeibei168 无人机无人机图像处理人工智能游戏引擎人机交互农业检测
无人机图像在精准农业中的应用1.引言在精准农业中，无人机图像处理技术发挥着重要作用。通过无人机采集的高分辨率图像，农民和农业研究人员可以实时监测作物生长情况、土壤湿度、病虫害状况等，从而实现精准管理。本节将详细介绍无人机图像在精准农业中的应用，包括图像采集、图像预处理、图像分析和数据可视化等环节。2.无人机图像采集无人机图像采集是精准农业图像处理的第一步。无人机配备有高分辨率相机，可以在空中对农田
Manus产品介绍及部署使用指南极客奇点 AI工具集的应用及实操人工智能 AIGC
一、ManusAgent是什么？ManusAgent是Manus公司基于其高精度动作捕捉技术开发的自主智能体系统。它结合人工智能（AI）算法与实时动作捕捉数据，能够实现以下核心功能：自主决策：通过机器学习模型分析环境信息，动态调整行为（如避障、路径规划）。人机协作：与人类用户自然交互，例如辅助操作或学习人类动作模式。多设备协同：控制虚拟角色、机器人、无人机等设备，形成智能协作网络。技术基础：硬件支
解读目前AI就业岗位——大语言模型（LLM）应用工程师学习路线、就业前景及岗位全解析 AI敲代码的手套 AI岗位介绍人工智能语言模型学习
文章目录前言什么是大语言模型（LLM）应用工程师？岗位职责就业前景如何？行业分布：岗位薪资：未来发展学习路线及所需技能1.基础技能学习2.深入AI技术3.专攻自然语言处理（NLP）4.掌握大语言模型（LLM）开发5.项目部署与性能优化适合本科/研究生什么专业的学生？本科推荐专业研究生推荐方向面试问题总结1.技术基础2.实践问题3.编程面试4.系统设计如何快速入门？1.学习课程：薪资的决定性因素总结
深入理解Aider sends a repo map 超级小龙虾 python
你提到的这个链接（https://aider.chat/2023/10/22/repomap.html）是Aider的官方文档，介绍了一种叫做“RepoMap”（仓库地图）的功能。Aider是一个AI编程辅助工具，主要通过与大语言模型（如GPT或Claude）协作来帮助开发者编辑代码。RepoMap是它提供给LLM的上下文机制，用于提升模型对代码库的理解能力。以下是对这段内容的理解和使用方式的详细
11-数据传输与加密解密技术详解：格式、算法与安全实践只不过是胆小鬼罢了网络安全基础入门安全密码学
在现代Web开发与网络安全领域，数据传输与加密解密技术是保障数据安全和隐私的关键。本文将深入探讨数据传输格式、加密算法、密码存储、代码混淆等关键技术，结合实际案例与最佳实践，为开发者和安全从业者提供全面的指导。一、数据传输格式1.常见数据传输格式1.1JSONJSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式，易于阅读和编写，同时也易于机器解析和生成。JSON支
30-WEB开发：Smarty模板引擎与插件组件的安全应用只不过是胆小鬼罢了 WEB安全开发 web安全
在WEB开发的广阔领域中，模板引擎和插件组件是两个重要的组成部分。它们不仅能够提高开发效率，还能增强项目的可维护性和可扩展性。然而，如果使用不当，也可能带来安全风险。今天，就让我们一起深入探讨Smarty模板引擎和插件组件在WEB开发中的应用与安全问题。一、模板引擎：Smarty的使用与安全1.模板引擎的概念模板引擎是一种将前端界面（HTML）与程序代码（如PHP）分离的解决方案。它的主要目的是让
SpringBoot整合Redis、ApacheSolr和SpringSession 后端springboot
一、简介SpringBoot自从问世以来，以其方便的配置受到了广大开发者的青睐。它提供了各种starter简化很多繁琐的配置。SpringBoot整合Druid、Mybatis已经司空见惯，在这里就不详细介绍了。今天我们要介绍的是使用SpringBoot整合Redis、ApacheSolr和SpringSession。二、SpringBoot整合RedisRedis是大家比较常用的缓存之一，一般R
踩坑实录！Spring AOP切点表达式失效之谜及高效修复攻略 spring-aop
在Java开发的广袤天地里，SpringAOP想必是大家都十分熟悉的利器，它为我们的代码编织了一张强大的横切关注点之网，极大地提升了代码的可维护性和可扩展性。关于SpringAOP的常规使用方法，官方文档https://docs.spring.io/spring-framework/reference/core/aop.html已经有了详尽的阐述，本文就不再赘述。今天，我们将聚焦于一次棘手的Spr
Aider + Llama 3.1：无需编码开发全栈APP 七哥的AI日常 llama
Llama3.1在代码生成方面的卓越表现在代码生成领域，Llama3.1的表现尤为出色，几乎成为了开源模型中的佼佼者。它不仅在代码自动化和生成方面表现突出，还可以作为AI编程助手，帮助调试代码和开发完整的应用程序。在多个基准测试中，Llama3.1的表现几乎与GBT-4Omni和Claude3.5Sonic持平，甚至在某些情况下超越了这些模型。今天我们将展示如何将新的Llama3.1与Aider搭
Flink CDC 在阿里云实时计算Flink版的云上实践 flink大数据实时计算
摘要：本文整理自阿里云高级开发工程师，ApacheFlinkCommitter阮航老师在FlinkForwardAsia2024生产实践（三）专场中的分享，主要分为以下四个方面：一、FlinkCDC&实时计算Flink二、CDCYAML核心功能三、CDCYAML典型应用场景四、Demo&未来规划一、FlinkCDC&实时计算Flink1.1FlinkCDC简介FlinkCDC在经过多个版本的发布后
MATLAB 2024b深度学习工具箱新特性全面解析与DeepSeek大模型集成开发：卷积神经网络、迁移学习算法、时间卷积网络、生成式对抗网络、自编码器、目标检测YOLO模型、语义分割、注意力机制等 WangYan2022 DeepSeek ChatGPT 机器学习/深度学习数据语言 matlab 深度学习 MATLAB 2024b DeepSeek 本地化部署
随着人工智能技术的飞速发展，其与多学科的交叉融合以及在工程实践领域的纵深拓展已成为时代潮流。在这一背景下，MATLAB2024b深度学习工具箱应运而生，凭借架构创新与功能强化，为科研工作者提供了一套全栈式的科研创新与行业应用解决方案，具有重要的时代意义。本教程紧密围绕该版本工具链的三大革新方向展开，致力于助力科研工作者在深度学习领域取得突破性进展。首先，构建了覆盖经典模型与前沿架构的体系化教程，从
全流程ROMS海洋数值建模与多尺度耦合模拟——从Linux开发、模式调试到风暴潮-示踪剂综合应用赵钰老师生态环境水环境气象算法机器学习人工智能深度学习数据分析
ROMS（RegionalOceanModelingSystem）是一种用于模拟区域海洋动力过程的高性能数值模型。它由美国罗格斯大学、加州大学洛杉矶分校等机构联合开发，广泛应用于海洋科学研究、海岸带管理、气候变化评估等领域。ROMS能够模拟海洋环流、温度、盐度、波浪、生态系统等多种过程。以下是ROMS的核心内容：1.ROMS的基本原理控制方程：基于Navier-Stokes方程，考虑地球旋转效应（
AI 应用开发工程师（Agent方向）：打造未来的智能体架构！ AI敲代码的手套 AI岗位介绍人工智能架构
文章目录前言一、什么是AIAgent？为什么它如此重要？二、AIAgent开发工程师到底做什么？三、AIAgent开发工程师需要掌握哪些技能？四、实战项目推荐（附GitHub项目）五、如何入行AIAgent开发？总结前言在AI领域，AIAgent（智能体）正在成为最热门的方向之一。从智能客服到自动化办公助手，再到企业知识管理，AIAgent正在改变人与机器的交互方式。那么，AI应用开发工程师（Ag
python利用selenium实现大麦网抢票的案例奔向理想的星辰大海技术研发 python selenium 开发语言
一、selenium原理介绍Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7,8,9,10,11），MozillaFirefox，Safari，GoogleChrome，Opera，Edge等。这个工具的主要功能包括：测试与浏览器的兼容性——测试应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试
HarmonyOS 之 @Require 装饰器自学指南 harmonyos-next
在HarmonyOS应用开发工作中，我频繁碰到组件初始化传参校验的难题。在复杂的组件嵌套里，要是无法确保必要参数在构造时准确传入，就极易引发运行时错误，而且排查起来费时费力。一次偶然的机会，我接触到了@Require装饰器，它能在编译阶段就对组件构造传参进行严格校验，大大提升了代码的健壮性和开发效率。然而在学习过程中，我发现相关资料零散且缺乏系统性。因此，我决定撰写这篇博客，把自己的学习经验和实践
技术团队评估需求开发成本远超预期，如何应对需求管理
应对技术团队评估需求开发成本远超预期的关键包括重新审视需求范围、优化需求管理流程、加强团队沟通协作、进行风险管理和控制、提升技术团队评估能力。其中，优化需求管理流程尤为关键。根据PMI研究表明，超过50%的项目失败与需求管理不善有关，需求变更和范围蔓延（ScopeCreep）是导致成本超出预期的常见原因。一、重新审视需求范围重新审视和明确需求范围是应对成本超预期的第一步。项目启动初期可能出现需求不
CSS盒子类型详解：让你一次搞懂内外显示类型程序员
CSS盒子类型详解：让你一次搞懂内外显示类型在CSS布局中，盒子类型常常让开发者感到困惑。今天，我们用简单的比喻来彻底理解这个概念。一、盒子的两个维度想象一个快递包裹：外部显示类型决定这个包裹如何在货架上摆放内部显示类型决定包裹里面的物品如何排列1.外部显示类型（OuterDisplayType）决定盒子与其他元素的关系/*区块盒子：独占一层货架*/.block-box{display:block
个人投资者参与场外个股期权的交易流程有哪些步骤？ qiquanjiang 区块链人工智能
场外个股期权是一种独特的金融衍生品，与交易所内交易的期权不同，它通常在非交易所的平台上进行交易。这种期权合约赋予投资者权利，在未来某个时间点以预设的价格购买或出售某一特定股票，下文为大家详细介绍个人投资者参与场外个股期权的交易流程有哪些步骤？本文来自：财顺期权一、个人投资者如何参与场外个股期权下单交易？个人投资者可以通过两种主要方式参与场外个股期权下单交易：‌1.通过机构交易通道：‌大多数个人投资
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement