qq_26562641

gSpan频繁子图挖掘算法

参考资料：http://www.cs.ucsb.edu/~xyan/papers/gSpan.pdf
http://www.cs.ucsb.edu/~xyan/papers/gSpan-short.pdf
http://www.jos.org.cn/1000-9825/18/2469.pdf

http://blog.csdn.net/coolypf/article/details/8263176

更多挖掘算法：https://github.com/linyiqun/DataMiningAlgorithm

介绍

gSpan算法是图挖掘邻域的一个算法，而作为子图挖掘算法，又是其他图挖掘算法的基础，所以gSpan算法在图挖掘算法中还是非常重要的。gSpan算法在挖掘频繁子图的时候，用了和FP-grown中相似的原理，就是Pattern-Grown模式增长的方式，也用到了最小支持度计数作为一个过滤条件。图算法在程序上比其他的算法更加的抽象，在实现时更加需要空间想象能力。gSpan算法的核心就是给定n个图，然后从中挖掘出频繁出现的子图部分。

算法原理

说实话，gSpan算法在我最近学习的算法之中属于非常难的那种，因为要想实现他，必须要明白他的原理，而这就要花很多时间去明白算法的一些定义，比如dfs编码，最右路径这样的概念。所以，我们应该先知道算法整体的一个结构。

1、遍历所有的图，计算出所有的边和点的频度。

2、将频度与最小支持度数做比较，移除不频繁的边和点。

3、重新将剩下的点和边按照频度进行排序，将他们的排名号给边和点进行重新标号。

4、再次计算每条边的频度，计算完后，然后初始化每条边，并且进行此边的subMining()挖掘过程。

subMining的过程

1、根据graphCode重新恢复当前的子图

2、判断当前的编码是否为最小dfs编码，如果是加入到结果集中，继续在此基础上尝试添加可能的边，进行继续挖掘

3、如果不是最小编码，则此子图的挖掘过程结束。

DFS编码

gSpan算法对图的边进行编码，采用E(v0,v1,A,B,a)的方式，v0,v1代表的标识，你可以看做就是点的id,A,B可以作为点的标号，a为之间的边的标号，而一个图就是由这样的边构成的，G{e1, e2, e3,.....}，而dfs编码的方式就是比里面的五元组的元素，我这里采用的规则是，从左往右依次比较大小，如果谁先小于另一方，谁就算小，图的比较算法同样如此，具体的规则可以见我后面代码中的注释。但是这个规则并不是完全一致的，至少在我看的相关论文中有不一样的描述存在。

生成subGraph

生成子图的进行下一次挖掘的过程也是gSpan算法中的一个难点，首先你要对原图进行编码，找到与挖掘子图一致的编码，找到之后，在图的最右路径上寻找可以扩展的边，在最右路径上扩展的情况分为2种，1种为在最右节点上进行扩展，1种为在最右路径的点上进行扩展。2种情况都需要做一定的判断。

算法的技巧

算法在实现时，用的技巧比较多，有些也很不好理解，比如在dfs编码或找子边的过程中，用到了图id对于Edge中的五元组id的映射，这个会一开始没想到，还有怎么去描述一个图通过一定的数据结构。

算法的实现

此算法是借鉴了网上其他版本的实现，我是在看懂了人家代码的基础上，自己对其中的某些部分作了修改之后的。由于代码比较多，下面给出核心代码，全部代码在这里。

GSpanTool.java:

[java]  view plain copy print ? 
     
    
 package DataMining_GSpan;  
   
 import java.io.BufferedReader;  
 import java.io.File;  
 import java.io.FileReader;  
 import java.io.IOException;  
 import java.text.MessageFormat;  
 import java.util.ArrayList;  
 import java.util.HashMap;  
 import java.util.Map;  
   
 /** 
  * gSpan频繁子图挖掘算法工具类 
  *  
  * @author lyq 
  *  
  */  
 public class GSpanTool {  
     // 文件数据类型  
     public final String INPUT_NEW_GRAPH = "t";  
     public final String INPUT_VERTICE = "v";  
     public final String INPUT_EDGE = "e";  
     // Label标号的最大数量，包括点标号和边标号  
     public final int LABEL_MAX = 100;  
   
     // 测试数据文件地址  
     private String filePath;  
     // 最小支持度率  
     private double minSupportRate;  
     // 最小支持度数，通过图总数与最小支持度率的乘积计算所得  
     private int minSupportCount;  
     // 初始所有图的数据  
     private ArrayList<GraphData> totalGraphDatas;  
     // 所有的图结构数据  
     private ArrayList<Graph> totalGraphs;  
     // 挖掘出的频繁子图  
     private ArrayList<Graph> resultGraphs;  
     // 边的频度统计  
     private EdgeFrequency ef;  
     // 节点的频度  
     private int[] freqNodeLabel;  
     // 边的频度  
     private int[] freqEdgeLabel;  
     // 重新标号之后的点的标号数  
     private int newNodeLabelNum = 0;  
     // 重新标号后的边的标号数  
     private int newEdgeLabelNum = 0;  
   
     public GSpanTool(String filePath, double minSupportRate) {  
         this.filePath = filePath;  
         this.minSupportRate = minSupportRate;  
         readDataFile();  
     }  
   
     /** 
      * 从文件中读取数据 
      */  
     private void readDataFile() {  
         File file = new File(filePath);  
         ArrayList<String[]> dataArray = new ArrayList<String[]>();  
   
         try {  
             BufferedReader in = new BufferedReader(new FileReader(file));  
             String str;  
             String[] tempArray;  
             while ((str = in.readLine()) != null) {  
                 tempArray = str.split(" ");  
                 dataArray.add(tempArray);  
             }  
             in.close();  
         } catch (IOException e) {  
             e.getStackTrace();  
         }  
   
         calFrequentAndRemove(dataArray);  
     }  
   
     /** 
      * 统计边和点的频度，并移除不频繁的点边，以标号作为统计的变量 
      *  
      * @param dataArray 
      *            原始数据 
      */  
     private void calFrequentAndRemove(ArrayList<String[]> dataArray) {  
         int tempCount = 0;  
         freqNodeLabel = new int[LABEL_MAX];  
         freqEdgeLabel = new int[LABEL_MAX];  
   
         // 做初始化操作  
         for (int i = 0; i < LABEL_MAX; i++) {  
             // 代表标号为i的节点目前的数量为0  
             freqNodeLabel[i] = 0;  
             freqEdgeLabel[i] = 0;  
         }  
   
         GraphData gd = null;  
         totalGraphDatas = new ArrayList<>();  
         for (String[] array : dataArray) {  
             if (array[0].equals(INPUT_NEW_GRAPH)) {  
                 if (gd != null) {  
                     totalGraphDatas.add(gd);  
                 }  
   
                 // 新建图  
                 gd = new GraphData();  
             } else if (array[0].equals(INPUT_VERTICE)) {  
                 // 每个图中的每种图只统计一次  
                 if (!gd.getNodeLabels().contains(Integer.parseInt(array[2]))) {  
                     tempCount = freqNodeLabel[Integer.parseInt(array[2])];  
                     tempCount++;  
                     freqNodeLabel[Integer.parseInt(array[2])] = tempCount;  
                 }  
   
                 gd.getNodeLabels().add(Integer.parseInt(array[2]));  
                 gd.getNodeVisibles().add(true);  
             } else if (array[0].equals(INPUT_EDGE)) {  
                 // 每个图中的每种图只统计一次  
                 if (!gd.getEdgeLabels().contains(Integer.parseInt(array[3]))) {  
                     tempCount = freqEdgeLabel[Integer.parseInt(array[3])];  
                     tempCount++;  
                     freqEdgeLabel[Integer.parseInt(array[3])] = tempCount;  
                 }  
   
                 int i = Integer.parseInt(array[1]);  
                 int j = Integer.parseInt(array[2]);  
   
                 gd.getEdgeLabels().add(Integer.parseInt(array[3]));  
                 gd.getEdgeX().add(i);  
                 gd.getEdgeY().add(j);  
                 gd.getEdgeVisibles().add(true);  
             }  
         }  
         // 把最后一块gd数据加入  
         totalGraphDatas.add(gd);  
         minSupportCount = (int) (minSupportRate * totalGraphDatas.size());  
   
         for (GraphData g : totalGraphDatas) {  
             g.removeInFreqNodeAndEdge(freqNodeLabel, freqEdgeLabel,  
                     minSupportCount);  
         }  
     }  
   
     /** 
      * 根据标号频繁度进行排序并且重新标号 
      */  
     private void sortAndReLabel() {  
         int label1 = 0;  
         int label2 = 0;  
         int temp = 0;  
         // 点排序名次  
         int[] rankNodeLabels = new int[LABEL_MAX];  
         // 边排序名次  
         int[] rankEdgeLabels = new int[LABEL_MAX];  
         // 标号对应排名  
         int[] nodeLabel2Rank = new int[LABEL_MAX];  
         int[] edgeLabel2Rank = new int[LABEL_MAX];  
   
         for (int i = 0; i < LABEL_MAX; i++) {  
             // 表示排名第i位的标号为i，[i]中的i表示排名  
             rankNodeLabels[i] = i;  
             rankEdgeLabels[i] = i;  
         }  
   
         for (int i = 0; i < freqNodeLabel.length - 1; i++) {  
             int k = 0;  
             label1 = rankNodeLabels[i];  
             temp = label1;  
             for (int j = i + 1; j < freqNodeLabel.length; j++) {  
                 label2 = rankNodeLabels[j];  
   
                 if (freqNodeLabel[temp] < freqNodeLabel[label2]) {  
                     // 进行标号的互换  
                     temp = label2;  
                     k = j;  
                 }  
             }  
   
             if (temp != label1) {  
                 // 进行i，k排名下的标号对调  
                 temp = rankNodeLabels[k];  
                 rankNodeLabels[k] = rankNodeLabels[i];  
                 rankNodeLabels[i] = temp;  
             }  
         }  
   
         // 对边同样进行排序  
         for (int i = 0; i < freqEdgeLabel.length - 1; i++) {  
             int k = 0;  
             label1 = rankEdgeLabels[i];  
             temp = label1;  
             for (int j = i + 1; j < freqEdgeLabel.length; j++) {  
                 label2 = rankEdgeLabels[j];  
   
                 if (freqEdgeLabel[temp] < freqEdgeLabel[label2]) {  
                     // 进行标号的互换  
                     temp = label2;  
                     k = j;  
                 }  
             }  
   
             if (temp != label1) {  
                 // 进行i，k排名下的标号对调  
                 temp = rankEdgeLabels[k];  
                 rankEdgeLabels[k] = rankEdgeLabels[i];  
                 rankEdgeLabels[i] = temp;  
             }  
         }  
   
         // 将排名对标号转为标号对排名  
         for (int i = 0; i < rankNodeLabels.length; i++) {  
             nodeLabel2Rank[rankNodeLabels[i]] = i;  
         }  
   
         for (int i = 0; i < rankEdgeLabels.length; i++) {  
             edgeLabel2Rank[rankEdgeLabels[i]] = i;  
         }  
   
         for (GraphData gd : totalGraphDatas) {  
             gd.reLabelByRank(nodeLabel2Rank, edgeLabel2Rank);  
         }  
   
         // 根据排名找出小于支持度值的最大排名值  
         for (int i = 0; i < rankNodeLabels.length; i++) {  
             if (freqNodeLabel[rankNodeLabels[i]] > minSupportCount) {  
                 newNodeLabelNum = i;  
             }  
         }  
         for (int i = 0; i < rankEdgeLabels.length; i++) {  
             if (freqEdgeLabel[rankEdgeLabels[i]] > minSupportCount) {  
                 newEdgeLabelNum = i;  
             }  
         }  
         //排名号比数量少1，所以要加回来  
         newNodeLabelNum++;  
         newEdgeLabelNum++;  
     }  
   
     /** 
      * 进行频繁子图的挖掘 
      */  
     public void freqGraphMining() {  
         long startTime =  System.currentTimeMillis();  
         long endTime = 0;  
         Graph g;  
         sortAndReLabel();  
   
         resultGraphs = new ArrayList<>();  
         totalGraphs = new ArrayList<>();  
         // 通过图数据构造图结构  
         for (GraphData gd : totalGraphDatas) {  
             g = new Graph();  
             g = g.constructGraph(gd);  
             totalGraphs.add(g);  
         }  
   
         // 根据新的点边的标号数初始化边频繁度对象  
         ef = new EdgeFrequency(newNodeLabelNum, newEdgeLabelNum);  
         for (int i = 0; i < newNodeLabelNum; i++) {  
             for (int j = 0; j < newEdgeLabelNum; j++) {  
                 for (int k = 0; k < newNodeLabelNum; k++) {  
                     for (Graph tempG : totalGraphs) {  
                         if (tempG.hasEdge(i, j, k)) {  
                             ef.edgeFreqCount[i][j][k]++;  
                         }  
                     }  
                 }  
             }  
         }  
   
         Edge edge;  
         GraphCode gc;  
         for (int i = 0; i < newNodeLabelNum; i++) {  
             for (int j = 0; j < newEdgeLabelNum; j++) {  
                 for (int k = 0; k < newNodeLabelNum; k++) {  
                     if (ef.edgeFreqCount[i][j][k] >= minSupportCount) {  
                         gc = new GraphCode();  
                         edge = new Edge(0, 1, i, j, k);  
                         gc.getEdgeSeq().add(edge);  
   
                         // 将含有此边的图id加入到gc中  
                         for (int y = 0; y < totalGraphs.size(); y++) {  
                             if (totalGraphs.get(y).hasEdge(i, j, k)) {  
                                 gc.getGs().add(y);  
                             }  
                         }  
                         // 对某条满足阈值的边进行挖掘  
                         subMining(gc, 2);  
                     }  
                 }  
             }  
         }  
           
         endTime = System.currentTimeMillis();  
         System.out.println("算法执行时间"+ (endTime-startTime) + "ms");  
         printResultGraphInfo();  
     }  
   
     /** 
      * 进行频繁子图的挖掘 
      *  
      * @param gc 
      *            图编码 
      * @param next 
      *            图所含的点的个数 
      */  
     public void subMining(GraphCode gc, int next) {  
         Edge e;  
         Graph graph = new Graph();  
         int id1;  
         int id2;  
   
         for(int i=0; i<next; i++){  
             graph.nodeLabels.add(-1);  
             graph.edgeLabels.add(new ArrayList<Integer>());  
             graph.edgeNexts.add(new ArrayList<Integer>());  
         }  
   
         // 首先根据图编码中的边五元组构造图  
         for (int i = 0; i < gc.getEdgeSeq().size(); i++) {  
             e = gc.getEdgeSeq().get(i);  
             id1 = e.ix;  
             id2 = e.iy;  
   
             graph.nodeLabels.set(id1, e.x);  
             graph.nodeLabels.set(id2, e.y);  
             graph.edgeLabels.get(id1).add(e.a);  
             graph.edgeLabels.get(id2).add(e.a);  
             graph.edgeNexts.get(id1).add(id2);  
             graph.edgeNexts.get(id2).add(id1);  
         }  
   
         DFSCodeTraveler dTraveler = new DFSCodeTraveler(gc.getEdgeSeq(), graph);  
         dTraveler.traveler();  
         if (!dTraveler.isMin) {  
             return;  
         }  
   
         // 如果当前是最小编码则将此图加入到结果集中  
         resultGraphs.add(graph);  
         Edge e1;  
         ArrayList<Integer> gIds;  
         SubChildTraveler sct;  
         ArrayList<Edge> edgeArray;  
         // 添加潜在的孩子边，每条孩子边所属的图id  
         HashMap<Edge, ArrayList<Integer>> edge2GId = new HashMap<>();  
         for (int i = 0; i < gc.gs.size(); i++) {  
             int id = gc.gs.get(i);  
   
             // 在此结构的条件下，在多加一条边构成子图继续挖掘  
             sct = new SubChildTraveler(gc.edgeSeq, totalGraphs.get(id));  
             sct.traveler();  
             edgeArray = sct.getResultChildEdge();  
   
             // 做边id的更新  
             for (Edge e2 : edgeArray) {  
                 if (!edge2GId.containsKey(e2)) {  
                     gIds = new ArrayList<>();  
                 } else {  
                     gIds = edge2GId.get(e2);  
                 }  
   
                 gIds.add(id);  
                 edge2GId.put(e2, gIds);  
             }  
         }  
   
         for (Map.Entry entry : edge2GId.entrySet()) {  
             e1 = (Edge) entry.getKey();  
             gIds = (ArrayList<Integer>) entry.getValue();  
   
             // 如果此边的频度大于最小支持度值，则继续挖掘  
             if (gIds.size() < minSupportCount) {  
                 continue;  
             }  
   
             GraphCode nGc = new GraphCode();  
             nGc.edgeSeq.addAll(gc.edgeSeq);  
             // 在当前图中新加入一条边，构成新的子图进行挖掘  
             nGc.edgeSeq.add(e1);  
             nGc.gs.addAll(gIds);  
   
             if (e1.iy == next) {  
                 // 如果边的点id设置是为当前最大值的时候，则开始寻找下一个点  
                 subMining(nGc, next + 1);  
             } else {  
                 // 如果此点已经存在，则next值不变  
                 subMining(nGc, next);  
             }  
         }  
     }  
       
     /** 
      * 输出频繁子图结果信息 
      */  
     public void printResultGraphInfo(){  
         System.out.println(MessageFormat.format("挖掘出的频繁子图的个数为：{0}个", resultGraphs.size()));  
     }  
   
 }  

这个算法在后来的实现时，渐渐的发现此算法的难度大大超出我预先的设想，不仅仅是其中的抽象性，还在于测试的复杂性，对于测试数据的捏造，如果用的是真实数据测的话，数据量太大，自己造数据拿捏的也不是很准确。我最后也只是自己伪造了一个图的数据，挖掘了其中的一条边的情况。大致的走了一个过程。代码并不算是完整的，仅供学习。

算法的缺点

在后来实现完算法之后，我对于其中的小的过程进行了分析，发现这个算法在2个深度优先遍历的过程中还存在问题，就是DFS判断是否最小编码和对原图进行寻找相应编码，的时候，都只是限于Edge中边是连续的情况，如果不连续了，会出现判断出错的情况，因为在最右路径上添加边，就是会出现在前面的点中多扩展一条边，就不会是连续的。而在上面的代码中是无法处理这样的情况的，个人的解决办法是用栈的方式，将节点压入栈中实现最好。

算法的体会

这个算法花了很多的时间，关关理解这个算法就已经不容易了，经常需要我在脑海中去刻画这样的图形和遍历的一些情况，带给我的挑战还是非常的大吧。

算法的特点

此算法与FP-Tree算法类似，在挖掘的过程中也是没有产生候选集的，采用深度优先的挖掘方式，一步一步进行挖掘。gSpan算法可以进行对于化学分子的结构挖掘。

C++入门笔记张峻铖 C++c++
写在开头初衷：对于一个程序员/算法工程师来说，只会Python未免过于单薄了。出于未来找工作的需要，开始学习C++，并使用C++刷LeetCode。背景：本科有C语言课程，甚至学过汇编，研究生阶段主要使用Python。提醒：该系列文章以尽可能快地应用C++（刷题）为目的，暂以B站黑马程序员C++教程为教材，主要记录重点内容和对个人来讲不易理解或陌生的内容，具有较浓的个人笔记特点，因此，在全面性和权
【5分钟力扣】1160.拼写单词（python3实现）金鞍少年金鞍少年的刷题之路字符串 leetcode 力扣1160题 python拼写单词
文章目录一、前言二、题目三、哈希表解法3.1哈希表基本概念3.2解题思路3.3代码实例四、字符串比较解法4.1解题思路4.2代码实例一、前言如果放弃太早，你永远都不知道自己会错过什么。每天五分钟，看懂一道简单、中等难度的算法题，尽可能将复杂的题讲清楚。疯狂学习python中，2020-07-20更新二、题目给你一份『词汇表』（字符串数组）words和一张『字母表』（字符串）chars。假如你可以用
Open3D 进阶（31）渐进三角网(PTD)地面滤波点云侠点云进阶线性代数算法计算机视觉 python
目录一、算法原理1、PTD算法2、实现流程二、代码实现三、参数指南四、结果展示。一、算法原理1、PTD算法渐进三角网地面滤波算法（ProgressiveTINDensification,PTD）是一种广泛应用于机载LiDAR点云数据处理的滤波方法，旨在从复杂场景中精确分离地面点，以生成数字高程模型（DEM）。2、实现流程 PTD的核心思想是迭代加密三角网，逐步逼近真实地形：实现流程主要包括以
怎么对教育视频进行加密？提高视频的安全性！菜包eo 音视频
前言在数字教育蓬勃发展的当下，知识版权保护成为行业核心命题。教育视频作为知识传播的重要载体，其加密技术的优劣直接关乎机构的核心竞争力与用户权益。本文将深入剖析高安全性视频加密方案，解锁教育内容防护的关键密码。一、VRM分片错序视频加密采用分布式编码技术，将视频文件物理切片，每片视频进行多种算法混合型加密，同时结合独立研制密码本，将关键数据进行错序混淆，对视频文件进行最高级别加密，这样经过加密的视频
极限与配合念致达互换性与技术测量机电专业必修课程
极限与配合术语及概念公称尺寸（基本尺寸）实际尺寸极限尺寸实际偏差极限偏差尺寸公差（Th,Ts）尺寸公差带图配合间隙与过盈配合的种类1.间隙配合2.过盈配合3.过渡配合配合公差（T~f~）公差与配合国家标准标准公差系列公差单位：公差等级基本偏差系列基本偏差基本偏差代号孔轴公差带代号、公差带标注、配合代号公差带代号公差带表示配合代号术语及概念公称尺寸（基本尺寸）设计时给定的尺寸符号：孔（D）轴（d）实
C++实现一个基于多态的职工管理系统（附源码） loveCC_orange C/C++c++面试华为后端开发多态
之前为了找实习，学了Python，刷了五六十道算法题，然后就开始投简历面试了，结果就是各个大厂一轮游，要Python开发的岗位又少的可怜。但所幸华为的实习面试通过了~本来以为这样就可以等着拿offer了，结果泡池子失败，今年华为的RAN研究部offer数量缩水，由于没在前四之列，所以就被pass掉了。然后又重新开始海投简历找实习。在无数次碰壁之后，深感自己才疏学浅，学的东西还是太少了。于是继续刷题
【AI大模型】26、算力受限下的模型工程：从LoRA到弹性智能系统的优化实践无心水 AI大模型人工智能搜索引擎 LoRA 大语言模型微调模型压缩知识蒸馏量化技术
引言：算力瓶颈与模型工程的突围之路在人工智能领域，大语言模型的发展正呈现出参数规模爆炸式增长的趋势。从GPT-3的1750亿参数到PaLM的5400亿参数，模型能力的提升往往伴随着对算力资源的极度渴求。然而，对于大多数企业和研究者而言，动辄数百GB的显存需求、数十万块GPU的训练集群显然是难以企及的"算力鸿沟"。当面对"无米之炊"的困境时，模型工程技术成为突破算力瓶颈的核心路径——通过算法创新而非
Python编程：使用 YOLO 目标检测倔强老吕 python 开发语言
YOLO（YouOnlyLookOnce）是一种基于深度学习的实时目标检测算法，由JosephRedmon等人于2016年首次提出。与传统的两阶段目标检测方法（如R-CNN系列）不同，YOLO将目标检测任务视为一个单一的回归问题，直接在图像上进行一次推理即可预测边界框和类别概率。YOLO的核心思想单次前向传播（SingleShotDetection）：YOLO只需对输入图像进行一次神经网络推理，就
基于YOLOv8和Faster R-CNN的输电线路异物目标检测项目检测输电线异物数据集输电线缺陷数据集绝缘子如何使用YOLOv8和Faster R-CNN训练输电线路异物目标检测数据集 QQ67658008 YOLO r语言 cnn 输电线路绝缘子线路异物目标检测
电力篇-输电线路缺陷数据集输电线路异物目标检测数据集16000张5种检测目标：‘burst’-爆裂‘defect’-缺陷‘foreign_obj’-异物‘insulator’-绝缘体‘nest’-窝（巢）带标注-YOLO格式可直接用于YOLO系列目标检测算法模型训练如何使用YOLOv8和FasterR-CNN训练输电线路异物目标检测数据集的详细步骤和代码。假设数据集包含16000张图片和5种检测目
【北上广深杭大厂编程面试题】C++篇...这里介绍C++是如何实现多态的？（三）努力毕业的小土博^_^ 计算机基础知识和编程 c++面试 java 开发语言职场和发展
【北上广深杭大厂编程面试题】C++篇…这里介绍C++是如何实现多态的？（三）【北上广深杭大厂编程面试题】C++篇…这里介绍C++是如何实现多态的？（三）文章目录【北上广深杭大厂编程面试题】C++篇...这里介绍C++是如何实现多态的？（三）前言3.纯虚函数与抽象类示例代码：纯虚函数与抽象类输出：4.虚函数的动态绑定与vtablevtable工作原理：总结欢迎铁子们点赞、关注、收藏！祝大家逢考必过！
不懂的还在争论AI，懂行的已用Python+DeepSeek变现！逆袭机会就在AI应用层渡难繁辰 python开发人工智能拥抱AI 人工智能 python ai
最近总有种错觉：AI时代轰轰烈烈，普通人却只能当看客？大模型训练动辄千万美金，算法高深莫测，似乎离我们太远。别急，AI真正的革命性力量，正从神秘实验室涌向普通人的键盘——它的名字叫“AI应用层”。而拿到这张船票的钥匙，就是你早该学起来的：Python。当质疑者还在争论“AI能否取代人类”，行动派已用DeepSeek+LangChain开发智能应用月入五位数！巨头烧钱搭台，我们轻量唱戏！科技大佬砸重
【学习】《算法图解》第六章学习笔记：广度优先搜索自学也学好编程程序人生
前言《算法图解》第六章为我们介绍了一种基础且强大的图搜索算法——**广度优先搜索(Breadth-FirstSearch,BFS)**。这种算法能够系统地探索图中的节点，常用于解决两类核心问题：一是判断从一个节点到另一个节点是否存在路径；二是在无权图中找到两个节点之间的最短路径。本笔记将深入探讨图的基本概念、BFS的工作原理、其实现方式以及相关的性能分析。一、图（Graph）简介在讨论BFS之前，
MATLAB算法实战应用案例精讲-【数模应用】主效应&交互效应&单独效应林聪木 matlab 算法开发语言
目录前言几个相关概念因素和水平主效应单纯主效应交互作用效应或影响（effect）因素之间的相互制约和影响两因素交互作用三因素及多因素交互作用几个高频面试题目什么是主效应,交互效应,单独效应？回归分析中是必须加入控制变量的吗？如果假如控制变量之后，显著性不高了该怎么办？控制变量说明控制变量选择控制变量处理主效应和交互效应的联系与区别如何依据主效应和交互效应描述结果？算法原理数学模型主效应二分变量交互
【学习】《算法图解》第七章学习笔记：树自学也学好编程程序人生
前言在前面的章节中，我们学习了数组、链表、散列表等基本数据结构，以及一些基础算法。本章将介绍一种非常重要的数据结构——树(Tree)，特别是二叉搜索树(BinarySearchTree)。树结构在计算机科学中应用广泛，从文件系统到数据库再到人工智能，都能看到树的身影。《算法图解》第七章深入浅出地介绍了树的基本概念、实现和应用，帮助读者理解这一关键数据结构。一、树的基本概念（一）什么是树树是一种分层
Git Worktree 实现 “一边修生产Bug，一边写新需求” 代码里的小猫咪 git git Worktree
1.什么是GitWorktree？传统Git切换分支时，工作区会完全覆盖当前文件。GitWorktree允许在同一个Git仓库中创建多个工作目录，每个工作目录可以独立地检出不同的分支。这意味着可以在一个仓库中同时处理多个任务，而不需要频繁地切换分支。实现：并行开发：同时在不同分支写代码、运行测试隔离环境：每个工作区独立编译/调试互不影响零切换成本：无需gitstash保存临时状态2.核心操作1.创
常见排序方法大全实相无相算法排序算法数据结构
这篇文章主要讨论各种常见的排序算法，包括冒泡排序、插入排序、选择排序、快速排序、堆排序、希尔排序、归并排序、基数排序等。每种排序算法都有它自己的特点。本文将对这些算法的工作原理、特点、时间复杂度等方面进行介绍，并且给出实现示例。一：基本定义冒泡排序（BubbleSort）：是一种简单的排序算法，它重复地走访过要排序的数列，一次比较两个元素，如果它们的顺序错误就把它们交换过来。插入排序（Insert
【机器学习&深度学习】前馈神经网络（单隐藏层）一叶千舟深度学习【理论】机器学习深度学习神经网络
目录一、什么是前馈神经网络？二、数学表达式是什么？三、为什么需要“非线性函数”？四、NumPy实现前馈神经网络代码示例五、运行结果六、代码解析6.1初始化部分6.2前向传播6.3计算损失（Loss）6.4反向传播（手动）6.5更新参数（梯度下降）6.6循环训练七、训练过程可视化（思维图）八、关键问题答疑Q1：为什么需要隐藏层？Q2：ReLU是干嘛的？Q3：学习率怎么选？九、总结学习建议在机器学习中
【通过 emit() 触发的自定义事件】软件205 VUE3API 前端 javascript 开发语言
@[TOC](通过emit()触发的自定义事件)子组件搜索重置constemit=defineEmits();.item-search{margin-left:12px;}父组件使用importFormSearchfrom"@/components/FormSearch/index.vue";consthandleQuery=()=>{console.log("搜索参数:",{...queryPa
Python性能优化指南：让你的代码提速10倍的实用技巧天天进步2015 python python
Python以其简洁易用著称，但在性能方面常被诟病。其实，通过一些实用的优化技巧，你的Python代码性能完全可以提升数倍甚至十倍。本文将结合实际经验，系统介绍Python性能优化的常见思路与方法，并给出具体案例，助你写出高效的Python程序。1.算法与数据结构优化优先选择合适的数据结构：如查找用set/dict，顺序存储用list。避免不必要的嵌套循环，能用集合操作、字典映射解决的，绝不用暴力
【行云流水a】淘天联合爱橙开源强化学习训练框架ROLL OpenRL/openrl PPO-for-Beginners: 从零开始实现强化学习算法PPO 强化学习框架verl 港大等开源GoT-R1 行云流水AI笔记开源算法
以下是DQN（DeepQ-Network）和PPO（ProximalPolicyOptimization）的全面对比流程图及文字解析。两者是强化学习的核心算法，但在设计理念、适用场景和实现机制上有显著差异：graphTDA[对比维度]-->B[算法类型]A-->C[策略表示]A-->D[动作空间]A-->E[学习机制]A-->F[探索方式]A-->G[稳定性]A-->H[样本效率]A-->I[关键
LeetCode Hot100(二分） asom22 LeetCode Hot100 题解 leetcode 算法职场和发展
35.搜索插入位置题意给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。请必须使用时间复杂度为O(logn)的算法。题解首先理解二分的做法，我们对于一个有序的序列，每一次都查询他中间的位置，如果当前位置大于他，那就肯定在大于他的那侧，反之就在他小于他的那侧，代码实现如下代码importjava.util.ArrayList;im
微软人工智能证书AI-102 | 如何快速通过？全球认证考试中心人工智能微软
微软AI-102考试，全称“DesigningandImplementingaMicrosoftAzureAISolution”，是微软推出的用于验证考生在Azure平台上设计和实施AI解决方案核心能力的认证考试。以下是具体介绍：考试描述：考试主要衡量考生实施计划和管理Azure认知服务解决方案、计算机视觉解决方案、自然语言处理解决方案、知识挖掘解决方案、对话式AI解决方案的能力。考试题型通常包括
DAY 41 简单CNN yizhimie37 python训练营打卡笔记深度学习
@浙大疏锦行https://blog.csdn.net/weixin_45655710知识回顾数据增强卷积神经网络定义的写法batch归一化：调整一个批次的分布，常用与图像数据特征图：只有卷积操作输出的才叫特征图调度器：直接修改基础学习率卷积操作常见流程如下：1.输入→卷积层→Batch归一化层（可选）→池化层→激活函数→下一层Flatten->Dense(withDropout，可选)->Den
随机近似算法：步长序列选择的理论与金融实践
随机近似算法：步长序列选择的理论与金融实践摘要随机近似算法作为统计学习与优化的核心工具，其收敛性与稳定性高度依赖步长序列的设计。本文系统阐述步长序列的理论约束与工程选择策略，并结合金融波动率估计场景，展示算法在动态系统参数估计中的实践价值。1.随机近似算法的数学框架随机近似算法通过随机样本的迭代更新逼近目标参数，其核心迭代式为：θn+1=θn+an(Yn−g(θn))\theta_{n+1}=\t
浏览器的垃圾回收机制甘露寺 js 浏览器 javascript 前端
深入解析现代浏览器的垃圾回收机制：分代回收与标记清除算法本文详细探讨了Chrome、Firefox等现代浏览器中JavaScript引擎的垃圾回收（GC）原理，重点讲解分代回收策略和标记清除/整理算法的工作流程，并通过示例帮助理解内存自动管理背后的机制。为什么需要垃圾回收？JavaScript是一种自动内存管理的语言。开发者通常不需要手动分配或释放内存（如C/C++中的malloc/free）。这
点云从入门到精通技术详解100篇-点云滤波算法及单木信息提取格图素书人工智能
目录知识储备点云滤波算法及单木信息提取点云条件滤波单木信息提取1.点云预处理2.点云密度计算3.密度阈值筛选4.骨架提取5.骨架细化优化方向前言国内外研究现状激光雷达研究现状点云数据的滤波算法研究现状单木分割应用现状LiDAR工作原理与点云数据的组成2.1LiDAR系统的内部结构2.1.1激光测距单元2.1.2光学机械扫描单元2.1.3惯性导航系统INS2.1.4动态差分GPS2.2定位原理2.3
Golang动态路由实现：灵活处理URL路径 Golang编程笔记 Golang编程笔记 Golang开发实战 golang 开发语言后端 ai
Golang动态路由实现：灵活处理URL路径关键词：Golang动态路由、URL路径处理、参数化路由、通配符匹配、路由算法、HTTP框架、RESTful设计摘要：本文深入探讨Golang中动态路由的实现原理与实践方法，从基础概念到复杂场景逐步解析。通过对比标准库与第三方框架的路由机制，详细讲解参数捕获、通配符匹配、正则表达式路由等核心技术。结合具体代码示例演示如何构建高性能路由系统，涵盖路由匹配算
动态规划之01背包问题蓝澈1121 数据结构与算法动态规划算法 java
动态规划算法动态规划算法介绍动态规划(DynamicProgramming)算法的核心思想是：将大问题划分为小问题进行解决，从而一步步获取最优解的处理算法动态规划算法与分治法类似，其基本思想也是将待解决问题分解成若干个子问题，先求解子问题，然后从这些子问题的解得到原问题的解与分治法不同的是，适合于动态规划求解的问题。经分解得到子问题往往不是互相独立的。（即下一个子阶段的求解是建立在上一个子阶段的基
《网络攻防技术》《数据分析与挖掘》《网络体系结构与安全防护》这三个研究领域就业如何？扣棣编程其他网络数据分析安全
这几个研究领域都是当前信息技术领域的热点方向，就业前景总体来说都非常不错，但各有侧重和特点。我来帮你详细分析一下：1.网络攻防技术就业前景：非常火热且持续增长。核心方向：渗透测试、漏洞挖掘与分析、恶意软件分析、入侵检测/防御、应急响应、威胁情报、安全审计、红蓝对抗等。市场需求：极高。数字化转型深入、网络攻击日益频繁和复杂（勒索软件、APT攻击、供应链攻击等）、数据安全与隐私保护法规（如GDPR、中
核密度估计KDE和概率密度函数PDF（深入浅出）赵孝正深度学习数学基础 pdf KDE
目录1.和密度估计（KDE）核密度估计的基本原理核密度估计的公式核密度估计的应用Python中的KDE实现示例代码结果解释解释结果总结2.概率密度函数（PDF）概率密度函数（PDF）是怎么工作的：用图画来解释解释这个图：问题解答：总结3.核密度估计（KDE）和概率密度函数（PDF）之间的关系故事开始：第一种方法：概率密度函数（PDF）第二种方法：核密度估计（KDE）总结一下：问题解答：1.和密度估
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源