BQW_

【图表示学习】实现DeepWalk

DeepWalk是一种图嵌入算法，其原理见【图表示学习】word2vec与DeepWalk

DeepWalk的源代码Github为https://github.com/phanein/deepwalk

本文是对源代码的简化和重新整理，方便读者可以快速的理解DeepWalk的原理

源代码包含了并行处理、数据序列化来处理大规模的数据，但是本文将这部分删除

源代码主要在文件夹deepwalk下，代码入口为文件__main__.py；数据在文件夹example_graphs

from six import iterkeys
from six.moves import range, zip, zip_longest
from collections import defaultdict, Iterable
from scipy.io import loadmat
from scipy.sparse import issparse
from gensim.models import Word2Vec, KeyedVectors
from sklearn.utils import shuffle as skshuffle
from sklearn.preprocessing import MultiLabelBinarizer
from sklearn.utils import shuffle as skshuffle
from sklearn.multiclass import OneVsRestClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import f1_score

import random
import numpy

import warnings
warnings.filterwarnings('ignore')

D:\work\Anaconda3\lib\site-packages\ipykernel_launcher.py:3: DeprecationWarning: Using or importing the ABCs from 'collections' instead of from 'collections.abc' is deprecated, and in 3.8 it will stop working
  This is separate from the ipykernel package so we can avoid doing imports until

一、定义图的数据结构

使用邻接表的方式存储图

class Graph(defaultdict):
    """
    以字典的形式存储图信息(也就是邻接表)，其中key是结点的编号，value是相邻结点编号组成的list
    """
    def __init__(self):
        super(Graph, self).__init__(list)
        
    def nodes(self):
        """返回图中的所有结点"""
        return self.keys()
    
    def adjacency_iter(self):
        """返回邻接表"""
        return self.items()
    
    def subgraph(self, nodes={}):
        """给定顶点集合nodes，返回对于的子图"""
        subgraph = Graph()
        for n in nodes:
            if n in self:
                subgraph[n] = [x for x in self[n] if x in nodes]
        return subgraph
    
    def check_self_loops(self):
        """检测自循环(也就是某个结点的相邻节点包含自己的情况)"""
        for x in self:
            for y in self[x]:
                if x==y:
                    return True
    
    def remove_self_loops(self):
        """删除自循环"""
        for x in self:
            if x in self[x]:
                self[x].remove(x)
        return self
    
    def make_consistent(self):
        """对邻接表中的相邻节点进行排序并去除自循环"""
        for k in iterkeys(self):
            self[k] = list(sorted(set(self[k])))
        self.remove_self_loops()
        return self
    
    def make_undirected(self):
        """转换为无向图"""
        for v in list(self):
            for other in self[v]:
                if v != other:
                    self[other].append(v)
        self.make_consistent()
        return self
    
    def has_edge(self, v1, v2):
        """判断两顶点间是否有边"""
        if v2 in self[v1] or v1 in self[v2]:
            return True
        return False
    
    def degree(self, nodes=None):
        """返回给定顶点的度"""
        if isinstance(nodes, Iterable):
            return {v:len(self[v]) for v in nodes}
        else:
            return len(self[nodes])
        
    def order(self):
        return len(self)
    
    def number_of_edges(self):
        """图中边的数目"""
        return sum([self.degree(x) for x in self.keys()])/2 # 所有顶点度的和再除以2
    
    def number_of_nodes(self):
        """图中顶点的数目"""
        return self.order()
    
    def random_walk(self, path_length, alpha=0, rand=random.Random(), start=None):
        """
        返回截断随机游走
        path_length:随机游走的长度
        alpha:重新开始的概率
        start:随机游走的起点
        """
        G = self
        if start:
            path = [start]
        else:
            path = [rand.choice(list(G.keys()))]
            
        while len(path)<path_length:
            cur = path[-1]
            # 度大于0的点，也就是有相邻节点的点
            if len(G[cur]) > 0:
                if rand.random() >= alpha:
                    path.append(rand.choice(G[cur]))
                else:
                    # 以一定的概率重新回到出发顶点
                    path.append(path[0])
            else:
                break
        return [str(node) for node in path]

二、加载数据为Graph对象

1.辅助函数

def grouper(n, iterable, padvalue=None):
    "grouper(3, 'abcdefg', 'x') --> ('a','b','c'), ('d','e','f'), ('g','x','x')"
    return zip_longest(*[iter(iterable)]*n, fillvalue=padvalue)

2.加载邻接表数据(adjlist)

数据格式为：

1 2 3 4 5 6 7 8 9 11 12 13 14 18 20 22 32

2 1 3 4 8 14 18 20 22 31

3 1 2 4 8 9 10 14 28 29 33

4 1 2 3 8 13 14

5 1 7 11

6 1 7 11 17

其中每行的第一个数表示图中的某个点，后面一系列数表示与该点相邻的点。

def load_adjacencylist(file_, undirected=False, chunksize=10000,unchecked=True):
    """
    每chunksize个顶点的连接信息为一个chunk
    """
    parse_func = parse_adjacencylist_unchecked
    convert_func = from_adjlist_unchecked
        
    adjlist = []
    with open(file_) as f:
        for idx, adj_chunk in enumerate(map(parse_func, grouper(int(chunksize), f))):
            adjlist.extend(adj_chunk)
    G = convert_func(adjlist)
    
    # 转换为无向图
    if undirected:
        G = G.make_undirected()
        
    return G

def parse_adjacencylist_unchecked(f):
    """
    输入：('1 2 3', '2 1','3 1')
    输出：[[1,2,3],[2,1],[3,1]]
    """
    adjlist = []
    for l in f:
        if l and l[0] != "#":
            adjlist.extend([[int(x) for x in l.strip().split()]])
    return adjlist

def from_adjlist_unchecked(adjlist):
    """
    输入：[[1,2,3],[2,1],[3,1]]
    输出：实例化Graph，例如{1:[2,3],2:[1],3:[1]}
    """
    G = Graph()
    for row in adjlist:
        node = row[0]
        neighbors = row[1:]
        G[node] = neighbors
    return G

G1 = load_adjacencylist('./data/karate.adjlist')
print(G1)

Graph(, {1: [2, 3, 4, 5, 6, 7, 8, 9, 11, 12, 13, 14, 18, 20, 22, 32], 2: [1, 3, 4, 8, 14, 18, 20, 22, 31], 3: [1, 2, 4, 8, 9, 10, 14, 28, 29, 33], 4: [1, 2, 3, 8, 13, 14], 5: [1, 7, 11], 6: [1, 7, 11, 17], 7: [1, 5, 6, 17], 8: [1, 2, 3, 4], 9: [1, 3, 31, 33, 34], 10: [3, 34], 11: [1, 5, 6], 12: [1], 13: [1, 4], 14: [1, 2, 3, 4, 34], 15: [33, 34], 16: [33, 34], 17: [6, 7], 18: [1, 2], 19: [33, 34], 20: [1, 2, 34], 21: [33, 34], 22: [1, 2], 23: [33, 34], 24: [26, 28, 30, 33, 34], 25: [26, 28, 32], 26: [24, 25, 32], 27: [30, 34], 28: [3, 24, 25, 34], 29: [3, 32, 34], 30: [24, 27, 33, 34], 31: [2, 9, 33, 34], 32: [1, 25, 26, 29, 33, 34], 33: [3, 9, 15, 16, 19, 21, 23, 24, 30, 31, 32, 34], 34: [9, 10, 14, 15, 16, 19, 20, 21, 23, 24, 27, 28, 29, 30, 31, 32, 33]})

3.加载边表数据(edgelist)

数据格式为：

0 1

0 2

3 7

3 8

其中每一行代表连接两个顶点的边。

def load_edgelist(file_, undirected=True):
    G = Graph()
    with open(file_) as f:
        for l in f: # 读取每行的数据
            x, y = l.strip().split()[:2]
            x = int(x)
            y = int(y)
            G[x].append(y)
            if undirected: # 无向图，则加相反的边
                G[y].append(x)
    G.make_consistent()
    return G
G2 = load_edgelist("./data/p2p-Gnutella08.edgelist")
print(G2.number_of_nodes())

4.加载邻接矩阵数据(mat)

def load_matfile(file_, variable_name="network", undirected=True):
    mat_varables = loadmat(file_)
    mat_matrix = mat_varables[variable_name]
    return from_numpy(mat_matrix, undirected)

def from_numpy(x, undirected=True):
    G = Graph()
    # 如果是稀疏矩阵格式
    if issparse(x):
        cx = x.tocoo() # 转换为coo matrix形式
        for i,j,v in zip(cx.row, cx.col, cx.data):
            G[i].append(j)
    else:
        raise Exception("Dense matrices not yet supported.")
    if undirected:
        G.make_undirected()

    G.make_consistent()
    return G

G3 = load_matfile("./data/blogcatalog.mat")
print(G3.number_of_nodes())

三、生成语料

1.参数

seed = 0
number_walks = 80 # 在全图上执行随机游走的次数(每次都会对图中的所有点进行随机游走)
walk_length = 40 # 随机游走的长度
num_walks = len(G3.nodes()) * number_walks # 总共产生的游走序列的数量
data_size = num_walks * walk_length
representation_size = 128 # 词向量的维度
window_size = 10 # word2vec训练时窗口的大小
workers = 4 # 并行进程数

2.生成语料

def build_deepwalk_corpus(G, num_paths, path_length, alpha=0, rand=random.Random(0)):
    walks = []
    nodes = list(G.nodes())
    for cnt in range(num_paths):
        rand.shuffle(nodes)
        for node in nodes:
            walks.append(G.random_walk(path_length, rand=rand, alpha=alpha, start=node))
    return walks

walks = build_deepwalk_corpus(G3, 
                              num_paths=number_walks,
                              path_length=walk_length,
                              alpha=0,
                              rand=random.Random(seed))
print(len(walks))
print(len(walks[0]))
print(walks[0])

824960
40
['597', '4373', '1360', '7894', '4162', '4445', '1452', '1635', '3764', '8343', '8762', '8323', '5255', '4175', '445', '1230', '1704', '327', '3197', '3280', '3695', '3857', '855', '1555', '4414', '862', '2357', '686', '1969', '2009', '3338', '4560', '5090', '6622', '6072', '4637', '5050', '4804', '7072', '6916']

3.使用word2vec训练

model = Word2Vec(walks,
                 size=representation_size,
                 window=window_size,
                 min_count=0, sg=1, hs=1,
                 workers=workers)
model.wv.save_word2vec_format("blogcatalog.embeddings")

四、评估

1.参数

embeddings_file = "blogcatalog.embeddings"
matfile = "./data/blogcatalog.mat"
adj_matrix_name = "network"
label_matrix_name = "group"
num_shuffles = 10

2.辅助函数

def sparse2graph(x):
    """将稀疏邻接矩阵转换为由字典表示的邻接表"""
    G = defaultdict(lambda: set())
    cx = x.tocoo()
    for i,j,v in zip(cx.row, cx.col, cx.data):
        G[i].add(j)
    return {str(k):[str(x) for x in v] for k,v in G.items()}

class TopKRanker(OneVsRestClassifier):
    def predict(self, X, top_k_list):
        assert X.shape[0] == len(top_k_list)
        probs = numpy.asarray(super(TopKRanker, self).predict_proba(X))
        all_labels = []
        for i, k in enumerate(top_k_list):
            probs_ = probs[i, :]
            labels = self.classes_[probs_.argsort()[-k:]].tolist()
            all_labels.append(labels)
        return all_labels

3.加载数据

# 加载词向量
model = KeyedVectors.load_word2vec_format(embeddings_file, binary=False)

# 加载标签
mat = loadmat(matfile)
A = mat[adj_matrix_name]
graph = sparse2graph(A)
labels_matrix = mat[label_matrix_name] # (顶点数,标签类别)
labels_count = labels_matrix.shape[1]

# 多标签二值化转换
mlb = MultiLabelBinarizer(range(labels_count))
# 词向量矩阵
features_matrix = numpy.asarray([model[str(node)] for node in range(len(graph))])

# 数据shuffle
shuffles = [] # 用于保存多次shuffle的结果
for x in range(num_shuffles):
    shuffles.append(skshuffle(features_matrix, labels_matrix))
    
# 用于保存结果
all_results = defaultdict(list)
# 训练集和测试集的划分比较分别为0.1、0.5和0.9
training_percents = [0.1, 0.5, 0.9]

4.训练顶点分类模型并评估效果

# 不同的训练集和测试集划分比较
for train_percent in training_percents:
    # 执行num_shuffles次训练
    for shuf in shuffles:
        X, y = shuf
        # 划分训练集
        training_size = int(train_percent*X.shape[0])
        X_train = X[:training_size,:]
        y_train_ = y[:training_size]
        y_train = [[] for _ in range(y_train_.shape[0])]
        cy =  y_train_.tocoo()
        for i,j in zip(cy.row, cy.col):
            y_train[i].append(j)
            
        assert sum(len(l) for l in y_train) == y_train_.nnz
        # 划分测试集
        X_test = X[training_size:,:]
        y_test_ = y[training_size:]
        y_test = [[] for _ in range(y_test_.shape[0])]
        cy = y_test_.tocoo()
        for i,j in zip(cy.row, cy.col):
            y_test[i].append(j)
        
        # 训练模型
        clf = TopKRanker(LogisticRegression(solver='lbfgs'))
        clf.fit(X_train, y_train_)
        
        # 模型预测
        top_k_list = [len(l) for l in y_test]
        preds = clf.predict(X_test, top_k_list)
        
        # 模型评估
        results = {}
        averages = ["micro", "macro"]
        for average in averages:
            results[average] = f1_score(mlb.fit_transform(y_test), mlb.fit_transform(preds), average=average)
        all_results[train_percent].append(results)

print('Results, using embeddings of dimensionality', X.shape[1])
print('-------------------')
for train_percent in sorted(all_results.keys()):
    print ('Train percent:', train_percent)
    for index, result in enumerate(all_results[train_percent]):
        print ('Shuffle #%d:   ' % (index + 1), result)
    avg_score = defaultdict(float)
    for score_dict in all_results[train_percent]:
        for metric, score in score_dict.items():
            avg_score[metric] += score
    for metric in avg_score:
        avg_score[metric] /= len(all_results[train_percent])
    print ('Average score:', dict(avg_score))
    print ('-------------------')

Results, using embeddings of dimensionality 128
-------------------
Train percent: 0.1
Shuffle #1:    {'micro': 0.3581986673814812, 'macro': 0.2033224239333088}
Shuffle #2:    {'micro': 0.3652487714987715, 'macro': 0.21577524088832908}
Shuffle #3:    {'micro': 0.3623166141792765, 'macro': 0.21066689705245478}
Shuffle #4:    {'micro': 0.3620649919336253, 'macro': 0.21171869067147162}
Shuffle #5:    {'micro': 0.35988947731982507, 'macro': 0.20222950493659103}
Shuffle #6:    {'micro': 0.35737906636929934, 'macro': 0.21090059048705442}
Shuffle #7:    {'micro': 0.3616287094547964, 'macro': 0.20471820148032435}
Shuffle #8:    {'micro': 0.3655955211289209, 'macro': 0.21922779915266496}
Shuffle #9:    {'micro': 0.35839791299010204, 'macro': 0.21189205464993427}
Shuffle #10:    {'micro': 0.35914952410193424, 'macro': 0.2078152517515965}
Average score: {'micro': 0.36098692563580326, 'macro': 0.20982666550037302}
-------------------
Train percent: 0.5
Shuffle #1:    {'micro': 0.4175778546712803, 'macro': 0.27454889378894143}
Shuffle #2:    {'micro': 0.4148700939745716, 'macro': 0.27046150803807273}
Shuffle #3:    {'micro': 0.41626129256428074, 'macro': 0.2696294691077568}
Shuffle #4:    {'micro': 0.41131664853101196, 'macro': 0.2687751830941183}
Shuffle #5:    {'micro': 0.4086511885019347, 'macro': 0.2628792857558395}
Shuffle #6:    {'micro': 0.42060622914349277, 'macro': 0.2676333163255493}
Shuffle #7:    {'micro': 0.4159658072521715, 'macro': 0.2685014990215809}
Shuffle #8:    {'micro': 0.4115448504983389, 'macro': 0.271229381068436}
Shuffle #9:    {'micro': 0.41506565307532833, 'macro': 0.27456128536082786}
Shuffle #10:    {'micro': 0.41693180246230455, 'macro': 0.2744381873233862}
Average score: {'micro': 0.41487914206747156, 'macro': 0.27026580088845087}
-------------------
Train percent: 0.9
Shuffle #1:    {'micro': 0.42203742203742206, 'macro': 0.25880516173753676}
Shuffle #2:    {'micro': 0.4207232267037552, 'macro': 0.28166124425360894}
Shuffle #3:    {'micro': 0.43083275980729524, 'macro': 0.28905126447658364}
Shuffle #4:    {'micro': 0.4314789687924016, 'macro': 0.2977340602872717}
Shuffle #5:    {'micro': 0.44467640918580376, 'macro': 0.289030378588737}
Shuffle #6:    {'micro': 0.4166666666666667, 'macro': 0.2857354498771346}
Shuffle #7:    {'micro': 0.44308111792774363, 'macro': 0.3100004806293008}
Shuffle #8:    {'micro': 0.42270194986072424, 'macro': 0.28487379305227356}
Shuffle #9:    {'micro': 0.451985559566787, 'macro': 0.2897217493931982}
Shuffle #10:    {'micro': 0.428067700987306, 'macro': 0.2626375242068254}
Average score: {'micro': 0.4312251781535906, 'macro': 0.28492511065024706}
-------------------

在Java中String类为什么不可以修改？
目录一、语言设计与实现层面的原因二、设计目标与优势三、如何绕过限制？（异常情况）四、替代方案：可变字符串总结在Java中，String类的不可变性（Immutable）是其核心设计之一，这种设计源于多方面的技术考量和实际需求。以下从多个角度解析String为什么不可以修改：一、语言设计与实现层面的原因final修饰类：String类被声明为final，意味着它不能被继承。这避免了子类通过重写方法或
【C# in .NET】9. 探秘委托：函数抽象的底层机制阿蒙Armon C#in .NET c#.net java
探秘委托：函数抽象的底层机制在C#的类型系统中，委托（Delegate）作为函数的抽象容器，架起了面向对象与函数式编程的桥梁。它不仅是事件驱动编程的核心，更是LINQ、异步编程等现代C#特性的基础。与类和结构体相比，委托的底层实现融合了引用类型的内存管理与函数指针的调用特性，涉及CLR对方法调度的深度优化。本文将从IL指令解析到JIT编译细节，全面揭示委托的本质机制，带你理解这一特殊类型如何在.N
Flink双流处理：实时对账实现1
Flink双流处理：实时对账实现1去发现同类优质开源项目:https://gitcode.com/资源描述本资源文件详细介绍了Flink双流处理的实时对账实现。内容涵盖了基础概念、双流处理的方法以及实战案例，帮助开发者深入理解Flink在实时对账场景中的应用。内容概述基础概念介绍了Flink的基本概念和架构，为后续的双流处理打下基础。双流处理方法详细讲解了Flink中双流处理的核心方法和技巧，帮助
AUTOSAR汽车电子嵌入式编程精讲300篇-基于 FPGA 的 CAN 控制器设计与验证（续）格图素书汽车 fpga开发
目录3CAN控制器的设计3.1CAN的模块构成3.2CPI模块3.2.1CPI模块总设计3.2.2位时序设计3.2.3发送模块设计3.2.4接收模块设计3.2.5错误处理模块设计3.2.6过载帧模块设计3.3CAN控制器的操作模式4CAN控制器的验证4.1基于Vivado软件的CAN控制器仿真4.1.1CAN控制器配置及地址打包4.1.2其余端口配置说明4.1.3Testbench编写说明4.1.
李文乐值不值，时间是最好的证明。李文乐明星简书
李文乐如果你要做一件事，请不要炫耀，也不要宣扬，只管安安静静的去做。因为那是你自己的事，别人不知道你的情况，也不可能帮你去实现。千万不要因为虚荣心而炫耀。也不要因为别人的一句评价而放弃自己的梦想。其实最好的状态，是坚持自己的梦想，听听前辈的建议，少错几步。值不值，时间是最好的证明。
Perl中的数组操作
Push返回数组中的个数pop返回数组中被Pop出的数，最后一个shift返回数据中删除的数字，第一个unshift返回数组长度，从第一个添加printjoin(':',unshift(@numbers,0,10));Map1.会遍历整个数组，并对数组的每个值调用函数，例如mapuc,@word,输出全大写2.$_表示数组的每一个值，例如@word=qw(abcdefg);printmap{$_}
Gcn符号笔记 happydog007 笔记 python
KeyPoints邻接矩阵A通常表示无向图中结点之间的连接，尺寸为[N,N]，其中N是结点的数量。度矩阵D是对角矩阵，尺寸为[N,N]，对角元素表示每个结点的度。结点特征向量矩阵XXX的尺寸为[N,C]，其中C是每个结点的特征数量，包含结点的额外属性，如年龄或文本特征。邻接矩阵A邻接矩阵A是一个方阵，用于表示图中结点之间的连接关系。对于无向图，A[i,j]=1A[i,j]=1A[i,j]=1表示结
兼职群聊怎么加入？(加入兼职群聊后赚钱的方法) 幸运副业
兼职群聊怎么加入？(加入兼职群聊后赚钱的方法)一直以来，人们都在寻找额外的赚钱机会，而如今，兼职群聊已经成为一种越来越受欢迎的方式。随着互联网的发展，加入兼职群聊已经成为许多人实现财务自由的途径之一。那么，兼职群聊怎么加入呢？一旦加入了这些群聊，又有哪些方法可以赚钱呢？本文将为您提供详细的答案和指导。推荐一篇找兼职必看的免费教程：《手机兼职，300-500/天，一单一结，大量要人》在这里可以找到各
淘宝分享优惠券：如何成为省钱达人并助力商家营销？氧惠购物达人
在数字化时代，网络购物已成为人们日常生活中不可或缺的一部分。淘宝作为中国最大的电商平台，不仅提供了丰富的商品选择，还通过各种营销手段，如优惠券、红包等，吸引着消费者的目光。其中，淘宝分享优惠券作为一种新型的营销方式，不仅帮助消费者节省购物开支，还能助力商家推广商品，实现双赢。那么，淘宝分享优惠券究竟是如何运作的？我们又该如何利用它成为省钱达人并助力商家营销呢？淘宝分享优惠券，顾名思义，就是消费者将
# 百万级OpenID自动化获取：高并发架构设计与微信生态实战 Loving_enjoy 计算机学科论文创新点人工智能深度学习经验分享 facebook
>当你的小程序日活突破10万+，如何安全高效地管理海量用户身份？OpenID作为微信生态的"用户身份证"，其获取效率直接影响业务增长！在微信生态开发中，OpenID是用户身份识别的核心密钥。然而传统获取方式存在三大痛点：1.**效率瓶颈**：单线程获取10万OpenID需27小时+2.**稳定性风险**：网络波动导致数据丢失3.**开发成本高**：需重复实现授权逻辑本文将揭秘百万级OpenID自动
微算法科技基于格密码的量子加密技术，融入LSQb算法的信息隐藏与传输过程中，实现抗量子攻击策略强化 MicroTech2025 量子计算区块链
随着量子计算技术的发展，传统加密算法面临被量子计算机破解的风险，LSQb算法也需考虑应对未来可能的量子攻击。微算法科技基于格密码的量子加密技术，融入LSQb算法的信息隐藏与传输过程中，实现抗量子攻击策略强化。格密码在面对量子攻击时具有较高的安全性，通过这种融合，能为LSQb算法提供更强大的抗攻击能力，确保信息在复杂的量子计算环境下的安全性。格密码是一种基于数学格结构的密码学方法，具有在量子计算环境
图机器学习（13）——图相似性检测
图机器学习（13）——图相似性检测0.前言1.基于图嵌入的方法2.基于图核的方法3.基于GNN的方法4.应用0.前言图机器学习(machinelearning,ML)方法能广泛应用于各类任务，其应用场景涵盖从药物设计到社交网络推荐系统等多个领域。值得注意的是，由于这类方法在设计上具有通用性，同一算法可用于解决不同问题。学习图之间相似性的定量度量是一个关键问题。事实上，这是网络分析的重要步骤，同时也
思维导图——梳理岗位职责平常辛
继续学习《思维导图法高效职场应用》（张蕾、孙易新著），如何用思维导图梳理岗位职责。一、岗位职责常见的3方面问题岗位职责太过笼统抽象，无法明确执行程度和考核。不清楚岗位各事项间的关联。不知如何讲岗位职责与行业发展衔接并及时相应调整。二、构建岗位职责的五个步骤1.明确岗位名称2.制定岗位目标。3.分析岗位环境。4.梳理岗位职责内容。5.界定职责内容中的主要职责和辅助职责。
kafka--基础知识点--0 Chasing__Dreams kafka kafka 分布式
kafka架构https://cloud.tencent.com/developer/article/230789219张图生产者架构消息的磁盘存储文件结构https://cloud.tencent.com/developer/article/230789219张图produce消息分区策略kafka–基础知识点–5–生产者分区策略ISR、OSR、AR是什么？ISR：ISR，全称in-syncre
前端领域状态管理的事件驱动机制解析前端视界前端大数据与AI人工智能前端艺匠馆前端状态模式 ai
前端领域状态管理的事件驱动机制解析关键词：前端状态管理、事件驱动、订阅发布模式、状态变更、组件通信摘要：本文从前端开发的实际痛点出发，用“快递站管理”的生活案例类比，深入浅出解析事件驱动机制在状态管理中的核心作用。通过拆解状态管理、事件驱动、订阅发布模式等核心概念，结合代码示例和实战场景，帮助开发者理解如何用事件驱动实现更可控、可维护的状态管理系统。背景介绍目的和范围随着前端应用从“网页”进化为“
PyTorch数据加载与预处理飘若随风 PyTorch pytorch 人工智能 python
数据加载与预处理详解1.数据集类(Dataset和DataLoader)1.1Dataset基类PyTorch中的Dataset是一个抽象类，所有自定义的数据集都应该继承这个类，并实现以下两个方法：__len__():返回数据集的大小__getitem__():根据索引返回一个样本概念解析：Dataset类提供了统一的数据访问接口通过继承Dataset，我们可以轻松地将数据集成到PyTorch的生
详解NIO Channel类沧澜sincerely Java 高并发 nio
目录什么是NIOChannel？为什么要学习NIOChannel？FileChannelSocketChannelDatagramChannel本篇文章内容的前置知识为NIOBuffer类，如果不了解，可点击链接学习详解NIOBuffer类及其属性和方法-CSDN博客什么是NIOChannel？在JavaNIO中，Channel（通道）是一种广义的I/O抽象，用于表示与数据源或数据目的地之间的连接
常用的折叠展开过渡动画效果css
如何实现优雅的折叠展开动画效果在现代Web设计中，折叠展开动画是一种常见且实用的交互方式，它可以帮助用户在保持界面简洁的同时，灵活控制内容的显示与隐藏。本文将分享如何使用HTML、CSS和JavaScript实现一个平滑流畅的折叠展开动画效果。基本原理折叠展开动画的核心原理是通过CSS过渡(transition)来控制元素的高度、内边距和其他样式属性的变化。当用户点击触发按钮时，JavaScrip
尝试is制作轮播图鸡蛋卷1619
图片转换2letarr=["http://p1.music.126.net/wBMu9w9U8o7k4CDssm5FDg==/109951166684652624.jpg?imageView&quality=89","http://p1.music.126.net/82byaQmflAHb77TFu5l5HQ==/109951166682139804.jpg?imageView&quality=8
Redux架构解析：状态管理的核心原理止观止架构前端 react.js redux
Redux作为JavaScript应用的状态管理库，其技术架构与核心原理围绕可预测的状态管理设计，通过严格的单向数据流和函数式编程理念实现复杂应用的状态控制。以下从设计理念、核心架构、工作流程、源码实现等角度进行系统性剖析：一、设计理念与原则单一数据源（SingleSourceofTruth）整个应用的状态存储在一个全局Store对象中，形成唯一的状态树（StateTree）。优势：简化状态共享和
Kafka 时间轮深度解析：如何O(1)处理定时任务 lifallen Kafka Java kafka linq 分布式 java 数据库数据结构 apache
TimingWheel（时间轮）TimingWheel是一种高效的、用于实现大量定时任务调度的算法结构。相比于传统的基于优先队列（PriorityQueue）的定时器（其添加/删除操作的时间复杂度为O(logn)），时间轮可以实现近乎O(1)的添加和删除操作，这在需要管理成千上万个定时任务的场景下（例如Kafka中的请求超时、延迟操作等）具有巨大的性能优势。可以把一个TimingWheel想象成一
今天是为《棋魂》爆哭的一天艾米吖
昨天下午偶然开始看一直很受好评的《棋魂》，看的一直停不下来！终于在今天下午，在接近结局的时候，自己开始爆哭！！好感人！！！为什么褚嬴没有告别就离开了！好伤心！！导演你赔我眼泪！！真的太好哭了！！！尤其是在褚嬴他想骑自行车到最后都没骑到的时候，感觉自己的心都碎了！！！后来去微博看了一下，才知道剧的宣传中有个张超（褚嬴扮演者）和胡先煦（时光扮演者）一起骑自行车的图。虽然是现代装，但也算是圆了褚嬴的梦了
5大核心技术+3大交互革命！Java如何让虚拟世界‘活过来’？——附代码实战+防坑指南！墨瑾轩 Java乐园交互 java 开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣从“木头人”到“交互大师”的Java魔法之旅一、Java的“五大核心技术”——虚拟世界的“五感开关”1.1核心技术1：JOGL渲染引擎——“视觉中枢”作用：用OpenGL实现3D场景渲染代码示例：//JOGL渲染循环：画一个旋转的立方体importjavax.
ColQwen-Omni：RAG全模态检索来了，支持【文本|图像|视频|音频】四种模态！致Great 音视频
还记得ColPali、ColQwen和DSE吗？这些模型开创了视觉文档检索的新范式：无需费力地从文档中提取文本进行处理，只需将文档页面视为一系列图像（屏幕截图），然后训练视觉语言模型（VLM）直接将其内容表示为向量。ColPali的实践表明，这种策略通常比其他替代方法更快、更简单，并且能带来更好的检索性能。自发布一年以来，ColPali和ColQwen系列模型已被下载数百万次，被誉为“2024年顶
2018-05-23 修改博文陈艳芳_育儿及修行成长
你只有不断去模仿高手才有可能学会高手的本事，你只有模仿了很多的高手之后，才有可能形成自己的特点，才有可能成为一代宗师。刚开始的模仿，一定会很难看的，尽管初学的动作会很难看，就像孩子走路一样难看。但是最终才会一点点的提高。一，本段要达到的目的？（扮演作者）给出学习的路径：模仿，模仿多个高手；给出学习过程中的状态：开始很难看，一点点提高二，为了实现目的，作者采用了怎样的方式？（分析文章思维体系）逐步递
钰泰ETA3000电池均衡IC 展嵘-杨 15909469118 正则表达式单片机嵌入式硬件
描述ETA3000是电池平衡IC，可面向上下两串电池组，其可以通过无限级联，实现3节-24节动力电池组的均衡，ETA3000是主动开关式均衡，其均衡电流可以达到1.5A。ETA3000是钰泰半导体独有专利池内的新型电池均衡器，与传统的无源平衡技术不同，ETA3000利用具有电感器的控制方案来在两个电池之间source和sink电流，直到相邻两节电池电势均等。在传统的线性平衡技术中，会产生较大功耗，
WIFI7新特性浅析及Linux内核对其的支持 winter91 Linux NetWork linux WIFI
WIFI7新特性浅析及Linux内核对其的支持|DD'NotesWIFI7新特性浅析及Linux内核对其的支持wifi7新特性Wi-Fi7（IEEE802.11be）作为下一代无线网络标准，在速度、延迟、容量和稳定性等方面实现了显著提升。以下是其核心新特性：1.更高带宽与速率320MHz信道带宽支持连续320MHz或非连续160+160MHz带宽（6GHz频段），相比WiFi6的160MHz实现速
明天的明天你还要如此？ 88兰猫
六年前你就想做出的决定却推迟到现在还没有去执行，你还指望下一个六年会是什么样子？你希望时光刻在你脸上的是木纳无神，还是坚毅与睿智？我想，没有人会选择前者。曾经，昨天的昨天，你许下了一个愿望，立下多个大志。当到了昨天的未来却没能实现几个，那你明天的明天还要如此吗？人生是没有多少个明天的。为什么会如此？我们应该多问几个“为什么”。一眼就看到头的未来你不能要！真实的现实是你根本不知道下一秒钟会发生什么，
Redisson实现限流器详解：从原理到实践源末coco 单片机 stm32 嵌入式硬件
什么是限流器？限流器（RateLimiter）是一种控制请求频率的机制，用于保护系统免受过多请求的冲击。想象一下，你开了一家餐厅，如果同时涌入1000个客人，厨房肯定忙不过来，这时候就需要"限流"——控制进入餐厅的人数。限流的常见场景//场景1：API接口限流@RestControllerpublicclassUserController{@GetMapping("/api/user/{id}")
弘扬建党精神传承榜样力量夕阳醉year
弘扬建党精神，传承榜样力量。在实现第二个百年奋斗目标新征程上，新时代党员干部自当把伟大建党精神转化为锤炼党性修养的思想自觉，转化为攻坚克难的强大动力，转化为担当作为的实际行动，激发干事创业的精气神，践行党的初心使命，在全面建设社会主义现代化国家新征程上奋勇争先、建功立业。弘扬建党精神，坚定理想信念。习近平总书记指出：“理想信念就是共产党人精神上的‘钙’，没有理想信念理想信念不坚定，精神上就会‘缺钙
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置

【图表示学习】实现DeepWalk

一、定义图的数据结构

二、加载数据为Graph对象

1.辅助函数

2.加载邻接表数据(adjlist)

3.加载边表数据(edgelist)

4.加载邻接矩阵数据(mat)

三、生成语料

1.参数

2.生成语料

3.使用word2vec训练

四、评估

1.参数

2.辅助函数

3.加载数据

4.训练顶点分类模型并评估效果

你可能感兴趣的:(图,图嵌入,图表示,DeepWalk,word2vec,实现)