_wjunjie

CS224W Colab_1 笔记

1 Graph Basic

1.1 networkx实现空手道俱乐部Graph的可视化。

1.2 利用network计算Graph的平均度并取整（Question 1）

1.3 平均聚类系数计算，并保留2位小数，可以使用networkx自带的聚类系数函数（Question 2）

1.4 计算id=0节点经过一次迭代的PageRank值（Question 3）

1.5 计算(raw) closeness centrality （Question 4）

2 Graph To Tensor

2.1 Tensor矩阵的初始化（全1，全0，随机值）及元素类型转换

2.2 将networkx中Graph的边转化为dict类型，每条边在dict中用一个而2个元素的tuple表示。然后，再将dict转换为torch.LongTensor类型（Question 5）。

2.3 实现一个负样本边生成函数，功能是生成原图中没有的一些边（需要注意无向图正负边为同一条边，自环不算边等情况）（Question 6）

3 Node Embedding Learning

3.1 torch.nn.Embedding类的使用

3.2 nn.Embedding实例emb的可视化

3.3 torch.nn.Embedding类的实例emb的训练过程（Question 7）

1 Graph Basic

主要涉及networkx包的使用：

1.1 networkx实现空手道俱乐部Graph的可视化。

# Visualize the graph
nx.draw(G, with_labels = True)
pylab.show()   # tips 2：draw画图不显示问题可尝试导入pylab包

1.2 利用network计算Graph的平均度并取整（Question 1）

# Question 1
def average_degree(num_edges, num_nodes):
    # TODO: Implement this function that takes number of edges
    # and number of nodes, and returns the average node degree of
    # the graph. Round the result to nearest integer (for example
    # 3.3 will be rounded to 3 and 3.7 will be rounded to 4)

    avg_degree = 0

    ############# Your code here ############
    avg_degree = round(num_edges * 2 / num_nodes)
    #########################################

    return avg_degree

num_edges = G.number_of_edges()
num_nodes = G.number_of_nodes()
avg_degree = average_degree(num_edges, num_nodes)
print("Average degree of karate club network is {}".format(avg_degree))

1.3 平均聚类系数计算，并保留2位小数，可以使用networkx自带的聚类系数函数（Question 2）

# Question 2
def average_clustering_coefficient(G):
  # TODO: Implement this function that takes a nx.Graph
  # and returns the average clustering coefficient. Round
  # the result to 2 decimal places (for example 3.333 will
  # be rounded to 3.33 and 3.7571 will be rounded to 3.76)

  avg_cluster_coef = 0

  ############# Your code here ############

  ## Note:
  ## 1: Please use the appropriate NetworkX clustering function
  avg_cluster_coef = round(nx.average_clustering(G), 2)
  #########################################

  return avg_cluster_coef

avg_cluster_coef = average_clustering_coefficient(G)
print("Average clustering coefficient of karate club network is {}".format(avg_cluster_coef))

1.4 计算id=0节点经过一次迭代的PageRank值（Question 3）

提示：节点邻居的遍历可以用networkx中自带函数G.neighbors(node_id)来实现，其返回值是一个dict迭代器(dict_keyiterator)。

# Question 3
def one_iter_pagerank(G, beta, r0, node_id):
  # TODO: Implement this function that takes a nx.Graph, beta, r0 and node id.
  # The return value r1 is one interation PageRank value for the input node.
  # Please round r1 to 2 decimal places.

  r1 = 0

  ############# Your code here ############
  ## Note:
  ## 1: You should not use nx.pagerank
  '''
      tips 3: nx.neighbors(self, n_id)
    '''
  tmp = G.neighbors(node_id) # tmp: Debug
  for nb in G.neighbors(node_id):
      r1 += 1.0 * r0 / G.degree(nb)
  r1 = r1 * beta + (1.0 - beta) / G.number_of_nodes()
  r1 = round(r1, 2)
  #########################################

  return r1

beta = 0.8
r0 = 1 / G.number_of_nodes()
node = 0
r1 = one_iter_pagerank(G, beta, r0, node)
print("The PageRank value for node 0 after one iteration is {}".format(r1))

1.5 计算(raw) closeness centrality （Question 4）

PS：可以使用networkx自带的closeness计算函数，但需注意自带函数计算出的值是归一化后的值，即乘以了(节点数-1)。这里的结果需要除以(节点数-1)以消除归一化。

# Question 4
def closeness_centrality(G, node=5):
  # TODO: Implement the function that calculates closeness centrality
  # for a node in karate club network. G is the input karate club
  # network and node is the node id in the graph. Please round the
  # closeness centrality result to 2 decimal places.

  closeness = 0

  ## Note:
  ## 1: You can use networkx closeness centrality function.
  ## 2: Notice that networkx closeness centrality returns the normalized
  ## closeness directly, which is different from the raw (unnormalized)
  ## one that we learned in the lecture.

  #########################################
  closeness = nx.closeness_centrality(G, node) / (G.number_of_nodes() - 1)
  closeness = round(closeness, 2)

  return closeness

node = 5
closeness = closeness_centrality(G, node=node)
print("The node 5 has closeness centrality {}".format(closeness))

2 Graph To Tensor

Tensor，一种数据类型

2.1 Tensor矩阵的初始化（全1，全0，随机值）及元素类型转换

import torch

# Generate 3 x 4 tensor with all ones
ones = torch.ones(3, 4)
print(ones)

# Generate 3 x 4 tensor with all zeros
zeros = torch.zeros(3, 4)
print(zeros)

# Generate 3 x 4 tensor with random values on the interval [0, 1)
random_tensor = torch.rand(3, 4)
print(random_tensor)

# Get the shape of the tensor
print(ones.shape) 
'''
  ones.shape作用等同于ones.size()，其返回一个torch.Size类，shape[0]和shape[1]可获得行数、列数。
'''

# Create a 3 x 4 tensor with all 32-bit floating point zeros
zeros = torch.zeros(3, 4, dtype=torch.float32)
print(zeros.dtype)

# Change the tensor dtype to 64-bit integer
zeros = zeros.type(torch.long)
print(zeros.dtype) #输出zeros张量内部元素的类型。  int64

2.2 将networkx中Graph的边转化为dict类型，每条边在dict中用一个而2个元素的tuple表示。然后，再将dict转换为torch.LongTensor类型（Question 5）。

①networkx中G的边转换为dict集合，可以用G.edges()函数，其返回值类型为，该类型（集合）中元素（即每条边）类型为tuple，详见下面实现。

②dict转tensor可以直接用tensor的初始化函数。

PS：题目要求最后转换得到的tensor的shape为2*节点数，所以需要用到tensor.t()函数来实现矩阵的转置。

def graph_to_edge_list(G):
  # TODO: Implement the function that returns the edge list of
  # an nx.Graph. The returned edge_list should be a list of tuples
  # where each tuple is a tuple representing an edge connected
  # by two nodes.

  edge_list = []

  ############# Your code here ############
  for e in G.edges():
      edge_list.append(e)
  #########################################

  return edge_list

def edge_list_to_tensor(edge_list):
  # TODO: Implement the function that transforms the edge_list to
  # tensor. The input edge_list is a list of tuples and the resulting
  # tensor should have the shape [2 x len(edge_list)].

  edge_index = torch.tensor([])

  ############# Your code here ############
  edge_index = torch.LongTensor(edge_list).t()
  #########################################

  return edge_index

pos_edge_list = graph_to_edge_list(G)
pos_edge_index = edge_list_to_tensor(pos_edge_list)
print("The pos_edge_index tensor has shape {}".format(pos_edge_index.shape))
print("The pos_edge_index tensor has sum value {}".format(torch.sum(pos_edge_index)))

2.3 实现一个负样本边生成函数，功能是生成原图中没有的一些边（需要注意无向图正负边为同一条边，自环不算边等情况）（Question 6）

函数：random.randint(0, N)可以生成[0,N]的随机整数。

# Question 6
import random
def myjudge1(G, p, q):
    if (p != q and G.has_node(p) and G.has_node(q) and not G.has_edge(p, q) and not G.has_edge(q, p)):
        return True
    return False



def sample_negative_edges(G, num_neg_samples):
  # TODO: Implement the function that returns a list of negative edges.
  # The number of sampled negative edges is num_neg_samples. You do not
  # need to consider the corner case when the number of possible negative edges
  # is less than num_neg_samples. It should be ok as long as your implementation
  # works on the karate club network. In this implementation, self loops should
  # not be considered as either a positive or negative edge. Also, notice that
  # the karate club network is an undirected graph, if (0, 1) is a positive
  # edge, do you think (1, 0) can be a negative one?

  neg_edge_list = []

  ############# Your code here ############
  cas = 0
  while(cas < num_neg_samples):
      p = random.randint(0, G.number_of_nodes() - 1)
      q = random.randint(0, G.number_of_nodes() - 1)
      if myjudge1(G, p, q):
          neg_edge_list.append((p, q))
          cas += 1
  #########################################

  return neg_edge_list

# Sample 78 negative edges
neg_edge_list = sample_negative_edges(G, len(pos_edge_list))

# Transform the negative edge list to tensor
neg_edge_index = edge_list_to_tensor(neg_edge_list)
print("The neg_edge_index tensor has shape {}".format(neg_edge_index.shape))

# Which of following edges can be negative ones?
edge_1 = (7, 1)
edge_2 = (1, 33)
edge_3 = (33, 22)
edge_4 = (0, 4)
edge_5 = (4, 2)

############# Your code here ############
## Note:
## 1: For each of the 5 edges, print whether it can be negative edge

for a, b in [(7, 1), (1, 33), edge_3, (0, 4), (4, 2)]:
    print(myjudge1(G, a, b))

其他更好的代码实现版本：利用networkx自带函数nx.non_edges(G)得到G中所有不存在的边，然后利用random.sample(range(0,n), numb)函数从前边得到的边中随机选择numb个。

代码：

def sample_negative_edges(G, num_neg_samples):
  #题目要求：不用考虑num_neg_samples比所有不存在边的数量还高的边界条件
  #不考虑自环
  #注意，本来需要考虑逆边的问题，但是由于nx.non_edges函数不会出现两次重复节点对，所以不用考虑这个问题。

  neg_edge_list = []

  #得到图中所有不存在的边（这个函数只会返回一侧，不会出现逆边）
  non_edges_one_side=list(enumerate(nx.non_edges(G)))
  neg_edge_list_indices=random.sample(range(0,len(non_edges_one_side)),num_neg_samples)
  #取样num_neg_samples长度的索引
  for i in neg_edge_list_indices:
    neg_edge_list.append(non_edges_one_side[i][1])
  
  return neg_edge_list


# Sample 78 negative edges
neg_edge_list = sample_negative_edges(G, len(pos_edge_list))

# Transform the negative edge list to tensor
neg_edge_index = edge_list_to_tensor(neg_edge_list)

3 Node Embedding Learning

3.1 torch.nn.Embedding类的使用

PS：Embedding相当于生成了一个N*M的嵌入表，G中的每个节点在表中都有一个对应的M维嵌入。

①torch.nn.Embedding初始化方法：

# Initialize an embedding layer
# Suppose we want to have embedding for 4 items (e.g., nodes)
# Each item is represented with 8 dimensional vector

emb_sample = nn.Embedding(num_embeddings=4, embedding_dim=8) #初始化
print('Sample embedding layer: {}'.format(emb_sample))

'''
>>> print('Sample embedding layer: {}'.format(emb_sample))
Sample embedding layer: Embedding(4, 8)
'''

②torch.nn.Embedding的使用：

索引id需要是torch.LongTensor类型的矩阵，可以一维可以二维，具体维度根据最后需要的矩阵shape来定。（id矩阵是nn.Embdding矩阵和目标矩阵之间的过渡量）

# Select an embedding in emb_sample
id = torch.LongTensor([1])
print(emb_sample(id))

# Select multiple embeddings
ids = torch.LongTensor([1, 3])
print(emb_sample(ids))

# Get the shape of the embedding weight matrix
shape = emb_sample.weight.data.shape
print(shape)

# Overwrite the weight to tensor with all ones
emb_sample.weight.data = torch.ones(shape)

# Let's check if the emb is indeed initilized
ids = torch.LongTensor([0, 3])
print(emb_sample(ids))

③torch.nn.Embedding值的修改：

# Overwrite the weight to tensor with all ones
emb_sample.weight.data = torch.ones(shape)

实现一个nn.Embedding生成函数，要求其各个元素值服从[0, 1]的均匀分布，可以使用torch.rand(a, b)来生成一个服从[0, 1]均匀分布的a*b的矩阵。

PS：网上有人说实际上nn.Embedding初始化的时候的值就是[0,1]的，这里再修改一次的目的是为了协同torch.manual_seed()函数来保证结果的可复现性。

# Please do not change / reset the random seed
torch.manual_seed(1)

def create_node_emb(num_node=34, embedding_dim=16):
  # TODO: Implement this function that will create the node embedding matrix.
  # A torch.nn.Embedding layer will be returned. You do not need to change
  # the values of num_node and embedding_dim. The weight matrix of returned
  # layer should be initialized under uniform distribution.

  emb = None

  ############# Your code here ############
  emb = torch.nn.Embedding(num_node, embedding_dim)
  emb.weight.data = torch.rand(num_node, embedding_dim)
  #########################################

  return emb

emb = create_node_emb()
ids = torch.LongTensor([0, 3])

# Print the embedding layer
print("Embedding: {}".format(emb))

# An example that gets the embeddings for node 0 and 3
print(emb(ids))

3.2 nn.Embedding实例emb的可视化

def visualize_emb(emb):
  X = emb.weight.data.numpy()
  pca = PCA(n_components=2)
  components = pca.fit_transform(X)
  plt.figure(figsize=(6, 6))
  club1_x = []
  club1_y = []
  club2_x = []
  club2_y = []
  for node in G.nodes(data=True):
    if node[1]['club'] == 'Mr. Hi':
      club1_x.append(components[node[0]][0])
      club1_y.append(components[node[0]][1])
    else:
      club2_x.append(components[node[0]][0])
      club2_y.append(components[node[0]][1])
  plt.scatter(club1_x, club1_y, color="red", label="Mr. Hi")
  plt.scatter(club2_x, club2_y, color="blue", label="Officer")
  plt.legend()
  plt.show()

# Visualize the initial random embeddding
visualize_emb(emb)

3.3 torch.nn.Embedding类的实例emb的训练过程（Question 7）

PS：我们滴目标是，使每个节点在emb表中对应的embedding能最大程度的保持节点的结构特点。不同于监督分类任务中可以直接对比节点的预测值和标签值，这里没有ground-truth，所以采取的思路是：

如果模型很好的学习到了节点的结构特征，那么一个节点和它的邻居的embedding应该是相似的（这里用向量点积来衡量相似度，相当于余弦相似度），所以模型的输出值就是一些向量点积，label标签就是对应edge是否在图中存在（即向量点积对应的两个节点是否直接相连）。

代码如下：

tips 1：Tensor类型的数据可以直接使用+、-、*、/、==、>、sigmoid、mul...等运算符，详见accuracy()函数以及train()函数的Version 2。

tips 2：item()函数可以将一个1*1的Tensor转换为普通数据类型的量

tips 3：每轮epoch，optimizer的梯度要清零

tips4：随着epoch轮次的迭代，loss会越来越小，loss如果不是递减的，则模型有错误，例如梯度没清零。

# Question 7

from torch.optim import SGD
import torch.nn as nn

def accuracy(pred, label):
  # TODO: Implement the accuracy function. This function takes the
  # pred tensor (the resulting tensor after sigmoid) and the label
  # tensor (torch.LongTensor). Predicted value greater than 0.5 will
  # be classified as label 1. Else it will be classified as label 0.
  # The returned accuracy should be rounded to 4 decimal places.
  # For example, accuracy 0.82956 will be rounded to 0.8296.

  accu = 0.0

  ############# Your code here ############
  accu = ((pred > 0.5) == label).sum().item() * 1.0 / pred.shape[0]
  accu = round(accu, 4)
  #########################################

  return accu

def train(emb, loss_fn, sigmoid, train_label, train_edge):
  # TODO: Train the embedding layer here. You can also change epochs and
  # learning rate. In general, you need to implement:
  # (1) Get the embeddings of the nodes in train_edge
  # (2) Dot product the embeddings between each node pair
  # (3) Feed the dot product result into sigmoid
  # (4) Feed the sigmoid output into the loss_fn
  # (5) Print both loss and accuracy of each epoch
  # (6) Update the embeddings using the loss and optimizer
  # (as a sanity check, the loss should decrease during training)

  epochs = 500
  learning_rate = 0.1

  optimizer = SGD(emb.parameters(), lr=learning_rate, momentum=0.9)

  for i in range(epochs):

    ############# Your code here Version 2 ############

    optimizer.zero_grad()
    tmp = emb(train_edge)
    pred = sigmoid(tmp[0].mul(tmp[1]).sum(1))
    loss = loss_fn(pred, train_label)
    print(f"Epochs: {i}, Accuracy: {accuracy(pred, train_label)}, Loss: {loss}")
    loss.backward()
    optimizer.step()

    #########################################
    ############# Your code here Version 1############
    '''   
    optimizer.zero_grad()
    pred = torch.Tensor(train_edge.shape[1])
    for j in range(train_edge.shape[1]):
        node_ids = torch.LongTensor([train_edge[0][j], train_edge[1][j]])
        tmp = emb(node_ids)
        pred[j] = sigmoid(tmp[0].dot(tmp[1]))

    loss = loss_fn(pred, train_label)
    print(f"Epochs: {i}, Accuracy: {accuracy(pred, train_label)}, Loss: {loss}")
    loss.backward()
    optimizer.step()
    '''
    #########################################

loss_fn = nn.BCELoss()
sigmoid = nn.Sigmoid()


print(pos_edge_index.shape)
print(neg_edge_index.shape)

# Generate the positive and negative labels
pos_label = torch.ones(pos_edge_index.shape[1], )
neg_label = torch.zeros(neg_edge_index.shape[1], )


# Concat positive and negative labels into one tensor
train_label = torch.cat([pos_label, neg_label], dim=0)

# Concat positive and negative edges into one tensor
# Since the network is very small, we do not split the edges into val/test sets
train_edge = torch.cat([pos_edge_index, neg_edge_index], dim=1)
print(train_edge.shape)

train(emb, loss_fn, sigmoid, train_label, train_edge)

# Visualize the final learned embedding
visualize_emb(emb)

部分结果：

Average degree of karate club network is 5
Average clustering coefficient of karate club network is 0.57
The PageRank value for node 0 after one iteration is 0.13
The node 5 has closeness centrality 0.01

End...

Python中gdal实现栅格遥感影像读取计算及基于质量评估QA波段筛选掩膜数据疯狂学习GIS
本文介绍基于Python语言中gdal模块，对遥感影像数据进行栅格计算，同时基于QA波段对像元加以筛选、掩膜的操作。前期系列博客1（https://blog.csdn.net/zhebushibiaoshifu/article/details/113929859）详细介绍了基于ENVI、ERDAS等软件对遥感影像加以各类处理的操作，系列博客2（https://blog.csdn.net/z
转载：十年驾车经验总结：活着，才是硬道理 weixin_30920853
一个优秀的驾驶员，应该对自己负责、对家人负责、对他人负责，对生命心存敬畏！现实生活中，违章又无处不在，为什么呢？原因一、侥幸心理。平时不系安全带，偶尔酒后驾驶，平时闯闯红灯，晚上出来飚飚车，从来没出过事故，安全意识越来越淡薄，总感觉车技好无所谓，其实，靠侥幸是不可能幸运一辈子的，据统计：驾龄5~6年属于事故高发期。原因二、环境因素。我在都江堰生活过3个月，在那里，闯红灯属于普遍现象，后来我去西宁，
Android8.0一些系统数据库的变更总结留给时光吧
1.SettingsProvider之前的一些系统设置内容如亮度、音量大小等都存储在settings.db这个数据库中，但在8.0上数据库不见了。在8.0上都存在几个xml文件中了，其实从6.0开始就已经开始了这种操作，只不过6.0上并没有删除原始数据库，从7.0开始系统删除了原始数据库。简单看一下源码：android\frameworks\base\packages\SettingsProvid
不完美的家庭会议水煮毛豆
第一天上网课加上我没在家。孩子还算自律，按时上课按时完成作业。就是我发现作业以“完成为目的”写的不好。提出建议似乎还有情绪……请教完奋赢老师我俩开始商量怎么“收拾”她——开个会！（这次由爸爸组织，爷爷奶奶也参加。）时间：2022年1月10日地点：客厅主持人：爸爸记录：妈妈参会成员：爸爸，妈妈，爷爷，奶奶，等等，仓鼠会议主题：总结2021规划2022会议流程：1.感谢家人。2.总结，规划3.一日流程
Python爬虫【二十四章】分布式爬虫架构实战：Scrapy-Redis亿级数据抓取方案设计程序员_CLUB Python入门到进阶 python 爬虫分布式
目录一、背景：单机爬虫的五大瓶颈二、Scrapy-Redis架构深度解析1.架构拓扑图2.核心组件对比三、环境搭建与核心配置1.基础环境部署2.Scrapy项目配置四、分布式爬虫核心实现1.改造原生Spider2.布隆过滤器集成五、五大性能优化策略1.动态优先级调整2.智能限速策略3.连接池优化4.数据分片存储5.心跳监控系统六、实战：新闻聚合平台数据抓取1.集群架构2.性能指标七、总结1.核心收
Python 代码库之如何获取数据array最后一个元素（含demo源码） iCloudEnd
Python代码库之如何获取数据array最后一个元素（含demo源码）源码>>>some_list=[1,2,3]>>>some_list[-1]=3#Setthelastelement>>>some_list[-2]=2#Setthesecondtolastelement>>>some_list[1,2,3]更多精彩代码请关注我的专栏reportlab教程和源码大全python源码大全Sqli
Python,Rust开发关停大脑APP Geeker-2025 python rust
要关停名为“大脑”的APP，具体实现方式取决于APP的运行环境和架构。以下是针对不同场景的Python和Rust解决方案：---###**场景1：终止本地进程（适合桌面/服务端应用）**####Python方案（使用`psutil`库）```pythonimportpsutildefstop_brain_app():target_name="brain_app"#替换为实际进程名forprocin
Python,Java,C++开发磁悬浮原理与技术实操APP Geeker-2025 python java c++
#磁悬浮原理与技术实操APP技术方案基于Python、Java和C++开发的磁悬浮原理学习与应用APP，结合理论教学与实操模拟：##系统架构设计```mermaidgraphTDA[跨平台客户端-C++/Qt]-->|API调用|B[后端服务-Java/Spring]B-->C[磁悬浮模拟引擎-Python]B-->D[硬件控制接口]C-->E[物理模型计算]D-->F[磁悬浮套件]A-->G[3
Python,C++开发电学/动力学与发明创造APP
#电学/动力学与发明创造APP-Python与C++集成解决方案##系统架构设计```mermaidgraphTDA[用户界面-Qt/PyQt]-->B[应用逻辑层-Python]B-->C[核心引擎-C++]C-->D[硬件接口]C-->E[物理引擎]B-->F[3D可视化]F-->G[OpenGL/Vulkan]```##技术栈分工|组件|技术|功能||------|------|------
Python,Go开发光电效应与日常应用APP Geeker-2025 python golang
以下是一个基于Python与Go开发的光电效应科普与应用APP的完整技术方案，结合了物理原理模拟、实时数据处理及生活场景应用，参考了工业级开发实践（如光电实验数据处理和能源设备控制）：---###一、系统架构设计```mermaidgraphLRA[Go微服务层]-->B[Python科学计算层]A-->C[数据库/物联网]B-->D[硬件接口]D-->E[传感器/实验设备]subgraph前端A
Python,Go are applicated to develop the app “Star travel and your preparation”
为了开发“星际旅行准备”应用（**StarTravelandYourPreparation**），结合**Python**和**Go**的技术优势，可设计如下分层架构，融合深空导航、生命维持系统（LSS）优化与跨星域资源管理功能：---###**1.核心架构设计**####**(1)星际导航引擎（Go）**-**角色**：实时多维空间路径规划与异常规避-**实现**：-**曲速走廊计算**：基于A
2019.06.19 进阶的小宇宙
今天班长来找我，觉得最近数学和地理作业做的不好，这时候我突然意识到，我对学生的单独关注太少了，我也注意到她的作业并不是很好，但是她给我的感觉就是压力很大，对自己要求很高，所以做不到的时候，可能会着急。我跟她说，放松心态，那么对于数学，现在因为天天综合卷，所以知识很杂乱，那么自己复习的时候应该注意归纳总结。理清楚知识点和题目。
Python SSTI漏洞原理与基础利用以及Fenjing的使用教程 cba尼里托圣 python 网络 web安全
文章目录一、Python类与对象模型基础二、魔术方法的作用与利用价值1.__class__魔术方法2.__bases__与__mro__魔术方法3.__subclasses__()魔术方法4.__init__魔术方法5.__globals__魔术方法三、魔术方法链的构建与利用1.漏洞验证2.获取类对象3.定位到object基类4.遍历object的子类5.定位危险类6.获取全局变量空间7.执行命令
分布式爬虫：设计一个分布式爬虫架构来抓取大规模数据 Python爬虫项目 2025年爬虫实战项目分布式爬虫架构开发语言 redis 测试工具 python
✨引言随着互联网信息的爆炸式增长，单机爬虫面对大规模网站数据抓取显得力不从心。特别是爬取新闻、商品、社交平台等网站时，经常遇到响应慢、IP被封等问题。为了解决这些问题，分布式爬虫系统应运而生。在本文中，我们将手把手带你打造一个基于Scrapy+Redis+Celery+FastAPI+Docker的现代分布式爬虫架构，实现任务调度、去重控制、分布式抓取与结果存储。本文代码均基于Python3.10
Python医疗大数据实战：基于Scrapy-Redis的医院评价数据分布式爬虫设计与实现 Python爬虫项目 python 开发语言爬虫 selenium scrapy
摘要本文将详细介绍如何使用Python构建一个高效的医院评价数据爬虫系统。我们将从爬虫基础讲起，逐步深入到分布式爬虫架构设计，使用Scrapy框架结合Redis实现分布式爬取，并采用最新的反反爬技术确保数据采集的稳定性。文章包含完整的代码实现、性能优化方案以及数据处理方法，帮助读者掌握医疗大数据采集的核心技术。关键词：Python爬虫、Scrapy-Redis、分布式爬虫、医疗大数据、反反爬技术1
红林主人《红语堂十言集》第五十章红林主人
《红语堂十言集》第五十章1、治国尚且如烹小鲜，治司岂能儿戏。2、一次事故是万次错误的积累。3、江山易改，本性难移，真是这样。4、公司高管，在公司危机时刻，发生事故时，应该是统帅之谋，不是勇士之举。5、曾经的经验，虽不是什么金科玉侓，但确实是将一个投资3千万的企业做到价值五个亿。经验经过实践总结，就汇集为了管理方案。《公司团队建设方案》《公司品牌传播方案》《公司市场管理方案》《公司营销管理方案》《公
Python,C++开发磁流体研究以及应用APP Geeker-2025 python c++
#Python与C++开发磁流体研究与应用APP方案以下是一个结合Python与C++的磁流体(MHD)研究与应用APP的完整技术方案，融合了高性能计算、实时仿真和工业应用场景：##系统架构设计```mermaidgraphTDA[用户界面层]-->B[Python应用层]B-->C[C++核心计算层]C-->D[硬件接口层]D-->E[实验设备/传感器]subgraph前端A1[桌面端-PyQt
【Python】socket 宅男很神经 python 开发语言
第一章：网络通信基石——深入理解OSI与TCP/IP模型在深入探究Pythonsocket模块之前，我们必须首先建立对网络通信底层原理的深刻理解。socket作为操作系统提供的低级网络接口，其行为和功能直接映射着网络协议栈的各个层次。因此，对OSI（开放系统互连）模型和TCP/IP模型的透彻分析，是理解socket操作精髓的先决条件。1.1网络通信的起源与核心概念网络通信的本质是数据在不同物理位置
LeetCode - 剑指 Offer 66. 构建乘积数组翊棽312 LeetCode leetcode 算法职场和发展
原题地址。剑指Offer66.构建乘积数组题目描述解题思路遍历乘法源代码运行结果总结反思题目描述解题思路遍历乘法先将其分为上下两个三角：下三角从上往下：从第二行开始，并且给B[0]赋初值1。累乘结果等于前一个的B[i-1]乘以a数组当前索引的前一个的元素a[i-1]（这是因为相邻两行之间，下一行比上一行的左三角多了一个**a[i-1]**元素）。一个循环下来之后，每个B元素得到了a数组左下角各自的
安装python后如何安装numpy_如何简单安装NumPy与SciPy
2015-12-27回答numpy是一个定义了数值数组和矩阵类型和它们的基本运算的语言扩展。scipy是一种使用numpy来做高等数学、信号处理、优化、统计和许多其它科学任务的语言扩展。学习这两个工具的话，官方有很详细的文档和教程来帮助入门：我是传送门另外，还有一本书《numpyandscipy》，很薄，才67页：我是传送门如何安装numpy和scipy之所以写这篇文章主要是因为scipy官网貌似
我总结的制作酵素快步骤婷依1988
我总结的制作酵素快步骤：首先将水果喷上果蔬宝，接下来1、桶；2、倒入水6L；3、将大滤芯放入桶内；4、直接将白砂糖倒入水中（不要搅拌，给糖自然融化也很快的，有了加热垫会更快，不一定需要先化糖）；5、洗净水果，处理切片（切越小或者越薄越好）；6、倒入桶中并搅拌（搅拌时用手按住大滤芯，不要让滤芯随着搅动而转动摩擦到桶壁和桶底）勺子搅动时也尽量不要碰到桶壁和桶底，因为桶壁和桶底有一层还原酶，负责杀菌的；
Python 中 sys 库的全面解析与实战应用二向箔reverse 服务器 python
在Python的众多标准库中，sys库占据着举足轻重的地位。它与Python解释器紧密交互，为开发者提供了访问解释器内部信息和控制解释器行为的强大能力。无论是命令行参数处理、系统环境配置，还是程序退出控制，sys库都能大显身手。本文将带您深入探索sys库的常用功能，通过丰富的实例讲解，助您轻松掌握其使用技巧。sys库的基础认知sys库是Python的内置标准库，无需额外安装，只需通过imports
python环境安装jupyter 爱分享的胖头鱼 02.Python(基础知识)jupyter ide python python虚拟环境
安装完毕之后下一步可以参考：配置jupyter的启动路径-CSDN博客1前提条件：python环境系统：win10python：本地已经有python，可以查看本地的python版本：C:\Users\PC>python--versionPython3.8.102安装jupyter并启动安装jupyterC:\Users\PC>pipinstalljupyternotebookCollecting
2018-6-12 Day9 预算日伍羽卿桁
【百日生涯营DAY9】制定下周的预算；然后制定下个月的预算吧。预算这件事，就跟你制定愿景一样，既要期待又要以现实为基础。通过不断试错和总结复盘，以后你的预算能力也会越来越强的！1.6月16日为来贵阳租房:1700×6（半年）＋1700（押金）＋1700（中介费）＝136002.家具:100003.搬家:50004.三餐:20005.昆明结算工资:500018-卿心-贵阳-2组
python爬虫之获取渲染代码
获取渲染后的网页代码过get()方法获取浏览器中的网页资源后,浏览器将自动渲染网页源代码内容，并生成渲染后的的时使用page_source()方法即可获取渲染后的网页代码。示例代码:'''获取渲染后的网页代码'''fromseleniumimportwebdriverfromselenium.webdriver.chrome.optionsimportOptionschrome_options=O
学习笔记(66):Python入门教程-datetime模块时间运算顾子宇研发管理 python 编程语言 Python 小猿圈 Python入门教程
立即学习:https://edu.csdn.net/course/play/24459/296363?utm_source=blogtoedudatetime模块：datetime.date：表示日期的类，常用属性有year，month，daydatetime.time：表示时间的类，常用的属性有hour,minute,second,microseconddatetime.datetime：表示日
掌握reStructuredText：编写与格式化文档的技巧
本文还有配套的精品资源，点击获取简介：reStructuredText（rST）是一种轻量级文本标记语言，广泛用于Python社区的文档编写，特别是借助Sphinx文档生成器。本文介绍了rST的基础语法和高级特性，包括段落、标题、强调、代码、列表、引用、链接、图像、表格、章节组织、自定义角色和指令、包含和排除文件以及源代码高亮。同时，探讨了Sphinx与rST结合使用的高级功能，包括扩展、配置和构
[Python] -项目实战5- Python 实现简易学生成绩管理系统踏雪无痕老爷子 Python python 开发语言
一、为什么做这个项目？学习OOP和GUI基础：通过类与对象封装学生信息，熟悉Tkinter构建窗口、表格、按钮等。实用性强：可添加、查询、删除、修改学生记录，是常见管理系统的基本功能。扩展性好：后续可以接入数据库、图表展示、权限控制等功能。二、核心技术与工具tkinter：Python内置的桌面GUI库，用于构建窗口界面、表单和按钮。sqlite3：轻量级关系数据库，适合小型持久化存储，无需部署服
[Python] -项目实战类3- 用Python制作一个记事本应用踏雪无痕老爷子 Python 开发语言 python
一、为什么要自己写记事本？提升GUI编程能力：通过构建窗口、菜单、文本区等组件，理解基本控件的使用。实用工具：自定义功能、更轻量、更符合个人使用习惯。实验与扩展空间大：方便加入特色功能，如自动保存、代码高亮、插件等。二、准备工作✅安装Python（建议Python 3.7+）。无需安装第三方库，tkinter是Python标准库的一部分。用于构建UI界面。sudoaptinstallpython3
[Python] -项目实战4- 利用Python进行Excel批量处理踏雪无痕老爷子 Python python excel 开发语言
一、为什么要批量处理Excel文件？节省时间：人工对数十、数百个Excel文件重复操作不现实，Python批量处理一次搞定。保证一致性：统一格式、统一操作，避免手动误差。易于集成：可嵌入日常自动化流程，支持定时和触发执行。二、常用库及选型建议库作用优势局限pandas读取/清洗/分析Excel数据语法简
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

CS224W Colab_1 笔记

1 Graph Basic

1.1 networkx实现空手道俱乐部Graph的可视化。

1.2 利用network计算Graph的平均度并取整（Question 1）

1.3 平均聚类系数计算，并保留2位小数，可以使用networkx自带的聚类系数函数（Question 2）

1.4 计算id=0节点经过一次迭代的PageRank值（Question 3）

1.5 计算(raw) closeness centrality （Question 4）

2 Graph To Tensor

2.1 Tensor矩阵的初始化（全1，全0，随机值）及元素类型转换

2.2 将networkx中Graph的边转化为dict类型，每条边在dict中用一个而2个元素的tuple表示。然后，再将dict转换为torch.LongTensor类型（Question 5）。

2.3 实现一个负样本边生成函数，功能是生成原图中没有的一些边（需要注意无向图正负边为同一条边，自环不算边等情况）（Question 6）

3 Node Embedding Learning

3.1 torch.nn.Embedding类的使用

3.2 nn.Embedding实例emb的可视化

3.3 torch.nn.Embedding类的实例emb的训练过程（Question 7）

你可能感兴趣的:(Python总结,python,开发语言)