海阔＆天空742

实战-----基于 PyTorch 的 GNN 搭建

1.图的表示

2.图卷积网络（GCN）的搭建

3.图注意力网络（GAT）的搭建

4.PyG 基础：图数据的操作

1.torch_geometric 的安装

2.图数据的属性

3.基准图数据库及基本操作

4.图数据的可视化

5.实验总结

1.图的表示

在开始讨论特定的图神经网络操作之前，我们首先来考虑如何表示图。在数学上，图 G 定义为一组节点/顶点 V 和一组边/链接 E：G=（V，E）的二元组。每条边链接两个顶点，如下图所示：

如上图所示，顶点是 V=1,2,3,4，边是 E=（1,2）、（2,3）、（2,4）、（3,4）。注意，这里为了简单起见，假设图是无向的，因此不添加像（2,1）（2,1）这样的镜像对。在实际应用中，顶点和边通常可以具有特定的属性特征，也可以是有向边。那么，如何用一种有效的方法来表示图呢？通常有两种方案：

邻接矩阵：表示顶点之间相邻关系的矩阵。
邻接表：存储方法跟树的孩子链表示法相类似，是一种顺序分配和链式分配相结合的存储结构。如这个表头结点所对应的顶点存在相邻顶点，则把相邻顶点依次存放于表头结点所指向的单向链表中。

2.图卷积网络（GCN）的搭建

图卷积神经网络（Graph Convolutional networks, GCN）由 Kipf 等人在 2016 年提出，类似于图像中的卷积处理，CNN 中的卷积本质上就是利用共享参数的过滤器，通过计算中心像素点以及相邻像素点的加权和来实现空间特征的提取。而 GCN 也是如此，依赖于节点间的消息传递方法，这意味着点与其邻居点交换信息，并相互发送消息。在看具体的数学表达式之前，我们可以试着直观地理解 GCN 是如何工作的，可分为以下两大步骤：

第一步，每个节点创建一个特征向量，表示它要发送给所有邻居的消息。

第二步，消息被发送到相邻节点，这样每个节点均会从其相邻节点接收一条消息。

下面的图可视化了以上两大步骤：

之后，如何组合节点接收的所有消息呢？由于节点间消息的数量不同，因此需要一个适用于任意数量的操作，通常的方法是求和或取平均值。令 $H^{(l)}$ 表示节点以前的特征表示， $H^{(l+1)}$ 为整合消息后的特征表示，GCN 层定义如下:

$W^{(l)}$ 是将输入特征转换为消息的权重参数。在邻接矩阵 A 的基础上，加上单位矩阵，以便每个节点也向自身发送消息，即：A^=A+I。最后，为了取平均值的运算，需要用到矩阵 D^，这是一个对角矩阵，Dii 表示节点 i 的邻居数。σ 表示一个任意的激活函数，当然，不一定是 Sigmoid，事实上，在 GNN 中通常使用基于 ReLU 的激活函数。

在 PyTorch 中实现 GCN 层时，我们可以灵活地利用张量进行运算，不必定义矩阵 D^，只需将求和的消息除以之后的邻居数即可。此外，线性层便是以上的权重矩阵，同时可以添加 bias。基于 PyTorch，GCN 层可定义如下：

import torch
import torch.nn as nn

class GCNLayer(nn.Module):

    def __init__(self,c_in,c_out):
        """
        Inputs:
        :param c_in: 输入特征
        :param c_out: 输出特征
        """
        super().__init__()
        self.projection = nn.Linear(c_in,c_out); #线性层
        
    def forword(self,node_feats,adj_matrix):
        """
        输入
        :param node_feats: 节点特征表示，大小为[batch_size,num_nodes,c_in]
        :param adj_matrix: 邻接矩阵：[batch_size,num_nodes,num_nodes]
        :return:
        """
        num_neighbors = adj_matrix.sum(dim=-1,keepdims=True)#各节点的邻居数
        node_feats = self.projection(node_feats)#将特征转化为消息
        #各邻居节点消息求和并求平均
        node_feats = torch.bmm(adj_matrix,node_feats)
        node_feats = node_feats / num_neighbors
        return node_feats

为了进一步理解 GCN 层，可将其应用至上面的节点示例图中。首先，基于上面示例图，指定一些节点特征和添加自连接的邻接矩阵：

node_feats = torch.arange(8,
dtype=torch.float32).view(1,4,2)
adj_matrix = torch.Tensor([[[1,1,0,0],
            [1,1,1,1],
            [0,1,1,1],
            [0,1,1,1]]])
print("节点特征：\n",node_feats)
print("添加自链接的邻接矩阵：\n",adj_matrix)

接下来将其输入 GCN 层，为简单起见，这里将线性权重矩阵初始化为单位矩阵，以便输入特征与消息相等，可以更容易地验证消息传递操作。

layer = GCNLayer(c_in=2, c_out=2)
# 初始化权重矩阵
layer.projection.weight.data = torch.Tensor([[1., 0.], [0., 1.]])
layer.projection.bias.data = torch.Tensor([0., 0.])

# 将节点特征和添加自连接的邻接矩阵输入 GCN 层
with torch.no_grad():
    out_feats = layer(node_feats, adj_matrix)

print("节点特征:\n", node_feats)
print("添加自连接的邻接矩阵:\n", adj_matrix)
print("节点输出特征:\n", out_feats)

结果：

节点特征：
 tensor([[[0., 1.],
         [2., 3.],
         [4., 5.],
         [6., 7.]]])
添加自链接的邻接矩阵：
 tensor([[[1., 1., 0., 0.],
         [1., 1., 1., 1.],
         [0., 1., 1., 1.],
         [0., 1., 1., 1.]]])
节点输出特征：
 tensor([[[1., 2.],
         [3., 4.],
         [4., 5.],
         [4., 5.]]])

Process finished with exit code 0

如上所见，第一个节点的输出值是其自身和第二个节点的平均值，其他节点同理。当然，在具体实践中，我们还希望允许节点之间的消息传递不仅仅局限于邻居节点，这可以通过应用多个 GCN 层来实现，而很多的 GNN 即是由多个 GCN 和非线性（如 ReLU）的组合构建而成，如下图所示：

通过以上 GCN 层的运算示例，发现一个问题，即节点 3 和 4 的输出相同，这是因为它们具有相同的相邻节点（包括自身）输入，再取均值，所得到的值便一样了。这在大部分情况下并不合理。

3.图注意力网络（GAT）的搭建

为了解决此问题，一种常见的方法是对自连接添加更高的权重，或者为不同连接定义不同的权重，这里就涉及到了另一个重要概念：注意力机制。

注意力机制描述了多个元素的加权平均，这一概念同样适用于图，称为图注意力网络（Graph Attention Networks，GAT，由 Velickovic et al.，2017 提出)，与 GCN 类似，图注意力层使用线性层为每个节点创建消息。对于注意力的计算部分，综合使用来自节点本身的特征以及其它节点的特征。节点从 i 到 j 的最终注意力权重 αij 的计算示意图如下所示：

hi 和 hj 分别是节点 i 和 j 的原始特征，用 W 作为权重矩阵，运算后进行拼接，再经过权重矩阵 a 的计算，其形状为 [1,2×dmessage]，接着经由激活函数（例如 LeakyReLU）以及 Softmax 的运算，最后计算而得的 αij 表示节点从 i 到 j 的最终注意力权重，计算方法如下：

最终的节点特征值 hi′ 基于所有 αij 以及相应的 Whj 进行加权平均而得,σ 表示激活函数,示意图如下：

为了增加图注意力网络的表征能力，Velickovic 等人建议将其扩展到多头机制，类似于 Transformer 中的多头注意力模块。在有了对图注意层的基本了解之后，我们可以基于 PyTorch 实现它：

import torch
import torch.nn as nn
import torch.nn.functional as F

class GATLayer(nn.Module):

    def __int__(self,c_in,c_out,
                num_heads=1,concat_heads=True,alpha=0.2):
        """

        :param c_in: 输入特征维度
        :param c_out: 输出特征维度
        :param num_heads: 多头的数量
        :param concat_heads: 是否拼接多头计算的结果
        :param alpha: LeakyReLU的参数
        :return:
        """
        super().__init__()
        self.num_heads = num_heads
        self.concat_heads = num_heads
        if self.concat_heads:
            assert c_out % num_heads ==0,"输出特征数必须是头数的倍数！"
            c_out = c_out // num_heads

        #参数
        self.projection = nn.Linear(c_in,c_out*num_heads) #有几个头，就需要将c_out扩充几倍
        self.a = nn.Parameter(torch.Tensor(num_heads,2*c_out)) #用于计算注意力的参数，由于对两节点拼接后的向量进行操作，所以2*c_out
        self.leakrelu = nn.LeakyReLU(alpha) #激活层

        #参数初始化
        nn.init.xavier_uniform_(self.projection.weight.data, gain=1.414)
        nn.init.xavier_uniform_(self.a.data, gain=1.414)

        def forward(self,node_feats,adj_matrix,print_attn_probs=False):
            """
            输入：
            :param self:
            :param node_feats: 节点的特征表示
            :param adj_matrix: 邻接矩阵
            :param print_attn_probs: 是否打印注意力
            :return:
            """
            batch_size,num_nodes = node_feats.size(0),node_feats.size(1)

            #将节点初始输入进行权重运算
            node_feats = self.projection(node_feats)
            #扩展出多头数量的维度
            node_feats = node_feats.view(batch_size,num_nodes,self.num_heads,-1)

            # 获取所有顶点对拼接而成的特征向量 a_input
            edges = adj_matrix.nonzero(as_tuple=False)  # 返回所有邻接矩阵中值不为 0 的 index，即所有连接的边对应的两个顶点
            node_feats_flat = node_feats.view(batch_size * num_nodes, self.num_heads, -1)  # 将所有 batch_size 的节点拼接

            edge_indices_row = edges[:, 0] * batch_size + edges[:, 1]  # 获取边对应的第一个顶点 index
            edge_indices_col = edges[:, 0] * batch_size + edges[:, 2]  # 获取边对应的第二个顶点 index

            a_input = torch.cat([
            torch.index_select(input=node_feats_flat, index=edge_indices_row, dim=0), # 基于边对应的第一个顶点的 index 获取其特征值
                torch.index_select(input=node_feats_flat, index=edge_indices_col, dim=0)  # 基于边对应的第二个顶点的 index 获取其特征值
            ], dim=-1)  # 两者拼接

            # 基于权重 a 进行注意力计算
            attn_logits = torch.einsum('bhc,hc->bh', a_input, self.a)
            # LeakyReLU 计算
            attn_logits = self.leakyrelu(attn_logits)

            # 将注意力权转换为矩阵的形式
            attn_matrix = attn_logits.new_zeros(adj_matrix.shape + (self.num_heads,)).fill_(-9e15)
            attn_matrix[adj_matrix[..., None].repeat(1, 1, 1, self.num_heads) == 1] = attn_logits.reshape(-1)

            # Softmax 计算转换为概率
            attn_probs = F.softmax(attn_matrix, dim=2)
            if print_attn_probs:
                print("注意力权重:\n", attn_probs.permute(0, 3, 1, 2))
            # 对每个节点进行注意力加权相加的计算
            node_feats = torch.einsum('bijh,bjhc->bihc', attn_probs, node_feats)

            # 根据是否将多头的计算结果拼接与否进行不同操作
            if self.concat_heads:  # 拼接
                node_feats = node_feats.reshape(batch_size, num_nodes, -1)
            else:  # 平均
                node_feats = node_feats.mean(dim=2)

            return node_feats

和前面一样，输入层被初始化为一个单位矩阵，但是我们将 a 设置为任意数字的向量，以获得不同的注意力值。另外，多头机制设置为用两个头：

layer = GATLayer(2, 2, num_heads=2)
layer.projection.weight.data = torch.Tensor([[1., 0.], [0., 1.]])
layer.projection.bias.data = torch.Tensor([0., 0.])
layer.a.data = torch.Tensor([[-0.2, 0.3], [0.1, -0.1]])
node_feats = torch.arange(8, dtype=torch.float32).view(1, 4, 2)
adj_matrix = torch.Tensor([[[1, 1, 0, 0],
                                    [1, 1, 1, 1],
                                    [0, 1, 1, 1],
                                    [0, 1, 1, 1]]])
with torch.no_grad():
    out_feats = layer(node_feats, adj_matrix, print_attn_probs=True)


print("节点特征:\n", node_feats)
print("添加自连接的邻接矩阵:\n", adj_matrix)
print("节点输出特征:\n", out_feats)

注意力权重:
 tensor([[[[0.3543, 0.6457, 0.0000, 0.0000],
          [0.1096, 0.1450, 0.2642, 0.4813],
          [0.0000, 0.1858, 0.2885, 0.5257],
          [0.0000, 0.2391, 0.2696, 0.4913]],

         [[0.5100, 0.4900, 0.0000, 0.0000],
          [0.2975, 0.2436, 0.2340, 0.2249],
          [0.0000, 0.3838, 0.3142, 0.3019],
          [0.0000, 0.4018, 0.3289, 0.2693]]]])
节点特征:
 tensor([[[0., 1.],
         [2., 3.],
         [4., 5.],
         [6., 7.]]])
添加自连接的邻接矩阵:
 tensor([[[1., 1., 0., 0.],
         [1., 1., 1., 1.],
         [0., 1., 1., 1.],
         [0., 1., 1., 1.]]])
节点输出特征:
 tensor([[[1.2913, 1.9800],
         [4.2344, 3.7725],
         [4.6798, 4.8362],
         [4.5043, 4.7351]]])

Process finished with exit code 0

4.PyG 基础：图数据的操作

1.torch_geometric 的安装

安装torch-geometric之前，需要先安装torch-scatter、torch-sparse、torch-cluster、torch-spline-conv

安装网址：网址在此

最后 pip install torch-geometric

安装完成以后，我们可以基于 Data 类构建图数据，比如下图所示的图数据：

2.图数据的属性

简单地说，图构由节点以及边构成，当然在此基础上，还包含一系列其它信息，比如是否有向，是否有孤立点，节点的特征表示等。应用 PyG 中的类 torch_geometric.data.Data，可快速构建你的图数据对象，一般情况下，包含以下默认属性（并非必须属性）：

data.x: 节点的特征矩阵，大小为 [num_nodes, num_node_features]。
data.edge_index: 图中的边，以 COO （把矩阵中不为 0 的数的行号，列号存储下来）方式存储，大小为 [2, num_edges]。
data.edge_attr: 边的特征矩阵，大小为 [num_edges, num_edge_features]。
data.y: 数据的目标输出, 大小不固定，比如，node-level 的目标输出大小为 [num_nodes, *]，graph-level 的目标输出大小为 [1, *]。
data.pos:节点的位置矩阵，大小为 [num_nodes, num_dimensions]。

import torch
from torch_geometric.data import Data
# 基于节点的index表示边
#[0,1,1,2]表示出发的节点index
#[1,0,2,1]表示到达index
edge_index = torch.tensor([[0,1,1,2],
                           [1,0,2,1]],dtype=torch.long)
x = torch.tensor([[-1],[0],[1]],dtype=torch.float)#节点的特征矩阵，有3个节点，特征维度为1

data = Data(x=x,edge_index = edge_index) #初始化图
print(data)#查看图属性

结果：

Data(x=[3, 1], edge_index=[2, 4])

Process finished with exit code 0

edge_index 为边表示矩阵大小，x 为节点的特征矩阵大小。

Data 类还提供如下的一些功能，以获取更多的信息：

获取属性键：

获取某键下的值：

获取节点数：

获取边数：

获取节点的特征维度：

查看是否存在孤立的节点：

data.contains_self_loops()

查看是否存在环:

查看是否是有向图：

3.基准图数据库及基本操作

除了可以自定义图数据，PyG 还包含有很多常见的基准数据集，典型代表有：

Cora：一个根据科学论文之间相互引用关系而构建的图数据集合，论文分为 7 类：Genetic_Algorithms，Neural_Networks，Probabilistic_Methods，Reinforcement_Learning，Rule_Learning，Theory，共 2708 篇。
Citeseer：一个论文之间引用信息数据集，论文分为 6 类：Agents、AI、DB、IR、ML 和 HCI，共包含 3312 篇论文。
Pubmed：生物医学方面的论文搜寻以及摘要数据集。

此外，还包含了一系列 3D 点云数据集，比如 FAUST，ShapeNet 等。PyG 提供了这些数据的自动下载，并将其处理成 Data 类的形式，接下来以 ENZYMES 数据集为例（包含 600 个图和 6 个类别）进行说明。

遗憾的是，在使用 datasets 进行数据集 ENZYMES 的创建时，由于网络不稳定等原因经常会出现 HttpError 类的错误，所以需要手动下载数据集并且注释掉源码中的基于 url 的下载操作，如果你在个人环境中操作，具体步骤如下:

第一步：在 url 链接中手动下载数据集：https://www.chrsmrrs.com/graphkerneldatsets/ENZYMES.zip
第二步：解压下载的 zip 文件，并构建文件路径：

- ENZYMES
    - processed # 空文件，后续会存放处理后的数据
    - raw # 存放解压后的几个文件

第三步：进入 PyTorch Geometric 库中的 tu_dataset.py 文件（可通过代码 from torch_geometric.datasets import TUDataset 中的 TUDataset 跳转），跳转至类 TUDataset(InMemoryDataset) 后，注释掉其中的 download() 函数，即不基于 url 下载数据集。

接下来拿ENZYMES数据集（包含600个图，每个图分为6个类别，图级别的分类）举例如何使用PyG的公共数据集

from torch_geometric.datasets import TUDataset

# 导入数据集
dataset = TUDataset(
    # 指定数据集的存储位置
    # 如果指定位置没有相应的数据集
    # PyG会自动下载
    root='ENZYMES/',
    # 要使用的数据集
    name='ENZYMES',
)
# 数据集的长度
print(len(dataset))
# 数据集的类别数
print(dataset.num_classes)
# 数据集中节点属性向量的维度
print(dataset.num_node_features)
# 600个图，我们可以根据索引选择要使用哪个图
data = dataset[100]
print(data)
# 随机打乱数据集
dataset = dataset.shuffle()

在导入数据集的时候遇到了一个报错：

AttributeError: module ‘torch‘ has no attribute ‘sparse_csc‘

通过查找网上资料，发现是因为torch-geometric版本过高，通过降低版本，最终解决。参见这篇博客，亲测有效解决方案。

结果如下：

600
6
3
Data(edge_index=[2, 176], x=[45, 3], y=[1])
True

综合以上操作的输出结果，可知此图（dataset[100]）中包含了 45 个节点，特征大小为 3，存在 176/2 = 88 条边，目标标签为 graph-level 的类别（类别标签为 1）。

神经网络通常以批次化的方式进行训练（即基于一小批数据用作一次参数的迭代更新），而 PyG 通过创建稀疏的邻接矩阵，也提供了相应功能的迭代器 DataLoader，加载 torch_geometric.data.DataLoader，可以快速实现数据的批次化。

from torch_geometric.data import DataLoader
loader = DataLoader(dataset, batch_size=32, shuffle=True) # 批次大小为 32，并且数据的顺序随机打乱

批次化迭代：

for batch in loader:
    print("一批数据：",batch)
    print("一批数据量：",batch.num_graphs)

结果如下：

一批数据： DataBatch(edge_index=[2, 4000], x=[1026, 3], y=[32], batch=[1026], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 3936], x=[1092, 3], y=[32], batch=[1092], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 3300], x=[828, 3], y=[32], batch=[828], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 3298], x=[903, 3], y=[32], batch=[903], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 3918], x=[1032, 3], y=[32], batch=[1032], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 4074], x=[1057, 3], y=[32], batch=[1057], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 4482], x=[1204, 3], y=[32], batch=[1204], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 4526], x=[1176, 3], y=[32], batch=[1176], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 3800], x=[1009, 3], y=[32], batch=[1009], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 3700], x=[957, 3], y=[32], batch=[957], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 3818], x=[981, 3], y=[32], batch=[981], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 4256], x=[1088, 3], y=[32], batch=[1088], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 4070], x=[1080, 3], y=[32], batch=[1080], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 4336], x=[1150, 3], y=[32], batch=[1150], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 4134], x=[1083, 3], y=[32], batch=[1083], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 3920], x=[983, 3], y=[32], batch=[983], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 3892], x=[1014, 3], y=[32], batch=[1014], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 3984], x=[1039, 3], y=[32], batch=[1039], ptr=[33])
一批数据量： 32
一批数据： DataBatch(edge_index=[2, 3120], x=[878, 3], y=[24], batch=[878], ptr=[25])
一批数据量： 24

Process finished with exit code 0

以第一批数据的输出 一批数据： Batch(batch=[1145], edge_index=[2, 4284], x=[1145, 3], y=[32]) 为例，batch=[1145] 表示此批数据的节点数有 1145，边数有 4284/2 = 2142。另外，由于数据量不一定能被 batch_size 整除，所以最后一批数据有可能小于 batch_size。

接下来以 ShapeNet 中的 Airplane 数据集（3D 点云数据：指在一个三维坐标系统中的一组向量的集合）为例进行说明，首先需要加载数据集。

加载数据集,并未经过转换的原始数据如下：

from torch_geometric.datasets import ShapeNet
dataset = ShapeNet(root='Airplane', categories=['Airplane'])
print(dataset[0])

结果：

Processing...
Done!
Data(x=[2518, 3], y=[2518], pos=[2518, 3], category=[1])

Process finished with exit code 0

可通过变换从点云生成最近邻图，将点云数据集转换为图数据集：

import torch_geometric.transforms as T
dataset = ShapeNet(root='Airplane', categories=['Airplane'],
                    pre_transform=T.KNNGraph(k=6)) # 进行 KNN 聚类操作

结果：

Data(x=[2518, 3], y=[2518], pos=[2518, 3], category=[1])

Process finished with exit code 0

当然，仅仅打印 dataset[0] 无法可视化两者的差别。因此很多时候，图数据需要配合专门的函数进行可视化操作。

4.图数据的可视化

相对于其它类型的数据，比如文本、图像等，图数据能够通过可视化给人直观的视觉感受。比如，单纯地通过模型处理前后的图数据的聚合效果可以判断模型的基本性能。接下来通过一个简单地案例实现对图数据的可视化。

首先定义可视化函数：

import networkx as nx
import matplotlib.pyplot as plt
%matplotlib inline

def visualize_networkx(graph, color):
    plt.figure(figsize=(8,8)) # 设定图画区域大小
    nx.draw_networkx(graph, with_labels=False,node_color=color) # 画图
    plt.show()

在进行可视化之前，首先需要对图数据进行格式转化，转化为 networkx：

假如 to_undirected=True：应用 to_networkx 将 torch_geometric.data.Data 转化为 networkx.DiGraph 。
假如 to_undirected=False：应用 to_networkx 将 torch_geometric.data.Data 转化为 networkx.Graph 。

from torch_geometric.datasets import KarateClub
from torch_geometric.utils import to_networkx

dataset = KarateClub()[0] # 取图数据集
G = to_networkx(dataset,to_undirected=True) # 转化为 networkx
visualize_networkx(G, color=dataset.y) # 画图

在上图中，相同颜色的点为同一类别，可直观了解数据的分布特性。

5.实验总结

在以上的实验中，我们对 PyG 中的图数据类以及自身具备的图数据进行了实践，整体而言比较简单，和 PyTorch 中的一些相关操作也有相似之处。唯一美中不足的是，在加载 PyG 中的图数据时经常会遇到问题，需要手工下载数据集并且修改原代码。

你可能感兴趣的:(pytorch,人工智能,python)

python爬虫爬百度云盘的资源 oaa608868 百度云爬虫 python
最近百度云盘不知道为啥不提供资源检索，正好最近看了一下python，正好来练练手，写歌爬虫爬一下百度云盘的资源。分析了一下百度云盘的网友源码和js文件，里面有大量ajax的东西，利用json传输数据，前端显示。话说，这样数据爬去就方便多了，也不要用scrapy啥的，直接解析json数据就好。分析js文件提炼了下面三个链接：URL_SHARE='http://yun.baidu.com/pclo
Python通过字符串调用函数_python 面向对象根据字符串调动对应函数(1) m0_61418142 python 数据库 linux
textprocess(file,language)但是textprocess(file=‘data.txt’,language=‘english’)language(text)TypeError:‘str’objectisnotcallable百度谷歌一番，我查到以下几种方式####1-字典最简单，易上手的方式，使用字典配对。defchinese(text):print(‘jieba分词’)de
python-内置装饰器大风起于云兮测试开发学习 python
类方法classMethodsdemo:param_a=0#定义类方法必须要加classmethod装饰器@classmethoddefclass_method_demo(cls):"""这是一个类方法，类方法的第一个参数必须为cls，以区别实例方法的self参数:return:"""print('这是一个类方法',cls.param_a)if__name__=='__main__':Method
【python第三方库】Hydra库在AI项目中使用简介
文章目录一、前言1.omegaconf与Hydra库的关系2.Hydra优势二、实际用法展示1.项目结构2.配置文件3.Python代码4.运行示例4.1默认配置运行4.2从命令行覆盖配置4.3多运行模式5.超参数优化5.1安装Optuna插件5.2修改config.yaml5.3运行超参数优化一、前言Hydra是一个开源Python框架，可简化研究和其他复杂应用程序的开发。关键特性是能够通过组合
大学专业科普 | 计算机应用、视觉与算法鸭鸭鸭进京赶烤计算机应用
一、专业概述计算机应用专业是一门实践性很强的学科，专注于将计算机技术转化为实际应用，服务于各个行业和领域，为社会的数字化转型提供人才支撑。二、课程设置专业基础课程：包括计算机组成原理、操作系统、数据结构、计算机网络等，为学生构建坚实的理论基础。专业核心课程：聚焦于程序设计语言（如C、C++、Java、Python等）、数据库原理与应用、软件工程、Web前端开发等，使学生具备开发各类软件系统的能力。
字符串篇(python)—如何统计字符串中连续的重复字符个数_python随机给出字符串,统计连续且相同个数 2401_84141337 程序员 python 开发语言
"""递归实现一个求字符串中连续出现相同字符的最大值例如字符串"aaabbcc"最大值为a3解题思路遍历字符串的时候定义两个变量curMaxLen记录当前遍历字符重复的连续字符个数maxLen遍历到目前为止找到最长的连续重复字符的个数"""defgetMaxDupChar(s,startIndex,curMaxLen,maxLen):ifstartIndex==len(s)-1:returnmax
【Python】Hydra 用法详解行码棋 #Python python 开发语言
Hydra官方文档Hydra（Python配置管理工具）1.引言在机器学习、深度学习和软件开发中，管理复杂的配置是一个常见的挑战。Hydra是一个强大的Python库，允许开发者轻松地管理和组织配置文件，支持动态参数覆盖、多层次配置和可组合配置等特性。2.安装HydraHydra可以通过pip直接安装：pipinstallhydra-core安装完成后，你可以使用hydra进行配置管理。3.基础用
Python 时间处理实战：4 个 datetime 模块的高效应用场景李智 - 重庆 Python 精讲精练 -从入门到实战 python 案例学习编程技巧经验分享经典范例
Python时间处理实战：4个datetime模块的高效应用场景Python的datetime模块是标准库中用于处理日期和时间的核心模块。它提供了多种类和工具，方便开发者操作日期、时间、时间间隔以及时区信息。以下是其主要功能及组件：一、基础速递1.主要类及用途1.1datetime.date功能：处理日期（年、月、日）。示例：fromdatetimeimportdatetoday=date.tod
Python实战案例，requests模块，Python实现获取动态图表小雁子学Python Python技术分享 python 实战案例 requests模块动态图表
前言利用Python实现获取动态图表，废话不多说~让我们愉快地开始吧~开发工具Python版本：3.6.4相关模块：re模块；requests模块；urllib模块；pandas模块；以及一些Python自带的模块。环境搭建安装Python并添加到环境变量，pip安装需要的相关模块即可。看一下B站2019年「数据可视化」版块的情况，第一个视频超2百万的播放量，4万+的弹幕百度指数获取百度指数，首先
onnx模型部署 python_深度学习模型转换与部署那些事(含ONNX格式详细分析) weixin_39759270 onnx模型部署 python
背景深度学习模型在训练完成之后，部署并应用在生产环境的这一步至关重要，毕竟训练出来的模型不能只接受一些公开数据集和榜单的检验，还需要在真正的业务场景下创造价值，不能只是为了PR而躺在实验机器上在现有条件下，一般涉及到模型的部署就要涉及到模型的转换，而转换的过程也是随着对应平台的不同而不同，一般工程师接触到的平台分为GPU云平台、手机和其他嵌入式设备对于GPU云平台来说，在上面部署本应该是最轻松的事
如何禁止GPTBot等爬虫爬取网站内容：保护数据安全的实用指南淮橘√ 人工智能
引言随着人工智能技术的快速发展，网络爬虫（如OpenAI的GPTBot、GoogleBot、Anthropic的ClaudeBot等）被广泛用于抓取网站数据以训练AI模型或索引内容。然而，部分网站管理员可能不希望自己的内容被爬虫抓取，原因包括保护原创内容、降低服务器负载或防止数据被滥用。一、为什么需要禁止爬虫？网络爬虫可能带来以下问题：内容盗用风险：原创内容可能被AI模型或其他服务未经授权使用。服
Java 与 AI 携手，掀起多领域智能变革浪潮 WangRK_ 人工智能 java 开发语言
在数字化转型的时代浪潮下，技术更新迭代速度超乎想象。当Java这门历经二十余年沉淀的编程语言，遇上风头正劲的人工智能（AI），一场席卷多领域的智能变革正悄然发生。尤其是在金融与零售两大行业，这场技术融合带来的改变，正重塑着整个行业的生态。一、Java在金融与零售行业的“前世今生”（一）曾经的行业基石在金融领域，Java堪称“代码钢铁侠”，是金融基础设施的坚实支柱。全球顶级交易所依靠Java强大的性
Python - 爬虫；Scrapy框架之插件Extensions（四） MinggeQingchun Python Python 爬虫 Scrapy extensions
阅读本文前先参考https://blog.csdn.net/MinggeQingchun/article/details/145904572在Scrapy中，扩展（Extensions）是一种插件，允许你添加额外的功能到你的爬虫项目中。这些扩展可以在项目的不同阶段执行，比如启动、关闭、处理请求、处理响应等。Extensions官网文档：Extensions—Scrapy2.12.0document
python中的高级变量V hbwhmama python学习 python
定义一个元组(常规)info_tuple=("Tom",18,1.85)print(type(info_tuple))#查看info_tuple的类型print(info_tuple)#输出元祖中的所有元素('Tom',18,1.85)print(info_tuple[0])#指定索引直输出指定数据Tom定义一个空元组info_tuple_01=()print(type(info_tuple_01
Python应用指南：利用高德地图API获取公交+地铁可达圈（二）图说交通高德API系列 python 开发语言信息可视化 shp 高德地图api
副标题：利用Python自动化调用高德API并批量处理可达圈在上一篇文章中，我们详细探讨了如何利用高德地图API获取单一位置的公交可达圈数据。通过构建请求URL、发送HTTP请求、解析返回的JSON数据，并对其中的坐标进行从GCJ-02（高德火星坐标系）到WGS84（通用地理坐标系）的转换，最终将结果整理为CSV格式输出，实现了对单个出发点在指定时间范围内可到达区域的精确描绘。这一过程不仅帮助我们
筑牢医疗AI安全防线：四重防护体系全解析 Allen_Lyb 数智化教程（第二期）人工智能安全
一、引言：医疗AI发展中的安全困境在数字化浪潮席卷下，医疗领域正经历着一场由人工智能（AI）驱动的深刻变革。医疗AI凭借其强大的数据分析与处理能力，在疾病诊断、药物研发、健康管理等诸多环节展现出巨大潜力，成为推动医疗行业进步的关键力量。而这一切的背后，医疗数据作为AI发展的“燃料”，以及AI算力作为运行的“引擎”，起着不可或缺的核心作用。医疗数据涵盖了患者从基本信息、病史、症状描述到各种检查检验报
UI自动化-Selenium WebDriver Oooon_the_way ui 自动化 selenium
前言SeleniumWebDriver是Selenium项目中最核心、最强大的组件，它是一个用于自动化控制网页浏览器的开源API（应用程序编程接口）。简单来说，SeleniumWebDriver就是一个允许你用编程语言（如Java、Python、C#、JavaScript、Ruby等）编写脚本来模拟真实用户操作网页浏览器（如Chrome,Firefox,Edge,Safari等）的工具。核心功能：
[使用Python轻松提取YouTube视频转录：从零开始的指南] mmlihaio python 开发语言 linux
#使用Python轻松提取YouTube视频转录：从零开始的指南##引言在当今信息爆炸的时代，YouTube已成为获取信息的重要平台。随着视频内容的激增，自动化获取视频转录内容的需求日益增加。本文将带您探索如何使用Python从YouTube视频中提取转录信息，并分享一些实用的技巧和编码示例。##主要内容###1.YouTube转录加载器简介借助`langchain_community`库的`Yo
深入解析youtube-dl模块：视频与播放列表信息提取指南
深入解析youtube-dl模块：视频与播放列表信息提取指南youtube-dl项目地址:https://gitcode.com/gh_mirrors/you/youtube-dl前言youtube-dl作为一款强大的多媒体内容下载工具，其核心功能通过Python模块的形式提供了丰富的编程接口。本文将深入探讨如何使用youtube-dl模块来提取视频和播放列表信息，帮助开发者更好地集成这一功能到自
Python 爬虫实战：从图片网站抓取图片并进行特征提取（2025 最新版） Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 github chrome 数据库
一、引言在当今的数字时代，图像数据在各个领域中扮演着至关重要的角色。无论是计算机视觉、机器学习，还是数据分析，图像数据的获取和处理都是基础。然而，获取大量高质量的图像数据并非易事。幸运的是，互联网上充斥着丰富的图像资源，只需借助合适的工具和技术，我们就能高效地从中获取所需的图像数据。本文将详细介绍如何使用Python构建一个完整的爬虫系统，从图片网站抓取图像，并对其进行特征提取。我们将涵盖从网页分
解决web服务中在线查看minio上文件提示CORS的问题 Hong.1948 前端网络 javascript
web页面访问excel、word之类的文件时，由于浏览器的安全机制，如果目标地址和源地址不同源，就会报CORS，即跨域访问的问题。解决跨域的问题，主要有2个思路：方案1：修改目标服务的CORS策略，允许跨域访问方案2：强行同源，然后使用nginx转发请求。此前使用s3服务的时候，使用方案1解决了跨域访问的问题。s3服务，不管是客户端还是pythonsdk，都可以直接修改指定桶的CORS策略，配置
【Python】Synonyms 宅男很神经 python 开发语言
当然，我完全理解您的需求，并且将竭尽全力为您提供一个前所未有的、极其深入和全面的关于“Python库Synonyms，用于中文词性分析和相似度计算”的专属学习指南。我将从最底层、最核心的原理开始，逐步向上构建知识体系，确保每一个细节都被剖析得淋漓尽致，不放过任何一个学习角度。所有内容都将是原创生成，绝无抄袭，并辅以大量我独立设计的实战代码示例，每行代码都将附带详尽的中文解释。由于您要求极高的字数（
Python包管理工具UV：告别龟速pip，体验秒级安装，你的生产力引擎即将升级 wylee python uv pip
摘要：还在为Python包的龟速安装和复杂的依赖管理而抓狂吗？还在苦苦等待CI/CD流水线中漫长的pipinstall完成吗？今天，我要向你隆重介绍一个划时代的Python包管理工具——UV！它由Python生态巨头Astral团队倾力打造，采用Rust编写，旨在彻底颠覆你对Python包安装、虚拟环境管理和依赖解析的认知。UV不仅是pip和virtualenv的闪电替代品，更是pip-tools
python拷贝文件到指定路径不存在_Python实现文件夹递归拷贝 weixin_39717825
维护一个网站，数据库可以自动备份，但用户上传的文件很多，手动备份很麻烦，所以想用Python实现自动备份目标：1.多层文件夹嵌套，在要备份的文件夹中嵌套多个文件夹2.增量备份，因为文件较多，且之前已有部分备份，所以只需对新增的文件进行备份，提升效率Python安装：1.下载安装包，http://www.python.org/getit/，可以选择Python2或3，2的兼容性更好2.添加Pytho
Python 单例模式与魔法方法深度剖析：从原理到实践女码农的重启开发语言单例模式
在Python面向对象编程领域，单例模式和魔法方法是极具特色且功能强大的技术。单例模式确保一个类在程序运行过程中仅有一个实例，常用于资源管理、全局状态维护等场景；魔法方法则是Python类中以双下划线__开头和结尾的特殊方法，赋予类丰富的行为定制能力。本文将深入探讨二者的原理、实现方式、应用场景，以及它们之间的紧密联系。一、单例模式：实例唯一性的保障1.1单例模式的核心概念单例模式（Singlet
Gradio全解3——Gradio三种客户端：python、javascript与curl（三）——curl 龙焰智能 Gradio全解教程 gradio client curl awk/read post/get 嵌入式url
Gradio全解3——Gradio三种客户端：python、javascript与curl（三）——curl前言3.3Curl查询GradioApps3.3.1安装3.3.2获取Gradio程序的URL3.3.3HF_TOKEN和身份认证1.POST/GET示例2.整合命令：awk和read3.HF_TOKEN4.身份认证3.3.4POST：请求预测1.基本语法2.常用示例3.3.5GET：获取结
Open AI在AI人工智能领域的技术安全防护体系 AI智能探索者 AI Agent 智能体开发实战人工智能安全网络 ai
OpenAI在AI人工智能领域的技术安全防护体系关键词：OpenAI、AI安全、技术防护、伦理框架、模型对齐、数据隐私、对抗攻击摘要：本文将深入探讨OpenAI在人工智能领域构建的多层次技术安全防护体系。我们将从基础概念出发，逐步解析OpenAI如何通过技术创新和系统设计来确保AI系统的安全性、可靠性和可控性。文章将涵盖从数据安全到模型对齐，从伦理框架到实际防护技术的全方位内容，帮助读者全面理解现
揭秘自然语言处理在AI人工智能领域的奥秘 AI智能探索者 AI Agent 智能体开发实战人工智能自然语言处理 easyui ai
揭秘自然语言处理在AI人工智能领域的奥秘关键词：自然语言处理、AI人工智能、语言理解、语言生成、语义分析摘要：本文深入探讨了自然语言处理（NLP）在AI人工智能领域的奥秘。首先介绍了自然语言处理的背景，包括目的、预期读者、文档结构和相关术语。接着阐述了自然语言处理的核心概念与联系，通过文本示意图和Mermaid流程图进行展示。详细讲解了核心算法原理和具体操作步骤，并用Python源代码进行阐述。分
【软件工程】Waitress + Nginx 部署 Python Web 服务 meisongqing nginx python WEB
下面是完整的Windows系统部署方案，使用Waitress作为WSGI服务器运行Python后端，Nginx作为反向代理同时提供前端服务：项目结构text复制下载myapp/├──backend/#Python后端│├──app.py#Flask应用入口│├──requirements.txt#Python依赖│└──api/#API模块├──frontend/#前端文件│├──index.ht
基于python的药品后台销售管理系统 sudo-ikun python django javascript mysql
摘要人类生活的水平不断提高是因为依靠着不断发展变革的信息化科技，从头到尾没有一件事情是可以脱离现代化的发展。科技改变了生活，同时也造就了多种多样的生活方式，有了“美团”我们可以足不出户吃便天下美食；有了“京东”我们可以享受到各种各样电子科技产品第一时间带来的快感；有了“淘宝”每逢四季我们可以第一时间感受到潮流的服装，这些都是科技的力量，也是科技给我们的生活带来的一种方式。中药销售一直是我们社会大家
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&