Mighty_Crane

读Graph-Matching-Networks复现①嵌入

参数

{'aggregator': 
	{'aggregation_type': 'sum',
	 'gated': True,
	 'graph_transform_sizes': [128],
	 'input_size': [32],
	 'node_hidden_sizes': [128]},
 'data': 
 	{'dataset_params': 
 		{'n_changes_negative': 2,
 		
		 'n_changes_positive': 1,
		 #一对被视为正（相似）的边替换的数量。
		 
		 'n_nodes_range': [20, 20],
		 'p_edge_range': [0.2, 0.2],
		 #生成具有 20 个节点且 p_edge=0.2 （边概率？）的图
		 
		 'validation_dataset_size': 1000},
  	 'problem': 'graph_edit_distance'},
 'encoder': 
	 {'edge_hidden_sizes': None,
	  'node_feature_dim': 1,
	  'node_hidden_sizes': [32]},
 'evaluation': {'batch_size': 20},
 'graph_embedding_net': 
	 {'edge_hidden_sizes': [64, 64],
	 
	  'edge_net_init_scale': 0.1,
	  #用小参数权重初始化消息 MLP 以防止聚合消息向量爆炸
	  #或者也可以使用例如 层标准化以控制这些的规模。
	  
	  'layer_norm': False,
	  # 在实验中没有使用层范数，但有时会有用
	  
	  'n_prop_layers': 5,
	  'node_hidden_sizes': [64],
	  'node_state_dim': 32,
	  
	  'node_update_type': 'gru',
	  # 其他也可以用'mlp'  `residual`
	  
	  'prop_type': 'matching',
	  #如果用嵌入网络就设置为 `embedding` 
	  
	  'reverse_dir_param_different': False,
	  #如果是有向图则设成TRUE
	  
	  'share_prop_params': True,
	  # 判断在信息传递层是否参数共享
	  
	  #如果有双向边就设成FALSE
	  'use_reverse_direction': True},
	  
 'graph_matching_net': 
	 {'edge_hidden_sizes': [64, 64],
	  'edge_net_init_scale': 0.1,
	  'layer_norm': False,
	  'n_prop_layers': 5,
	  'node_hidden_sizes': [64],
	  'node_state_dim': 32,
	  'node_update_type': 'gru',
	  'prop_type': 'matching',
	  'reverse_dir_param_different': False,
	  'share_prop_params': True,
	  'similarity': 'dotproduct',
	  'use_reverse_direction': True},
 'model_type': 'embedding',
 'seed': 8,
 'training': 
	 {'batch_size': 20,
	 
	  'clip_value': 10.0,
	  #设置梯度裁剪防止梯度爆炸
	  
	  'eval_after': 10,
	  #每个 `eval_after * print_after` 步骤对验证集进行评估。
	  
	  'graph_vec_regularizer_weight': 1e-06,
	  #图向量上有一个小的正则化器会缩放以避免图向量爆炸。 
	  #如果模型中的数值问题特别严重，
	  #可以将 `snt.LayerNorm` 添加到每一层的输出、聚合消息和聚合节点表示中，
	  #以将网络激活规模保持在合理范围内。

	  'learning_rate': 0.0001,
	  'loss': 'margin',
	  'margin': 1.0,
	  'mode': 'pair',
	  
	  'n_training_steps': 500000,
	  #控制训练时长
	  
	  'print_after': 100}}
	  #每隔这么多训练步骤打印训练信息

生成固定大小的图
——————
build_datasets划分数据集
（好像训练集或验证集都只有一个图？）
——————————
默认训练模式为’pair’，也即学习结果与标签作误差的标准损失函数（相对于三元损失）

training_data_iter = training_set.pairs(config['training']['batch_size'])
# 'batch_size'为20
first_batch_graphs, _ = next(training_data_iter)

其中

def pairs(self, batch_size):
    """Yields batches of pair data."""
    while True:
        batch_graphs = []
        batch_labels = []
        positive = True
        for _ in range(batch_size):# 20
            g1, g2 = self._get_pair(positive)
            #随意造出的图，依照原图改出的图
            batch_graphs.append((g1, g2))
            #这样的到一批20对图作为一个批次
            batch_labels.append(1 if positive else -1)
            #positive=true对应相似的情况
            positive = not positive
        packed_graphs = self._pack_batch(batch_graphs)
        #_pack_batch将一批图打包成一个collection实例
        labels = np.array(batch_labels, dtype=np.int32)
        yield packed_graphs, labels
        #yield把函数变成一个iter迭代器

其中

def _get_pair(self, positive):
    g = self._get_graph()
    #随机生成一个连通图
    if self._permute:	#True
    #随意定下20个点，再随意添加一些边生成新图
        permuted_g = permute_graph_nodes(g)
    else:
        permuted_g = g
    n_changes = self._k_pos if positive else self._k_neg		
    #True → n_changes = 1
    changed_g = substitute_random_edges(g, n_changes)
    #随机删除20条边，再添加n_changes=1条边得到新图
    return permuted_g, changed_g

其中（但是这样100个图里就能返回一个连通图？）

def _get_graph(self):
    """Generate one graph."""
    n_nodes = np.random.randint(self._n_min, self._n_max + 1)
    #其实还是20
    p_edge = np.random.uniform(self._p_min, self._p_max)
    #其实还是0.2

    # 随机生成100个有20个节点以0.2为概率连接的图，再筛选出其中的连通图返回
    n_trials = 100
    for _ in range(n_trials):
        g = nx.erdos_renyi_graph(n_nodes, p_edge)
        if nx.is_connected(g):
            return g

def _pack_batch(self, graphs):
    Graphs = []
    for graph in graphs:
        for inergraph in graph:
            Graphs.append(inergraph)
    graphs = Graphs
    #一批共40个图
    from_idx = []
    to_idx = []
    graph_idx = []
    n_total_nodes = 0
    n_total_edges = 0
    for i, g in enumerate(graphs):
        n_nodes = g.number_of_nodes()
        n_edges = g.number_of_edges()
        edges = np.array(g.edges(), dtype=np.int32)
        #from_idx记录所有边的起点
        from_idx.append(edges[:, 0] + n_total_nodes)
        #to_idx记录所有边的终点
        to_idx.append(edges[:, 1] + n_total_nodes)
        #记录全为当前图索引i的向量（长20）
        graph_idx.append(np.ones(n_nodes, dtype=np.int32) * i)
        n_total_nodes += n_nodes
        n_total_edges += n_edges
    GraphData = collections.namedtuple('GraphData', [
        'from_idx',
        'to_idx',
        'node_features',
        'edge_features',
        'graph_idx',
        'n_graphs'])
    return GraphData(
        from_idx=np.concatenate(from_idx, axis=0),
        to_idx=np.concatenate(to_idx, axis=0),
        # this task only cares about the structures, the graphs have no features.
        # setting higher dimension of ones to confirm code functioning
        # with high dimensional features.
        node_features=np.ones((n_total_nodes, 8), dtype=np.float32),
        edge_features=np.ones((n_total_edges, 4), dtype=np.float32),
        graph_idx=np.concatenate(graph_idx, axis=0),
        n_graphs=len(graphs),
    )

（用yield是节省了空间，但时间上还挺久的）
以training_data_iter的第一个，即next(training_data_iter)为例
packed_graphs，即next(training_data_iter)[0]为

其中from_idx和to_idx为长度相同但不定的行向量，即边的起点索引集和终点索引集，这第一个长为1552，
edge_features是长度与其相同也不定的4维行向量，该不定长度即边总数大概1480~1690，这第一个长为1552，即1552x4
node_features是全1的800长（即节点总数）的8维行向量，即800x8
graph_idx是800长的行向量
n_graphs为40
labels，即next(training_data_iter)[1]为
[ 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1]，长20
————————————————
将packed_graphs记作first_batch_graphs，（莫名其妙）取两个_features的列数，即8和4分别作为参数node_feature_dim，edge_feature_dim构造模型
这里先用图嵌入，也即是GNN来试试

GraphEmbeddingNet(
  (_encoder): GraphEncoder(
    (MLP1): Sequential(
      (0): Linear(in_features=8, out_features=32, bias=True)
    )
    (MLP2): Sequential(
      (0): Linear(in_features=4, out_features=16, bias=True)
    )
  )
  (_aggregator): GraphAggregator(
    (MLP1): Sequential(
      (0): Linear(in_features=32, out_features=256, bias=True)
    )
    (MLP2): Sequential(
      (0): Linear(in_features=128, out_features=128, bias=True)
    )
  )
  (_prop_layers): ModuleList(
    (0): GraphPropLayer(
      (_message_net): Sequential(
        (0): Linear(in_features=80, out_features=64, bias=True)
        (1): ReLU()
        (2): Linear(in_features=64, out_features=64, bias=True)
      )
      (_reverse_message_net): Sequential(
        (0): Linear(in_features=80, out_features=64, bias=True)
        (1): ReLU()
        (2): Linear(in_features=64, out_features=64, bias=True)
      )
      (GRU): GRU(64, 32)
    )
    (1): GraphPropLayer(
      (_message_net): Sequential(
        (0): Linear(in_features=80, out_features=64, bias=True)
        (1): ReLU()
        (2): Linear(in_features=64, out_features=64, bias=True)
      )
      (_reverse_message_net): Sequential(
        (0): Linear(in_features=80, out_features=64, bias=True)
        (1): ReLU()
        (2): Linear(in_features=64, out_features=64, bias=True)
      )
      (GRU): GRU(64, 32)
    )
    (2): GraphPropLayer(
      (_message_net): Sequential(
        (0): Linear(in_features=80, out_features=64, bias=True)
        (1): ReLU()
        (2): Linear(in_features=64, out_features=64, bias=True)
      )
      (_reverse_message_net): Sequential(
        (0): Linear(in_features=80, out_features=64, bias=True)
        (1): ReLU()
        (2): Linear(in_features=64, out_features=64, bias=True)
      )
      (GRU): GRU(64, 32)
    )
    (3): GraphPropLayer(
      (_message_net): Sequential(
        (0): Linear(in_features=80, out_features=64, bias=True)
        (1): ReLU()
        (2): Linear(in_features=64, out_features=64, bias=True)
      )
      (_reverse_message_net): Sequential(
        (0): Linear(in_features=80, out_features=64, bias=True)
        (1): ReLU()
        (2): Linear(in_features=64, out_features=64, bias=True)
      )
      (GRU): GRU(64, 32)
    )
    (4): GraphPropLayer(
      (_message_net): Sequential(
        (0): Linear(in_features=80, out_features=64, bias=True)
        (1): ReLU()
        (2): Linear(in_features=64, out_features=64, bias=True)
      )
      (_reverse_message_net): Sequential(
        (0): Linear(in_features=80, out_features=64, bias=True)
        (1): ReLU()
        (2): Linear(in_features=64, out_features=64, bias=True)
      )
      (GRU): GRU(64, 32)
    )
  )
)

#创建可以给无key字典提供默认值的字典
accumulated_metrics = collections.defaultdict(list)
#此时结果为defaultdict(list, {})

成对比较，所以记training_n_graphs_in_batch *= 2=40
迭代开始：
1.提取出来node_features, edge_features, from_idx, to_idx, graph_idx, labels，先tensor化，再cuda化
2.送进model前向（GraphEmbeddingNet）
①先送进GraphEncoder前向，也即将两个_features分别通过两个MLP，输出node_features, edge_features尺寸由分别的hidden_sizes决定，

node_states = node_features
layer_outputs = [node_states]

②五层prop层（考虑信息的双向传递，每个方向是一层MLP接ReLu激活后再接一个MLP）
每层更新node_states，记录进layer_outputs
至于边信息，在GraphPropLayer的前向过程中_compute_aggregated_messages》graph_prop_once中edge_features与from_states和to_states拼接得到的edge_inputs整合出messages传入unsorted_segment_sum得到正向的aggregated_messages，同理得到反向的reverse_aggregated_messages与前者相加得到aggregated_messages，进而送入_compute_node_update与节点信息整合
从而GraphPropLayer在GraphEmbeddingNet》_build_layer》_build_layer中构造prop层的结构

③最后通过aggregator层整合节点信息
首先是一层MLP得到800x256的矩阵node_states_g，

if self._gated:	#True
     gates = torch.sigmoid(node_states_g[:, :self._graph_state_dim])
     #	前128列通过sigmoid的800x128的结果乘以后128列
     node_states_g = node_states_g[:, self._graph_state_dim:] * gates

接着计算张量段的和

graph_states = unsorted_segment_sum(node_states_g, graph_idx, n_graphs)

其中判定len(graph_idx.shape)=1，则
s=torch.prod(torch.tensor(node_states_g.shape[1:])).long().cuda()，即tensor(128,device=‘cuda:0’)，把graph_idx横向复制成800x128的矩阵segment_ids
tensor = torch.zeros(*shape).cuda().scatter_add(0, segment_ids,node_states_g) 
这里scatter_add参考https://blog.csdn.net/weixin_43922901/article/details/102587924的二维计算
torch.zeros(*shape).cuda()[segment_ids[i][j]][j] +=
node_states_g[i][j] # 0维上的运算
torch.zeros(*shape).cuda()[i][segment_ids[i][j]] +=
node_states_g[i][j] # 1维上
最终统一tensor为node_states_g的数据类型，返回tensor，即graph_states

(由于_aggregation_type设为sum所以跳过将小于 -1e5 的所有内容重置为 0进一步转换减少的graph_states这一过程)
将graph_states送进第二个MLP，最终得到整个模型的输出graph_vectors 40x128

接下来把graph_vectors横向劈开得到上下两个20x128，记作x和y
进而计算成对损失，可以是margin距离，即 $torch.relu[margin - labels * (1 -||x, y||_2)]$ ，margin可以取1
或者hamming距离，首先如下计算x和y的近似汉明相似度（不太懂两个tanh的内积能等效于异或xor吗，还求个均值是怎样）

def approximate_hamming_similarity(x, y):
    """Approximate Hamming similarity."""
    return torch.mean(torch.tanh(x) * torch.tanh(y), dim=1)

然后计算距离 $0.25×[labels - approximate\_hamming\_similarity(x, y)]^2$
接着记录相似样本和非相似样本的位置is_pos，is_neg
之后是相似度，可以是margin相似度，即负的相似度；也可以是如下汉明相似度（这次整个x y中正数相乘也是不懂）

def exact_hamming_similarity(x, y):
    """Compute the binary Hamming similarity."""
    match = ((x > 0) * (y > 0)).float()
    return torch.mean(match, dim=1)

(下面两步也不明白是在干啥)

sim_pos = torch.sum(sim * is_pos) / (n_pos + 1e-8)
sim_neg = torch.sum(sim * is_neg) / (n_neg + 1e-8)

然后（依然不懂）

graph_vec_scale = torch.mean(graph_vectors ** 2)
loss += (config['training']['graph_vec_regularizer_weight'] *0.5 * graph_vec_scale)
# config['training']['graph_vec_regularizer_weight']=1e-6

接着就是BP优化的事了，顺便记录进accumulated_metrics，方便后续打印（不过这时loss还是矩阵的形式，这给后续画图的打算添了不少麻烦，按说记录损失值才对吧，记成一个矩阵耗复杂度不说，关键这样对吗？）
（试着画了下图感觉BP时使用loss均值还是原loss的影响不大，ACC和AUC是挺漂亮的，总体上升明显，但loss波动的仿佛没有收敛）

至于评估阶段eval，每1000轮一次，
首先是计算AUC即ROC曲线面积，
这里with torch.no_grad():是让这一块的代码不做计算图（就是链式法则），体现在这一段的变量没有grad_fn=

通过一次model前向得到x和y，直接compute_similarity计算相似度scores

scores = (scores - scores_min) / (scores_max - scores_min + 1e-8)
labels = (labels + 1) / 2

如上整理后送入sklearn的metrics.roc_curve算出auc值
（ACC后面看到三元损失训练时再细扣这里吧）

————————————
或者采用三元损失，

training_data_iter = training_set.triplets(config['training']['batch_size'])
first_batch_graphs = next(training_data_iter)

其中

def triplets(self, batch_size):
    """Yields batches of triplet data."""
    while True:
        batch_graphs = []
        for _ in range(batch_size):
            g1, g2, g3 = self._get_triplet()
            batch_graphs.append((g1, g2, g1, g3))
        yield self._pack_batch(batch_graphs)

与pairs的区别在于没有标签，以及存进batch的顺序
其中

def _get_triplet(self):
   """Generate one triplet of graphs."""
   g = self._get_graph()
   if self._permute:
       permuted_g = permute_graph_nodes(g)
   else:
       permuted_g = g
   pos_g = substitute_random_edges(g, self._k_pos) #1
   neg_g = substitute_random_edges(g, self._k_neg) #2
   return permuted_g, pos_g, neg_g

与_get_pair的区别体现在用substitute_random_edges构造了两个图，一个天了一条边，另一个添了两条

from_idx,to_idx 3360
edge_features 3360x4
node_features 1600x8
从而送进model得到80x128的graph_vectors
通过reshape_and_split_tensor切分出4份x_1, y, x_2, z计算损失（其实x_1=x_2）
margin: $torch.relu(margin+||x_1-y||_2 -||x_2-z||_2$
hamming: $0.125×\{[approximate\_hamming\_similarity(x_1, y) - 1] ^2 +[approximate\_hamming\_similarity(x_2, z) + 1]^2\}$

sim_pos = torch.mean(compute_similarity(config, x_1, y))
sim_neg = torch.mean(compute_similarity(config, x_2, z))
graph_vec_scale = torch.mean(graph_vectors ** 2)
loss += (config['training']['graph_vec_regularizer_weight'] *0.5 * graph_vec_scale)

接着评估阶段计算准确率，大概因为成对损失本身就能表征准确率，所以统一采用三元损失的方式来计算准确率，
这时通过前向得到x_1, y, x_2, z，再分别计算应该相似的x_1和y以及应该不相似的x_2和z的相似度sim_1和sim_2
得到sim_1 > sim_2的01向量，求均值作为acc

————————————
优化器

Adam (
Parameter Group 0
    amsgrad: False
    betas: (0.9, 0.999)
    eps: 1e-08
    lr: 0.0001
    weight_decay: 1e-05
)

os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
os.environ["CUDA_VISIBLE_DEVICES"] = "0"
use_cuda = torch.cuda.is_available()
device = torch.device('cuda' if use_cuda else 'cpu')
model.to(device)

可解释性：走向透明与可信的人工智能一位小说男主人工智能入门深度学习机器学习人工智能神经网络
随着深度学习和机器学习技术的迅速发展，越来越多的行业和领域开始应用这些技术。然而，这些技术的“黑盒”特性也带来了不容忽视的挑战。在许多任务中，尽管这些模型表现出色，取得了相当高的精度，但其决策过程不透明，这对于依赖于机器决策的应用（如金融、医疗、法律等）来说，可能是无法接受的。因此，如何提高模型的可解释性、实现透明和可信的人工智能，成为了当下人工智能领域的重要课题。❤️本文将深入探讨机器学习中的可
**LLM Gateway：您的智能对话门户** 芮奕滢Kirby
LLMGateway：您的智能对话门户llm-gatewayGatewayforsecure&reliablecommunicationswithOpenAIandotherLLMproviders项目地址:https://gitcode.com/gh_mirrors/ll/llm-gateway在人工智能和自然语言处理的浪潮中，LLMGateway以其卓越的设计与功能脱颖而出，为开发者和用户提供
Qwen-VL论文解读 dream_home8407 人工智能
Qwen-VL：用于理解、定位、文本阅读等的通用视觉-语言模型摘要在本文中，我们介绍了Qwen-VL系列，这是一组大规模的视觉-语言模型（LVLMs），旨在感知和理解文本和图像。从Qwen-LM开始，我们通过精心设计的（i）视觉受体，（ii）输入-输出接口，（iii）3阶段训练管道，以及（iv）多语言多模态清洗语料库，赋予其视觉能力。除了传统的图像描述和问答，我们还通过图像-标题-框元组的对齐实现
单目测距（yolo-目标检测+标定+深度学习目标检测_测距）计算机C9硕士_算法工程师 YOLO 目标检测深度学习
YOLOv5模型介绍YOLOv5是目前最先进的目标检测算法之一，在多个数据集上取得了优秀的表现。相较于YOLOv4，YOLOv5采用了更深的Backbone网络和更高的分辨率输入图像，以提高检测精度和速度。单目测距实现方法在目标检测的基础上，我们可以通过计算物体在图像中的像素大小来估计其距离。具体方法是，首先确定某个物体的实际尺寸，然后根据该物体在图像中的像素大小计算其距离。这个方法可以应用于各种
Depth Anything V2：单目深度估计的更强基线武朵欢Nerissa
DepthAnythingV2：单目深度估计的更强基线项目地址:https://gitcode.com/gh_mirrors/de/Depth-Anything-V2项目介绍DepthAnythingV2是由HKU与TikTok团队合作开发的单目深度估计算法的升级版本。这个框架显著提升了细节处理能力和鲁棒性，相比于基于深度学习的方法，它提供了更快的推理速度、更少的参数量以及更高的深度预测精度。本项
知网爬虫，作者、摘要、题目、发表期刊等主要内容的获取大懒猫软件爬虫
爬取知网内容的详细过程爬取知网内容需要考虑多个因素，包括网站的结构、反爬虫机制等。以下是一个详细的步骤和代码实现，帮助你使用Python爬取知网上的论文信息，包括作者、摘要、题目、发表期刊等主要内容。1.数据准备首先，需要准备一些基础数据，如知网的URL、请求头等。2.模型构建使用requests库发送HTTP请求，使用BeautifulSoup库解析HTML内容。如果遇到动态加载的内容，可以使用
OpenAI的编程语言和框架，给程序员带来了帮助有哪些 API技术大佬Anzexi58 OpenAI 人工智能人工智能深度学习
OpenAI是一个人工智能开发公司，成立于2015年，总部位于美国旧金山。这家公司致力于研究和开发先进的人工智能技术，旨在将这些技术应用到解决全球一些最棘手的问题上。OpenAI以其卓越的技术和实验室出品的groundbreakingAIpapers而闻名。OpenAI的研究涉及深度学习、自然语言处理、视觉感知、强化学习等多个领域，并已在各种应用中取得了令人瞩目的成果。例如，在机器人领域，Open
探索OpenAI Python SDK: 智能编程新里程周澄诗Flourishing
探索OpenAIPythonSDK:智能编程新里程openai-pythonTheofficialPythonlibraryfortheOpenAIAPI项目地址:https://gitcode.com/gh_mirrors/op/openai-python如果你对人工智能和自然语言处理有浓厚的兴趣，那么这个项目将为你开启新的探索之门——。这是一个由OpenAI开发的Python库，用于与他们的A
DeepSeek：突破传统的AI算法与下载排行分析 smart_ljh 行业搜索人工智能 AI
DeepSeek的AI算法突破DeepSeek相较于OpenAI以及其它平台的性能对比DeepSeek的下载排行分析（截止2025/1/28AI人工智能相关DeepSeek甚至一度被推上了搜索）未来发展趋势总结在人工智能技术飞速发展的当下，搜索引擎市场也迎来了新的变革。DeepSeek，作为一款基于深度学习技术和大数据算法的搜索引擎，以其独特的优势在国内外市场上引起了广泛关注。下面介绍一下针对De
大模型应用：探索AI大模型的50个应用场景：让科技改变生活。 AGI大模型资料分享员人工智能科技生活 agi 语言模型自然语言处理
随着人工智能技术的迅猛发展，AI大模型在各个领域的应用日益广泛。百度创始人、董事长兼首席执行官李彦宏在2024年世界人工智能大会上表示，目前AI技术发展路线发生了方向性改变，已从过去辨别式人工智能转向了未来生成式人工智能。他更是呼吁：“大家不要卷模型，要卷应用！”本文将为大家盘点AI大模型的50个应用场景，并按应用频率从高到低进行排列，带您了解AI如何深刻改变我们的工作与生活。1.自然语言处理(N
我们为什么要用大语言模型来迭代数据安全能力？大模型. 语言模型人工智能自然语言处理架构深度学习大数据大模型
在当今科技飞速发展的时代，大语言模型无疑是最炙手可热的话题之一。从OpenAI的GPT系列到谷歌的BERT，这些拥有海量参数的模型宛如智能巨人，正重塑着自然语言处理（NLP）的格局。你或许好奇，大语言模型究竟为何如此备受瞩目？这得从自然语言处理领域的核心任务——文本分类说起。文本分类，就像是给五花八门的文本信息贴上合适的“标签”，无论是判断一封邮件是正常邮件还是垃圾邮件，分析社交媒体上的评论是积极
检索增强（Retrieval Augmentation）是一种结合信息检索技术和生成模型的技术大霸王龙系统分析业务人工智能
检索增强（RetrievalAugmentation）是一种结合信息检索技术和生成模型的技术，旨在通过从外部知识库或文档中检索相关信息来增强生成模型的能力。这种方法广泛应用于自然语言处理（NLP）任务中，如问答系统、对话生成和文本生成等。1.检索增强的核心思想检索增强的核心思想是将生成模型与信息检索系统结合，利用外部知识库或文档中的信息来辅助生成更准确、更丰富的回答或内容。具体来说，检索增强包括以
新手安装新版Anaconda找不到 Anaconda prompt ？没出现在开始菜单。行者将至X PyTorch深度学习 prompt python 开发语言人工智能学习
当安装Anaconda新版本之后，发现开始菜单没有Anacondaprompt等一系列的快捷方式。查询了很多资料，也卸载重装了，对于小白来说，有些太复杂听不懂。我解决的办法：第一步：win+R输入cmd进入命令行，进入到Anaconda的安装目录，语句：cdAnaconda的安装目录。例如我的：（这里注意，要先F:进入到F盘路径上）我安装的路径是F:\anaconda3F:进入F盘之后再：cdF:
医学顶会 MICCAI‘24 | LKM-UNet: 大型内核视觉 Mamba UNet 用于医学图像分割小白学视觉医学图像处理论文解读 MICCAI 深度学习医学图像顶会医学图像处理论文解读
本文内容只为星球内部成员学习和学术交流，请勿用作他用本文内容只为星球内部成员学习和学术交流，请勿用作他用论文信息题目：LKM-UNet:LargeKernelVisionMambaUNetforMedicalImageSegmentationLKM-UNet:大型内核视觉MambaUNet用于医学图像分割作者：JinhongWang,JintaiChen,DannyChen,JianWu源码链接：
【系统架构设计师】论文：论微服务架构及其应用（高分论文3篇）数据知道系统架构设计师(软考高级)架构系统架构微服务软考高级系统架构设计师论文
更多内容请见：备考系统架构设计师-专栏介绍和目录文章目录论文一摘要正文论文二摘要正文论文三摘要正文论文一摘要我作为系统分析师兼任系统架构师参与了××航空公司物流综合平台4.0的建设工作。该物流平台旨在整合该公司航空物流、仓储、冷链运输、快递、支付、信用等多个相关业务，提供统一的点到点的综合物流配送服务。该综合平台采用了微服务的系统架构进行开发。平台最终在2021年6月初步上线运行，后又陆续进行了4
【编程小白必看】Python编程练习题元组操作秘籍一文全掌握 6个q python习题集 python 网络开发语言
【编程小白必看】Python编程练习题元组操作秘籍一文全掌握文章目录前言一、练习题精选1.创建一个空元组2.创建一个单元素元组3.创建一个包含多个元素的元组4.访问元组中的第一个元素5.访问元组中的最后一个元素6.访问元组中的多个元素7.元组拼接8.元组重复9.获取元组的长度10.检查元素是否在元组中11.检查元素是否不在元组中12.计算元组中元素出现的次数13.获取元组中元素的索引14.获取元组
【编程小白必看】Python 开发工具操作秘籍一文全掌握 6个q python基础知识 python 开发语言
【编程小白必看】Python开发工具操作秘籍一文全掌握文章目录前言一、什么是Python开发工具？二、环境搭建三、常用开发工具介绍1.PyCharm2.VisualStudioCode(VSCode)3.JupyterNotebook4.Spyder5.SublimeText五、常见问题与解决方法1.缺少依赖库2.编辑器卡顿3.代码提示不准确总结前言嘿，小伙伴们！今天我们要一起走进Python开发
DeepSeek--通向通用人工智能的深度探索者油泼辣子多加专业名词解释人工智能
一、词源与全称“DeepSeek"由"Deep”（深度）与"Seek"（探索）组合而成，中文译名为"深度求索"。其全称为"深度求索人工智能基础技术研究有限公司"，英文对应"DeepSeekArtificialIntelligenceResearchInstitute"。这一命名体现了企业对深度学习技术与未知领域持续探索的双重追求。二、发展历程初创期（2023）公司成立于中国杭州，创始团队汇聚了来自
数组at()方法：负索引的救赎与JavaScript标准化之路不做超级小白前端功能通关秘籍 web前端 javascript 开发语言 ecmascript
数组at()方法：负索引的救赎与JavaScript标准化之路从一次代码评审说起在某次团队代码评审中，小白注意到有同事写下了这样的代码：constlastItem=arr[arr.length-1];这让我回想起自己早期开发时被负索引问题困扰的经历。今天，随着ES2022的发布，我们终于迎来了官方解决方案——Array.prototype.at()。本文将带你深入理解这一新特性背后的设计哲学与技术
linux git clone出现fatal: unable to access Failed to connect to github.com port 443: Timed out解决方案 herosunly C/C++/Linux解决方案 linux git github timeout port 443
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了linuxgitclone出现fatal:unabletoaccessF
[论文笔记] llama-factory 微调qwen2.5、llama3踩坑心心喵论文笔记深度学习人工智能
一、bug1、pre-tokenize的时候,会OOM解决：在yaml文件中添加streaming参数#tokenizestreaming:Truemax_steps:10000https://github.com/hiyouga/LLaMA-Factory/blob/3a023bca2a502810a436cfba7708df164754ea62/src/llamafactory/hparams
YOLOv10涨点改进：特征融合创新 | 多层次特征融合（SDI），小目标涨点明显，| UNet v2，比UNet显存占用更少、参数更少 AI小怪兽 YOLOv10魔术师 YOLO 目标检测算法人工智能目标跟踪
本文独家改进：多层次特征融合（SDI），能够显著提升不同尺度和小目标的识别率如何引入到YOLOv10：1)替代原始的Concat；改进结构图如下：《YOLOv10魔术师专栏》将从以下各个方向进行创新：【原创自研模块】【多组合点优化】【注意力机制】【卷积魔改】【block&多尺度融合结合】【损失&IOU优化】【上下采样优化】【小目标性能提升】【前沿论文分享】【训练实战篇】订阅者通过添加WX:AI_C
YOLO11涨点优化：特征融合创新 | 多层次特征融合（SDI），小目标涨点明显| UNet v2，比UNet显存占用更少、参数更少 AI小怪兽 YOLO11魔术师深度学习目标检测计算机视觉目标跟踪神经网络 python
本文独家改进：多层次特征融合（SDI），能够显著提升不同尺度和小目标的识别率如何引入到YOLO11：1)替代原始的Concat；改进结构图如下：《YOLOv11魔术师专栏》将从以下各个方向进行创新：【原创自研模块】【多组合点优化】【注意力机制】【卷积魔改】【block&多尺度融合结合】【损失&IOU优化】【上下采样优化】【小目标性能提升】【前沿论文分享】【训练实战篇】订阅者通过添加WX:AI_CV
AI软件外包需要注意什么外包开发AI软件的关键因素是什么如何选择AI外包开发语言北京动点飞扬软件 AI外包
1.定义目标与需求首先，要明确你希望AI智能体做什么。是自动化任务、数据分析、自然语言处理，还是其他功能？明确目标可以帮助你选择合适的技术和方法。2.选择开发平台与工具开发AI智能体的软件时，你需要选择适合的编程语言、框架和工具。例如：编程语言：Python是最常用的语言，因为它有强大的AI/ML库，如TensorFlow、PyTorch、scikit-learn等。开发平台：你可以使用本地环境、
2025毕设springboot 猫舍管理系统分析与设计论文+源码 zhihao508 课程设计 spring boot 后端
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景关于猫舍管理系统的研究，现有研究主要集中在宠物店的信息化管理、宠物医院的业务流程优化以及宠物寄养服务的数字化升级等方面。然而，专门针对猫舍管理系统的分析与设计研究相对较少，尤其是针对猫咪养殖、销售、预约及品种管理等综合功能的系统化研究更为稀缺。当前，许多猫舍仍采用传统的手工管理
人脸识别的经典深度学习方法明初啥都能学会深度学习人工智能
人脸识别的经典深度学习方法引言1.卷积神经网络（CNN）1.1LeNet1.2AlexNet1.3VGGNet1.4ResNet2.人脸检测2.1Viola-Jones算法2.2基于深度学习的人脸检测3.人脸特征提取3.1主成分分析（PCA）3.2人脸对齐3.2.1基于特征点的对齐3.2.2基于深度学习的对齐4.人脸识别模型4.1传统机器学习方法4.2基于深度学习的方法5.公式解读5.1卷积运算5
100个高质量ChatGPT学术论文写作提示词分享--系列（一）迪娜学姐人工智能深度学习论文阅读
我是娜姐@迪娜学姐，一个SCI医学期刊编辑，探索用AI工具提效论文写作和发表。ChatGPT学术论文写作高质量提示词分享，今天先分享50个，涵盖论文写作、文献综述、研究方法设计、数据分析、学术演讲准备等方面。1.论文写作(ThesisWriting)1.为[研究主题]制定一个引人入胜的论文标题，突出其创新性和重要性。Craftanengagingthesistitlefor[researchtop
100个高质量ChatGPT学术论文写作提示词分享--系列（二）迪娜学姐论文阅读论文笔记人工智能 chatgpt
我是娜姐@迪娜学姐，一个SCI医学期刊编辑，探索用AI工具提效论文写作和发表。ChatGPT学术论文写作高质量提示词分享，之前分享过50个，涵盖论文写作、文献综述、研究方法设计、数据分析、学术演讲准备等方面：100个高质量ChatGPT学术论文写作提示词分享--系列（一）今天继续分享50个，包括论文修改与编辑、写作技巧与提升、参考文献引用及编辑、论文投稿和课题申请：6论文修改与编辑(ThesisR
【附源码】基于flask框架奶茶连锁管理系统 (python+mysql+论文) JAVA程序设计 python flask mysql
本系统（程序+源码）带文档lw万字以上文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义选题背景：
CT-Mamba:一种用于低剂量CT降噪的混合卷积状态空间模型论文解读 ZcZc__1 深度学习人工智能图像处理
论文：CT-Mamba:AHybridConvolutionalStateSpaceModelforLow-DoseCTDenoising代码：zy2219105/CT-Mamba，作者称将会在论文正式发表后提供。本文参考了该网站，其对CT-Mamba提供了更详细的描述：https://www.aimodels.fyi/papers/arxiv/ct-mamba-hybrid-convolutio
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h

读Graph-Matching-Networks复现①嵌入

你可能感兴趣的:(论文,小白,自然语言处理,深度学习)