oldmao_2001

01.图论基础，图算法与图机器学习概况介绍

文章目录

课程简介
图的概念
- 图的重要性
- 常见图的应用分类
- 为什么要图+机器学习？
- 图表征
图相关基础概念
- 各种各样的图
- 图的表示方法
- 边的属性
- 图相关概念
- 重要的图属性
- - 度分布
  - 路径长度（距离）
  - 聚集（群聚、集群）系数
  - 连通分量
作业：分析维基百科选民网络

课程简介

课程网站就不贴了，以下是原课程介绍。后续将在这个专栏记录一些笔记和作业。
图诞生为一个简洁的数学概念：节点和节点之间关系的集合。如今图已经被广泛应用于建模许多真实世界的场景——从社交网络的人际关系，到信用卡的欺诈行为监测，再到遗传学与疾病检测，图无处不在。相比于其他的数据结构，图数据的一个重要的特性：图数据包含大量有价值的关系数据。然而，许多之前的机器学习模型往往只关注每个样本的特征，而没有考虑到样本之间的关系数据或没有很好的方法来利用和建模这些关系数据。图机器学习就应运而生了。近年来图逐渐变成机器学习的一个核心热门领域，拥有巨大的理论与实际应用发展前景。
本课程将结合图机器学习的数学理论基础与实际应用基础，深入浅出，来讲解当今最炙手可热的图机器学习与深度学习模型。从图论的数学基础开始，到经典的Google发家的PageRank搜索排名算法，到对利用节点本身特征和节点之间关系对节点进行分类的机器学习算法，再到诞生于近两年的图深度神经网络模型，本课程会为大家讲解模型的理论支持，模型结构，并讨论实际应用。学员在完成本课程之后，将拥有对图数据的深刻理解，与将在科研或工作中遇到的问题使用图机器学习的思路解决的能力。

参考教材
Networks, Crowds, and Markets: Reasoning about a Highly Connected World.
By David Easley and Jon Kleinberg. Cambridge University Press, 2010.

斯坦福的CS224W，18版：https://www.bilibili.com/video/av73701777，没有中字，凑合看吧
19版在这里：https://www.bilibili.com/video/BV1Vg4y1z7Nf?p=1，有中字

图的概念

“图"（Graph）与“网络"（Network）在文献中常互相通用，但有微小的区别网络常用于描述生活中实际存在的复杂系统，如社交网络等图是网络的数学表示方式
本课程中图=Graph，社交媒体研究领域中把图叫Network，本课程中二者混用不区分。（）
数据结构中的图是顶点的有穷非空集合和顶点之间边的集合G(V，E)

下面看几个图数据的例子
社交网络：微博，微信，QQ
网页：不同网页之间的超链接
参考文献：文献的相互引用等

这里要说明的是，和数据结构一样，图也有分有向图和无向图，例如微博社交网络，A关注B，B不一定关注B，那么这里AB中间就是有向的关系；文献引用当然也是有向的。另外在网页和文献引用中可以从图的出入度来判断论文或者网页的重要性。

图的重要性

图定义了复杂系统中节点与节点之间的联系。为什么要研究这个玩意？
1.与传统的二维表不一样，关系型数据库通常是结构化数据，结构化数据适合存储那些表结构（属性）固定的信息，但是我们现实世界中万物各自属性不一样，很难用一个（或者有限个）表结构来进行存储
2.每个个体或者样本（可以看做数据库表中没一条记录），有的时候是有相互关系的，数据库中只能用主外键来表示表和表之间的关系，记录本身之间的关系无法表示（或者说表示得不彻底），例如表记录中记录了CPU，内存，主板等电子原件信息，但是某些CPU和主板是有配套关系的，这个关系就很难表达。
从数据历史发展来看，结构化数据实际上对真实世界进行了简化描述，早期图才是贴合数据描述的。

研究图=认识、建模、预测复杂系统的行为=直接对节点间的关系进行建模

常见图的应用分类

识别紧密联系的节点集群：社群识别（Community Detection）
所谓社群，是指图谱中共享相同的属性或承担相似角色的一组个体，社会关系中常见的社群例如家庭、同事圈、朋友圈等等。典型的社群识别应用有：
关系图谱中识别欺诈团伙（Fraud Detection）是一个典型应用。https://www.weiyangx.com/306008.html
可参考数量社会学。
社交网络中的意见分化：曾经有人用图来分析非死不可上发文情况来预测××结果。

预测某个节点的所属分类：对图的节点分类（Node Classification）

预测两个节点之间是否有关系：链结预测（Link Prediction）。典型应用为：知识推断。例如：基于规则：“爸爸的爸爸是爷爷”可以推理出谁是谁的爷爷。
还有推荐系统
计算生物学：多种药同时服用的副作用：使用GNN来对多种药物同时使用时产生的副作用进行建模

测量节点之间/网络之间的相似度：网络相似度（Network Similarity）。典型应用为：图可以做像高分子分类、3D视觉分类等任务。

为什么要图+机器学习？

不是为图数据而设计的机器学习方法往往只关注每个样本的特征，而没有考虑到样本之间的关系数据或没有很好的方法来利用和建模这些关系数据。
换句话说就是通常的算法考虑所有样本都来自同一分布，而实际上样本与样本可能是独立分布的。GML是来建模这种独立分布样本之间关系的方法。

图表征

这个玩意很重要，就类似Word2Vec一样。将图的节点映射到低维的向量，且拥有相似相邻结构的节点在嵌入空间中也更相近
https://zhuanlan.zhihu.com/p/62629465

图相关基础概念

基本和数据结构里面差不多，但是表达的意思不一样，具体可以参考数据结构（C++）笔记：06.图

现实	逻辑表达	数学表达
对象	节点	$N$
相互作用	边、链接	$E$
系统	网络、图	$G (N, E)$

从上表可知，建立一个图需要知道：节点和边是什么？（不同应用考虑的边（关系）不一样。）
表示一个图需要根据研究的问题来选择合适图的表示方法，这里注意，图的表示不一定唯一的，可能有多种表示方法。
节点的度，有向图中出度和入度。

各种各样的图

无向图：边是对称、相互的（没有方向），如QQ好友（其实QQ和微信好友不是相互的，可以拉黑），同学关系
有向图：边是有方向的，与一个节点相关联的边有出边和入边之分，与一个有向边关联的两个节点也有起点和终点之分，如微博的关注关系、汽车站点路径

完全图：节点两两之间都有一条边的无向图。无向图的边为：
$E=\cfrac{N(N-1)}{2},N为节点数目$
二分图：两个不相交的集合，可以看到边的两个端点分别在两个集合中，同一个集合中任意两个节点没有相邻关系。

未加权图和加权图（每个又可以分为有向和无向）
自环图（又可以分为有向和无向）：节点可以自己连接到自己。
多重图（又可以分为有向和无向）：两个节点之间可以有多个边相连。
无环图和有环图（又可以分为有向和无向）
强连通有向图：有向图中每一个节点到另一个节点都有路径，反之亦然（相当于两个节点有两条边相连，或者节点有环）
弱连通有向图：忽略边的方向才连通的有向图

现实应用与图的对应：
邮件网络：有向，多重，允许节点与自己有链结（自己和自己发邮件）
微博好友网络：有向，可有/无权重（如沟通频率）
facebook好友网络：无向，可有/无权重（如沟通频率）
电话网络：有向，多重

图的表示方法

邻接矩阵，多为稀疏矩阵
边表，图以边的集合来表示图
邻接表

边的属性

边在不同应用中可以表示不同的含义：
权重（如：两个好友之间发消息的频率、路径的长短，引文的多少）
排名（如：最好的朋友，第二好的朋友…）
类型（同学，同事，亲戚，同班，同宿舍…）

图相关概念

节点的度，有向图中出度和入度。
路径：是一个顶点序列（这个是重点），使得从它的每个顶点有一条边到该序列中下一顶点。路径允许经过同一条边多次，例如：ABABAB是A到B的路径。
连通度
连通分量（无向图才有这个）
最大连通分量（无向图才有这个）
强连通分量（Strongly connected components (SCCs)）（有向图才有这个）

重要的图属性

数据结构中很少关注下面这些属性：
度分布（Degree Distribution）： $P (k)$
路径长度（Path Length）： $h$
聚集（群聚、集群）系数（Clustering Coefficient）： $C$
连通分量（Connected Components）： $s$

度分布

度分布是对一个网络中节点度数的总体描述（就是度为1的节点占总节点数量的百分比、度为2的节点占总节点数量的百分比、度为3的节点占总节点数量的百分比…以此类推）：
$P(k)=\cfrac{N_k}{N}$
N为节点数量
$N_k$ 为度为k的节点的数量

路径长度（距离）

本来路径中允许经过同一条边多次，但是求路径长度的时候是指最短路径。例如：ABABAB是A到B的路径，但是路径长度 $h_{A,B}=2$
最长的最短路径称为图的直径(Network Diameter)： $\text{max}(h_{i,j}),j\neq i$
两点之间无路径，距离则为无穷大（或0）.
有向图中两点的路径长度不一定相等 $h_{A,B}\neq h_{B,A}$
连通图/强连通有向图/连通分量的平均路径长度:
$\bar h=\cfrac{1}{2E_{max}}\sum_{i,j\neq i}h_{i,j}$
其中：
$h_{i,j}$ 是从节点 $i$ 到节点 $j$ 的距离
$E_{max}=\cfrac{n(n-1)}{2}$ 是最大的边的数量

聚集（群聚、集群）系数

节点 $i$ 的聚集系数 $C_i$ ：描述节点 $i$ 的相邻节点之间结集成团的程度。
例如，生活社交网络中，你的朋友之间相互认识的程度；
网页、文献的重要程度。
$C_i=\cfrac{2e_i}{k_i(k_i-1)},C_i\in[0,1]$
$e_i$ ：是除当前节点 $i$ 外，其他 $k_i$ 个相邻节点之间的最大的边的数量。节点 $i$ 与相邻节点之间的边的数量。
$k_i$ ：表示当前节点 $i$ 有 $k_i$ 个相邻节点
完全图中的聚集系数等于1。
以下图例来自维基百科，注意看黑线是 $e_i$ ，灰线是 $k_i$ 。

以上是无向图，有向图还要考虑方向。
算出一个图里的每一个顶点的聚集系数后，可以计算整个图的平均聚集系数。其实就是所有顶点的局部集聚系数的算术平均：
$C=\cfrac{1}{N}\sum_i^NC_i$

连通分量

查找连通分量的伪代码

从随机选择一个节点开始，进行宽度优先搜索（BFS）
记录BFS经过的所有节点
如果所有节点BFS都经过了，那么网络为连通图
否则从没被BFS经过的点开始，重复BFS

当然以上不是最优算法，具体可以看这里：
https://zhuanlan.zhihu.com/p/64916637
http://blog.sina.com.cn/s/blog_8d84b9240101f5e0.html
https://blog.csdn.net/hurmishine/article/details/75248876

作业：分析维基百科选民网络

参考：https://www.yuque.com/mamudechengxuyuan/kvkh16/wamgd3
数据集下载：http://snap.stanford.edu/data/wiki-Vote.html
介绍帖过来：
Wikipedia is a free encyclopedia written collaboratively by volunteers around the world. A small part of Wikipedia contributors are administrators, who are users with access to additional technical features that aid in maintenance. In order for a user to become an administrator a Request for adminship (RfA) is issued and the Wikipedia community via a public discussion or a vote decides who to promote to adminship. Using the latest complete dump of Wikipedia page edit history (from January 3 2008) we extracted all administrator elections and vote history data. This gave us 2,794 elections with 103,663 total votes and 7,066 users participating in the elections (either casting a vote or being voted on). Out of these 1,235 elections resulted in a successful promotion, while 1,559 elections did not result in the promotion. About half of the votes in the dataset are by existing admins, while the other half comes from ordinary Wikipedia users.

The network contains all the Wikipedia voting data from the inception of Wikipedia till January 2008. Nodes in the network represent wikipedia users and a directed edge from node i to node j represents that user i voted on user j.
看不懂没关系，下面是重点：
维基百科选民网络是一个有向图 $G = (V, E)$ ，具有节点集 $V$ 和边集 $E\in V×V$ ，其中(边是节点的有序对)。边 $(a,b)\in E$ 表示用户a投票给用户b。
统计结果：

作业分两部分：
1、手工编程计算（不使用现成的包）：
图中的节点数量
图中的有向边数量
图中的无向边数量，当两个节点都相互有指向，则这两个节点的边看做是无向边。
图中0出度的节点数量
图中0入度的节点数量
图中最大强连通分量的节点和边的数量
图中最大弱连通分量的节点和边的数量
图的平均聚集系数

# This is a sample Python script.


import os

# Press the green button in the gutter to run the script.
if __name__ == '__main__':

    print(os.listdir('./data'))  # 这里应该判断文件是否存在

    startline = 3  # 从start开始读取

    s = []  # 定义存放读取文件记录的list
    StartNode = []
    EndNode = []
    TotalNode = []
    with open("./data/wiki-Vote.txt", "r") as f:
        for i in range(0, startline):  # 忽略前面3行说明
            f.readline()
        for each in f:
            G_array = each.strip()  # 读取每一行数据
            s.append(list(map(int, G_array.split("\t"))))  # 将\t制表符为分隔符将两个节点分开，并转化为整形

    for edge in s:
        StartNode.append(edge[0])  # 读取起始点
        EndNode.append(edge[1])  # 读取结束点

    TotalNode = StartNode + EndNode  # 合并节点
    TotalNode = list(set(TotalNode))  # 去重得到节点数量

    # 计算图中的无向边数量
    countUndirEdge = 0
    temprd = s # 设置临时记录集
    for edge in temprd:
        if ([edge[1], edge[0]] in temprd):  # 找到相互指向的边，计数器加1，把该边移除，这里比较慢，可以换在节点list中查找会快
            temprd.remove([edge[1], edge[0]])
            countUndirEdge = countUndirEdge + 1
    #     #temprd.remove(edge)  # 移除查找过的边



    # 计算图中0出度的节点数量 法1
    countOutputNode = 0
    for outputNode in TotalNode:
        if (outputNode not in StartNode):
            countOutputNode = countOutputNode + 1

    # 计算图中0出度的节点数量 法2
    outNode = list(set(TotalNode) - set(StartNode))
    # print("aaa",len(outNode))

    # 计算图中0出度的节点数量 法1
    countInputNode = 0
    for inputNode in TotalNode:
        if (inputNode not in EndNode):
            countInputNode = countInputNode + 1

    inNode = list(set(TotalNode) - set(EndNode))

    print('图中的节点数量:', len(TotalNode))  # 7115
    print('图中的有向边数量:', len(s))  # 103689
    print('图中的无向边数量：', countUndirEdge)  # 2927
    print('图中0出度的节点数量法1：', countOutputNode)  # 1005
    print('图中0入度的节点数量法1：', countInputNode)  # 4734
    print('图中0出度的节点数量法2：', len(outNode))  # 1005
    print('图中0入度的节点数量法2：', len(inNode))  # 4734

# See PyCharm help at https://www.jetbrains.com/help/pycharm/

2、用SNAP计算以上参数。
https://blog.csdn.net/weixin_40493501/article/details/104471591
弄了半天，直接下载后解压放项目目录，
这里注意要使用3.7版本的python。。。不然报错到怀疑人生(DLL加载错误)。
代码可以参考官档


#import os
import snap#这个玩意要python3.7才不会报错

# Press the green button in the gutter to run the script.
if __name__ == '__main__':

    G1 = snap.LoadEdgeList(snap.PNGraph, './data/wiki-Vote.txt', 0, 1)
    MxScc = snap.GetMxScc(G1)# 图中最大强连通分量
    MxWcc = snap.GetMxWcc(G1)# 图中最大弱连通分量
    # for EI in MxScc.Edges():
    #     print("edge: (%d, %d)" % (EI.GetSrcNId(), EI.GetDstNId()))

    print('图中的节点数量:', G1.GetNodes())# 7115

    print('图中的有向边数量:', snap.CntUniqDirEdges(G1))# 103689

    print('图中的无向边数量：', snap.CntUniqBiDirEdges(G1)) # 2927

    print('图中0出度的节点数量：', snap.CntOutDegNodes(G1,0))# 1005

    print('图中0入度的节点数量：', snap.CntInDegNodes(G1,0))#4734

    print('图中最大强连通分量的节点数量：', MxScc.GetNodes())#1300
    print('图中最大强连通分量的边数量：', snap.CntUniqDirEdges(MxScc))#39456

    print('图中最大弱连通分量的节点数量：', MxWcc.GetNodes())  # 7066
    print('图中最大弱连通分量的边数量：', snap.CntUniqDirEdges(MxWcc))  # 103663

    print('图的平均聚集系数：',snap.GetClustCf (G1, -1))# # 0.14089784589308724

全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
Spring Cloud Gateway 的执行链路详解愤怒的代码 SpringCloud spring cloud
SpringCloudGateway的执行链路详解核心目标明确SpringCloudGateway的请求处理全过程（从接收到请求→到转发→到返回响应），方便你在合适的生命周期节点插入你的逻辑。核心执行链路图（执行顺序）┌──────────────┐│客户端请求│└────┬─────────┘↓┌────┴─────────────┐│NettyHttpServer│←→ReactorNetty
matlab卷积矩阵绝对值,MATLAB矩阵分析和计算 weixin_39928736 matlab卷积矩阵绝对值
MATLAB矩阵分析和计算编辑锁定讨论上传视频本词条缺少概述图，补充相关内容使词条更完整，还能快速升级，赶紧来编辑吧！《MATLAB矩阵分析和计算》是清华大学出版社出版的一本图书。[1]书名MATLAB矩阵分析和计算作者杜树春出版社清华大学出版社出版时间2019年6月1日定价59元ISBN9787302524816印次1-1印刷日期2019.04.23MATLAB矩阵分析和计算图书内容编辑本书侧重
第一次在CSDN 使用Markdown编辑页，就看到了完美的语法，在此处，我记录一下撰卢编辑器笔记
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML图表FLowchart流程图导出与导入导出导入欢迎使用Mark
面试官：Spring 如何控制 Bean 的加载顺序？
在大多数情况下，我们不需要手动控制Bean的加载顺序，因为Spring的IoC容器足够智能。核心原则：依赖驱动加载SpringIoC容器会构建一个依赖关系图（DependencyGraph）。如果BeanA依赖于BeanB（例如，A的构造函数需要一个B类型的参数），Spring会保证在创建BeanA之前，BeanB已经被完全创建和初始化好了。@ServicepublicclassServiceA{
Python Day9
@浙大疏锦行PythonDay9.内容：热力图的绘制enumerate()方法子图的绘制代码：list_nums=[1,2,3,4,5,6]forindex,valinenumerate(list_nums):print(f"index={index},val={val}")forvalinlist_nums:print(f"val={val}")importpandasaspdimportmat
macd的python代码同花顺_同花顺最牛MACD副图源码再来一碗饭
DIFF:EMA(CLOSE,6)-EMA(CLOSE,16),ColorFFFF26;DEA:EMA(DIFF,5),Color8A15FF;MACD:=2*(DIFF-DEA);对DIFF:0-(EMA(CLOSE,6)-EMA(CLOSE,16));对DEA:0-(EMA(DIFF,5));对称:0-(2*(DIFF-DEA)),STICK,ColorFF6060,LINETHICK1;{D
5G UE注册-建立会话-释放会话-UE注销信令流程 nonamelake 5g
1.画这个流程图的原因3GPP组织估计跟某厂一样部门墙较重，核心网和无线各搞各的标准，为什么内部不拉通一下，搞个端到端的信令流程，好让我等菜鸟能学的容易点。看着3GPP协议里的信令流程，真心看不懂啊，不信你们瞧瞧下面这几张图。2.3GPP里的5GUE注册流程+PDU会话建立流程+PDU会话释放流程+UE注销流程3.自己动手画流程图我看到上面的4张图就头晕呀，实线+虚线+大箭头，而且有些信令的名字和
Flink 2.0 DataStream算子全景 Edingbrugh.南空大数据 flink flink 人工智能
在实时流处理中，ApacheFlink的DataStreamAPI算子是构建流处理pipeline的基础单元。本文基于Flink2.0，聚焦算子的核心概念、分类及高级特性。一、算子核心概念：流处理的"原子操作1.数据流拓扑（StreamTopology）每个Flink应用可抽象为有向无环图（DAG），由源节点（Source）、算子节点（Operator）和汇节点（Sink）构成，算子通过数据流（S
Matplotlib-图像处理与可视化
Matplotlib-图像处理与可视化一、图像数据的本质：从数组到像素二、基础操作：加载与显示图像1.加载图像数据2.显示单张图像3.显示灰度图像三、进阶可视化：通道分离与色彩调整1.分离RGB通道2.调整亮度与对比度四、实用技巧：色彩映射与像素值分析1.自定义色彩映射（Colormap）2.像素值分布直方图五、多图对比与标注：算法结果可视化1.边缘检测结果对比2.图像标注：突出感兴趣区域六、注意
2023年最新Python安装详细教程_python自定义安装 2401_89213215 python 开发语言
1、选择python的稳定发布版本StableReleases点击进入windows操作系统对应的页面，显示python安装版本，这些python安装版本适合windows操作系统。图3-1python稳定与预发布版本图3-1左边是稳定发布版本StableReleases，右边是预发布版本Pre-releases，前者是经过测试，相对完善、稳定的版本，后者还处于测试中，可能不完善，因此，我们下载左
（一）OpenCV——噪声去除（降噪）
高斯滤波器（针对高斯噪声）高斯噪声是指它的概率密度函数服从高斯分布（即正态分布）的一类噪声。常见的高斯噪声包括起伏噪声、宇宙噪声、热噪声和散粒噪声等等。高斯滤波(Gaussianfilter)包含许多种，包括低通、带通和高通等，我们通常图像上说的高斯滤波，指的是高斯模糊(GaussianBlur)，是一种高斯低通滤波，其过滤调图像高频成分（图像细节部分），保留图像低频成分（图像平滑区域），所以对图
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
从卡顿到丝滑：uni-app房产App性能优化实践儿歌八万首 uniapp uni-app 性能优化
1.性能优化概述在移动互联网时代，用户对应用性能的要求越来越高。据统计，如果一个应用的启动时间超过3秒，将有53%的用户选择放弃使用。对于房产行业的移动应用来说，性能优化更是至关重要，因为它直接影响到用户的看房体验和决策效率。房产应用的独特挑战房产应用相比其他类型的应用，面临着更多的性能挑战：数据量大：房源、客户、跟进记录等海量数据需要高效处理和展示图片密集：房源图片、户型图、实景照片等大量高清图
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
【Python办公】Excel透视转数据图表(饼状图\柱状图\折线图-可拓展) 小庄-Python办公 Python办公自动化 python excel 开发语言 Excel透视 Excel透视工具 python数据分析数据分析
目录专栏导读前言项目概述技术栈选择核心依赖库核心架构设计类结构设计数据流设计界面设计实现布局结构动态界面更新核心功能实现1.透视表计算2.数据排序功能3.数据可视化4.数据统计功能错误处理和用户体验输入验证异常处理项目亮点和创新点1.灵活的多列组合2.智能数据类型处理3.一体化的数据处理流程4.用户友好的界面设计使用场景扩展建议功能扩展性能优化总结完整代码结尾专栏导读欢迎来到Python办公自动化
FFmpeg滤镜相关的重要结构体 melonbo FFMPEG ffmpeg
核心结构体概览FFmpeg滤镜系统由多个关键结构体组成，构成了完整的滤镜处理框架。以下是滤镜系统中最重要的结构体及其相互关系：AVFilterGraph┬─AVFilterContext┬─AVFilter│├─AVFilterLink│└─AVFilterPad└─AVFilterInOut详细结构体分析1.AVFilterGraph（滤镜图容器）功能：管理整个滤镜图的所有组件和状态重要成员：t
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（四） Superstarimage 文献随笔材质神经网络人工智能扩散模型
AnevaluationofSVBRDFPredictionfromGenerativeImageModelsforAppearanceModelingof3DScenes输入3D场景的几何和一张参考图像，通过扩散模型和SVBRDF预测器获取多视角的材质maps，这些maps最终合并成场景的纹理地图集，并支持在任意视角、任意光照条件下进行重新渲染。样例图如下：在当前时代的技术背景下，生成与几何匹配
android mvvm官方demo,Android mvvm架构demo(DataBinding+LiveData+ViewModel+ Repository)
1.实现效果实现页面加载Bing每日一图的功能2.项目结构image(忽略没有按分类创建).png3.实现过程1.注入依赖//ViewModel与LiveDataimplementation"android.arch.lifecycle:extensions:1.1.1"//图片加载implementation'com.github.bumptech.glide:glide:4.9.0'//网络请
【前端】【Echarts】【Liquidfill 水球图】深入理解 ECharts Liquidfill 水球图：从入门到进阶患得患失949 Echarts学习数据大屏前端 echarts javascript
效果深入理解EChartsLiquidfill水球图：从入门到进阶在可视化数据展示中，水球图（Liquidfill）是一种极具表现力的图表。它形象地用“水位高低”表示某个百分比或完成度，非常适合展示指标进度、占比、加载状态等。本文将结合实际HTML示例，带你全面掌握如何使用ECharts+echarts-liquidfill插件绘制水球图，并通过多个实例逐步讲解配置技巧。准备工作在HTML中使用水
物联网入门资料收集 Robin罗兵物联网
1、动动手做一个简单的物联网门禁，手机远程开锁，还带本地射频遥控https://blog.csdn.net/qq_40582683/article/details/796439082、一张图读懂基于微信硬件平台的物联网架构：https://blog.csdn.net/yueqian_scut/article/details/491534053、疯狂物联的控制模块：https://s.taobao.
跨越十年的C++演进：C++20新特性全解析十年编程老舅 C++Linux后端 c++c++20 c++新特性 c++11 c++14 c++17 c++23
跨越十年的C++演进系列，分为5篇，本文为第四篇，后续会持续更新C++23~前3篇如下：跨越十年的C++演进：C++11新特性全解析跨越十年的C++演进：C++14新特性全解析跨越十年的C++演进：C++17新特性全解析C++20标准是C++语言的第四个正式标准，于2020年12月正式发布。首先先上C++20特性思维导图：接下来将从关键字、语法、宏、属性、弃用这5个类目来讲解~1、关键字1.1、c
matlab画信号图方法,献给初学者：手把手教你绘制信号通路图
信号通路是指能将细胞外的分子信号经细胞膜传入细胞内发挥效应的一系列酶促反应通路。细胞信号通路图是科研研究过程中最常见也是最常用到的，如何绘制适合我们自己科研课题的信号通路图呢？可以试试pathwaybuildertool软件。这款软件简单易学，即便是零基础的同学，也可以做出漂亮的信号通路。1.首先，打开PathwayBuilderTool2.0软件，软件自带分子生物学会用到的基本元素，如不同的细胞
工业日志AI大模型智能分析系统-后端实现
目录项目主要架构完整系统架构主要系统架构解析图思路解析模板json示例主要核心代码示例LangGraph工作流(backend/ai/workflows.py)LangChainAgents(backend/ai/agents.py)Django视图(backend/core/views.py)配置(config.py)响应示例关键优势项目主要架构LangGraph、LangChain、Djang
AI技术全景图鉴：从模型开发到落地部署的全链路拆解大模型玩家人工智能 langchain 大模型产品经理学习 ai 程序员
人工智能（AI）技术的快速发展，使得企业在AI模型的开发、训练、部署和运维过程中面临前所未有的复杂性。从数据管理、模型训练到应用落地，再到算力调度和智能运维，一个完整的AI架构需要涵盖多个层面，确保AI技术能够高效、稳定地运行。本文将基于AI技术架构全景图，深入剖析AI的开发工具、AI平台、算力与框架、智能运维四大核心部分，帮助大家系统性地理解AI全生命周期管理。一、AI开发工具：赋能高效开发，提
网安学习NO.14
防火墙基础实验传统防火墙配置实验拓扑图PC：ip192.168.10.1255.255.255.0192.168.10.254ipdns114.114.114.114二层交换机vl10exinte0/0swmoacswacvl10exinre0/1swtrendoswmotr三层交换机vl10exintg0/0swtrendoswmotrexiproutingintvl10ipaddress192
C#灵魂解剖图：从变量囚徒到架构主宰的7层蜕变！洁辉 c#架构开发语言
一、基础语法核心1.数据类型与变量//值类型intage=30;//整型doublepi=3.14159;//双精度浮点decimalprice=99.95m;//精确小数boolisActive=true;//布尔值DateTimenow=DateTime.Now;//日期时间//引用类型stringname="JohnDoe";//字符串int[]scores={90,85,95};//数组o
Python生态全景图：8大主流框架优缺点及选型指南 Sammyyyyy python 开发语言 django fastapi flask
引言：Python的“万能”生态Python为何能成为当今最流行的编程语言之一？答案并非其语法本身，而在于其强大且多样化的框架生态。这个生态系统如同一片繁荣的大陆，覆盖了从Web后端到人工智能的几乎所有技术领域，让开发者能用一种语言胜任多种截然不同的任务。本文将化作一张“技术地图”，快速带你游览Python在Web开发、数据科学和网络爬虫三大领域的8个标志性框架。我们的目标是迅速掌握它们的精髓，让
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc