王壹浪

论文翻译：混合维在庞加莱几何三维骨架的动作识别

Graph Convolutional Networks (GCNs)已经展示了其对不规则数据(如人体动作识别中的骨骼数据)建模的强大能力，这提供了一种令人兴奋的新方法，为居住在图中不同部分的节点融合丰富的结构信息。在人类动作识别中，现有的研究引入了动态图形生成机制，以更好地捕捉隐含的语义骨架连接，从而提高了识别性能。在本文中，我们提供了一种正交的方法来探索底层连接。而不是引入昂贵的动态。我们认为这是一个更适合对图数据进行建模的空间，可以使提取的表示与嵌入矩阵相匹配。具体来说，我们提出了一种新的时空GCN (ST-GCN)架构，它是通过庞加莱几何学定义的，这样它就能够更好地建模结构数据的潜在解剖结构。为了进一步探索黎曼空间的最优投影维数，我们在流形上混合了不同的维数，为每个STGCN层的维数探索提供了一种有效的方法在最终的结果架构中，我们在两个目前规模最大的3D数据集(即NTU)上评估我们的方法RGB+D和NTU RGB+D 120。比较结果表明，该模型在40%模型规模的情况下，在任何给定的评价指标下都能取得比之前的最佳GCN方法更好的性能，证明了该模型的有效性。

人的动作识别是计算机视觉研究的重要课题之一。它可以为许多潜在的应用做出贡献，如人类行为分析、视频理解和虚拟现实。一般来说，有几种不同的模态，例如，外观，深度，光流，骨架数据，被利用在动作识别任务。最近，基于骨架的人类动作识别引起了相当多的关注，因为紧凑的骨架数据使模型对于视点和环境的变化更加有效和健壮。在本文中，我们关注的是基于骨架的三维动作识别问题，并期望提供一个更鲁棒的神经网络来完成这项任务。最近，graph convolutional networks (GCNs) (Defferrard, Bresson, and Vandergheynst 2016;在基于骨架的动作识别中，成功地采用了时间卷积网络ST-GCNs (Kipf and Welling 2016)，保持了骨骼的自然拓扑结构。Yan等首先提出了时空图卷积网络(Yan, Xiong, and Lin) 2018)，该任务将神经结构解耦为GCN来捕获空间信息和1D卷积过滤器来建模动态信息。在GCN部分，当前的ST-GCN方法提供了一个预定义的图嵌入矩阵来编码骨架拓扑这个矩阵和骨架序列数据一起被送入ST-GCNs以提取高级表示。然而，正如工作中提到的(Peng et al.)。2020)，固定的图嵌入矩阵会将约束引入到特征学习过程中，可能不利于更高层次的表示，对最终的分类产生负面影响。因此，在(Shi et al. 2019;Peng et al. 2020)提出了一种全局或分层动态图生成范式，以打破学习约束。实验证明了动态图生成机制可以进一步提高该任务的性能。

本文旨在从另一个角度处理基于骨架的人类动作识别任务。代替提供一个动态的嵌入图，我们转向探索一个更好的建模空间的骨架图序列。尽管目前深神经网络在欧氏空间的特征表示取得了成功，但图数据被证明具有高度非欧氏潜在解剖学特征但据我们所知，之前的ST-GCNs (Yan, Xiong, and Lin 2018;Shi等2019年;(Peng et al. 2020)是在欧几里得空间中定义的，这可能不是层次图数据建模的最佳选择。我们认为，神经网络操作直接定义在一个数据相关的空间，例如，双曲人ifold (Benedetti and Petronio 2012)对学习过程有益。为此，在本文中，我们提出了一个特殊的双曲几何模型上的时空图卷积网络，即庞加模型(Benedetti and)
Petronio 2012)。双曲几何，这是一个非欧几里得几何与常数负高斯曲率，最近在深度神经网络的背景下获得了越来越多的动量，tree-likeliness属性。在双曲几何上建立STGCN可以从双曲距离中受益，因为不相关样本之间的距离会以指数形式大于相似样本之间的距离。我们的方法与动态图生成方法是正交的，本文研究了一种更合理的流形投影，使投影特征更适合给定的嵌入矩阵，而不是通过计算节点嵌入相似度来生成动态嵌入图。双曲空间中样本之间的关系可以强调相似样本，抑制不相关样本。此外，我们的方法对于图序列数据也更通用，因为它们自然处于非欧几里得空间。然而，采用具有非欧几里得设置的深度神经网络是具有挑战性的，因为基本操作(如卷积)的原则性推广并非无关紧要。受工作的启发(Gulcehre et al. 2018)，我们从双曲空间和切线空间之间的投影中得到帮助。由于它们之间存在双射，所以在切空间上进行卷积操作，然后提取的特征将被投影回流形上的一条轨迹。通过将特征投影回流形，可以得到嵌入在双曲空间上的图。为了进一步探索非欧几里得空间中的最优投影维数，我们将不同维数混合到双曲空间中，为每个图神经网络层的维数探索提供了一种有效的方法。最后，得到ST-GCN我们在两个目前最具挑战性的基于骨架的三维数据集上评估我们的方法，即NTU RGB+D (Shahroudy等人)。和NTU RGB+D 120 (Liu et al. 2019a)。与各种先进的方法相比，我们的方法在任何给定的评估方案下都能得到最佳的结果。此外，在模型大小方面，目前最佳的模型(Peng et al.)。甚至比我们的模型大2.5倍，证明了我们方法的有效性。我们的贡献可以总结如下:

我们通过庞加莱几何学提出了一种新的时空图卷积网络，给了我们一个全新的视角ST-GCN用于黎曼流形上的图序列建模。

该方法基于庞加莱模型学习每个图的多维结构嵌入。为了提供更卓越的表现，我们提供了一种有效的方法，通过混合庞加莱模型上的维度来探索更好的投影空间。

要评价我们方法的有效性，请理解在两个目前最具挑战性的基于骨架的三维动作识别任务上进行了大规模的实验。结果表明，该模型在任何给定指标下都能以一种有效的方式获得最佳的分类精度。

本文的其余部分组织如下。本节回顾了相关的方法并讨论了它们与目前工作的关系。本节详细描述了该方法和相应的神经结构。我们以分段的方式进行实验，并在不同的数据集上报告实验结果。在本节中，实验包括在NTU RGB+D数据集上进行的消融实验以及与最先进方法的性能比较。最后，对全文进行了总结。

图卷积网络(GCNs)
将卷积神经网络从常规数据，如图像，推广到不规则数据，如图形数据，是近年来一个活跃的话题。图卷积网络是最成功的代表之一(Monti等人2017年;Velickoviˇc et al . 2018;2016年Kipf和Welling;Defferrard, Bresson和Vandergheynst(2016)，包括时空图卷积网络(ST-GCNs)，在许多研究领域日益受到关注，并取得了很好的成果主要根据如何定义图形卷积，GCNs可以分为两类，即频谱域方法和空间域方法。频谱仪将图形数据转换为其频谱，并在频谱域应用滤波器。这一流派中有许多具有代表性的作品它可以一次处理整个图像。同时，尤其对于大型图，它是费时的。另一个限制是光谱结构被限制在一个单一的领域，因为光谱滤波器系数是基依赖的。如果可以跨不同的域构造兼容的正交基，这个问题就可以解决。然而，这种构造需要领域之间的对应关系的专家知识，这在大多数情况下是极其困难的。相反，基于空间的方法直接在空间域中设计卷积运算它类似于传统的容积式过滤器，因为它是用于图像的。空间域方法通过信息聚合直接在图域内进行卷积，因而对大型图具有更强的可伸缩性。然而，缺点是难以建模全局结构。为图形序列建模动态信息，例如动作的骨架剪辑获得认可，多次获得ST-GCNs(严、熊、林2018年;Shi等2019年;彭等(2020)提出。然而，据我们所知，即使是骨架数据也存在于非欧几里得空间中，所有的ST-GCNs都是在欧几里得空间中定义的。相反，在本文中，我们提出了一个全新的GCN模型，它在非欧几里得空间中模拟人类行为。我们注意到也有工作和Kiela 2017;Ganea Becigneul和Hofmann, 2018年;´Liu, Nickel和Kiela(2019))在黎曼空间中定义神经网络，但它们要么基于传统的前向网络，要么只是为只有两到三层的网络设计转换和聚合函数。相反，我们提供了一个深度空间时间图卷积网络来处理动态图序列。

：行动表彰(严、熊、林2018;彭、红、赵2019年;(Peng et al. 2020)是产业界和学术界最重要的领域之一。在现实生活中，RGB数据无处不在，我们可以找到很多以前基于RGB图像或视频的动作识别作品。然而，他们的一个缺点是，学习的表示容易分心，因为整个区域的视频帧被利用来学习表示目前，骨架数据更容易访问，并且在此任务中越来越流行。与基于RGB的动作识别相比，基于骨架的动作识别对于复杂多变的背景具有更强的鲁棒性。本课题的作品主要有以下三个方面:1)手工制作特征，其中作品利用手工制作特征来利用关节运动的动力学，包括利用LOP特征来克服类内方差问题构建三维关节位置的直方图(Xia, Chen, and Aggarwal 2012)，并在李群中建模三维几何关系(Vemulapalli, Arrate, and Chellappa 2014)。这些方法需要大量的专业知识。2)传统的深度学习方法，提供了一种自动的特征学习策略，已成为主流方法。Work (Kim and Reiter 2017)根据手工设计的转换规则，对图结构骨架数据进行重新排列，并将其建模为伪图像，使构建的网格数据直接受益于cnn由于输入是时间序列数据，因此也有很多尝试利用RNN和LSTM对动态信息建模。代表作有(杜、王、王2015;Shahroudy等人2016;Song等，2017;Zhang et al. 2017;
其中，他们通过将RNN扩展到时空域、将人体骨骼分割成部分或为这项任务提供一个全连接的深度LSTM来建模骨骼序列。但由于没有充分考虑图数据的物理结构和拓扑结构，性能难以进一步提高。3)方法更流行，更适合这个任务。直观地说，骨架特征可以表示为一个图结构，因为它们的组成部分是同形的。因此，可以将骨架中的关节和骨头定义为图的顶点和连接。Yan等开发了时空图卷积网络(STGCN) (Yan, Xiong, and Lin 2018)，将骨架数据建模为图结构，利用了对不规则数据建模的强大能力，取得了比以往方法更好的性能。ST-GCN成为处理基于骨架的操作的通用框架识别任务。在此基础上，工作in (Shi et al. 2019)探索了一种全局自适应嵌入矩阵生成方法，进一步提高了性能。Peng等人引入了神经架构搜索，并为该任务自动设计了GCN (Peng et al. 2020)架构。该工作(Peng et al. 2020)取得了目前最好的结果。我们的工作也是基于ST-GCN，但是我们提供了一种更有效的方法来建模图序列，因此甚至不需要构造一个动态图。黎曼流形上的神经网络流行的深度学习方法通常使用函数相似性等策略将数据嵌入到低维的欧氏向量空间中，以捕获语义表示。这很简单，因为我们对现实世界的直觉与欧几里得空间密切相关。然而，在许多领域，如基因组学、社交网络和基于骨架的动作识别，数据的潜在解剖结构是由非欧几里得空间(如黎曼流形)定义的。以往的深度神经网络大多直接应用于这类d然而，优化建模空间的能力不仅可以减少计算量，而且可以进一步提高任务的性能。近年来，将层次数据嵌入到黎曼空间中取得了很好的效果，在深度学习中得到了广泛的应用。例如，通过构造黎曼空间，Mathieu等人提出了一种庞加莱变分自动编码器(Mathieu’et al. 2019)，并对分层结构显示了更好的泛化。Cho等人提供了一种批处理标准化的黎曼方法并取得了优越的性能。这里我们关注双曲几何，这是一个常数负高斯曲率的非欧几里得几何。这个几何的一个重要的内在性质是指数增长。在这个领域已经有一些设计神经网络的尝试。特别是镍和基拉(Nickel and Kiela)(2017)报告了在双曲空间中学习表示的开拓性研究。然后，工作在(Ganea, Becigneul，’和Hofmann 2018)介绍了双曲神经网络将双曲几何与深度学习联系起来。
在此之后，作品还提供了传统操作的双曲类比，其中开发了其他算法，如庞加莱手套(Tifrea, B’ecigneul，’和Ganea 2018)和双曲注意力网络(Gulcehre et al. 2018)。我们也发现这是可行的(Liu, Nickel, and Kiela 2019;Chami等人2019)使用双曲几何构造图神经网络，这与我们的工作相似。但是，我们的模型不同于这些工作，因为我们处理的是动态图序列，而它们只关注静态图。此外，我们提供了一种有效的方法来探讨投影维数对网络的影响，而这些维数都没有涉及到这个问题。

图1:框架的说明。在我们的框架中主要有三个阶段，包括(a)图形特征嵌入，(b)在庞加莱模型中提取图，(c)在欧几里得空间中进行分类。在第一阶段，我们使用GCN过滤器来捕获每一帧的图形表示，然后使用时间过滤器来捕获动态信息。对于第一阶段的输出，我们混合了不同的维度，然后将它们投影到切空间，其中ST-GCN用于提取更高级别的图表示。然后该特性被映射回来注意，ST-GCN基于阶段(a)中的相同模块，这里的流形空间基于庞加莱模型。我们将阶段(b)中的几个模块堆叠起来，以捕获更高级别的语义表示。之后，如阶段(c)所示，将图形特征投影回欧几里得空间，这样可以使用欧几里得损失函数来优化这一过程。

在本节中，我们将描述在庞加勒模型上定义的ST-GCN。该框架如图1所示。我们的网络的基本模块包括一个GCN和一个卷积滤波器。这样的块被多层堆叠，以捕获图序列的高级表示。时空模型由庞加莱几何学定义。最后，学习到的特征被提前返回到欧几里得空间进行预测。下面我们将详细介绍框架的重要组件。

时空图卷积网络
对于社会网络、生物信息等复杂结构的建模，图形数据是一种非常有用的数据结构，而神经网络对这类不规则数据的建模并不容易。定义G为骨架序列的一个框架。假设骨架由N个节点组成，节点连接在邻接处进行编码表示具有N个节点的图(骨架)的输入表示。为了提取G的特征表示，对其进行傅里叶变换，然后对变换后的信号进行滤波等基本运算。因此，一个规范化的拉普拉斯图
L = In - D−1/2AD−1/2用于傅里叶变换。这里，对角度矩阵D由元素Dii =构造P j Aij。然后，用算子g循环过滤，用循环的参数化的图可以表示为：

Y在哪里提取的图像特征和U是傅里叶基础受到L = UΛUT和Λ作为其对应的特征值。根据(Hammond, Vandergheynst, and Gribonval 2011)的建议，过滤器g的微分逼近可以进一步用k阶的Chebyshev多项式逼近，这样计算负担显著减少。这是

为了进一步提高稳健性，(Shi等人。
2019;Peng et al. 2020)提出了一个ST-GCN块，该块基于节点相关性生成动态嵌入矩阵。而不是提供动态的，我们设计我们的
Poincare模型中的ST-GCN块，使节点repre-’语句符合原始图结构。通过这种方法，我们可以用更少的参数来捕获图的特征。在这一节中，我们将讨论如何在黎曼流形上定义STGCN。这里，我们关注的是双曲空间中的庞加莱模型(Reynolds 1993)，是一个最大对称的单连通黎曼流形，具有恒定的负截面曲率。双曲空间类似于具有常正曲率的n维球体。作为一个特例，庞加莱模型可以通过双曲面模型在z=0平面的单位圆上的立体投影来推导。这很难想象，因为很难想象在一个弯曲的温泉我们可以嵌入二维双曲几何模型到伪欧几里得空间称为闵可夫斯基空间(Tataru 2001)。这里，一个n维的闵可夫斯基空间是一个实维n的实向量空间，其中有一个常数闵可夫斯基度规。如图2，庞加莱圆盘，即二维庞加莱模型，是由上半部双曲面在z=0处投影到单位圆盘上。庞加莱圆盘打破了“”的规则欧氏空间，例如，如图3所示，给定一条线←→AB与a点C /∈←→AB，则至少可以画两条穿过C但不相交的线
←→AB。通过C的两条直线，记为直线l1和直线l2。与欧几里得二维空间不同，我们有这个←→AB同时平行于l1和l2，但同时l1和l2并不平行。还要注意，l2与欧几里得空间的不同之处在于它与一对平行线(l1)相交，但不与另一条平行线相交(
←→AB)。在双曲几何中，一个重要的内在性质是指数增长，而不是多项式增长欧几里得几何学。这意味着不相关样本之间的距离将以指数形式大于相似样本之间的距离。因此，双曲空间中样本之间的关系可以强调相似样本，抑制不相关样本。因此，双曲几何在一些特殊的任务，如学习层次嵌入优于欧几里得几何这里，我们正式定义了这个流形。设M是一个n维流形。对于流形M有三个重要的基本分量，即测地线、切空间和黎曼度规。测地线是一条直线到弯曲空间的一般化，定义为一条可以平行移动切向量而不变形的曲线。在我们的双曲面模型，如图2所示，测地线(或我们的双曲线)被定义为由两点所定义的平面和原点(即坐标(0,0,0))与双曲面相交而形成的曲线。所以一个端点必须先向下然后再向上到达另一个点。这个距离不是用欧几里得空间表面上的最短路径直接指向它，而是绕圆周运动。形式上，x, y∈M的距离定义为：

切线空间TxM x点被定义为一阶线性近似的M x。一个黎曼度量g是一家集内积gx: Tx×Tx→R庞加莱模型不同顺利,x。,开放´单位球配备黎曼度量张量,定义了：

在gE = In表示欧几里得度规张量，它与欧几里得度规张量保角。那么，一个黎曼流形(M, g)就是一个具有群黎曼度量g的流形。

现在，我们在庞加莱几何模型上构建时空图卷积网络，为时序图序列提供更灵活的表示。双曲空间的一个优点是它提供了双曲空间和切空间在某一点上的双射，这样双曲流形上的点的运算可以在切空间上执行，然后映射回去，反之亦然。双射由指数映射完成，它将切空间上的点映射到流形上，定义为expxTxM→M。对数映射，作为逆步骤，将切空间上的点映射回流形，被定义为logx: M→TxM。数学上,通过上述投影函数，我们可以在庞加莱模型上执行GCN操作。由于“黎曼空间中没有向量空间的定义，受(Ganea, Becigneul, and Hofmann 2018)的启发，”我们通过将图形嵌入到对数映射中来对切空间进行特征提取。这样，可以利用神经操作所进行的欧几里得变换对双曲空间中的特征进行处理。具体来说，如图1所示，有三种：

图2:2D庞加莱模型的说明。对于双曲面上的任何一点，我们把它延伸到一个焦点(0,0，-1)来形成一条直线。那么在z=0平面上的交点就是它在庞加莱模型中的投影点

框架中的阶段。首先通过特征嵌入网络对输入的原始数据进行编码。然后将捕获的特征投影到切空间中，通过GCN和时间滤波器进行滤波

这里，Xi表示输入的第i个框架，{Yi}T是GCN之后的整个T帧的表示。{一}然后将T输入到核T×1的时域滤波器中。还将有一个激活函数来执行Y上的非线性投影。最后，我们用logx函数映射回欧几里得空间，从而用欧几里得损失函数优化网络。

Mix-Dimensions在廖使用上述方法，我们可以在上面构建ST-GCN黎曼流形。然而，手工确定流形上各层的投影维数仍然不容易。对于一个10层的ST-GCN，会有数以千计的组合，这显然不可能手动评估每个设置并找出最好的一个。这里，我们提供了一种有效的方法来探索每一层的最佳设置。灵感来自于可瘦身的网络他们训练了一个可瘦身的网络来进行网络剪枝，我们在每个投影点混合不同的维度来有效地探索每一层的最佳投影维度。具体地说，我们在庞加莱模型上提供了一组投影维数。这样，在切线空间上就会有一组对应的ST-GCN块。我们让高维投影共享低维投影的操作，而不是在那里构造一组ST-GCN块。这样，我们就可以建立一个超级模型，对高维的探索就不需要从头训练了，因为他们可以从对低维的训练中获益。为此，我们在切向空间上构建了相应的可切换批处理归一化(Yu et al. 2018)和可瘦身网络。

图3:庞加莱模型的特性说明。穿过点C，可以画多条平行于AB线的直线(l1和l2)。

事实上，这种混合维方法在一次提供了庞加莱模型上ST-GCNs的数千个组合。我们没有评估所有这些组合的性能，而是计算该任务的相对建模能力。我们假设基于混合维数方法的超级模型可以提供每个个体维数设置的估计。因此，我们通过将每一层划分为特定的组来构建ST-GCN模型，并试图找出这个网络的最佳组合。例如，在一个层中，我们将图形表示投影到64维的庞加莱模型中。与只提供这种投影不同，我们同时将图投射到一组维度[32,48,64,80,96]。我们对其他层进行同样的处理。因此，这一层将有5个不同的ST-GCN块。因此,但是，对于一个深度的GCN模型来说，它将花费昂贵的计算费用。所以我们不用建立所有的模型，而是用一个最小的最大的模型来构建网络。在每次迭代中，我们随机抽取一个投影维数的组合和相应的ST-GCN进行激活和训练。在训练阶段结束后，我们随机选择一批投影组合。根据它们对该任务的相对预测精度，我们选择最佳的作为我们在庞加莱模型上的ST-GCN。

本节从数据集、架构、训练细节、比较结果和分析等方面对实验进行了描述。

图4:ST-GCN块的示意图。在Eq.(6)中有两个输入，分别为L和X，其中GCN为空间图形卷积网络，Conv-T为时间滤波器。随后是批处理规范化(BN)层和激活层(ReLU)。此外，为每个块添加一个剩余连接。输出和原始的L被送入下一个区块

知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
两步移动搜索法（2SFCA）python 我在北京coding python python 开发语言
实现两步移动搜索法（Two-StepFloatingCatchmentAreaMethod,2SFCA）是一种广泛应用于地理信息系统（GIS）领域的方法，用于评估设施的空间可达性。以下是基于Python和GeoPandas的一种实现方式。准备工作为了实现2SFCA方法，需要准备以下数据集：供给点：表示服务提供方的位置及其服务能力。需求点：表示潜在使用者的位置及其需求量。距离矩阵：描述供给点与需求点
反向传播神经网络极简入门自信哥
单个神经元神经网络是多个“神经元”（感知机）的带权级联，神经网络算法可以提供非线性的复杂模型，它有两个参数：权值矩阵{Wl}和偏置向量{bl}，不同于感知机的单一向量形式，{Wl}是复数个矩阵，{bl}是复数个向量，其中的元素分别属于单个层，而每个层的组成单元，就是神经元。神经元神经网络是由多个“神经元”（感知机）组成的，每个神经元图示如下：这其实就是一个单层感知机，其输入是由和+1组成的向量，其
Java、python中高级开发工程师岗位框架要求统计爱吃土豆的马铃薯ㅤㅤㅤㅤㅤㅤㅤㅤㅤ java python 开发语言
一、主流框架使用频率框架/技术出现频率说明SpringBoot89%几乎成为Java后端开发的标配，用于快速构建微服务和独立应用。SpringCloud76%微服务架构必备，提供服务发现、配置管理、网关等核心组件。MyBatis/MyBatis-Plus72%最流行的ORM框架，MyBatis-Plus进一步简化开发。Spring68%基础框架，中高级岗位要求深入理解IoC、AOP原理。Hiber
Java NIO 模型笔记笑衬人心。 JAVA学习笔记 java nio 笔记
目录JavaNIO概述JavaBIOvsNIONIO三大核心组件Channel（通道）Buffer（缓冲区）Selector（选择器）Channel详解Buffer详解Selector详解NIO工作流程图示例代码讲解NIO模型的优缺点NIO与Netty简介总结JavaNIO概述JavaNIO（NewI/O）是从Java1.4开始引入的一套新的I/OAPI。主要用于构建高性能、高并发的网络通信程序。
PPOCRLabel 环境配置教程 ysh9888 人工智能算法计算机视觉 opencv
PPOCRLabel环境配置教程_哔哩哔哩_bilibili1安装conda2新建环境condacreate--nameppocrpython=3.8--channelhttps://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/condaactivateppocrpipinstall-rrequirements.txt-ihttps://pypi
response.split(“\n“)[0].strip() 是什么 ZhangJiQun&MXP 教学 2021 AI python python 机器学习人工智能语言模型自然语言处理
response.split(“\n”)[0].strip()是什么returnresponse.split("\n")[0].strip()这行代码在Python中通常用于对字符串进行处理并返回处理后的结果response.split("\n")：split()是Python字符串对象的一个方法，用于根据指定的分隔符将字符串拆分成一个列表。在这行代码中，"\n"作为分隔符，表示按照换行符来拆分字
1.线性神经网络--线性回归温柔济沧海深度学习神经网络线性回归 python
1.1从零实现线性回归importrandomimporttorch#fromd2limporttorchasd2limportmatplotlib.pyplotaspltdeftrain_data_make(batch_size,X,y):num_examples=len(X)idx=list(range(num_examples))#生成0-999random.shuffle(idx)#样本需
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
Python函数 python知识
1文档字符串函数定义下的第一个字符串是文档字符串，用于解释函数。可以通过help(function_name)或function_name.__doc__来查看。2函数返回单个返回值：return一个值无返回值：函数执行完毕没有return语句，或者return后面没有值，会隐式地返回None返回多个值：实际上是返回一个包含所有值的元组(tuple)3参数函数声明：使用def关键字来创建函数默认参
【限时干货】Calibre智能分类，轻松突破内网限制畅享电子书库比头发还脆弱服务器 tcp/ip linux
文章目录前言1.网络书库软件下载安装2.网络书库服务器设置3.内网穿透工具设置4.公网使用kindle访问内网私人书库前言本研究旨在构建一套运行于微软操作系统环境下的独立电子图书管理体系，核心目标是建立可远程操作的资源访问机制。该架构采用高可用性设计，在第三方阅读平台服务中断时仍能保障数字内容传输的稳定性。系统创新性地融合了两大核心技术组件：通过Calibre开源软件实现文献分类算法与格式转换功能
Python-selenium爬取藏在歌词里 python selenium 开发语言
selenium前言使用python的requests模块还是存在很大的局限性，例如：只发一次请求；针对ajax动态加载的网页则无法获取数据等等问题。特此，本章节将通过selenium模拟浏览器来完成更高级的爬虫抓取任务。什么是seleniumSelenium是一个用于自动化Web应用程序测试的开源工具集。它提供了一组API和工具，可以与多种编程语言一起使用，如Java、Python、C#等，用于
python --飞浆离线ocr使用/paddleocr
依赖#python==3.7.3paddleocr==2.7.0.2paddlepaddle==2.5.2loguru==0.7.3frompaddleocrimportPaddleOCRimportcv2importnumpyasnpif__name__=='__main__':OCR=PaddleOCR(use_doc_orientation_classify=False,#检测文档方向use
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
跨平台ZeroMQ：在Rust中使用zmq库的完整指南涵树_fx 架构设计 Rust 实战 rust 开发语言后端
“消息就像神经元间的电信号，而ZeroMQ就是那个让系统思考的神经网络”——某个深夜调试zmq的程序员当你需要轻量级、高性能的进程间通信时，ZeroMQ就像代码世界里的瑞士军刀。今天我们一起探索如何在Rust生态中使用这把利器，感受它如何在不同操作系统间架起通信的桥梁。安装ZeroMQ：三大操作系统的通关秘籍Linux(Debian/Ubuntu)sudoaptupdatesudoaptinsta
善用关系网络：开源AI大模型、AI智能名片与S2B2C商城小程序赋能下的成功新路径
摘要：本文聚焦于关系在个人成功中的关键作用，指出关系即财富，善用关系、拓展人脉是成功的重要途径。在此基础上，引入开源AI大模型、AI智能名片以及S2B2C商城小程序等新兴技术工具，探讨它们如何助力个体在复杂的关系网络中更高效地挖掘和利用资源，提升处理关系的能力，从而为事业成功开拓新道路，揭示这些技术元素在当代成功路径中的创新应用与重要意义。关键词：关系网络；开源AI大模型；AI智能名片；S2B2C
说话人识别python_基于各种分类算法的说话人识别（年龄段识别） weixin_39673184 说话人识别python
基于各种分类算法的语音分类(年龄段识别)概述实习期间作为帮手打杂进行了一段时间的语音识别研究，内容是基于各种分类算法的语音的年龄段识别，总结一下大致框架，基本思想是：获取语料库TIMIT提取数据特征，进行处理MFCC/i-vectorLDA/PLDA/PCA语料提取，基于分类算法进行分类SVM/SVR/GMM/GBDT...用到的工具有HTK(C,shell)/Kaldi(C++,shell)/L
llama-cpp-python使用教程 try2find llama python 开发语言
以下是llama-cpp-python的完整使用教程，涵盖安装、基础用法、高级功能（如GPU加速、多模态等）和常见问题解决。1.安装1.1基础安装（CPU版）pipinstallllama-cpp-python-ihttps://pypi.tuna.tsinghua.edu.cn/simple1.2启用GPU加速（CUDA）CMAKE_ARGS="-DGGML_CUDA=ON"pipinstall
【Python】列表嵌套字典多规则排序魔都吴所谓 Python 算法工具 python 服务器 java
数据a=[{"project":"pro_613","branchList":[]},{"project":"pro_614","branchList":[]},{"project":"pro_612","branchList":[]},{"project":"pro_631","branchList":[]},{"project":"pro_617","branchList":[]},{"pro
Redis存储Cookie实现爬虫保持登录 requests | selenium
前言前面已经介绍了requests和selenium这两种方式的基础知识和模拟登录,但是我们需要每次都进行登录,这明显是很麻烦并且不合理的,所以这次我分享一下怎么可以让我们的程序进行一次登录之后,和普通浏览器一样下次不进行登录直接进行对网站数据的爬取下面的我分享的内容需要前置知识,如果同志有知识不理解,可以查看我以前写的文章Python爬虫request三方库实战-CSDN博客Python爬虫XP
Requestium - 将Requests和Selenium合并在一起的自动化测试工具测试界晓晓软件测试测试工具 selenium 自动化软件测试功能测试自动化测试程序人生
Requests是Python的第三方库，主要用于发送http请求，常用于接口自动化测试等。Selenium是一个用于Web应用程序的自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。本篇介绍一款将Requests和Selenium结合在一起的自动化测试工具-Requestium简介Requestium是一个Python库，它将Requests、Selenium和P
使用 C++ 实现 MFCC 特征提取与说话人识别系统 whoarethenext c++开发语言 mfcc 语音识别
使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
深度解析：venv和conda如何解决依赖冲突难题咕咕日志 conda python
文章目录前言一、虚拟环境的核心价值1.1依赖冲突的典型场景1.2隔离机制实现原理二、venv与conda的架构对比2.1工具定位差异2.2性能基准测试（以创建环境+安装numpy为例）三、venv的配置与最佳实践3.1基础工作流3.2多版本Python管理四、conda的进阶应用4.1环境创建与通道配置4.2混合使用conda与pip的风险控制4.3跨平台环境导出五、工具选型决策树5.1场景化推荐
MyChrome.exe与Selenium联动避坑指南：User Data目录冲突解决方案龙潜月七 selenium 测试工具
在自动化测试与网络数据采集场景中，MyChrome.exe与Selenium的联动能发挥强大作用，但二者的UserData目录配置若处理不当，易引发冲突。下面我将重点围绕该问题，详细阐述联动的注意事项。MyChrome.exe与Selenium联动避坑指南：UserData目录冲突解决方案在自动化测试与网络数据采集的领域中，MyChrome.exe与Selenium的组合常常是开发者的得力助手。M
深入解析C++中 std::sort背后的实现原理 —Introsort（Introspective Sort）点云SLAM C++c++算法数据结构快速排序排序算法堆排序深度优先
Introsort简介Introsort是一种混合排序算法，结合了三种经典算法的优点：算法用于特点快速排序通常情况平均时间复杂度O(nlogn)堆排序当快速排序退化（递归过深）时最坏时间复杂度O(nlogn)插入排序小规模数组时（如长度≤16）常数开销小，快Introsort运行机制排序逻辑如下：if(size2*log2(n))堆排序（HeapSort）else快速排序（QuickSort）快速
冒泡排序算法详解（含Python代码实现）算法_小学生算法
冒泡排序（BubbleSort）是最基础的排序算法之一，通常用于学习排序算法的入门理解。本文将通过Python代码实现冒泡排序，并详细讲解其原理、执行流程、复杂度分析及适用情况。✨一、算法简介冒泡排序的核心思想是：相邻两个元素比较，将较大的元素不断“冒泡”至右侧，最终实现排序。其基本过程是重复比较相邻的元素，如果顺序错误就交换，重复这一过程，直到没有任何需要交换的为止。二、Python代码实现下面
揭秘 Spring Cloud Zuul 在后端的负载均衡策略大厂资深架构师 Spring Boot 开发实战 spring cloud 负载均衡 spring ai
揭秘SpringCloudZuul在后端的负载均衡策略关键词：SpringCloudZuul、负载均衡、微服务网关、Ribbon、请求路由摘要：在微服务架构中，API网关是流量的“总调度员”，而负载均衡则是它的“智能大脑”。本文将以“小区门卫派件”为故事主线，用通俗易懂的语言揭秘SpringCloudZuul如何通过集成Ribbon实现后端负载均衡。我们将从核心概念到算法原理，从代码实战到应用场景
PyTorch中 item()、tolist()使用详解和实战示例点云SLAM PyTorch深度学习 pytorch 人工智能 python 深度学习张量的操作 item tolist
在PyTorch中，.item()和.tolist()是两个常用于从Tensor中提取Python原生数据的方法，尤其在调试、日志记录或将结果传给非张量库时非常有用。下面是它们的详解与代码示例。1..item()方法用途：将仅包含一个元素的张量（即标量张量）转换为对应的Python原生数据类型（float,int,等）。限制：只能用于只包含一个元素的Tensor，否则会报错。示例代码：import
攻防对抗的工作原理和架构 hao_wujing 安全
大家读完觉得有帮助记得关注和点赞！！！**攻防对抗（CyberKillChainDefense）**是网络安全领域的动态博弈过程，攻击方通过**入侵链**突破防御，防御方则构建**纵深的检测响应体系**进行拦截反制。其本质是**攻击成本与防御效能的持续对抗升级**。以下从工作原理到架构的深度解析：---###一、攻防对抗核心工作原理####**攻击链（CyberKillChain）vs防御链（De
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

论文翻译：混合维在庞加莱几何三维骨架的动作识别

你可能感兴趣的:(心得,人工智能,网络,大数据,算法,python)