茗创科技

利用深度学习进行组水平大脑解码

摘要

脑成像数据解码越来越受欢迎，可用于脑机接口和神经表征等方面的研究。解码通常是特定于个体的，由于不同被试之间的差异较大，因而不能很好地泛化。克服这一问题的技术不仅需要能够提供更丰富的神经科学见解，而且还能使组水平模型的性能优于特定个体模型。在这里，本文提出了一种使用个体嵌入的方法(类似于自然语言处理中的词嵌入)，来学习并利用个体间变异性的结构作为解码模型的一部分，即WaveNet架构的分类自适应。本研究将该方法应用于脑磁图数据，其中15名被试观看了118张不同的图像，每个图像有30个示例，使用图像呈现后的整个1s窗口来进行图像分类。本研究表明，深度学习和个体嵌入的结合对于缩小个体水平和组水平解码模型之间的性能差距至关重要。重要的是，组水平模型在低精度被试上的表现优于个体模型，并且可用于初始化个体模型。虽然总体上未发现组水平模型的性能显著优于个体水平模型，但是在更大的数据集上，组水平建模的性能预计会更高。为了提供组水平层面的生理学解释，本研究利用了置换特征重要性方法，提供了模型中编码的时空和频谱信息。所有代码均可在GitHub上获得(https://github.com/ricsinaruto/MEG-group-decode)。

前言

近年来，解码技术在神经影像学领域越来越受欢迎，特别是从内部状态(即大脑活动)解码外部变量(如刺激类别)。这种分析对于脑机接口(BCI)应用或获得神经科学见解非常有用。对大脑记录进行解码的应用中通常为每个数据集和每个被试拟合单独的模型(通常是线性模型)。这样做的好处是解码可以根据数据集/被试进行调整，但缺点是无法利用可在数据集/被试之间传递的知识。这对于神经影像学领域尤为重要，因为收集更多数据既昂贵而且难度也较大(例如在临床人群中)。特定被试(个体水平)模型的实际缺点还包括计算负荷增加、过拟合几率更高以及无法适应新的被试。本研究旨在利用多个被试的数据，训练一个可以在被试之间泛化的共享模型(组水平模型)。个体水平和组水平模型的概念可视化如图1所示。

图1.个体水平和组水平模型的概念可视化。

由于脑磁图(MEG)具有高时间分辨率和相对较好的空间分辨率，因而是研究大脑活动快速动态的极好方法。MEG非常适合进行解码分析，这种分析通常使用个体水平模型进行。这是因为神经影像数据中存在很高的被试间变异性。另一种方法是在多个被试中训练和使用相同的解码模型。将不明确地对任何被试间变异性进行建模的方法称为“朴素组水平建模”。这种朴素方法实际上假设所有数据来自同一被试(参见图1b)，但由于被试间差异很大，通常表现得非常糟糕。本研究旨在改进这些方法。如果组水平建模能够考虑到高度的被试间变异性，那么就可以在被试间共享相关信息，从而带来两个关键优势。首先，我们可以直接从组水平解码模型中获得神经科学见解。其次，使用适当规模的多被试数据集，组水平模型的性能将优于个体水平模型。

本研究的主要目标是通过使用单个组水平解码模型来改进个体水平模型，该模型可以在被试之间(以及被试内)进行泛化。本文将其称为跨被试解码，即模型在所有被试的部分数据上进行训练，然后在留出数据上进行测试。这是因为在这种方式下表现良好的组水平模型有助于获得与组水平相关的神经科学信息。本文还介绍了另一种方法，即留一法分析(Leave-one-subject-out，LOSO)。在LOSO分析中，组水平模型在多个被试数据上进行训练，并在一个新的未知数据上进行测试，这在零样本学习BCI应用中特别有用。

在这里，本研究提出了一种通用架构，借助个体嵌入(图1c和图2)对多个被试进行联合解码。需要注意的是，我们在全时段解码的背景下进行此操作，因为最近的研究表明，全时段模型的性能优于滑动窗口解码。本研究使用包含视觉任务的MEG数据集(15名被试)，并做出了以下贡献。首先，本研究引入了具有个体嵌入的组水平模型，明显改进了朴素组水平建模，并展示了与个体水平解码模型相比，可以提供的解码方面的潜在改进。其次，本研究深入探讨了非线性和个体嵌入如何有助于组水平建模。第三，本文展示了可以从基于深度学习的解码模型中获得神经科学见解，并使用置换特征重要性(PFI)来揭示有意义的时空和频谱信息是如何编码的。

图2.基于个体嵌入的组水平WaveNet分类器。

方法

数据

本研究使用任务态MEG数据集，其中包括15名被试观看118张不同的图像，每张图像观看30次。分段后的数据是公开的，但本研究直接从原作者那里获得了连续的原始MEG数据，以便能够使用MNE-Python运行我们的预处理流程。原始数据经过0.1-125Hz的带通滤波，并使用陷波滤波器去除线噪声。使用白化处理来消除个体水平模型中通道之间的协方差。先前的研究表明，去除通道间协方差(白化处理)，或者可以说是多元噪声归一化，可以提高线性解码模型的性能。对于组水平模型，不执行白化处理，而是通过去除均值并除以方差来对每个通道进行单独标准化。在组水平模型中不使用白化的原因是，当每个PCA分解投射到不同的空间时，它会破坏被试间通道的对齐。在白化处理之后，将数据降采样至250Hz并进行1.024s的分段。这导致了来自306个MEG传感器的306×256维试次(通道×时间点)。我们进行多类解码，预测118个类(图像)中每个类别的概率。有关分段数据的概要，详见表1。

表1.分段数据集的维度。

模型

本研究的目标不是设计一种用于解码MEG数据的新架构，而是基于已被证明对时间序列数据有效的卷积神经网络架构来构建模型。因此，本研究使用了一种基于WaveNet的解码模型进行分类，该模型已经成功地应用于音频领域，我们称之为WaveNet分类器。WaveNet中的扩张卷积对于建模时间序列数据非常有效，因为连续层可以提取输入的互补频率内容。本研究的WaveNet分类器模型由两部分组成：(时间)卷积块用作特征提取器，全连接块用于分类(图2)。卷积块使用一系列1D扩张卷积层，其中包括随机失活(dropout)和反双曲正弦激活函数。对于个体水平的建模，本研究使用3个卷积层。对于组水平的建模，使用了6个卷积层。通过训练分别使用3层和6层的个体水平和组水平模型，并在每种情况下选择最佳的模型版本，从而在个体水平和组水平之间进行公平比较。

本研究评估了每个模型的两个版本，分别是线性的和非线性的Wavenet分类器。这样我们就可以看到非线性(深度学习的基石)如何与组水平建模相互作用。最后，将组水平建模分为两种方法。首先，我们有一个朴素组水平模型，即标准的6层Wavenet分类器。其次是本研究提出的组水平模型，通过包含个体嵌入来改进朴素组水平模型。下面给出了个体水平(方程(1))、朴素组水平(方程(2))和嵌入组水平(方程(3))模型的数学表示。

其中，s表示单个被试，S是所有被试的集合。ts和ys分别表示被试s的目标变量和输入试次，fs是被试特定模型，fg是跨被试共享的组水平模型。es是特定被试的学习嵌入。个体嵌入是一种处理被试间变异的方法，类似于自然语言处理(NLP)中的词嵌入，每个被试都有一个对应的稠密向量。将该向量与输入试次数据的通道维度在所有时间点上进行连接(在每个试次中)。

实验过程

本研究的主要评估指标是在118个类别上进行跨被试解码的分类准确性。对于每个被试和类别，按照4∶1的比例划分训练集和验证集。个体水平和组水平模型在相同的划分上进行训练和评估。请注意，对于每个模型，还进行了额外的训练，其中(线性)恒等函数被用作激活函数，以评估非线性的影响。使用Adam优化器分别训练500和2000个epoch的线性模型和非线性模型。表2列出了图3中呈现的所有模型和训练组合。

表2.模型和训练组合及其对应的命名。

图3.在每个被试的验证集上评估经过训练的个体水平和组水平模型。

在组水平和个体水平模型中，Dropout设置为0.4和0.7，批大小分别为590和59。组水平模型的学习率设置为0.0001，个体水平模型的学习率设置为0.00005。在NVIDIA A100 GPU上，单个个体水平和组水平模型的训练时间分别为5-15分钟和4小时。

结果

所有训练模型的验证精度如图3所示。有趣的是，在个体水平上，线性模型的表现略优于非线性模型(增加了4%，p=5.7e-4)。本研究认为，在被试内进行训练/验证时，数据规模和噪声水平的限制都导致了非线性模型的性能欠佳。MEG数据集普遍存在较大的被试间差异，个体准确率范围从5%到88%不等。正如预期的那样，训练朴素组水平模型，即将线性或非线性WaveNet分类器简单应用于组水平建模(橙色小提琴图)时，会导致性能大大降低。在非线性模型中添加个体嵌入(non-linear group-emb)可将性能提高24%(p=1.9e-6)，但在线性模型中则没有提高(linear group-emb)。这表明，在非线性激活函数中结合个体嵌入可以缩小与个体水平模型的差距。

本研究还对每个被试的训练数据分别进行了500个epoch的嵌入组水平模型的微调(non-linear group-emb finetuned)。有效地使用组水平模型作为个体水平模型的初始化，相对于从头开始训练的个体水平模型(linear subject)来说有所改进，实现了50%的精度(提高了5%)。这表明在组水平上学习到的表征对于个体水平的建模是有用的。相比之下，对朴素组水平模型进行微调(non-linear group finetuned)仅达到42%的精度，这表明将微调与最好的组水平模型相结合时，可以达到最佳性能。

在神经解码中，人们普遍认为组水平模型的表现要比个体模型差。为什么会出现这种情况呢？通过绘制两种模型中每个被试的表现(图4)，可以得到一些启示。对于non-linear group-emb模型，有4个精度较低(15%-30%)的被试比linear subject中的精度要高(尽管被试间的均值较低)。这表明如果能够识别出这些被试，那么组水平模型可以成功地应用于某些个体。事实上，在linear subject个体水平的精度与non-linear group-emb和non-linear group-emb finetuned模型的精度之间具有强烈的负相关(分别为−0.88和−0.54)。将finetuned与个体水平模型(linear subject)相比，只有两个精度较高的被试略有下降，而较低/中等精度的被试通常比高精度被试显示出更大的改进(图4)。

图4.当比较经过训练的linear subject、non-linear group-emb和non-linear group-emb finetuned模型时，所有15个被试(不同颜色)的精度变化情况如图所示。

在训练non-linear group-emb模型时，对留一被试的嵌入进行随机初始化。在LOSO(零样本)评估中，两组模型都达到了5%的精度(图5a)。直到使用留一被试训练数据的70%时，两组模型都显著优于线性被试模型(p＜0.05，经多重比较校正)。因此，当微调组水平模型时，可以用比线性被试更少的数据来达到相同的性能水平。不出所料，non-linear group-emb模型没有比朴素模型(non-linear group)更好，但重要的是，也没有更差。与图3中的微调设置不同的是，当适应新的被试时，更好的组水平性能并不意味着更好的微调性能。本研究认为这是因为在适应新被试时，该被试的嵌入是随机初始化的，因此在微调过程中需要重新学习。这是本研究方法的一个局限性。

图5.a)对留出被试进行泛化和微调。b)训练后non-linear group-emb模型的时间(线条)和空间(传感器空间图)PFI。

图5b显示了训练后non-linear group-emb模型的时间和空间PFI。为了使结果更加稳健和平滑，对于时间PFI，采用100ms时间窗的随机混排，并对相同位置的磁强计和梯度计进行空间PFI的混排处理。精度损失较高的时间窗或通道被解释为包含更多有关视觉图像的神经可辨别性的信息。这表明了大脑中与呈现图像相关的信息处理是在何时何地发生的。时间PFI在150ms左右显示了一个巨大的峰值，这与之前在该数据集上的个体水平PFI结果一致。之后，信息内容迅速下降，在650ms左右的出现了第二个较小的峰值，这可能对应于500ms图像呈现结束后的大脑响应。空间PFI显示，最重要的通道位于大脑后部视觉区域的传感器中，这符合视觉任务的预期。这种PFI分析与深度学习模型中经常使用的基于梯度的分析方法之间存在良好的一致性。

为了进一步了解所训练的non-linear group-emb模型，可以通过分析学习到的权重来获得可解释的空间、时间和频谱信息。这种分析之所以可行，是因为我们使用了多层神经网络，而在经典的线性模型中无法进行等效的分析。我们可以利用模型自身的结构(即连续的层)，以及卷积层中的滤波器可以被视为单个的计算单元。这里的目的是理解模型本身以及它如何表示和处理数据。

图6显示了6个卷积层中的3个层的结果，同一层内的卷积核往往具有相似的时间敏感性，因此本研究只显示了5个卷积核(图6c)。为了比较具有不同输出幅度的卷积核之间的时间PFI，对输出偏差进行标准化处理。在早期层中，敏感性在100ms左右达到峰值，然后迅速下降，最后再次缓慢上升。早期层中的卷积核具有一定的随机空间敏感性(图6a)，而且不同卷积核之间存在一些差异。这种敏感性类似于对分类性能来说信息量最大的空间特征(参见图5b)。图6b显示了空间PFI的时间分布。这表明空间敏感性似乎不随时间而变化；也就是说，最重要的通道始终是相同的。

图6.利用PFI可以获得时空信息。

在神经生理学中，我们经常对振荡信号以及特定频率与某些任务(这里是视觉刺激解码)之间的关联性感兴趣。为此，本研究在频谱域中使用PFI，用于测量卷积核输出在特定频段扰动下的变化(图7a)。在所有层和卷积核中，该特征具有1/f(频率)形状，在10Hz处有一个明显的峰值。这些都是MEG信号的常见特征，表明卷积核的频谱敏感性与数据的功率谱一致。有趣的是，先前对该数据集的PFI分析未显示出10Hz的峰值。因此，分析深度学习模型的权重可以揭示更多或不同的信息。在图7b中，还观察了4个通道邻域的频谱PFI，并发现卷积核对所有频率下的相同通道(在视觉区域)都很敏感，并且这些通道具有更大的10Hz峰值。

图7.显示了3层卷积核的频率敏感性。

结论

本研究专注于跨被试解码，这是由于在组水平上表现良好的模型可用于获得与组水平相关的神经科学见解。在这种情况下，本研究提出的基于深度学习的组水平模型优于朴素组模型，并实现了与个体水平模型相似的性能。该模型具有三个关键优势，首先，它在组水平上提供了更丰富的信息。其次，当数据集较大时，组水平模型可能优于个体水平模型。第三，组水平模型可用于初始化个体水平模型，其性能优于随机初始化的个体水平模型。此外，个体嵌入和非线性对于使用组水平模型解码神经成像数据的目标是非常重要的，这将使我们能够更好地利用这种固有的有限资源。

参考文献：Csaky, R., van Es, M. W. J., Jones, O. P., & Woolrich, M. (2023). Group-level brain decoding with deep learning. Human Brain Mapping, 1-15. https://doi.org/10.1002/hbm.26500

小伙伴们关注茗创科技，将第一时间收到精彩内容推送哦～

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

利用深度学习进行组水平大脑解码

你可能感兴趣的:(深度学习,机器学习)