余弦的倒数

深度学习训练模型损失Loss为NaN或者无穷大（INF）原因及解决办法

文章目录

一、可能原因
- ==1. 学习率过高==
- ==2. batch size过大==
- 3. 梯度爆炸
- 4. 损失函数不稳定
- 5. 数据预处理问题
- 6. 数据标签与输入不匹配
- 7. 模型初始化问题
- 8. 优化器设置问题
- 9. 数值问题
- ==10. 模型结构设计缺陷==
二、调试步骤
三、常见预防措施

一、可能原因

1. 学习率过高

原因：学习率过高可能导致梯度爆炸，权重更新幅度过大，导致模型参数变为无穷大或 NaN。学习率设置过大是常见问题，它会让参数更新步幅太大，模型难以收敛，导致梯度在更新过程中迅速增大，使损失值变为无穷大或者NaN。
如果在迭代的100轮以内，出现NaN，一般情况下的原因是因为你的学习率过高，需要降低学习率。可以不断降低学习率直至不出现NaN为止，一般来说低于现有学习率1-10倍即可。如果为了排除是不是学习率的原因，可以直接把学习率设置为0，然后观察loss是否出现Nan，如果还是出现就不是学习率的原因。需要注意的是，即使使用 adam 之类的自适应学习率算法进行训练，也有可能遇到学习率过大问题，而这类算法，一般也有一个学习率的超参，可以把这个参数改的小一些。
解决方法：
- 降低学习率，例如从 1e-3 调整到 1e-4 或更低。尝试降低学习率，采用学习率衰减策略，如torch.optim.lr_scheduler.StepLR，让学习率随着训练轮次逐步变小，找到合适的学习率区间。降低初始学习率，并且设置合适的学习速率和学习率衰减，至少降低一个数量级
- 使用学习率调度器（如 torch.optim.lr_scheduler）。
- 梯度裁剪，设置gradient clipping，用于限制过大的 diff
- 数据量纲不一致，也会导致梯度爆炸，数据归一化方法（减均值，除方差，或者加入normalization，例如BN、L2 norm等）
- 注意每个batch前梯度要清零，optimizer.zero_grad()
- 如果模型中有多个loss层，就需要找到梯度爆炸的层，然后降低该层的loss weight

2. batch size过大

batch size过小，会导致模型后期摇摆不定，迟迟难以收敛，而过大时，模型前期由于梯度的平均，导致收敛速度过慢。
epoch在100内损失出现NaN可能原因以及解决

原因：如果在迭代的100轮以内，出现NaN，一般情况下的原因是因为你的学习率过高，需要降低学习率，也可能是batch size过大。
解决方案：减小学习率、减小batch size。

3. 梯度爆炸

原因：梯度过大，尤其是在深层网络中，可能导致数值溢出。
解决方法：
- 使用梯度裁剪 (torch.nn.utils.clip_grad_norm_ 或 torch.nn.utils.clip_grad_value_)。
- 检查模型结构，避免过深或过大的全连接层和激活函数。
  梯度消失不会导致模型出现 nan 和 inf ，只会导致模型 loss 不会下降，精度无法在训练过程中提升。而梯度爆炸则有可能导致模型在训练过程中出现 inf 。

4. 损失函数不稳定

原因：损失函数可能产生过大的中间值（例如，log 函数输入为 0，或平方误差值过大）。所选的损失函数与任务不契合。比如，在回归任务中用分类的交叉熵损失函数，由于计算逻辑不符，会得出不合理的结果。
解决方法：
- 在交叉熵损失中，确保模型输出经过 softmax（如果未使用 CrossEntropyLoss 的内置函数）。依据任务特性，正确选用损失函数。回归任务常用均方误差损失（MSELoss），分类任务常用交叉熵损失（CrossEntropyLoss ）等。
- 对输入数据或标签进行平滑处理（如标签平滑技术）。
- 损失函数应该考虑到是否可以正常地backward。
- 其次对输入的Tensor是否进行了类型转化，保证计算中保持同一类型。
- 最后考虑在除数中加入微小的常数保证计算稳定性。
- 尝试重现该错误,在loss layer中加入一些输出以进行调试。找到可能出现的错误的地方，增加一个bias

5. 数据预处理问题

原因：
- 数据中存在异常值（如极大或极小的数值）。如果训练数据本身就有缺失值或者无穷大的异常数据点，在模型计算过程中，很容易产生不正常的梯度，进而导致损失值异常。例如，在图像数据处理时，若像素值由于错误的归一化变成无穷大，后续计算就会受影响。
- 输入数据未标准化或归一化，导致输入范围过大。
解决方法：
- 检查数据分布，使用归一化或标准化（如 MinMaxScaler 或 StandardScaler）。对数据集进行全面检查，使用numpy.isnan() 或 torch.isnan() 函数定位包含NaN的样本，去除或者修正这些异常数据。对于无穷大的数据点，也可用类似方法检测，再重新做数据的归一化等预处理。
- 过滤异常值，确保数据质量。

6. 数据标签与输入不匹配

原因：脏数据。标签的数量、维度与输入数据不对应，使得模型在计算损失函数时出错。例如，分类任务中，标签数量与类别数不一致，会让交叉熵损失函数无法正确计算。
解决办法：仔细核对数据加载与预处理流程，保证标签与输入数据在形状、数量等维度上完全匹配。

7. 模型初始化问题

原因：模型参数初始化不当，可能导致训练初期梯度消失或爆炸。不合适的权重初始化可能导致模型在前向传播或反向传播时出现梯度爆炸或梯度消失。例如，若把所有权重初始化为 0，反向传播时各层神经元学到的梯度完全相同，很容易让梯度异常增大，损失值变为无穷大。
解决方法：
- 使用 PyTorch 提供的初始化方法（如 torch.nn.init）。
- 使用良好的初始化策略（如 Xavier 初始化、He 初始化）。采用合理的初始化方法，如nn.init.kaiming_normal_用于激活函数为 ReLU 类的网络层，nn.init.xavier_normal_ 也适用于多种常见网络结构，替换原来的初始化方式。

8. 优化器设置问题

原因：某些优化器参数（如权重衰减、动量）设置不合理。
解决方法：
- 调整优化器参数，例如降低权重衰减（weight_decay）或动量（momentum）。
- 尝试不同的优化器（如从 SGD 转换为 Adam）。

9. 数值问题

原因：某些计算操作导致数值溢出或除以零。
解决方法：
- 检查是否有除以零操作（如 1/x 中的 x 是否可能为 0）。
- 在计算中使用 torch.clamp 限制值的范围。

10. 模型结构设计缺陷

原因：一些过于复杂或者设计不合理的网络架构，像层数极深且没有合适的归一化层，容易造成梯度问题。例如，深层循环神经网络（RNN），若没有梯度裁剪等机制，梯度很容易累积爆炸，使得损失值趋向无穷。
如果你的网络中BatchNorm层很多，而且充当比较重要的角色，那么可以适当地检查一下Tensor在输入BatchNorm层后有没有可能变为nan，如果恰好发生这种情况，BatchNorm层中的移动均值(running_mean)和移动方差(running_var)也很有可能都是nan，而且这种情况很有可能发生在预测阶段。注：BatchNorm不能输入单个图像，也就是batch里只有一个样本。
当然上述现象出现的原因大部分在当我们使用model.eval()(Pytorch)之后发生。如果你在预测阶段也将模型model设置为model.train(True)，那么问题可能就不会出现。
解决办法：简化模型结构，合理添加批归一化层（Batch Normalization）、层归一化层（Layer Normalization ）来稳定梯度；还可以设置梯度裁剪，限制梯度的最大范数，避免梯度爆炸，在优化器更新参数前，使用torch.nn.utils.clip_grad_norm_函数。

二、调试步骤

检查数据：
- 打印训练数据的最大值、最小值、均值等。
- 可视化数据分布（例如使用直方图）。
观察损失变化：
- 打印每轮或每批次的损失值，观察损失在出错前是否剧烈波动。

梯度检查：

检查梯度是否出现异常（如过大或为 NaN）：

for name, param in model.named_parameters():
    if param.grad is not None:
        print(name, param.grad.abs().max())

单步运行：
- 在训练过程中暂停并打印中间变量，确认数据流在何处出现问题。
降低复杂度：
- 简化模型或使用更小的数据集，逐步定位问题。

三、常见预防措施

使用混合精度训练

可以避免数值溢出问题，尤其是在 GPU 上训练大模型时：

from torch.cuda.amp import GradScaler, autocast
scaler = GradScaler()
for data, target in train_loader:
    with autocast():
        output = model(data)
        loss = criterion(output, target)

    scaler.scale(loss).backward()
    scaler.step(optimizer)
    scaler.update()

使用正则化
- 添加 L2 正则化或 Dropout 来稳定模型训练。

动态调整学习率

使用学习率调度器，例如 ReduceLROnPlateau：

scheduler = torch.optim.lr_scheduler.ReduceLROnPlateau(optimizer, 'min')
scheduler.step(val_loss)

参考文章：
Pytorch训练模型损失Loss为Nan或者无穷大（INF）原因
神经网络训练时损失(loss)不下降常见解决办法以及训练时损失出现nan可能原因以及解决

你可能感兴趣的:(学习笔记,机器学习,深度学习,pytorch,深度学习,人工智能,机器学习)

eNSP中AR2220、AR201、AR1220、AR2240、AR3260、Router、NE40E、NE5000E、NE9000、CX路由器学习笔记 learning-striving eNSP 笔记 eNSP 路由器路由器接口 VRP
eNSP中常见华为路由器型号的接口特性详解及横向对比，重点关注接口类型、扩展能力和适用场景：缩写解释：LPU：LineProcessingUnit（线路处理单元）SPU：ServiceProcessingUnit（业务处理单元）PoE：PoweroverEthernet（以太网供电）GE：GigabitEthernet（千兆以太网）FE：FastEthernet（快速以太网）SFP：SmallFo
【数学建模】基于matlab模拟无人车泊车问题仿真 matlab科研助手数学建模 matlab 开发语言
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，代码获取、论文复现及科研仿真合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机无人机物理应用机器学习内容介绍无人驾驶汽车技术近年来取得了飞速发展，其中自动泊车功能是关键技术之一。本文将重点讨论无
AI大语言模型概述：从GPT到BERT的技术演进 AI智能涌现深度研究 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能计算大数据人工智能语言模型 AI 大模型 LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1什么是大语言模型大语言模型是一种基于深度学习的自然语言处理技术，它可以理解和生成人类语言。这些模型通过学习大量的文本数据，捕捉到语言的语法、语义和情感等信息，从而实现对自然语言的理解和生成。1.2为什么大语言模型如此重要大语言模型在近年来取得了显著的进展，它们在各种自然语言处理任务中都取得了最先进的性能。这些任务包括机器翻译、情感分析、文本摘要、问答系统等。大语言模型的成功在很大
Meta Platforms （原Facebook）计划推出新的大型语言模型以应用于人工智能 PM简读馆技术杂谈人工智能 facebook 语言模型
一、引言在当今科技飞速发展的时代，人工智能领域成为众多科技巨头激烈角逐的关键战场。MetaPlatforms作为全球社交媒体和科技行业的领军者，一直积极投身于新技术的探索与创新。近期，有消息传出MetaPlatforms计划推出新的大型语言模型以应用于人工智能领域，这一举措无疑将对行业格局产生深远影响。本报告将对MetaPlatforms在人工智能领域的发展历程、此次计划推出新模型的背景、可能带来
使用pytorch和opencv根据颜色相似性提取图像深蓝海拓机器视觉和人工智能学习 opencv学习笔记 pytorch opencv 人工智能
需求：将下图中的花朵提取出来。代码：importcv2importtorchimportnumpyasnpimporttimedefget_similar_colors(image,color_list,threshold):#将图像和颜色列表转换为torch张量device=torch.device('cuda'iftorch.cuda.is_available()else'cpu')image
完整指南：从基础到高级使用 Semantic Kernel 江沉晚呤时 Net core AI c#.netcore
SemanticKernel是微软推出的一款强大的开发框架，旨在帮助开发者通过语义理解和自然语言处理（NLP）构建智能应用。它为开发者提供了与OpenAI、AzureCognitiveServices等人工智能服务集成的简便接口，使得构建自然语言处理（NLP）应用变得更加直观和高效。在本文中，我们将从基础到高级全面讲解如何使用SemanticKernel，并提供详细的代码示例，帮助你快速掌握这个框
将excel文件各列保存为txt的实战代码爱编程的喵喵 Python基础课程 python excel txt 实战代码
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了将excel文件各列保存为txt的实
神经进化算法(Neuroevolution) 原理与代码实例讲解 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
神经进化算法,Neuroevolution,进化算法,深度学习,机器学习,遗传算法,神经网络,代码实例1.背景介绍在机器学习领域，神经网络凭借其强大的学习能力和泛化能力，在图像识别、自然语言处理、语音识别等领域取得了显著的成就。然而，传统的神经网络训练方法通常依赖于人工设计的网络结构和参数初始化，这往往需要大量的经验和试错，并且难以找到最优的网络结构和参数。神经进化算法(Neuroevolutio
神经架构搜索原理与代码实例讲解 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
神经架构搜索：原理与代码实例讲解作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习的快速发展，神经网络在各个领域取得了显著的成果。然而，设计一个高效、通用的神经网络架构仍然是一个具有挑战性的问题。手动设计网络架构需要大量的专业知识和经验，而且往往效率低下。因此，神经架构搜索（NeuralArchitectureS
智能守护者X100 - 自动化生产线智能机器人安全监控管理系统大霸王龙行业+领域+业务场景=定制 python microsoft ascii 文本处理
1.产品介绍产品名称：智能守护者X100-自动化生产线智能机器人安全监控管理系统主要功能：全方位实时监控：智能守护者X100采用高清摄像头与红外夜视技术，实现对自动化生产线及智能机器人的360°无死角监控。系统能自动识别并追踪生产线上的机器人活动轨迹，确保生产安全无遗漏。智能异常检测与预警：集成先进的人工智能算法，能够实时分析视频数据，自动识别机器人操作异常（如碰撞、卡顿、偏离预定路径等），并立即
【实战篇】DeepSeek + Cline 编程实战：从入门到“上头” 再见孙悟空_ 【2025 AI学习从零单排系列】【2025AI工具合集】DeepSeek+cline DeepSeek deepseek cline deepseek编程 AI编程
嘿，小伙伴们！今天咱们来好好唠唠这个超火的组合——DeepSeek+Cline，看看它们在编程实战里到底能发挥多大的威力。要是你还在为写代码时的各种问题烦恼，那这篇文章绝对能帮到你！一、初识DeepSeek和ClineDeepSeek是啥？DeepSeek是杭州深度求索公司开发的一系列人工智能模型，特别擅长知识类任务。它能干的事儿可多了，像自然语言处理、代码生成、数据分析这些都不在话下。而且，De
强者联盟——Python语言结合Spark框架博文视点全栈工程师全栈全栈数据 Spark Python PySpark
引言：Spark由AMPLab实验室开发，其本质是基于内存的快速迭代框架，“迭代”是机器学习最大的特点，因此非常适合做机器学习。得益于在数据科学中强大的表现，Python语言的粉丝遍布天下，如今又遇上强大的分布式内存计算框架Spark，两个领域的强者走到一起，自然能碰出更加强大的火花（Spark可以翻译为火花），因此本文主要讲述了PySpark。本文选自《全栈数据之门》。全栈框架Spark由AMP
单调队列学习笔记：滑动窗口最大值，绝对差不超过限制的最长连续子数组 Gravity! leetcode 学习笔记单调队列 leetcode 力扣算法
学习路线参考：单调队列滑动窗口最大值【基础算法精讲27】_哔哩哔哩_bilibilips：笔记和代码按本人理解整理，重思路【如果笔记对你有帮助，欢迎关注&点赞&收藏，收到正反馈会加快更新！谢谢支持！】上期笔记：单调栈学习笔记（一）：每日温度，接雨水-CSDN博客题目1：滑动窗口最大值239.滑动窗口最大值-力扣（LeetCode）“单调队列+滑动窗口”常同时出现，因为滑动窗口遵循“先来先走”，单调
基础篇（二）从监督学习到强化学习：机器学习的不同范式带上一无所知的我智能体的自我修炼：强化学习指南机器学习人工智能基础篇
从监督学习到强化学习：机器学习的不同范式在机器学习的广阔领域中，监督学习和强化学习是两种最重要的范式。它们各自有其独特的特点和应用场景，但也存在紧密的联系。本文将从监督学习出发，逐步延伸到强化学习，帮助你理解这两种范式的区别与联系，以及它们在实际中的应用。1.监督学习：从标注数据中学习1.1什么是监督学习？监督学习是机器学习中最常见的范式之一。它通过从标注数据中学习，建立输入（特征）与输出（标签）
智能教育：DeepSeek在个性化学习中的创新应用 Evaporator Core #DeepSeek快速入门系统架构设计师 DeepSeek进阶开发与应用聚类数据挖掘机器学习
教育是塑造未来的基石，而个性化学习则是现代教育的重要趋势。随着人工智能技术的飞速发展，教育领域正迎来一场深刻的变革。DeepSeek作为人工智能领域的领军者，正在通过其强大的技术能力，推动个性化学习的创新应用。一、个性化学习路径：从数据到洞察个性化学习的核心在于根据学生的学习数据，生成定制化的学习路径。DeepSeek通过深度学习算法，能够从海量的学习数据中提取关键信息，生成更加精准的学习建议。f
【DeepSeek R1构建本地RAG知识库】应用框架选型对比（MaxKB、Dify、FastGPT、RagFlow、Anything-LLM） Xd聊架构从0到1落地AI人工智能 rag ai 知识库
文章目录前言一、MaxKB1.简介2.技术概览二、Dify1.简介2.技术概览三、FastGPT1.简介四、RagFlow1.简介2.技术概览五、Anything-LLM1.简介2.技术概览六、更多资料1.LLM框架推荐2.RAG生产落地实践架构七、总结1.综合对比2.优缺点对比3.按需选择4.社区与支持5.部署与使用便捷性结尾前言在人工智能技术加速渗透各行各业的今天，检索增强生成（Retriev
Linux环境下进行本地Blast比对——操作流程生信分析笔记后端
今天分享一篇学习笔记，主要包含blast序列比对和数据提取方法。首先，需要准备RNA数据和蛋白质数据，本次利用蛋白质数据建立索引库，然后将RNA比对到蛋白质序列。RNA数据创建一个目录，导入mRNA序列数据，通常是一个fasta后缀文件。在工作目录下创建alignment文件夹将mRNA序列数据文件wheat-test.fasta拷贝到/alignment中蛋白质数据新建一个文件夹存放蛋白质序列数
DeepSeek + IDEA 辅助编程王炸组合猫猫姐大模型 java 大模型
DeepSeek+IDEA辅助编程王炸组合2025年的春节可以说是人工智能在中国史上飘红的一段历史时刻，年后上班的第一天，便马不停蹄的尝试新技能。今天的科技在飞速发展，编程领域的人工智能工具犹如雨后春笋般涌现。其中，DeepSeek则以其卓越的性能和智能化的功能，迅速在众多开发者中赢得了青睐。对于Java开发者而言，将DeepSeek集成到IDEA中，就如同为自己的编程之路配备了一位智能助手，大幅
Lucene硬核解析专题系列（三）：查询解析与执行 yinlongfei_love lucene mybatis 全文检索
Lucene的索引构建为高效搜索奠定了基础，而查询解析与执行则是将用户意图转化为实际结果的关键环节。本篇将从查询的解析开始，逐步深入到查询类型、评分模型和执行流程，揭示Lucene搜索能力的底层原理。一、查询语法与QueryParser的工作原理Lucene的查询过程始于用户输入的搜索字符串，例如“人工智能AND机器学习”。这一字符串需要被解析为Lucene能够理解的结构化对象。QueryPars
虚拟现实与增强现实：DeepSeek在沉浸式体验中的创新应用 Evaporator Core #DeepSeek快速入门人工智能 #深度学习 AI写作
在科技飞速发展的今天，虚拟现实（VR）和增强现实（AR）技术正在深刻改变我们的生活方式和交互体验。某知名科技评论家张华曾指出："VR和AR的潜力远未被完全挖掘，尤其是在与人工智能结合后，它们将带来前所未有的沉浸式体验。"DeepSeek作为人工智能领域的先锋，正在通过其强大的技术能力，推动VR和AR技术在沉浸式体验中的创新应用。一、VR与AR的技术融合VR和AR的核心在于为用户提供沉浸式的交互体验
微软官宣！Skype将在2025年5月5日正式退役，全面押注Teams 新加坡内哥谈技术人工智能自然语言处理语言模型深度学习学习 microsoft
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/23年传奇落幕，Skype正式告别历史舞台！微软宣布，这款曾经引领互联网通话革命的应用将
NLP自然语言处理——文本处理的基本方法小村学长毕业设计自然语言处理人工智能
NLP（自然语言处理）是人工智能领域的一个重要分支，它专注于使计算机能够理解和生成人类语言。文本处理是NLP中的基础且核心的部分，涉及多个步骤和技术，以确保原始文本数据能够被有效地转换、分析和利用。以下是对文本处理基本方法的详细探讨，包括文本预处理、文本表示、以及常见的NLP任务等。一、文本预处理文本预处理是NLP中的第一步，也是至关重要的一步。它主要包括以下几个子步骤：文本清洗：去除特殊字符：移
【WOA-CNN-LSTM】基于鲸鱼算法优化深度学习预测模型的超参数研究（Matlab代码实现）然哥爱编程深度学习 cnn lstm
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述2运行结果3参考文献4Matlab代码实现1概述摘要：深度学习模型的超参数选择对模型的性能和泛化能力具有重要影响。本文提出了一种基于鲸鱼算法（WOA）优化长短期记忆神经网络（LSTM）模型的超参数选择方法。首先，我们介绍了LSTM模型的结构和训练过程。然后，我们
AI视觉觉醒：深度学习如何革新视频标注，释放数据潜力基于深度学习的视频自动标注系统海棠AI实验室 AI理论探索与学术前沿人工智能深度学习音视频
目录引言：被忽视的视频数据金矿传统视频标注的困境：效率、成本与瓶颈深度学习：视频自动标注的破局之道深度学习视频自动标注系统架构系统架构图核心技术解析目标检测（ObjectDetection）行为识别（ActionRecognition）视频分割（VideoSegmentation）代码实践：基于YOLOv5的目标检测视频标注示例挑战与未来展望结语：AI赋能，释放视频数据的无限可能引言：被忽视的视频
自然语言处理：文本表示梦丶晓羽 python Glove Word2Vec TF-IDF 自然语言处理人工智能
介绍大家好，博主又来给大家分享知识了。今天给大家分享的内容是自然语言处理中的文本表示。在当今数字化信息爆炸的时代，自然语言处理作为人工智能领域的重要分支，发挥着越来越关键的作用。而文本表示，则是自然语言处理的基石之一，它就像是一把神奇的钥匙，能够将人类丰富多样、充满语义的自然语言，转化为计算机可以理解和处理的形式。话不多说，我们直接进入正题。文本表示概念阐述在自然语言处理(NLP)中，文本表示是将
Redis学习笔记 ——（3）哈希结构的用法、内部编码、使用场景码农小高 Redis redis 哈希算法学习
Redis学习笔记——（3）哈希结构的用法、内部编码、使用场景几乎所有的编程语言都提供了哈希（hash）类型，他们的叫法可能是哈希、字典、关联数组等。在Redis中，哈希类型是指键值本身又是一个键值对结构，例如value={{filed,value},…{filedn,valuen}}.1.哈希的用法HDELkeyfield1[field2]删除一个或多个哈希表字段HEXISTSkeyfield查
python读取redis大数据_大数据系列——Redis学习笔记 weixin_39661345
1.Redis的简介Redis是一个开源(BSD许可)，内存存储的数据结构服务器,可用作数据库，高速缓存和消息队列代理它支持字符串、哈希表、列表、集合、有序集合，位图，hyperloglogs等数据类型内置复制、Lua脚本、LRU收回、事务以及不同级别磁盘持久化功能，同时通过RedisSentinel提供高可用，通过RedisCluster提供自动分区。简言之，Redis是一种面向“键/值”对数据
活在AI原生时代的05后，开始用AI创业 shelly聊AI AI行业趋势 AI-native 人工智能 deepseek
大家好，我是Shelly，一个专注于输出AI工具和科技前沿内容的AI应用教练，体验过300+款以上的AI应用工具。关注科技及大模型领域对社会的影响10年+。关注我一起驾驭AI工具，拥抱AI时代的到来。人工智能&AIGC术语100条Shelly聊AI-重磅发布Shelly聊AI：年度展望：2025年AI与社会发展关键事件的深度思考（每年一篇，十年为期）凌晨1点，14岁的王泽恺在电脑前伸了个懒腰。屏幕
GPT-5倒计时：2025年AI海啸来袭，机器与人类对话临近 shelly聊AI AI核心技术 AI行业趋势 gpt 人工智能 openai
大家好，我是Shelly，一个专注于输出AI工具和科技前沿内容的AI应用教练，体验过300+款以上的AI应用工具。关注科技及大模型领域对社会的影响10年+。关注我一起驾驭AI工具，拥抱AI时代的到来。人工智能&AIGC术语100条Shelly聊AI-重磅发布Shelly聊AI：年度展望：2025年AI与社会发展关键事件的深度思考（每年一篇，十年为期）从实验室到现实，AI的进化速度正在挑战人类想象的
DeepSeek与数据分析：现状、挑战与未来展望 CodeJourney. 数据库人工智能算法
在当今数字化时代，人工智能（AI）的浪潮正以前所未有的速度席卷各个领域，数据分析作为众多行业决策的关键支撑，也不可避免地受到AI技术发展的深刻影响。近期，AI话题持续火热，不少企业老板要求员工学习AI并将其应用纳入考核。在此背景下，本文作者“紫苜”（原“蒋公子”）对频繁登上热搜的DeepSeek展开了探索，深入研究它在数据分析领域的能力、应用方式以及与其他工具的比较。DeepSeek在数据分析方面
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他