致Great

【LLM系列之BLOOM】BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

论文题目：《BLOOM: A 176B-Parameter Open-Access Multilingual Language Model》
论文链接：https://arxiv.org/abs/2211.05100
github链接：https://github.com/huggingface/transformers-bloom-inference/tree/main
huggingface链接：https://huggingface.co/bigscience/bloom

1 模型简介

预训练语言模型已经成为了现代自然语言处理pipeline中的基石，因为其在少量的标注数据上产生更好的结果。随着ELMo、ULMFiT、GPT和BERT的开发，使用预训练模型在下游任务上微调的范式被广泛使用。随后发现预训练语言模型在没有任何额外训练的情况下任务能执行有用的任务，进一步证明了其实用性。此外，根据经验观察，语言模型的性能随着模型的增大而增加(有时是可预测的，有时是突然的)，这也导致了模型规模越来越多的趋势。抛开环境的问题，训练大语言模型(LLM)的代价仅有资源丰富的组织可以负担的起。此外，直至最终，大多数LLM都没有公开发布。因此，大多数的研究社区都被排除在LLM的开发之外。这在不公开发布导致的具体后果：例如，大多数LLM主要是在英文文本上训练的。

为了解决这些问题，我们提出了BigScience Large Open-science Open-access Multilingual Language Model(BLOOM)。BLOOM是在46种自然语言和13种编程语言上训练的1760亿参数语言模型，其是由数百名研究人员合作开发和发布的。训练BLOOM的计算力是由来自于法国公共拨款的GENCI和IDRIS，利用了IDRIS的Jean Zay超级计算机。为了构建BLOOM，对于每个组件进行了详细的设计，包括训练数据、模型架构和训练目标、以及分布式学习的工程策略。我们也执行了模型容量的分析。我们的总体目标不仅是公开发布一个能够和近期开发的系统相媲美的大规模多语言的语言模型，而且还记录其开发中的协调过程。

2 BLOOM训练与数据集

2.1. BigScience

BLOOM 的开发由 BigScience 完成，BigScience 是一个开放的研究合作组织，其目标是公开发布 LLM。
超过 1200 人注册成为 BigScience 的参与者

2.2 训练语料

上述 ROOTS 语料库的动机是建立一个世界上尽可能多的人可以访问的语言模型，并且规模与之前的努力相当。
左图：所有 46 种自然语言的语系树状图，其中表面积与字节数成正比。 Indo-European and Sino-Tibetan 以 1321.89 GB 的总容量占据巨大部分。细橙色表面代表 18GB 的印度尼西亚语数据，绿色矩形 0.4GB 构成尼日尔-刚果语系子集。
右图：13 种编程语言按文件数量分布的华夫饼图，其中一个方块代表大约 30,000 个文件。

2.3 xP3: Prompted Dataset

多任务提示微调（也称为指令调优）涉及在由通过自然语言提示指定的大量不同任务组成的训练混合体上微调预训练语言模型。
原始 P3 数据集被扩展为包括英语以外的语言的新数据集和新任务，例如翻译。这导致了 xP3，它是 83 个数据集的提示集合，涵盖 46 种语言和 16 个任务。

在预训练 BLOOM 之后，应用大规模多任务微调方法使 BLOOM 具备多语言零样本任务泛化能力，其结果模型为 BLOOMZ。

3 BLOOM 模型结构与训练

3.1 模型结构

使用因果解码器的 Transformer 模型有两个架构偏差。
使用 ALiBi 位置嵌入，它根据键和查询的距离直接衰减注意力分数。与原始的 Transformer 和 Rotary 嵌入相比，它可以带来更流畅的训练和更好的下游性能。ALiBi不会在词嵌入中添加位置嵌入；相反，它会使用与其距离成比例的惩罚来偏向查询键的注意力评分。

如图所示，只是给 attention score 加上一个预设好的偏置矩阵，相当于 q 和 k 相对位置差 1 就加上一个 -1 的偏置。其实相当于假设两个 token 距离越远那么相互贡献也就越低。
当然也不是就直接用这个矩阵一加就行，还是有借鉴 T5 Bias 里，加入了多组 bias. 主要的偏置矩阵都是相同的，不同的只是旁边的 m 系数，可以给 m 当成是一个斜率(Slope)。
论文中 m 系数也是预设好的，作者会根据 head 数来设置一组 m 系数，具体按照头的数量 n 从到的指数差值来进行设置，比如说 8 个头，那么就设置为 M 也可以训练获得，但作者们发现，训练获得的并没有带了的更好的性质。论文：https://arxiv.org/pdf/2108.12409.pdf
Embedding Layer Norm 在第一个嵌入层之后立即使用，以避免训练不稳定。
使用了 25 万个标记的词汇表。使用字节级 BPE。这样，标记化永远不会产生未知标记

3.2 工程实现

BLOOM 使用 Megatron-DeepSpeed进行训练，它由两部分组成：Megatron-LM提供Transformer实现、张量并行性和数据加载原语，而DeepSpeed提供ZeRO优化器、模型流水线和通用分布式训练组件。
数据并行性 (DP) 多次复制模型，每个副本放置在不同的设备上并提供数据的一部分。处理是并行完成的，所有模型副本在每个训练步骤结束时同步。
张量并行性 (TP) 跨多个设备划分模型的各个层。这样，不是将整个激活或梯度张量驻留在单个 GPU 上，而是将该张量的碎片放置在单独的 GPU 上。
流水线并行性 (PP) 将模型的层拆分到多个 GPU 上，因此只有一小部分模型层被放置在每个 GPU 上。
使用bfloat16 混合精度。使用融合的 CUDA 内核。

3.3 模型变体

六个参数量的模型变体
BLOOM 的能源消耗略高于 OPT，但BLOOM 的排放量大约减少 2/3（25 吨对 70 吨）。这要归功于用于训练 BLOOM
的能源网的低碳强度，其排放量为 57 gCO2eq/kWh。

BLOOM 和 OPT 产生的碳排放量都比GPT-3少得多，这可以归因于几个因素，包括更高效的硬件以及更少的碳密集型能源。

3.4 提示学习

提示是在 BLOOM 发布之前开发的，并且没有经过任何先验的改进，举例说明了机器翻译 (MT) 的一些提示示例。

4 实验结果

4.1 零样本能力

跨提示的平均表现总是徘徊在机会附近。例外的是T0 模型，它显示出强大的性能。但是，该模型在多任务设置中进行了微调，无法直接进行比较。

在零样本设置中，MT结果通常很差。观察到的两个主要问题是 (i)过度生成和 (ii)没有产生正确的语言。

4.2 1-shot效果

SuperGLUE的一次性性能可变性在所有提示和模型中都减少了。
总的来说，oneshot 设置没有显着改善：模型的平均准确度仍然几乎总是偶然的。

OPT 和 BLOOM模型系列都随着规模的扩大而略有改善，并且在所有任务中系列之间没有一致的差异。BLOOM-176B 在 Ax-b、CB 和 WiC 上领先于 OPT-175B。

许多低资源语言的翻译质量与受监督的 M2M 模型相当，甚至略好。

4.3 文本摘要

BLOOM在多语言摘要上比 OPT获得了更高的性能，并且性能随着模型参数数量的增加而增加。

4.4 多任务微调

多语言多任务微调，即BLOOMZ，用于提高BLOOM模型的零样本性能。

4.5 代码生成

预训练的 BLOOM 模型的性能类似于在 Pile 上训练的类似大小的 GPT 模型。
然而，仅在代码上进行微调的Codex模型比其他模型强得多。

5 总结

BLOOM主要提升LLM的多语言能力
优化方式采用的AIBI、层归一化，其他模型差不多

你可能感兴趣的:(大模型,NLP,语言模型,人工智能,深度学习)

基于MATLAB_Simulink风光储与电解制氢系统仿真模型（光伏耦合PEM制氢）功率制氢附参考文献 qq924711725 MATLAB matlab 开发语言
基于MATLAB/Simulink风光储与电解制氢系统仿真模型（光伏耦合PEM制氢）功率制氢附参考文献光储电解制氢模型，光伏制氢，电解槽恒功率制氢，光伏耦合PEM制氢，母线电压维持800V。光伏采用mppt最大功率跟踪；储能采用电压电流双闭环控制；电解槽采用功率外环加电流内环控制，恒功率制氢。光伏出力不足时，蓄电池出力，光伏出力充足时，蓄电池充电，波形稳定，运行完美。附相关参考文献。谢谢理解！好的
企业AI数据安全白皮书：深寻模型会话保护与安当TDE实战安当加密人工智能
一、引言人工智能正在重塑企业的业务流程与创新模式，从智能客服到辅助决策，从图像识别到自然语言处理，AI模型正逐步渗透到企业运营的各个环节。然而，随着AI技术的深入应用，数据安全问题也如影随形。对于部署在企业内网的DeepSeek模型而言，员工与模型的会话内容往往包含企业的核心商业信息、敏感技术参数以及员工个人隐私等关键数据。一旦这些数据遭到泄露、篡改或恶意利用，不仅会给企业带来巨大的经济损失，还可
就在刚刚！马斯克决定将“地球上最聪明的人工智能”Grok-3免费了！源代码杀手 AI技术快讯人工智能 python
Grok-3概述与关键功能Grok-3是由xAI开发的先进AI模型，于2025年2月19日发布，旨在提升推理能力、计算能力和适应性，特别适用于数学、科学和编程问题。作为xAI系列模型的最新版本，Grok-3延续了公司对构建强大且安全的AI系统的承诺，并推动人工智能在多个领域的应用。Grok-3的核心优势在于其大规模强化学习（RL）优化，能够在几秒到几分钟内进行深度推理，适应复杂任务的需求。配备的D
Ollama：让大型语言模型触手可及步子哥 AGI通用人工智能语言模型人工智能自然语言处理
Ollama：让大型语言模型触手可及导语：近年来，大型语言模型（LLM）发展迅猛，但对于普通用户而言，搭建和使用LLM仍有一定门槛。Ollama应运而生，它是一个轻量级、可扩展的框架，致力于让每个人都能轻松构建和运行本地LLM。一键安装，轻松上手Ollama提供了简单易用的安装方式，无论你是macOS、Windows还是Linux用户，都能快速开始使用。macOS:下载Windows(预览版):下
DeepSeek这么火，一文教你本地部署DeepSeek! 入职啦 python python deepseek 部署持续部署 AI 人工智能
要说年假最火的是什么，DeepSeek绝对在话题榜上，公众号几乎都是关于他的，今天入职啦也来和大家聊一聊我们AI领域的新星–DeepSeek，顺便也教大家部署一套属于自己的本地搜索服务。为什么DeepSeek这么火？一、技术架构优势DeepSeek采用创新的混合模型架构，将传统机器学习与深度学习有机结合。这种架构既保留了传统方法的可解释性，又具备深度学习的强大表征能力。通过自适应学习机制，Deep
Python开发行业薪资多少？ Java大师兄-威哥 Python 编程 IT技术程序员 IT
大家都知道，人工智能越来越受欢迎了。而Python由于简单易用，是人工智能领域中使用最广泛的编程语言之一，它可以无缝地与数据结构和其他常用的AI算法一起使用。Python开发行业薪资多少？我们看看图片就能知道个大概。无论是国内还是国外对于编程语言的热度调查中，Python都是数得上名的。Python热度的持续升温，自然也引起了开源团队的项目。由于OSI认可的开放源码许可，程序员可以使用Python
#深度优化提示词模板：解锁DeepSeek R1终极潜力的系统方案领码科技 AI应用技能篇低代码提示词优化 DeepSeek R1 AI交互设计智能对话系统
摘要本文提出针对DeepSeekR1大模型的深度提示词优化体系，基于认知心理学原理与机器学习特征构建四维优化框架。通过解析模型工作机制、设计结构化模板、实战案例验证及进阶调优策略，形成覆盖基础到高阶的完整优化方案。研究显示优化后的提示词模板可使任务准确率提升40%，响应相关性提高55%。方案兼具理论深度与实践价值，为开发者提供可落地的优化指南。关键词：提示词优化、DeepSeekR1、AI交互设计
【Java】已解决java.lang.NoClassDefFoundError异常屿小夏 java 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
介绍 TensorFlow 的基本概念和使用场景。大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
TensorFlow是一个由谷歌开发的开源机器学习框架，广泛应用于深度学习领域。它提供了一个灵活的平台，可以用于构建各种机器学习模型，包括神经网络。TensorFlow的基本概念和使用场景如下：张量（Tensor）：TensorFlow中的基本数据结构就是张量，可以简单理解为多维数组。张量可以是标量（0维张量）、向量（1维张量）、矩阵（2维张量）等。在TensorFlow中，所有数据都以张量的形式
腾讯元宝超越DeepSeek？登顶下载榜：AI 的“下一战”拼什么？算家计算话题文章人工智能算家云腾讯元宝 DeepSeek AI竞争
3月3日深夜，腾讯元宝APP在中国区苹果应用商店免费App下载排行榜上，上升至第一，超越DeepSeek。超越DeepSeek登顶榜首，腾讯元宝有什么不同？一方面，腾讯元宝的爆发始于2月13日的重大更新：同时支持混元与DeepSeek模型。前者擅长快速响应（如混元TurboS“秒回”），后者专注深度推理，形成互补。这种“双引擎”模式，既满足用户即时需求，又提供复杂任务的处理能力，成为差异化竞争的核
Python爬取58同城广州房源+可视化分析 R3eE9y2OeFcU40
感谢关注天善智能，走好数据之路↑↑↑欢迎关注天善智能，我们是专注于商业智能BI，人工智能AI，大数据分析与挖掘领域的垂直社区，学习，问答、求职一站式搞定！对商业智能BI、大数据分析挖掘、机器学习，python，R等数据领域感兴趣的同学加微信：tstoutiao，邀请你进入数据爱好者交流群，数据爱好者们都在这儿。消失了一段时间，这段时间在CSDN阅读了不少关于Python爬虫的文章，也学习了秦璐老师
swagger基本使用及常用注解耀辰框架 api swagger2
一、介绍Swagger是一个规范和完整的框架，用于生成、描述、调用和可视化RESTful风格的Web服务。总体目标是使客户端和文件系统作为服务器以同样的速度来更新。文件的方法，参数和模型紧密集成到服务器端的代码，允许API来始终保持同步。作用：1.接口的文档在线自动生成。2.功能测试。每当我在学习一门知识的都会习惯性的去看他的介绍，了解出现的起源、使用的目的。或许有人就会问了，知道是什么但是还是不
3.6手写数字识别项目不要不开心了 pytorch 神经网络人工智能机器学习深度学习
今天的内容为手写数字识别项目1.数据准备：-使用`torchvision.datasets`加载MNIST数据集。-通过`transforms.Compose`对数据进行预处理，包括转换为张量和归一化。-使用`DataLoader`创建训练和测试数据集的生成器。2.可视化源数据：-使用`matplotlib`库可视化测试集中的部分图像，并显示其对应的真实标签。3.构建模型：-定义一个包含两个隐藏层
深度学习中N维数组的介绍帅维维深度学习深度学习人工智能
N维数组是机器学习和神经网络的主要数据结构。下面是N维数组的实例：0维数组（标量）：通常表示一个类别。1维数组（向量）：通常表示一个特征向量。二维数组（矩阵）：通常表示一个样本--特征矩阵。三维矩阵：通常表示RGB图片（宽*高*通道）。四维矩阵：通常表示一个RGB图片批量（批量大小*宽*高*通道）。五维矩阵：通常表示一个视频批量（批量大小*时间*宽*高*通道）。
想知道的都有！大模型的定义、基本架构、训练、经典代表、应用和挑战全解析和老莫一起学AI 语言模型人工智能自然语言处理学习大模型 ai 转行
导读都2024年了，学习AI相关的人或多或少的听说过“大模型”。目前，大模型技术以其庞大的参数规模和卓越的性能，成为了推动行业进步的新引擎。本文将带您深入探索大模型的神秘世界，从其定义、基本原理、训练三步骤，到Prompt技术的巧妙应用，以及大模型在各行业的广泛应用和面临的挑战。无论您是AI领域的专业人士，还是对技术充满好奇的普通读者，本文都将为您提供一个全面、深入的大模型知识图谱。1、大模型的定
5人3小时复刻Manus？开源OpenManus项目全解剖，我的DeepSeek股票报告这样诞生大F的智能小课 DeepSeek技术解析和实战大模型理论和实战数据库人工智能 python
大家好，我是大F，深耕AI算法十余年，互联网大厂技术岗。分享AI算法干货、技术心得。更多文章可关注《大模型理论和实战》、《DeepSeek技术解析和实战》，一起探索技术的无限可能！OpenManus是什么1.项目背景OpenManus是由MetaGPT核心团队仅用3小时复刻而成的开源项目，其在GitHub上线首日便获得了10k+的星标（不过下午查看时仅4k）。该项目的核心价值主要体现在以下三个方面
Win7安装新版本anaconda出现Failed to extract packages解决方案爱编程的喵喵 Python基础课程 python anaconda win7 failed to extra
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了Win7安装新版本anaconda出
大数据计算框架深入：Spark SQL、DataFrame、RDD 性能优化晴天彩虹雨大数据 spark big data
1.引言ApacheSpark是当前最流行的大数据计算框架之一，其中SparkSQL、DataFrame和RDD（ResilientDistributedDataset）是数据处理的三大核心API。如何优化Spark作业的性能，是大数据开发者必须掌握的关键技能。本文将深入探讨SparkSQL、DataFrame和RDD的性能优化方法，并结合实际案例进行分析。2.SparkSQL性能优化(1)使用P
闰年判断的三种实现方法代码的建筑师 python python 前端开发语言
#闰年判断#方法一：①能直接被4整除且不能被100整除的是闰年，eg:1900不是闰年；②能直接被400整除的是闰年，eg:2000是闰年#以下代码由于能被400整除的年份一定可以被4整除，所有直接放在一个大的判断条件下（year%4是否与0相等）year=int(input("请输入一个年份:"))if(year%4)==0:if(year%100)!=0:print("%s年是闰年"%year
Web3中的AI：一种去中心化智能的完整指南 lisw05 人工智能 web3 web3 人工智能去中心化
李升伟引言Web3与人工智能（AI）的结合正在重塑数字世界的底层逻辑。Web3以去中心化、用户数据主权和区块链技术为核心，而AI凭借数据驱动的智能化能力，为去中心化网络注入决策效率和创新活力。二者的融合不仅推动技术范式的革新，更催生了从金融到社会治理的全新应用场景。本文将从技术架构、核心应用、挑战与未来趋势等维度，系统解析Web3中AI的完整图景。一、技术基础：AI与Web3的融合架构1.去中心化
初识C++——C++与C语言的不同小白学编程 C++c++c语言开发语言
1.编程思想不同C语言的编程思想：面向过程。分析项目的实现步骤，使用函数实现一个个步骤，然后逐个调用这些函数完成项目。C++语言的编程思想：面向对象。对象=方法+数据三大特性：封装、继承、多态。2.全局变量类型增强例如：intnum;在c语言中会看成声明，编译通过；在c++中会看成定义，编译报错。3.c++中所有变量和函数都必须有类型例如：voidfunc(i)其中i没有类型名，c语言支持，但是c
【蓝桥杯学习笔记】12.数据结构——单调栈 Master_L u 蓝桥杯 python 蓝桥杯
系列文章目录【蓝桥杯学习笔记】1.入门基本语法及练习题【蓝桥杯学习笔记】2.常用模型----最大公约数和最小公倍数【蓝桥杯学习笔记】3.质数判断【蓝桥杯学习笔记】5.矩阵乘法【蓝桥杯学习笔记】6.一图看懂差分数组+《小明的彩灯》【蓝桥杯学习笔记】7.哈曼夫树【蓝桥杯学习笔记】8.itertools-为高效循环而创建迭代器的函数【蓝桥杯学习笔记】9.解立方根——二分法+牛顿迭代法【蓝桥杯学习笔记】1
机器学习在地图制图学中的应用地图模型炼丹师机器学习人工智能
原文链接：https://www.tandfonline.com/doi/full/10.1080/15230406.2023.2295948#abstractCSDN/2025/Machinelearningincartography.pdfatmain·keykeywu2048/CSDN·GitHub核心内容本文是《制图学与地理信息科学》特刊的扩展评论，系统探讨了机器学习（尤其是深度学习）在制
机器学习大纲总结 excellent121 机器学习人工智能
一、概念1.人工智能人工智能包含机器学习，机器学习包含深度学习2.机器学习机器学习是实现人工智能的一种途径机器学习=传统机器学习+深度学习3.深度学习深度学习是由机器学习的一种方法发展而来4.发展三要素数据、算法、算力5.发展史5.1符号主义（20世纪50-70）：专家系统占主导1950年：图灵设计国际象棋程序1962年：IBMArthurSamuel的跳棋程序战胜人类高手（人工智能第一次浪潮）5
TikTok账号矩阵如何做？要用海外住宅代理吗？ Snow跨境日记跨境电商代理IP ip 网络安全网络
TikTok的账号矩阵，可能听起来还比较陌生，但随着TikTok业务已经成为吃手可热的跨境业务，TikTok多账号矩阵已成为流行策略。但它有什么优点呢？操作多个帐户会导致被禁止吗？如何有效地建立账户矩阵开展业务？这篇文章揭晓一切！一、TikTok账户矩阵有什么优势？简而言之，TikTok账户矩阵涉及同时运营多个TikTok账户，这有两个主要优点：1.降低初始阶段的风险由于影响账户流量的因素很多，大
机器学习入门知识十五境剑修机器学习人工智能
目录前言一、机器学习是什么？二、机器学习的基本类型1.监督学习2.无监督学习3.半监督学习4.强化学习三、机器学习的工作流程四、常见的机器学习算法五、机器学习的评价指标六、机器学习中的过拟合与欠拟合七、机器学习的应用八、学习机器学习的资源前言随着人工智能的发展，作为人工智能中的一个基础且重要的分支——机器学习也是愈发吸引大家来了解以及学习，那么在学习机器学习前，我们需要先来了解一下什么是机器学习，
部署Nagios Core服務器安裝好了部署了aapenal 作為網頁服務器設定了防火墻可視化的軟件來每日監測服務器的狀況. 蠟筆小新工程師 intellij-idea
Nagios-一款成熟的網絡監控工具，可以監控服務器的運行狀況和性能。Zabbix-一個開源的監控解決方案，提供實時監控和告警功能。Datadog-一個強大的監控和分析平台，適用於現代IT環境。Cacti-一個基於LAMP的應用，可以繪製各類數據的圖形。Icinga-一個從Nagios分支出來的監控工具，提供分佈式監控和多線程框架。NeDi-一個LAMP下載NagiosCore：你可以從Nagio
一文读懂：京东、淘宝、拼多多 API 接口，功能大不同，场景各有招数据捕手19970108018 爬虫技能晋升路线大数据 php 交互
在电商行业蓬勃发展的今天，京东、淘宝、拼多多作为三大电商巨头，各自拥有庞大的用户群体和丰富的商品资源。为了满足开发者、商家和合作伙伴的多样化需求，这三大平台均提供了丰富的API接口。然而，这些API接口在功能、应用场景等方面却各有千秋。本文将带您深入了解京东、淘宝、拼多多API接口的特点和差异，帮助您更好地选择和使用这些接口。供稿者：Taobaoapi2014一、京东API接口1.功能特点京东AP
人工智能时代程序员何去何从？ Meteorabcd 人工智能
人工智能时代程序员的未来：挑战与机遇并存随着人工智能（AI）技术的飞速发展，程序员这一职业正面临着前所未有的变革。AI不仅改变了编程的方式，也重塑了程序员的工作内容和职业发展路径。那么，在人工智能时代，程序员将何去何从呢？一、AI对程序员的冲击：效率提升与岗位替代AI技术的普及使得编程效率大幅提升。如今，AI辅助编程工具如GitHubCopilot、CursorAI等已经能够自动生成代码片段、优化
【java-数据结构】Java优先级队列揭秘：堆的力量让数据处理飞起来学无止尽5 Java-数据结构 java 数据结构开发语言
我的个人主页我的专栏：人工智能领域、java-数据结构、Javase、C语言，希望能帮助到大家！！！点赞收藏❤引言在开发中，尤其是需要处理大量数据或者进行任务调度的场景下，如何高效地管理数据的顺序和优先级是一个至关重要的问题。Java提供了优先级队列（PriorityQueue），它基于堆（Heap）实现，能够以高效的方式管理数据的优先级。在本文中，我们将深入探讨优先级队列的工作原理，特别是堆的作
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他