罗不丢

Hadoop 3.0.0 （单机版）安装与配置与基础使用

吐槽一下：我相信每年还是会有很多非计算机专业的学生像我一样，选了大数据这个听起来就十分高大上的相关选修课，但是呢，一点电脑基础都没有。以为是个水课，混混就过去了，没想到碰到硬茬了，在学习这门选修课，我是真的要没有一点基础，网上教程又都是上几十个小时的课程，可它只是一门1学分的选修课，我不可能为了它花这么多时间。还好最后老师放水了，不用伪分布式，只要求学生把单机版hadoop随便玩玩就行了，不然我直接就挂科了。

由于我真的不太了解hadoop这个玩意，下面我说的内容（我的结课报告，这里面有很多的内容，特别是理论方面，是复制粘贴的，但由于年代久远，忘了是从哪复制粘贴来的了，基本上只有吐槽是我自己写的，如有侵权，立马删除）可能会有明显的知识错误，望大佬指出。

大数据技术概述

什么是大数据

就是数据很大很大呗！看似是一个外行人肤浅的想法，但老实说这还真的就是大数据的本质。大数据本身就是一个比较抽象的概念，所以网络上对大数据的定义都有部分差异。就以百度百科为例，百度百科对“大数据”的定义为：“大数据”（Big Data），或称巨量资料，指的是无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据的五V特性

大数据的应用

辅助决策
数据驱动服务
实时反馈决策
效率优化，提升效率

这是大数据常见的几个应用方面，但往往大数据的应用涉及的技术层又广又深。无法深入阐释。鉴于我的上一个选修课论文方向是电力系统和智能电网，就以大数据在智能电网中的应用做一个简单的例子。智能电网是以基本的物理电网为基础，通过应用目前的现代信息技术、通信技术以及计算机处理技术等，同时和传感测量技术、控制技术进行结合进而形成的一种高度集成的电网。而各种传感器的数据已经无法是人脑能够实时分析的了，这时大数据技术可以将设备监测数据进行数据储存与分析，之后将有价值的数据人性化展示给相关的监测人员（这段瞎编的）。

分布式文件系统---GFS及Hadoop概述

绝大多数内容参考于该视频（因为我根本就不会找谷歌这篇GFS的论文）：解读Google分布式文件系统GFS（合集）_哔哩哔哩_bilibili

什么是分布式文件系统

在进行这个问题的探讨前，首先得理解啥是文件系统，文件系统是操作系统用于明确存储设备或分区上的文件的方法和数据结构；即在存储设备上组织文件的方法。操作系统中负责管理和存储文件信息的软件机构称为文件管理系统，简称文件系统。文件系统由三部分组成：文件系统的接口，对对象操纵和管理的软件集合，对象及属性。从系统角度来看，文件系统是对文件存储设备的空间进行组织和分配，负责文件存储并对存入的文件进行保护和检索的系统。长话短说就是一个管理文件的软件，只不过这个软件的权限特别高，能进行许多高权限级别操作。Windows文件系统有FATFS、VFATFS、NTFS等。除了Windows外，Linux也有ext、vfs等等文件系统，像这种一台计算机，单个存储节点、一个操作系统，一个具体的文件系统的场景称之为一般文件系统。

而分布式文件系统又与一般文件系统有什么不同呢？一般文件系统的访问方式是系统总线IO，这一特点也造成了一般文件系统只能进行小量数据的存储，我不怎么了解电脑行情，但我在购买笔记本电脑时发现，大部分笔记本存储容量多在256G-2TB之间，即使是再接个机械硬盘也只能是TB级的储存容量，而大数据上个PB级别不是啥罕见的事。

因此在大数据领域，分布式文件系统的意义也就显现出来。分布式系统通过采用网络IO的访问方式，利用多台存储服务器分担存储负荷，利用位置服务器定位存储信息，它不但提高了系统的可靠性、可用性和存取效率，还易于扩展。常见的分布式文件系统有，GFS、HDFS、Lustre 、Ceph 、GridFS 、mogileFS、TFS、FastDFS等。各自适用于不同的领域。它们都不是系统级的分布式文件系统，而是应用级的分布式文件存储服务。

什么是GFS（Google File System）

GFS是一个为Google内部设计的大数据分布式存储框架，由2003年Google发表的论文提出，用来满足 Google 不断扩展的数据处理需求。不过Google并没有将其开源， GFS 为大型网络和连接的节点提供了较好的容错性、可靠性、可扩展性、可用性和性能。GFS 由多个由低成本商品硬件组件构建的存储系统组成。它经过优化以适应 Google 的不同数据使用和存储需求，例如其搜索引擎会生成大量必须存储的数据。这个系统最大的亮点有两个，一个是使用集群的概念，将硬件设施连接起来共同进行文件存储任务；另外一个是充分利用了现成服务器的优势，同时最大限度地减少了硬件弱点。

那么谷歌没有开源，为什么还要了解GFS，对于学习分布式文件系统来说，谷歌发表的论文简直就是经典中的经典，现在市面上许多的分布式文件系统就是基于GFS设计理念的类GFS文件系统。包括后面谷歌基于GFS方向的技术栈MapReduce、BigTable也是为分布式文件系统的设计开拓了思路。

GFS由单个主服务器和多个数据块服务器组成，并由多个客户端访问。文件被分成固定大小的64MB数据块。每一个数据块都有一个不可变且全局唯一的快处理程序，由主控服务器在创建块的时候分配的。默认情况下，每个文件块都会被复制到3个不同的块服务器上。对于GFS的特点，这里只谈我感知比较深的几点。

第一点：用户是怎样访问到需求数据的？

用户通过GFS客户端，也就是通过应用程序输入需求，首先客户端会在已缓存列表中寻找此需求的元数据，若有此需求的元数据，那么就可跳过主服务器，直接去访问chunkserver 服务器获取数据。若客户端里没有该需求元数据，那么就去主服务器（GFS master）索要元数据，缓存到客户端后，再进行数据获取，以此尽可能减少主服务器的运作压力。

第二点：为什么要把一个文件分成若干个chunk,一个chunk的大小为何设定为64M，一个文件的chunk要被分布在多个chunkserver中？

其实第一个问题还是比较好理解的，当文件过大时，若将它作为一个整体进行储存会十分依靠硬件提供的储存空间，所以要进行文件分块处理。而chunk的大小（文件偏移量的单位大小）决定着一个文件能被分成多少块，也就是多少个chunk。那为何chunk大小被设置成64M，要知道在当时的硬件情况下64M可不是一个小数目，但当时谷歌设计GFS的初衷就是为了处理GB级以上的文件，如果chunk设计过小，会使一个大文件被分成特别多个的chunk储存在不同的chunkserver中，而chunk在不同的chunkserver的位置是需要在主服务器中记载的，会对主服务器的内存造成不必要的浪费，chunk过大对chunkserver的硬件性能有较高要求，总的来说，chunk过小，对主服务器的性能要求会更高，chunk过大，对数据块服务器的性能要求更高，而64M相对来说是一个综合主服务器性能与分布式服务器较好的chunk大小。那为什么要将一个文件的chunk分布在不同的chunkserver中呢？假设我们将一个文件的chunk全部储存在一个chunkserver中，只有这个chunkserver满了以后，才将这一个文件剩余的chunk放在下一个chunkserver中,这样的话会出现一个chunkserver负载不均衡的问题，有些chunkserver被挤得满满的，而一些chunkserver中却只有几个chunk孤苦伶仃。因此谷歌设计了同一文件chunk被均匀分配在不同的chunkserver中，分配方法由主服务器决定以达到负载均衡，一般情况下，各个chunkserver的chunk数量差不会超过两个。

第三点：GFS的副本机制

对于一个分布式系统来说，高可靠性是在设计时必须考虑的一个因素。在长时间，多数据块储存情景下，很容易发生某个数据块服务器宕机导致数据暂时不能读取或者数据丢失，所以GFS建立了一附二的备份机制，即一个chunk会有两个副本储存在其他的chunkserver中，这样即使有两个储存相同文件数据块的chunkserver宕机，还是有一个能对其进行数据恢复。有时一些比较重要的数据会被要求储存在不同机架的服务器上，甚至不同机房的服务器上来确保数据不会损失，同时说明一下这里的三个chunk备份没有主次之分，还会有一个就近访问机制也是依赖于GFS副本机制，比如说三个相同的chunk分别被储存在北京、上海、广州的服务器中，那么北京用户访问数据，就会优先访问北京机房的服务器。在考虑主服务器宕机的可能性，谷歌也有一个类似于数据库的主备机制，以保证数据安全。

HDFS（Hadoop Distributed File Syetem）

什么是Hadoop？

Hadoop是一个由Apache基金会所开发的分布式系统基础架构，主要解决的是海量数据的储存和海量数据的分析计算，广义上hadoop生态圈不止是hadoop，还有hive，hbase等，它是对于GFS设计理念的开源实现。

Hadoop优势

Hadoop组成

我学的时候hadoop都3版本了，但我没找到相关资源

HDFS架构概述

NameNode（nn）存储文件元数据，如文件名，文件目录结构，文件属性（生成时间，副本数，文件权限），以及每个文件的块列表和块所在的DataNode等。
DataNode（dn）在本地文件系统存储文件块数据，以及块数据的校验。
Secondary NameNode（2nn）每隔一段时间对DataNode元数据备份。
YARN架构概述

Yet Another Resource Negotiator 简称YARN 另一种资源协调者，是Hadoop的资源管理器

（1）ResourceManager（RM）整个集群资源的主导者

（2）NodeManeger（NM）单个节点服务器的主导者

（3）ApplicationMaster（AM）单个任务的主导者

（4）Container 容器
Hadoop 3.0.0的安装部署（本地模式，系统为win11）
第一步：配置java环境变量
这个由于是后面老师要求用java实现基本操作才去用java的，我也不知道其他语言可不可以用hadoop，环境变量的配置网上教程多的是，这里就不赘述了。
第二步：下载hadoop的压缩包
下载链接：http://archive.apache.org/dist/hadoop/core/hadoop-3.0.0/hadoop-3.0.0.tar.gz
我试着想把压缩包上传上去，结果CSDN说已有资源，但我去已有资源去找吧，它又说无数据，把压缩包上传到阿里云盘去分享链接，它又说该文件格式可能含违法内容，这个链接的下载速度有时候会非常慢，有时候又是正常水平
当时我是直接用学校网盘里的资源，根本没考虑自己该咋样下载，

第三步：解压缩包

个人建议如果也是选修了解一下这个东西的话，解压到C盘以外的盘，以后删除简单一点

这里我解压到了D盘的hadoop文件夹中

第四步：配置相关文件

首先进入到hadoop 3.0.0的文件夹，然后进入etc目录

（1）：配置core-site.xml文件，红框为配置内容

（2）在hadoop3.0.0的目录下创建data文件夹,然后在data文件夹里创建namenode（名称节点）与datanode（数据节点）文件夹，还可以再创建一个tmp（临时目录）文件夹，我这里已经创建了一遍了，只需要创建文件夹就行了，不需要文件

（3）配置hdfs-site.xml文件（注意配置时要改为自己的文件夹路径）

（4）配置yarn-site.xml文件

（5）配置hadoop-env.cmd（好像叫命令脚本，如果电脑里没有notepad软件啥的，无法直接打开.cmd文件或者说闪退,我的土办法是先改为.xml文件修改后再改为.cmd文件）,修改JAVA_HOME为绝对路径，一定要对应环境变量里的文件路径

（6）配置mapred-site.xml文件

第五步：下载winuntils压缩包，选择对应版本将解压后的bin目录覆盖hadoop3.0.0的bin目录，这个资源相对来说好找一些，github里面也有

最好将winutil.exe再复制到Windows\system 32的目录下

（补充：最好将bin目录下hadoop.dll复制到C:\Windows\System32目录下，网上说的）

就是这个玩意

第六步：配置hadoop相关的环境变量

还有path里面的

第七步：以管理员身份运行cmd(命令提示符窗口)
（1）检查hadoop安装是否成功（这个倒不需要管理员身份）

（2）在管理员身份下打开cmd进行格式化（这里很容易报错，要看最后几行里有没有successfully~~的语句），一旦报错，老师冷酷地告诉我删掉hadoop文件夹，重新再来。我好像弄了三四遍

（3）在hadoop-3.0.0\sbin的路径下以管理员身份运行start-all.cmd和stop-all.cmd

出现四个有名字的窗口就基本完成hadoop在windows的安装了

注意，这里不要直接关闭这几个窗口，最好用命令行来操作，不然会被老师骂的，ε=(´ο｀*)))唉

不过私底下我想咋关就咋关，O(∩_∩)O哈哈~

第八步：查看web界面

（注意：在之前的版本中文件管理的端口是50070，在3.0.0中替换为了9870端口，这个跟文件配置有关，乱撞就是了反正经典访问端口也就那么几个）

如果是第一次无法访问原因可能是防火墙没关闭，或者浏览器不适配，最好把校园VPN也关了

注意要在hadoop还在运行时才能打开，不然直接打开啥也没有，web界面的内容只不过是数据映射而已。

（1）访问http://localhost:9870/查看文件管理界面

（2）访问http://127.0.0.1:8088/查看所有节点状态

HDFS的基本使用（命令行方式）

1. hadoop fs -help 显示Hadoop 命令指导帮助

2. hadoop fs -ls [-h][-R] 显示文件目录

[-h]：人性化显示文件大小

[-R]：递归查看指定目录以及子目录，就是把该路径下所有文件以及文件夹都显示出来
3. hadoop fs -mkdir [-p] 创建文件夹
:要创建的文件夹所在路径

[-p]:创建父目录，就是说要创建一个文件夹，本来是先创建user文件夹，然后再在user文件夹里创建test文件夹，用了-p 后你可以直接一次性创建出user里的test文件夹。

不用-p的命令创建test过程：

hadoop fs -mkdir /user

hadoop fs -mkdir /user/test

用了-p后创建test 过程：

hadoop fs -mkdir -p /user/test

4. hadoop fs -touchz 创建文件

5. hadoop fs -rm 删除文件或删除空白文件夹

6. hadoop fs -put [-f][-p] 上传文件

[-f]：覆盖目标文件（文件已存在的情况下）

[-p]：保留访问和修改时间、所有权和权限

：本地系统待上传文件或文件夹路径

：hdfs文件系统路径

7. hadoop fs -moveFromLocal 这个是上传后同时删除本地系统文件的操作

8. hadoop fs -cat 查看文件具体内容

9. hadoop fs -get [-f][-p] 获取HDFS上的文件

<-f>：覆盖目标文件（文件已存在的情况下）

[-p]：保留访问和修改时间、所有权和权限

：本地系统待下载预存放文件或文件夹路径

：hdfs文件系统路径

10. hadoop fs -df [-h] []

<-h>：人性化显示（原本用字节显示）

11. Hadoop fs -du [-s] [-h]

[-s]:显示指定路径文件长度汇总摘要而不是单个文件的路径摘要

[-h]:人性化显示文件大小

12. hadoop fs -mv 移动文件（也可附带重命名操作）

：文件原路径

：目的路径

这里进行的是重命名操作

13. hadoop fs -checksum 查看校验码信息(我的水平还用不上这种操作，我复制粘贴过来的)

hdfs为了保证数据的一致性，每次写文件时，针对io.bytes.per.checksum字节，都会创建一个单独的校验和。默认值为512字节，因为crc-32校验是4字节，存储开销小于1%。而客户端读取数据时，默认会验证数据的crc校验和。除此之外，每个数据节点还会在后台线程运行一个数据块检测程序，定期检查存储在数据节点上的所有块。当块和对应的crc校验匹配不上，由于hdfs存储着块的副本，它可以复制正确的副本替换出错的副本

hadoop设计的应用场景就是离线数据的分布式计算，所以这些数据会保存很久，而数据保存这么久，那么物理存储介质由于中位衰减，会造成数据损坏，这对一个大文件来说，很容易导致一个块由于时间关系，硬盘错位，最终导致整个文件都是错误的，这对离线处理来说是不可以接受的，hadoop就是为了离线处理的应用场景，才设计出crc校验。

14. hadoop fs -count [-q][-h][-v] 显示路径下的目录、文件和字节数

[-q]:控制显示的列

[-v]：显示标题行

15. hadoop fs -copyFromLocal 与put上传命令效果相同，从本地拷贝文件

：本地文件系统需上传的文件地址

：上传至HDFS的路径

16. Hadoop fs -copyToLocal 拷贝文件到本地，命令类似于get，不同的是拷贝目标地址必须为本地文件系统

17. Hadoop fs -find 查找目录文件

< expression>说明：

-name pattern 查找的文件名

-iname pattern 忽略大小查找文件名

-print 打印（默认值）（不写这个也行）

-print0 打印在一行（比如说同名异父目录的文件，默认情况下是逐行打印，用这个就会打印在一行）

HDFS基本操作（2）（编程方式）

这里由于代码全是老师给的，我压根就没写过，所以直接糊弄完事了，当初连java基础都不会，跟别说这些代码了，反正它最后给就是一个统计测试，给一个五百万个单词，普通程序需要很久，但hadoop花的时间少的多，不过我是在一个电脑上运行的，估计是并行起到的作用。

第一步：

安装eclipse插件，随后创建一个map/reduce项目,配置好项目主机名和端口，便会出现HDFS文件目录展示（前提是节点已启动）

第二步：

创建一个map/reduce项目，在项目下创建一个包，在这个包里去创建类（注意编写该代码要引进Hadoop相关的包）

第三步：

修改代码里的文件路径进行实操，增删改查就那几个操作

总结

虽然这些东西连大数据门槛都摸不到，但至少不是那种我想在下面玩手机的垃圾水课，还是不错的。

MySQL中基于机器学习的自适应缓存热点识别优化策略——开启数据库性能新纪元墨夶数据库学习资料1 数据库 mysql 机器学习
在数据驱动的世界里，数据库的性能直接影响到整个应用系统的响应速度和用户体验。随着业务量的增长和技术的发展，传统的缓存机制逐渐暴露出局限性。如何更智能地识别并利用热点数据进行缓存优化，成为提升数据库性能的关键所在。今天，我们将深入探讨一种创新的方法——基于机器学习的自适应缓存热点识别优化策略，并分享其在MySQL中的具体实现方案。为什么选择机器学习？‍传统上，开发者们依赖于手动配置或预设规则来决定哪
股神系列：蒋菲的量化投资中，如何利用大数据优化模型？她的数据来源有哪些？云策量化量化交易量化软件量化炒股量化炒股 QMT 量化交易入门教程 PTrade 股票投资 deepseek
推荐阅读：《程序化炒股：如何申请官方交易接口权限？个人账户可以申请吗？》标题：股神系列：蒋菲的量化投资中，如何利用大数据优化模型？她的数据来源有哪些？正文：在金融投资的世界里，量化投资以其科学、系统和客观的特点，成为了众多投资者追求的“圣杯”。而在量化投资领域，蒋菲以其独特的大数据量化投资模型而闻名。本文将深入探讨蒋菲如何利用大数据优化其量化投资模型，以及她的数据来源有哪些。一、量化投资模型的优化
算法笔记——前缀树、贪心算法（更新ing....... 不吃香菜的码农左神算法笔记算法数据结构贪心算法 leetcode 堆栈
前缀树、贪心算法一、前缀树1.什么是前缀树2.如何生成前缀树二、贪心算法1.拼接字符串2.金条问题3.项目会议时间问题4.项目收益最大化4.随时获得数据流的中位数一、前缀树1.什么是前缀树前缀树一般指字典树这是指一种结构而不是一类题（注意信息是在树的路上）典型应用是用于统计和排序大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：最大限度地减少无谓的字符串比较，查
Open3D 点云DBSCAN聚类算法 MelaCandy 算法聚类 numpy 计算机视觉图像处理 3d
目录一、DBSCAN基本原理二、代码实现2.1关键函数2.2完整代码三、实现效果3.1原始点云3.2聚类后点云Open3D点云算法汇总及实战案例汇总的目录地址：Open3D点云算法与点云深度学习案例汇总（长期更新）-CSDN博客一、DBSCAN基本原理DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）是一种基于密度的聚类算法，
Deepseek 个性化决策输出 meisongqing DeepSeek 个性化
Deepseek个性化决策输出：基于用户画像的定制化内容生成在教育场景中，通过构建动态用户画像与智能决策模型，教育数字人可基于学生水平实时调整讲解深度，实现精准化、个性化的学习支持。以下是核心实现框架与关键步骤：1.用户画像构建：多维度数据融合数据采集：显性数据：年龄、学科成绩、测试结果、学习时长、知识点掌握进度。隐性数据：交互行为（如答题犹豫时间、回放次数）、情绪识别（语音/表情分析）、认知负荷
【传输层协议】TCP协议详解（上）望舒_233 Linux网络 tcp/ip 网络服务器
前言TCP（TransmissionControlProtocol，传输控制协议）是TCP/IP协议栈中的核心协议，作为互联网通信的基石，承担着确保数据可靠传输的重要职责。接下来我将分两篇文章，从四个部分带大家学习一些与TCP相关的基本概念和机制，首先我将带大家认识一下TCP报头字段的含义，然后了解TCP保证可靠性的一些机制，接下来是TCP进行效率优化的机制，最后是TCP与应用层相关的概念。本篇文
我与DeepSeek读《大型网站技术架构》- 总结诺亚凹凸曼架构
文章目录读后感一、总结二、反思三、创新四、展望当代大型网站架构一、架构分层模型二、关键组件与技术选型三、架构演进策略四、架构突破口读后感一、总结架构演化优先于设计大型网站架构不是预先设计的产物，而是通过反复迭代和试错演化形成的。技术选型的核心动机是对业务需求的深刻理解，而非盲目模仿。典型案例包括淘宝架构因业务爆发力被迫转型为分布式系统。开放与协作的价值互联网的开放生态通过API经济（如淘宝Open
“统计视角看世界”专栏阅读引导赛卡统计视角看世界信息可视化数据分析
根据文章主题和逻辑关系，我为您设计以下阅读引导方案：1.六西格玛基础2.帕累托图3.直方图4.散点图基础5.散点图高阶6.多变量可视化7.密度图进阶8.回归分析配套文字说明：入门基石（必读）《1.六西格玛遇上Python》→方法论总纲，建议优先精读基础三剑客（可并行）├─《2.帕累托图》→重点数据排序与决策├─《3.直方图》→数据分布核心工具└─《4.散点图》→数据探索第一视角高阶应用链（递进学习
Node.js 如何发布一个 NPM 包——详细教程还是鼠鼠 node.js npm 前端 node.js vscode
在本文中，我将带大家一步步学习如何创建并发布一个NPM包，帮助开发者理解整个流程，并能顺利将自己的JavaScript库发布到NPM上供他人使用。1.安装Node.js和npm在开始之前，请确保你的电脑上已经安装了Node.js和npm（Node.js自带npm）。你可以在终端（Windows用户请使用cmd或PowerShell）输入以下命令检查是否已安装：node-vnpm-v如果出现版本号，
【TypeScript学习】TypeScript基础学习总结二 JAMJAM_NoName typescript 学习前端
主要记录ts中的类、接口与泛型1.类无论是在哪种语言中，类都是面向对象编程(OOP)的一个主要实现方式。能够实现代码更加灵活，更具有结构化。类作用都是提供一个模板，通过类可以创建多个具有相同结构的对象。//类的定义，与对象的声明classStudent{id:stringname:stringage:numberconstructor(id:string,name:string,age:numbe
2024年第五届MathorCup数学应用挑战赛--大数据竞赛思路、代码更新中..... 宇哥预测优化代码学习 1024程序员节
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️研赛及概况一、竞赛背景与目的二、组织机构与参赛对象三、竞赛时间与流程四、竞赛要求与规则五、奖项设置与奖励六、研究文档撰写建议七、参考资料与资源1找程序网站推荐2公式编辑器、流程图、论文排版324年研赛资源下载4思路、Python、Matlab代码分享......⛳
如何设计一个高可用的 Seata 集群？码农技术栈 java spring boot spring cloud 微服务架构 spring
——从零搭建永不宕机的分布式事务协调系统一、为什么需要高可用Seata集群？在分布式系统中，事务协调器TC是全局事务的“大脑”。一旦TC单点故障：灾难性后果：所有进行中的全局事务将卡死，业务完全不可用数据不一致风险：已提交的事务可能无法完成最终提交或回滚因此，构建高可用Seata集群是生产环境的必选项！二、Seata高可用架构设计核心要点1.TC集群化部署多节点部署：至少部署3个TC实例（奇数节点
前端技术学习记录：react+dvajs+ant design实现暴走计算器的页面重构（二）大泡泡糖学习记录 reactjs 前端 git webstorm
前端技术学习记录：react+dvajs+antdesign实现暴走计算器的页面重构（二）前言定义Modelconnect起来更新state拥抱变化主题切换更换页面获取当前设备类型编写武学选择前言www定义Model完成UI后，现在开始处理数据和逻辑。dva通过model的概念把一个领域的模型管理起来，包含同步更新state的reducers，处理异步逻辑的effects，订阅数据源的subscr
qt读书笔记 mmmcu2004 QT qt 读书 translation 工作 action
QWidget::setToolTip()用于为Widget设置相应的tip文本。同样，QAction::setToolTip()为Action设置相应的tip文本；若没有显式的为Action设置tip文本,Action会自动的使用actiontext。setStatusTip()，该函数为Widget和Action添加statustip。QWidget::setWhatsThis()QWhats
Tiny RDM：为什么说程序员都需要他，这款开源项目，太好用，轻量化的跨平台Redis桌面客户端，谁用谁知道！！小华同学ai 开源 redis 数据库
嗨，大家好，我是小华同学，关注我们获得“最新、最全、最优质”开源项目和高效工作学习方法TinyRDM是一款现代化、轻量级的跨平台Redis桌面客户端。它支持Mac、Windows和Linux系统，提供了丰富的功能特性，旨在为开发者提供便捷、高效的Redis操作体验。功能特性极度轻量TinyRDM基于Webview2构建，不内嵌浏览器，这使得它在保持轻量级的同时，也拥有出色的性能。感谢Wails框架
「差生文具多系列」推荐两个好看的 Redis 客户端古时的风筝杂说 redis 数据库缓存 Redis客户端
声明：大家好，我是风筝作者主页：【古时的风筝CSDN主页】。⚠️本文目的为个人学习记录及知识分享。如果有什么不正确、不严谨的地方请及时指正，不胜感激。直达博主：「古时的风筝」。（搜索或点击扫码）————————————————大家好，我是风筝软件推荐时间到，推荐两款我常用的Redis客户端，都是免费的，且支持Mac、Windows，如果你之前的Redis客户端用的不顺手，可以试试下面这两个。Re
Qt学习之路学习笔记3 delphi863
1，文件对方框创建file对象，选择打开方式，打开后传递给QTextStream，读取，赋给QText显示，关闭文件。（QTextStream::readAll()直接读取文件所有内容，如果这个文件有100M，程序会立刻死掉）实际应用中，分段读入怎么处理？2、事件中的继承自QLabel的鼠标事件label->setMouseTracking(true);设置后才能允许就跟踪，否则需要点击一次，才跟
C# 技术使用笔记：Asp.Net Core MVC 中控制器 Controllers 中返回数据使用详解 caifox菜狐狸 C#技术使用笔记 c#笔记 asp.net core ViewResult JsonResult Redirect 控制器
本文将深入探讨ASP.NETCoreMVC控制器中返回数据的多种方式，从基础的ViewResult到灵活的IActionResult，再到强大的ActionResult，我们将逐一剖析它们的使用场景、优缺点以及最佳实践。通过丰富的代码示例和详细的解释，帮助读者全面掌握控制器返回数据的技巧，从而提升开发效率，构建更加健壮和高效的Web应用程序。无论你是初学者还是有一定经验的开发者，本文都将为你提供有
SpringCloud框架下的注册中心比较：Eureka与Consul的实战解析耶耶Norsea 网络杂烩 spring cloud
摘要在探讨SpringCloud框架中的两种注册中心之前，有必要回顾单体架构与分布式架构的特点。单体架构将所有业务功能集成在一个项目中，优点是架构简单、部署成本低，但耦合度高。分布式架构则根据业务功能对系统进行拆分，每个模块作为独立服务开发，降低了服务间的耦合，便于升级和扩展，然而其复杂性增加，运维、监控和部署难度也随之提高。关键词SpringCloud,注册中心,单体架构,分布式架构,服务拆分一
C++学习系列（11）：智能指针（unique_ptr、shared_ptr、weak_ptr） DoYangTan C++学习系列 c++学习 java
C++学习系列（11）：智能指针（unique_ptr、shared_ptr、weak_ptr）1.引言在C++传统的内存管理方式中，动态分配的对象需要手动释放，否则可能会导致内存泄漏（MemoryLeak）。为了解决这个问题，C++11引入了智能指针（SmartPointer），它能自动管理资源，避免内存泄漏。本篇博客将介绍：智能指针的概念三种智能指针：unique_ptr、shared_ptr
语音识别学习系列（13）：语音识别中的情感识别与表达 DoYangTan 语音识别学习人工智能
语音识别学习系列（13）：语音识别中的情感识别与表达前言在语音识别领域，仅仅将语音准确转换为文字内容已不能满足日益多样化的人机交互需求。人们在交流过程中往往蕴含着丰富的情感信息，语音识别若能对情感进行识别与表达，将会使交互变得更加自然、智能且贴合人性化需求。本期我们就围绕语音识别中的情感识别与表达这一重要主题展开深入探讨，了解其背后的原理、方法以及实际应用价值。一、语音情感识别的基本原理与常用方法
目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
Spring Cloud Config 快速介绍与实例 oscar999 Spring Boot实战开发大全 Spring Boot Cloud Config
SpringCloudConfig是什么？SpringCloudConfig是一个用于分布式系统的配置管理工具，提供集中化的外部配置支持。它适用于微服务架构，能够将各个服务的配置集中存储在服务端（如Git仓库），客户端按需动态获取配置，解决了配置分散、环境切换复杂等问题。SpringCloudConfig核心概念ConfigServer：配置中心服务端，统一管理配置，支持Git、本地文件等存储方式
1.✨学习系统浅探 *TQK* 自我认知规划（不让别人看）认知提升
不要过于苛求完美，允许自己偶尔放松，保持积极心态。长期坚持比短期高强度更重要，尤其是为三年后的考研做准备，需要持续的努力而不是一时的冲刺。定期复盘，调整计划。如果某天状态不好，可以适当减少任务量，保持弹性。同时，保证足够的睡眠和运动，这对维持多巴胺水平和整体精力很重要。一、系统构建一Deepseek指令我的大一下学期已经开始了，这一学期我又有新的计算机课程。上一学期我学了C语言，基础知识掌握的还可
Seata分布式事务框架及四种模式原理解析 Cloud_. 分布式 seata java Seata-AX Seata-AT
一、Seata核心概念Seata（SimpleExtensibleAutonomousTransactionArchitecture）是阿里开源的分布式事务解决方案，核心思想是通过事务协调器（TC）统一管理全局事务分支的状态，协调资源管理器（RM）和事务管理器（TM）完成事务的提交与回滚。核心组件：TC(TransactionCoordinator)：全局事务协调者，维护全局事务状态，驱动分支事务
Spring Boot 整合 RabbitMQ：注解声明队列与交换机详解 Cloud_. java-rabbitmq spring boot rabbitmq MQ 消息队列
RabbitMQ作为一款高性能的消息中间件，在分布式系统中广泛应用。SpringBoot通过spring-boot-starter-amqp提供了对RabbitMQ的无缝集成，开发者可以借助注解快速声明队列、交换机及绑定规则，极大简化了配置流程。本文将通过代码示例和原理分析，详细介绍如何用注解实现RabbitMQ的集成，并深入解析交换机的作用与类型。一、环境准备1.添加依赖在pom.xml中引入S
Python 用户账户(创建用户账户) 钢铁男儿 Python 从入门到精通 python sqlite 数据库
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
深度学习框架PyTorch——从入门到精通（6.2）自动微分机制 Fansv587 深度学习 pytorch 人工智能经验分享 python 机器学习
本节自动微分机制是上一节自动微分的扩展内容自动微分是如何记录运算历史的保存张量非可微函数的梯度在本地设置禁用梯度计算设置requires_grad梯度模式（GradModes）默认模式（梯度模式）无梯度模式推理模式评估模式（`nn.Module.eval()`）自动求导中的原地操作原地操作的正确性检查多线程自动求导CPU上的并发不确定性计算图保留自动求导节点的线程安全性C++钩子函数不存在线程安全
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数