两只橙

人机交互系统（2.1）——深度学习分布式计算框架

1 为什么需要分布式计算？

在这个数据爆炸的时代，产生的数据量不断地在攀升，从GB，TB，PB到ZB。挖掘其中数据的价值也是企业在不断地追求的终极目标。但是要想对海量的数据进行挖掘，首先要考虑的就是海量数据的存储问题，比如TB量级的数据。

谈到数据的存储，则不得不说的是磁盘的数据读写速度问题。早在上个世纪90年代初期，普通硬盘的可以存储的容量大概是1G左右，硬盘的读取速度大概为4.4MB/s.读取一张硬盘大概需要5分钟时间，但是如今硬盘的容量都在1TB左右了，相比扩展了近千倍。但是硬盘的读取速度大概是100MB/s。读完一个硬盘所需要的时间大概是2.5个小时。所以如果是基于TB级别的数据进行分析的话，光硬盘读取完数据都要好几天了，更谈不上计算分析了。那么该如何处理大数据的存储以及计算分析呢？

一个很简单的减少数据读写时间的方法就是同时从多个硬盘上读写数据。比如，如果我们有100个硬盘，每个硬盘存储1%的数据，并行读取，那么不到两分钟就可以完成之前需要2.5小时的数据读写任务了。这就是大数据中的分布式存储的模型。当然实现分布式存储还需要解决很多问题，比如硬件故障的问题，使用多台主机进行分布式存储时，若主机故障，会出现数据丢失的问题，所以有了副本机制：系统中保存数据的副本。一旦有系统发生故障，就可以使用另外的副本进行替换（著名的RAID冗余磁盘阵列就是按这个原理实现的）。其次比如一个很大的文件如何进行拆分存储，读取拆分以后的文件如何进行校验都是要考虑的问题。比如我们使用Hadoop中的HDFS也面临这个问题，只是框架给我们实现了这些问题的解决办法，且在底层进行了封装，使得开发者在开发中不用考虑这些问题。

同样假如有一个10TB的文件，我们要统计其中某个关键字的出现次数，传统的做法是遍历整个文件，然后统计出关键字的出现次数，这样效率会特别特别低。基于分布式存储以后，数据被分布式存储在不同的服务器上，那么我们就可以使用分布式计算框架（比如MapReduce,Spark等）来进行并行计算（或者说是分布式计算），即：每个服务器上分别统计自己存储的数据中关键字出现的次数，最后进行一次汇总，那么假如数据分布在100台服务器上，即同时100台服务器同时进行关键字统计工作，效率一下子可以提高几十倍。

2 目前有哪些深度学习分布式计算框架？

2.1 PaddlePaddle

PaddlePaddle是百度推出的开源分布式深度学习框架，致力于让更多中国企业和开发者方便地完成深度学习应用，该框架提供了丰富的API，可以轻松地完成神经网络配置，模型训练等任务。

• 优点：
 提供工业级中文 NLP 算法和模型库，涵盖文本分类、序列标注、语义匹配等多种NLP任务的解决方案，拥有当前业内效果最好的中文语义表示模型和基于用户大数据训练的应用任务模型，且同类型算法模型可灵活插拔。
 基于百度海量规模的业务场景实践，同时支持稠密参数和稀疏参数场景的超大规模深度学习并行训练，支持千亿规模参数、数百个节点的高效并行训练。
 提供端到端的全流程部署方案，覆盖多硬件、多引擎、多语言，预测速度超过其他主流实现。同时，还提供了模型压缩、加密等工具。
 提供丰富的配套工具组件，在自动组网、强化学习、预训练模型、弹性训练等方面加速深度学习项目落地。
 中文文档齐全，方便本土开发。

• 缺点：
 开发语言单一，目前仅支持Python语言开发。

• 用途：
 生成对抗网络
 线性回归
 数字识别
 图像分类
 情感分析
 机器翻译
 个性化推荐
 词向量
 语义角色标注
…

• 案例：
 高尔夫球场的遥感检测：http://ai.baidu.com/support/news?action=detail&id=976

• Github地址：https://github.com/PaddlePaddle/Paddle

2.2 Deeplearning4j

Deeplearning4j是基于JVM、聚焦行业应用且提供商业支持的分布式深度学习框架，能在合理的时间内解决各类涉及大量数据的问题。Deeplearning4j与Kafka、Hadoop和Spark集成，可使用任意数量的GPU或CPU运行。

• 优点：
 支持Java、Scala和Python等多种语言开发。
 用多GPU运行图像处理任务时的性能可媲美Caffe，优于TensorFlow和Torch。
 可通过调整JVM的堆空间、垃圾回收算法、内存管理以及Deeplearning4j的ETL数据加工管道来优化Deeplearning4j的性能。
 跨平台性强，可在Linux服务器、Windows和OSX桌面、安卓手机上运行，还可通过嵌入式Java在物联网的低内存传感器上运行。
 提供多样化组件和工具，可快速搭建深度学习项目，DeepLearning4J的组件包括：
 DataVec进行数据摄取，将数据标准化并转换为特征向量。
 DeepLearning4J提供配置神经网络、构建计算图的工具。
 Keras Model Import（Keras模型导入）帮助用户将已训练的Python和Keras模型导入DeepLearning4J和Java环境。
 ND4J让Java能够访问所需的原生库，使用多个CPU或GPU快速处理矩阵数据。
 DL4J-Examples（DL4J示例）包含图像、时间序列及文本数据分类与聚类的工作示例。
 ScalNet是受Keras启发而为Deeplearning4j开发的Scala语言包装。它通过Spark在多个GPU上运行。
 RL4J用于在JVM上实现深度Q学习、A3C及其他强化学习算法。
 Arbiter帮助搜索超参数空间，寻找最理想的神经网络配置。

• 缺点：
 内存占用高，需要不断调整JVM已达到最优效果。

• 用途：
 语音识别
 情感分析
 欺诈检测
 推荐引擎
 相片聚类
 图像搜索
 命名实体识别
…

• 案例：
 官方示例：https://github.com/deeplearning4j/dl4j-examples

• Github地址：https://github.com/deeplearning4j/deeplearning4j

2.3 Mahout

Mahout是一个分布式线性计算框架，提供一些可扩展的机器学习领域经典算法的实现，旨在让数学家、统计学家和数据科学家快速实现自己的算法。

• 优点：
 包括聚类、分类、推荐过滤、频繁子项挖掘等诸多实现。
 基于Hadoop开发，可轻松实现分布式计算。
 快速高效实现数据挖掘算法，解决了并行挖掘的问题。

• 缺点：
 实现的算法单一，仅适用于推荐，分类，聚类等单一场景。
 对训练的数据格式有要求，定制化数据存在一定难度。

• 用途：
 推荐系统
 聚类
 分类

• 案例：
 官方示例：https://github.com/apache/mahout/tree/master/examples
• Github地址：https://github.com/apache/mahout

2.4 Spark MLllib

MLlib(Machine Learnig lib)是Spark对常用的机器学习算法的实现库，同时包括相关的测试和数据生成器。
MLlib是MLBase一部分，其中MLBase分为四部分：MLlib、MLI、ML Optimizer和MLRuntime。
MLlib目前支持4种常见的机器学习问题: 分类、回归、聚类和协同过滤。

• 优点：
 基于Spark开发，可轻松实现分布式计算。
 拥有庞大的Java生态链支持，文档丰富，业界有许多成功的方案可借鉴。
 Spark基于内存的计算模型适合迭代式计算，在内存中完成多个步骤的计算，只有必要时才会操作磁盘和网络，减少I/O和CPU资源的占用。
 具有出色而高效的Akka和Netty通信系统，通信效率高。

• 缺点：
 开发语言单一，基于Scala语言开发的多范式编程语言需要一定的学习成本。
 过度封装，若要修改某个实现环节，需修改源码重新编译。例如Spark内部使用计算两个向量的距离是欧式距离，若修改为余弦或马氏距离，需要修改源码并重新编译。

• 用途：
 推荐系统
 情感分析
 分类
 聚类
 回归
…

• 案例：
 官方示例：http://spark.apache.org/examples.html
• 项目地址：http://spark.apache.org/docs/1.1.0/mllib-guide.html

2.5 Ray

Ray是针对机器学习领域开发的一种新的分布式计算框架，该框架基于Python的机器学习和深度学习工作负载能够实时执行，并具有类似消息传递接口(MPI)的性能和细粒度。

• 优点：
 海量任务调度能力。
 毫秒级别的延迟。
 异构任务的支持。
 任务拓扑图动态修改的能力。

• 缺点：
 API层以上的部分还比较薄弱，Core模块核心逻辑估需要时间打磨。
 国内目前除了蚂蚁金服和RISELab有针对性的合作以外，关注程度还很低，没有实际的应用实例看到，整体来说还处于比较早期的框架构建阶段。

• 用途：
 增强学习
 分类
 聚类
 图像识别
 推荐系统
 文本翻译
…

• 案例：
 官方示例：https://github.com/ray-project/ray/tree/master/examples

• Github地址：https://github.com/ray-project/ray

2.6 Spark Stream

Spark是一个类似于MapReduce的分布式计算框架，其核心是弹性分布式数据集，提供了比MapReduce更丰富的模型，可以在快速在内存中对数据集进行多次迭代，以支持复杂的数据挖掘算法和图形计算算法。Spark Streaming[6]是一种构建在Spark上的实时计算框架，它扩展了Spark处理大规模流式数据的能力。

• 优点：
 能运行在100+的结点上，并达到秒级延迟。
 使用基于内存的Spark作为执行引擎，具有高效和容错的特性。
 能集成Spark的批处理和交互查询。
 为实现复杂的算法提供和批处理类似的简单接口。

• 用途：
 推荐系统
 用户画像
 日志分析
 舆情监控
 报表统计
…

• 案例：
 官方示例：http://spark.apache.org/examples.html

• 项目地址：http://spark.apache.org/streaming

2.7 Horovod

Horovod是Uber开源的又一个深度学习分布式计算框架，它的发展吸取了Facebook「一小时训练 ImageNet 论文」与百度Ring Allreduce的优点，可为用户实现分布式训练提供帮助。

• 优点：
 支持通过用于高性能并行计算的低层次接口 – 消息传递接口 (MPI) 进行分布式模型训练。有了MPI，就可以利用分布式 Kubernetes 集群来训练 TensorFlow 和 PyTorch 模型。
 分布式 TensorFlow 的参数服务器模型（parameter server paradigm）通常需要对大量样板代码进行认真的实现，但是 Horovod 仅需要几行。

• 缺点：
 国内文档少，需要一定的学习成本。
 开发语言单一，目前仅支持Python语言开发。

• 用途：
 分类
 聚类
 文本标注
 推荐系统
 图像识别
…

• 案例：
 官方示例：https://github.com/horovod/horovod/tree/master/examples

• Github地址：https://github.com/uber/horovod

2.8 BigDL

BigDL是一种基于Apache Spark的分布式深度学习框架。它可以无缝的直接运行在现有的Apache Spark和Hadoop集群之上。BigDL的设计吸取了Torch框架许多方面的知识，为深度学习提供了全面的支持，包括数值计算和高级神经网络，借助现有的Spark集群来运行深度学习计算，并简化存储在Hadoop中的大数据集的数据加载过程。

• 优点：
 丰富的深度学习支持。模拟Torch之后，BigDL为深入学习提供全面支持，包括数字计算（通过Tensor）和高级神经网络 ; 此外，可以使用BigDL将预先训练好的Caffe或Torch模型加载到Spark程序中。
 极高的性能。为了实现高性能，BigDL在每个Spark任务中使用英特尔MKL和多线程编程。因此，在单节点Xeon（即与主流GPU 相当）上，它比开箱即用开源Caffe，Torch或TensorFlow快。
 有效地横向扩展。BigDL可以通过利用Apache Spark，以及高效实施同步SGD和全面减少Spark的通信，从而有效地扩展到"大数据规模"上的数据分析。

• 缺点：
 对机器要求高，JDK7上运行性能差；在CentOS 6和7上，要将最大用户进程增加到更大的值（例如514585），否则，可能会出现"无法创建新的本机线程"异常。
 训练和验证的数据会加载到内存，挤占内存。

• 用途：
 直接在Hadoop/Spark框架下使用深度学习进行大数据分析（即将数据存储在HDFS、HBase、Hive等数据库上）。
 在Spark程序中/工作流中加入深度学习功能。
 利用现有的 Hadoop/Spark 集群来运行深度学习程序，然后将代码与其他的应用场景进行动态共享，例如ETL（Extract、Transform、Load，即数据抽取）、数据仓库（data warehouse）、功能引擎、经典机器学习、图表分析等。

• 案例：
 官方示例：https://bigdl-project.github.io/0.8.0/#ScalaUserGuide/examples/

• GitHub地址：https://github.com/intel-analytics/BigDL

2.9 Petastorm

Petastorm是一个由Uber ATG开发的开源数据访问库（深度学习分布训练库）。这个库可以直接基于数 TB Parquet 格式的数据集进行单机或分布式训练和深度学习模型评估。Petastorm支持基于Python的机器学习框架，如 Tensorflow、Pytorch 和 PySpark，也可以直接用在Python代码中。

• 优点：
 通过单数据模式定义进行数据的编码和解码。
 提供 Tensorflow 和 PyTorch 的适配器。
 将 Apache Spark 作为分布式集群计算框架来生成数据集。
 支持 Apache Parquet 格式的数据集的单机或分布式训练、验证。

• 缺点：
 兼容的框架有限。
 国内参考文档较少，需要一定的学习成本。

• 用途：
 单机或分布式训练和深度学习模型评估与验证。
 作为深度学习分布训练库。

• 案例：
 官方示例： https://github.com/uber/petastorm/tree/master/examples

• Github地址：https://github.com/uber/petastorm

2.10 TensorFlowOnSpark

TensorFlowOnSpark是为Apache Hadoop和Apache Spark集群带来可扩展的深度学习框架。通过结合深入学习框架TensorFlow和大数据框架Apache Spark 、Apache Hadoop的显着特征，TensorFlowOnSpark能够在GPU和CPU服务器集群上实现分布式深度学习计算。

• 优点：
 轻松迁移所有现有的TensorFlow程序，小于10行代码更改。
 支持所有TensorFlow功能：同步/异步训练，模型/数据并行，推理和TensorBoard。
 服务器到服务器的直接通信能实现更快的学习。
 允许数据集在HDFS和由Spark推动的其他来源或由TensorFlow拖动。
 轻松集成现有的数据处理流水线和机器学习算法（例如，MLlib，CaffeOnSpark）。
 轻松部署在云或内部部署：CPU和GPU，以太网和Infiniband。
 TensorFlowOnSpark基于TensorFlow实现，而TensorFlow有着一套完善的教程，内容丰富。

• 缺点：
 开源时间不长，未得到充分的验证。

• 用途：
 词向量
 文本标注
 情感分析
 推荐系统
 图像识别
 人脸检测
 分类
 聚类
…

• 案例：
 官方示例：https://github.com/yahoo/TensorFlowOnSpark/tree/master/examples

• Github 地址:https://github.com/yahoo/TensorFlowOnSpark

关注我的技术公众号《漫谈人工智能》，每天推送优质文章

USB转串口芯片CH9102替代CP2102注意事项 Chery1140 单片机嵌入式硬件
CH9102与CP2102可实现pin2pin兼容，可以在不更改硬件设计的前提下实现不同型号间快速切换与产品应用。CH9102系列型号包括：CH9102F（QFN24）和CH9102X（QFN28），CP2102系列型号包括：CP2102、CP2102N-GQFN24、CP2102N-GQFN28。1.应用差异说明1）驱动说明：CH9102芯片为CDC类串口芯片，用户可以选择使用操作系统内置的CD
【计算机毕设任务书】基于微信小程序的宠物寄养平台的设计与实现 Eastonzhang888 计算机毕设任务书参考案例课程设计微信小程序宠物数据库 intellij-idea 计算机毕业设计小程序
一、设计的主要内容、技术参数及工作要求研究目的现在宠物寄养管理中已有一些商家使用了基本的管理软件，这些软件都是依靠客户端，只可以特定人员使用，不能实现信息的共享。虽然可以帮助工作人员减少工作量，但从根本上还是无法满足用户的需求。这些软件都还是基于网络发展之初的要求，没有利用现代网络的技术，体现不了更为实用的功能。依靠客户端的系统开发时没有考虑园际化的问题，所以也满足不了国际化的要求。最近几年来，我
Conda 常用命令全解析 melck conda
在Windows系统中，Conda是一款功能强大的包管理和环境管理工具，尤其对于数据分析、科学计算等场景有着重要的作用。本文将详细介绍Conda在Windows系统中的常用命令，帮助你高效地管理虚拟环境和软件包。一、环境管理命令1.1查看Conda版本conda--version该命令用于确认Conda是否成功安装以及查看其版本号。这对于确保Conda的兼容性和功能性非常重要。1.2创建新环境co
欧*雅WCS项目总结十五001 项目归档后端 java 程序人生
项目介绍使用系统APRISO下发任务与wcs交互，wcs包含与海康agv对接，以及APRISO不纳入管理的库位（包括线边库位、码头库位、暂存区库位、空栈板库位）。wcs的主要定位就是高度定制化贴合生产业务，可以说wcs成为了agv和APRISO之间的桥梁。APRISO下发任务时候，通过生成xml文件实现的，这时候wcs会监听该文件目录新建的xml文件来生成任务。刚开始部署后不到一周出现了监听失效问
生产企业使用系统大全十五001 其他笔记经验分享其他
作为一般企业员工可能只负责或对其中部分系统比较熟悉，其实如果是一个生产型企业完整的系统大全应该包含以下这些，但由于系统之间可能存在的边界模糊，会把其他系统的功能给进行合并，但不影响我们了解成熟系统所对应的职责，以下就是十大系统的功能：图来源于：白话聊IT一、MES（制造执行系统）核心作用：宛如一座桥梁，衔接企业的计划层（由ERP系统代表）与工厂的实际控制系统，专注于对工厂生产现场进行实时、精准的管
如何快速定位并解决 Linux 系统性能瓶颈：终极全攻略 BitTalk 性能优化 linux 服务器 java
在现代IT环境中，Linux系统被广泛应用于服务器、嵌入式设备和超级计算机等各类场景。随着系统负载的增加，性能瓶颈不可避免地会影响系统的可靠性和效率。因此，了解如何有效地诊断和解决Linux系统中的性能问题至关重要。本篇博客将深入探讨Linux性能瓶颈的可能来源，介绍各种性能评估方法和概念，并最终提供使用Linux命令查找性能瓶颈的实用指南。性能瓶颈的可能来源在Linux系统中，性能瓶颈可能出现在
在瑞芯微RK3588平台上使用RKNN部署YOLOv8Pose模型的C++实战指南机＿长 YOLO系列模型有效涨点改进深度学习落地实战 YOLO c++开发语言
在人工智能和计算机视觉领域，人体姿态估计是一项极具挑战性的任务，它对于理解人类行为、增强人机交互等方面具有重要意义。YOLOv8Pose作为YOLO系列中的新成员，以其高效和准确性在人体姿态估计任务中脱颖而出。本文将详细介绍如何在瑞芯微RK3588平台上，使用RKNN（RockchipNeuralNetworkToolkit）框架部署YOLOv8Pose模型，并进行C++代码的编译和运行。注本文全
深度学习之目标检测的常用标注工具铭瑾熙人工智能机器学习深度学习深度学习目标检测目标跟踪
1LabelImgLabelImg是一款开源的图像标注工具，标签可用于分类和目标检测，它是用Python编写的，并使用Qt作为其图形界面，简单好用。注释以PASCALVOC格式保存为XML文件，这是ImageNet使用的格式。此外，它还支持COCO数据集格式。2labelmelabelme是一款开源的图像/视频标注工具，标签可用于目标检测、分割和分类。灵感是来自于MIT开源的一款标注工具Label
34、深度学习-自学之路-深入理解-NLP自然语言处理-RNN一个简单的程序，可以从程序中理解RNN的基本思想。小宇爱深度学习-自学之路深度学习自然语言处理 rnn
importsys,random,mathfromcollectionsimportCounterimportnumpyasnpf=open('tasks_1-20_v1/en/qa1_single-supporting-fact_train.txt','r')raw=f.readlines()f.close()tokens=list()forlineinraw[0:1000]:tokens.ap
ug12无法连接服务器系统,NX许可证错误：无法连接至许可证服务器系统。SPLM_LICENSE_SERVER错误[-15]... 逍遥药师 ug12无法连接服务器系统
问题原因这个问题可以说只要用过NX软件的工程师，都会遇到过，是最常见的NX许可证错误，可以说没有之一，因为这个提示只是告诉你，你的当前NX许可服务没有启动，就算是你安装完NX主程序不安装许可服务，也是这个提示。所以这个警告提示，实际上对你的问题参考没多大帮助。能让NX许可服务不能启动的原因有很多，所以只能自己去排查以下几种情况。解决方案1、检查你的NX许可服务有没有安装。(这是最基本，一般情况下不
DeepSeek-R1 技术全景解析：从原理到实践的“炼金术配方” ——附多阶段训练流程图与核心误区澄清... 雪停时偶遇一叶春流程图
合集-人工智能(5)1.如何改进AI模型在特定环境中的知识检索2024-09-242.深度学习与统计学中的时间序列预测2024-10-033.《使用coze搭建一个会搜索、写ppt、思维导图的Agent》2024-10-294.深入浅出：Agent如何调用工具——从OpenAIFunctionCall到CrewAI框架01-145.DeepSeek-R1技术全景解析：从原理到实践的“炼金术配方”—
【HarmonyOS Next】鸿蒙监听手机按键 GeorgeGcs HarmonyOS 解决方案 OpenHarmony知识体系 harmonyos 华为 onKeyEvent 按键监听事件按下鸿蒙
【HarmonyOSNext】鸿蒙监听手机按键一、前言应用开发中我们会遇到监听用户实体按键，或者扩展按键的需求。亦或者是在某些场景下，禁止用户按下某些按键的业务需求。这两种需求，鸿蒙都提供了对应的监听事件进行处理。onKeyEvent默认的按钮监听事件onKeyPreIme这是优先级最高的监听回调，别上面多了一个return开关，用于告诉系统监听事件是否再向下传递。窗口是第一级接收按钮事件的实体。
麒麟v10安装mysql5.7（ARM架构） qqxinxi arm开发
下载路径：华为云镜像麒麟v10是潮流时代的新时髦的linux操作系统，但随着ARM架构流行，出现了一些卡点，不以为然，没当回事的大吃一惊。经常卡住。例如:在安装mysql5.7（ARM架构）最简单：使用rpmmysql-5.7.27.1.el7.aarch64.rpm文件比较小下载完之后rpm-ivhmysql-5.7.27.1.el7.aarch64.rpm比较简单常用的方法，再不能连接互联网时
HarmonyOS进程通信及原理拥有一颗学徒的心 HarmonyOS harmonyos 华为鸿蒙信息与通信分布式
大家好，我是学徒小z，最近在研究鸿蒙中一些偏底层原理的内容，今天分析进程通信给大家，请用餐文章目录进程间通信1.通过公共事件（@ohos.commonEventManager）公共事件的底层原理2.IPCKit能力LiteIPC的归属与特点1.所属内核2.核心思想3.公共事件子系统鸿蒙内核小知识进程间通信1.通过公共事件（@ohos.commonEventManager）公共事件的底层原理公共事件
centos操作系统安装R包单细胞拟时序分析CytoTRACE2 探序基因 centos linux 运维
探序基因肿瘤研究院整理作者操作系统为centosstream8，R版本为4.3.3devtools::install_github("digitalcytometry/cytotrace2",subdir="cytotrace2_r")中途出现错误：*installing*source*package‘RcppGSL’...**成功将‘RcppGSL’程序包解包并MD5和检查**usingstag
GATK3.5GATK4.0与java版本的关系探序基因 java
探序基因肿瘤研究院整理操作系统centosstream9yum安装java后，输入java-version可看到：openjdkversion"11.0.20.1"2023-08-24LTSOpenJDKRuntimeEnvironment(Red_Hat-11.0.20.1.1-2)(build11.0.20.1+1-LTS)OpenJDK64-BitServerVM(Red_Hat-11.0.
HarmonyOS全栈开发指南：从入门到精通，构建万物智联的未来生态（一）林钟雪 Harmonyos harmonyos 华为
一、HarmonyOS基础认知篇1.HarmonyOS发展历程与核心使命内容摘要：HarmonyOS，由华为公司于2019年首次公开发布，标志着华为在操作系统领域的深度布局。从最初的智能物联网设备操作系统定位，到如今面向万物智联时代的分布式全场景操作系统，HarmonyOS经历了多次迭代与升级。发展历程：初期探索：2019年，华为正式推出HarmonyOS，旨在打造一个适用于智能物联网设备的操作系
侯捷 C++ 课程学习笔记：C++ 面向对象开发的艺术孤寂大仙v c++c++学习笔记
在侯捷老师的C++系列课程中，《C++面向对象开发》这门课程让我对面向对象编程有了更深入的理解。面向对象编程（OOP）是现代软件开发中最重要的编程范式之一，而C++作为支持OOP的语言，提供了强大的工具和特性。侯捷老师通过系统的讲解和实战案例，帮助我掌握了如何在C++中高效地使用面向对象技术。以下是我对这门课程的学习笔记和心得体会。一、课程核心内容：C++面向对象开发的关键特性![侯捷老师的课程详
语聊房软件开发流程与基础功能 ALLSectorSorft java html5 javascript
开发一款语聊房软件需要系统的规划和多领域技术整合。以下是关键流程、基础功能及示例代码：---一、开发流程1.需求分析-明确目标用户（社交/游戏/教育）-竞品分析（Clubhouse/Discord/狼人杀）-核心功能优先级排序2.技术选型-实时语音：声网Agora（推荐）/腾讯云TRTC/WebRTC-即时通讯：Socket.io/Sendbird/Firebase-后端框架：Node.js/Sp
网络安全常识网络安全Ash web安全网络安全
一、网络安全常识什么是网络安全？网络安全是指网络系统的硬件、软件及其系统中的数据受到保护，不因偶然的或者恶意的原因而遭到破坏、更改、泄露，系统可以连续可靠正常地运行，网络服务不被中断。什么是计算机病毒？计算机病毒（ComputerVirus）是指编制者在计算机程序中插入的破坏计算机功能或者破坏数据，影响计算机使用并且能够自我复制的一组计算机指令或者程序代码。什么是木马？木马是一种带有恶意性质的远程
linux网络安全网络安全Max linux web安全运维
Linux网络安全一直是IT行业中备受关注的话题，而红帽作为Linux操作系统的知名发行版，在网络安全领域也扮演着重要的角色。红帽公司一直致力于为用户提供安全可靠的Linux解决方案，以帮助用户建立强大的网络安全防护体系。首先，红帽操作系统本身具有较高的安全性。作为一款开源操作系统，Linux具有代码透明、强大的权限管理和丰富的安全功能等特点，这使得Linux相对于其他闭源操作系统更加安全可靠。而
MVCC（多版本并发控制）机制讲解十五001 基础 oracle 数据库 mysql
MVCC（Multi-VersionConcurrencyControl，多版本并发控制）这是一个在数据库管理系统中非常重要的技术，尤其是在处理并发事务时。别担心，我会用简单易懂的方式来讲解，让你轻松掌握它的原理和作用。1.什么是MVCC？定义MVCC是一种数据库技术，用于通过保留数据的多个版本来提高并发性能，同时避免事务之间的冲突。简单来说，它允许数据库在读取和写入操作时，同时存在多个版本的数据
深入解析JVM性能问题定位与优化测试不打烊性能测试 jvm 性能优化
JVM性能问题定位与优化详解：架构、内存、Linux命令与监控工具的全面解析引言Java虚拟机（JVM）是运行Java应用程序的核心组件，它管理内存、执行字节码，并提供垃圾回收机制等功能。然而，随着应用规模的增长，JVM的性能问题时常会成为系统瓶颈。为了有效定位和优化JVM性能问题，我们需要从JVM架构、内存管理、Linux系统命令，以及监控工具入手，对JVM的各类指标进行详尽的分析和优化。本文将
安装与部署openeuler 的HA VX-IT BANG 服务器网络 linux
实现原理LinuxHA（HighAvailability，高可用性）是指利用Linux操作系统构建的高可用集群解决方案，旨在确保关键业务服务在面临硬件故障、软件错误、网络中断等各种异常情况时，依然能够持续、稳定地运行，尽量减少服务中断时间，提高系统的可靠性和可用性。以下从几个方面详细介绍：关键组件和技术心跳监测（Heartbeat）这是LinuxHA系统中最基础也是最重要的组件之一。它通过在节点之
Ubuntu切换终端快捷键 yangsong4353 ubuntu shell term
在Ubuntu系统中，使用终端（Terminal）进行操作时，掌握一些快捷键可以大大提高工作效率。以下是一些常用的终端快捷键及其功能：打开和关闭终端打开终端:Ctrl+Alt+T关闭终端:Ctrl+D标签页操作新建标签页:Ctrl+Shift+T关闭标签页:Ctrl+Shift+W切换标签页:Alt+数字键（如Alt+1，Alt+2等）或Ctrl+PageUp/PageDown复制和粘贴复制:Ct
关于个人财务系统的javaweb小项目竹木有心 tomcat java
个人财务管理系统-项目计划书1.项目背景与目的随着现代社会的进步与人们收入水平的提高，个人财务的管理变得越来越重要。如何有效地记录、管理、分析个人的收支状况，成为了很多人关注的焦点。本项目旨在设计并实现一个基于JavaWeb技术的个人财务管理系统，通过该系统，用户可以轻松管理自己的收入与支出，查看财务统计分析，帮助用户进行财务规划与控制。本系统适用于大三学生的课程设计要求，涉及JavaWeb技术、
利用Beautiful Soup和Pandas进行网页数据抓取与清洗处理实战傻啦嘿哟 pandas
目录一、准备工作二、抓取网页数据三、数据清洗四、数据处理五、保存数据六、完整代码示例七、总结在数据分析和机器学习的项目中，数据的获取、清洗和处理是非常关键的步骤。今天，我们将通过一个实战案例，演示如何利用Python中的BeautifulSoup库进行网页数据抓取，并使用Pandas库进行数据清洗和处理。这个案例不仅适合初学者，也能帮助有一定经验的朋友快速掌握这两个强大的工具。一、准备工作在开始之
鸢尾花分类项目 GUI 编织幻境的妖分类数据挖掘人工智能
1.机器学习的定义机器学习是一门人工智能的分支，专注于开发算法和统计模型，使计算机能够在没有明确编程的情况下从数据中自动学习和改进。通过识别数据中的模式和规律，机器学习系统可以做出预测或决策。常见的应用包括图像识别、语音识别、推荐系统等。2.为什么使用鸢尾花数据集（Irisdataset）鸢尾花数据集是一个经典的多类分类问题数据集，由英国统计学家和遗传学家RonaldFisher在1936年引入。
c#编程：基于C#+Access的学生信息管理系统课程设计报告撰写提纲 gu20 C#c#课程设计开发语言数据库开发
1.摘要简述系统目标、技术选型（C#+Access）、核心功能及数据库设计亮点。关键词：学生信息管理系统；数据库原理；C#；Access；事务处理。2.引言背景与意义：信息化管理需求、数据库技术在教育领域的应用价值。设计目标：实现学生信息的高效管理，体现数据库规范化、安全性等原理。技术路线：C#（WinForm）、Access数据库、ADO.NET数据访问技术。3.需求分析3.1功能需求：1.学生
Linux发展史：从个人项目到开源帝国的技术演进 ♢.＊人工智能大模型 Linux 操作系统
一、起源与诞生（1960s-1991）UNIX的奠基Linux的基因可追溯至1969年贝尔实验室的KenThompson与DennisRitchie。为运行《星际旅行》游戏，Thompson用BCPL语言开发了UNIX原型，后由Ritchie以C语言重构，成为首个可移植操作系统12。其“一切皆文件”的设计哲学深刻影响了后续系统架构1。MINIX的启发1987年，AndrewS.Tanenbaum开
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(