Hadoop技术博文

盘点2017年晋升为Apache TLP的大数据相关项目

本文原文：https://www.iteblog.com/archives/2310.html，如下面格式排版错乱，请点击下面阅读原文进入本博客阅读。

本文主要盘点了 2017 年晋升为 Apache Top-Level Project (TLP) 的大数据相关项目，项目的介绍从孵化器毕业的时间开始排的，一共十二个。

Apache Beam: 下一代的大数据处理标准

Apache Beam（原名Google DataFlow）是Google在2016年2月份贡献给Apache基金会的Apache孵化项目，被认为是继MapReduce，GFS和BigQuery等之后，Google在大数据处理领域对开源社区的又一个非常大的贡献。Apache Beam的主要目标是统一批处理和流处理的编程范式，为无限，乱序，web-scale的数据集处理提供简单灵活，功能丰富以及表达能力十分强大的SDK。Apache Beam项目重点在于数据处理的编程范式和接口定义，并不涉及具体执行引擎的实现，Apache Beam希望基于Beam开发的数据处理程序可以执行在任意的分布式计算引擎上。

Apache Beam 主要有两大特点：

将数据的批处理（batch）和流处理（stream）编程范式进行了统一；
能够在任何的执行引擎上运行。

Apache Beam 仅仅是一个SDK，是一个应用顶层的API，主要由Beam SDK和Beam Runner组成，Beam SDK定义了开发分布式数据处理任务业务逻辑的API接口，生成的的分布式数据处理任务Pipeline交给具体的Beam Runner执行引擎。支持的执行引擎（官方叫做Apache Beam Pipeline Runners）包括Apache Apex，Apache Flink，Apache Spark以及它自己的Google Cloud Dataflow。 Apache Beam目前支持的API接口包括 Java 和 Python，其他的语言正在开发中。如下图所示：

如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop

Apache Beam 官方网址：https://beam.apache.org/

Apache Eagle: 分布式实时Hadoop数据安全方案

Apache Eagle 是由 eBay 公司开源的一个识别大数据平台上的安全和性能问题的开源解决方案。该项目于2017年1月10日正式成为 Apache 顶级项目。 Apache Eagle 提供一套高效分布式的流式策略引擎，具有高实时、可伸缩、易扩展、交互友好等特点，同时集成机器学习对用户行为建立Profile以实现实时智能实时地保护 Hadoop 生态系统中大数据的安全。
Apache Eagle 主要包括三大层：

数据收集及存储层（Data Collection and Storage）
数据处理层（Data Processing）
可视化层（Visualize）

整个组成如下：

如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop

Apache Eagle 依赖于 Apache Storm 来进行数据活动和操作日志的流处理，并且可以执行基于策略的检测和报警。它提供多个API：作为基于Storm API上的一层抽象的流式处理API和 policy engine provider API的抽象，它将WSO2的开源Siddhi CEP engine作为第一类对象。Siddhi CEP engine支持报警规则的热部署，并且警报可以使用属性过滤和基于窗口的规则（例如，在10分钟内三次以上的访问）来定义。

Eagle 支持根据用户在Hadoop平台上历史使用行为习惯来定义行为模式或用户Profile的能力。拥有了这个功能，不需要在系统中预先设置固定临界值的情况下，也可以实现智能地检测出异常的行为。Eagle中用户Profile是通过机器学习算法生成，用于在用户当前实时行为模式与其对应的历史模型模式存在一定程度的差异时识别用户行为是否为异常。目前，Eagle 内置提供以下两种算法来检测异常，分别为特征值分解（Eigen-Value Decomposition）和密度估计（Density Estimation）。这些算法从HDFS 审计日志中读取数据，对数据进行分割、审查、交叉分析，周期性地为每个用户依次创建Profile 行为模型。一旦模型生成，Eagle的实时流策略引擎能够近乎实时地识别出异常，分辨当前用户的行为可疑的或者与他们的历史行为模型不相符。

下图简单描述了目前Eagle中用户Profile的离线训练建模和在线实时监测的数据流：

如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop

Apache Eagle 官方网址：https://eagle.apache.org/

Apache Ranger：统一授权管理框架

Apache Ranger 是一个用在 Hadoop 平台上并提供操作、监控、管理综合数据安全的框架。Ranger 的愿景是在 Apache Hadoop 生态系统中提供全面的安全性。目前，Apache Ranger 支持以下 Apache 项目的细粒度授权和审计：

Apache Hadoop
Apache Hive
Apache HBase
Apache Storm
Apache Knox
Apache Solr
Apache Kafka
YARN

对于上面那些受支持的 Hadoop 组件，Ranger 通过访问控制策略提供了一种标准的授权方法。作为标准，Ranger提供了一种集中式的组件，用于审计用户的访问行为和管理组件间的安全交互行为。

Ranger 使用了一种基于属性的方法定义和强制实施安全策略。当与 Apache Hadoop 的数据治理解决方案和元数据仓储组件Apache Atlas一起使用时，它可以定义一种基于标签的安全服务，通过使用标签对文件和数据资产进行分类，并控制用户和用户组对一系列标签的访问。

Ranger 的总体架构如下图所示，主要由以下三个组件构成：

AdminServer: 以RESTFUL形式提供策略的增删改查接口，同时内置一个Web管理页面。
AgentPlugin: 嵌入到各系统执行流程中，定期从AdminServer拉取策略，根据策略执行访问决策树，并且定期记录访问审计。插件的实现原理将在后文详细介绍。
UserSync: 定期从LDAP/File中加载用户，上报给AdminServer。

整个过程如下：

如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop

Apache Ranger 官方网址：https://ranger.apache.org/

Apache Metron：实时网络安全检测框架

Apache Metron 是一个网络安全的实时数据处理、分析、查询、可视化框架。Metron 集成了各种开源大数据技术，为安全监控和分析提供了集中工具。 Metron 拥有支持大规模摄取、处理、检索与信息可视化的所有适当元素，一些关键的网络数据将推动数据保护、监控、分析与检测，并且有助于对恶意的非法行为予以回应。该项目最早可溯源至Cisco的开源大数据系统安全框架项目OpenSOC。Apache Metron 的主要功能包括：

可扩展的接收器和分析器能够监视任何Telemetry数据源
是一个扩展性很强的框架，且支持各种Telemetry数据流
支持对Telemetry数据流的异常检测和基于规则实时告警
通过预设时间使用Hadoop存储Telemetry的数据流
支持使用ElasticSearch实现自动化实时索引Telemetry数据流
支持使用Hive利用SQL查询存储在hadoop中的数据
能够兼容ODBC/JDBC和继承已有的分析工具
具有丰富的分析应用,且能够集成已有的分析工具
支持实时的Telemetry搜索和跨Telemetry的匹配
支持自动生成报告、和异常报警
支持原数据包的抓取、存储、重组
支持数据驱动的安全模型

Apache Metron 官方网址：https://metron.apache.org/

Apache SystemML：为大数据优化的声明式机器学习平台

Apache SystemML 是由 IBM 开发并开源的优化大数据机器学习平台，为使用大数据的机器学习提供了最佳的工作场所。它可以在 Apache Spark上运行，会自动缩放数据，逐行确定代码是否应在驱动程序或 Apache Spark 群集上运行。如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop

SystemML 是声明式机器学习 (DML)，包含线性代数原语，统计功能和 ML 指定结构，可以更容易也更原生的表达 ML 算法。算法通过 R 类型或者 Python 类型的语法进行表达。DML 通过提供灵活的定制分析表达和独立于底层输入格式和物理数据表示的数据显著提升数据科学的生产力。

其次，SystemML 提供自动优化功能，通过数据和集群特性保证高效和可伸缩。SystemML 可以在 MapReduce 或者 Spark 环境运行。

Apache SystemML 官方网址：https://systemml.apache.org/

Apache CarbonData：列式存储文件格式

Apache CarbonData 是由华为开发、开源并支持 Apache Hadoop 的列式存储文件格式，支持索引、压缩以及解编码等，其目的是为了实现同一份数据达到多种需求，而且能够实现更快的交互查询。

Apache CarbonData 文件格式是基于列式存储的，并存储在HDFS之上；其包含了现有列式存储文件格式的许多有点，比如：可分割、可压缩、支持复杂数据类型等；并且CarbonData为了解决上面5点要求，加入了许多独特的特性，主要概括为以下四点：

存储数据及其索引：在有过滤的查询中，它可以显著地加速查询性能，减少I/O和CPU资源。CarbonData的索引由多级索引组成，处理框架可以利用这些索引信息来减少调度和一些处理的开销；在任务扫描数据的时候它可以仅仅扫描更细粒度的单元(称为blocklet)，而不需要扫描整个文件。
可操作的编码数据：通过支持高效的压缩和全局编码模式，它可以直接在压缩或者编码的数据上查询，仅仅在需要返回结果的时候才进行转换，这种技术被称为late materialized。
列组：支持多列组成一个列组，并且使用行格式进行存储，这减少了查询时行重建的开销。
支持多种使用场景：比如支持类OLAP风格的交互式查询、顺序存取、随机访问等。

如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop

Apache CarbonData 官方网址：https://carbondata.apache.org/

Apache Fluo：大规模增量处理系统

Apache Fluo 是 Google Percolator（搜索索引）的开源实现，允许用户对存储在 Apache Accumulo 中的大型数据集进行增量更新，无需重新处理所有的数据。与批处理和流处理框架不同的是，Fluo 提供了更低的延迟，并且可以在极大的数据集上运行。

Apache Fluo 官方网址：https://fluo.apache.org/

Apache DistributedLog：高性能分布式复制日志系统

Apache DistributedLog 是由 Twitter 开发并开源的低延时（毫秒级）、高吞吐的分布式复制日志流系统。能提供持久的可复制的强一致性（分布式事务机制），可以作为基础构建设施用于创建可靠的分布式系统，例如可复制的状态机(replicated-state-machine)、一般的pub/sub系统、分布式数据库和分布式队列等。Apache DistributedLog已经在Twitter的线上运行了三四年，支持从分布式数据库、实时搜索引擎、跨机房数据同步到实时流计算等多种业务。Apache DistributedLog每天为Twitter传递1.5 trillion条记录（合17.5 PB数据）。Apache DistributedLog 主要有以下特点：

高性能：Apache DistributedLog可以在具有大量并发日志的持久写入中提供毫秒延迟，并且可以从数千个客户端处理每秒大量的读和写操作。
持久性和一致性：消息被持久化到磁盘上，并复制以存储多个副本以防止数据丢失。在严格的排序下，它们保证了写入者和读取者之间的一致性。
高效的扇入和扇出：Apache DistributedLog提供了一个高效的服务层,优化运行的多租户数据中心环境便或纱等。服务层能够支持大规模的读(扇入)和写(扇出)。
不同的工作负载：Apache DistributedLog支持各种工作负载，从那些对延迟敏感的联机事务处理(OLTP)应用程序(如分布式数据库和内存复制状态机),实时摄取和计算，到分析处理。
多租户：为了支持多租户的大量日志，Apache DistributedLog专为I/O在实际工作负载中隔离而设计。
分层体系架构：Apache分布式日志系统有一个现代的分层架构设计，它将无状态的服务层与有状态的存储层分离。支持大规模写入(扇入)和读取(扇出),允许扩展存储独立的CPU和内存。

Apache DistributedLog 体系结构如下：

如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop

Apache DistributedLog 官方网址：https://bookkeeper.apache.org/distributedlog/
关于 Kafka 和 DistributedLog 的比较可以参见： Kafka 和 DistributedLog 技术对比

Apache MADlib：基于SQL可扩展的机器学习库

Apache MADlib 是 Pivotal 与 UCBerkeley 合作的基于SQL可扩展的机器学习库，提供了精确的数据并行实现、统计和机器学习方法对结构化和非结构化数据进行分析。MADlib提供了丰富的分析模型，包括回归分析，决策树，随机森林，贝叶斯分类，向量机，风险模型，KMEAN聚集，文本挖掘，数据校验等。MADlib支持Greenplum,PostgreSQL 以及 Apache HAWQ, In-Database Analytics的特性使其大大扩展了数据库的分析功能，充分利用MPP架构使其能够快速处理海量数据集。

Apache MADlib 体系结构如下：

如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop

从上图可以看到，MADlib 由以下主要组件构成：

Python驱动函数（Python driver functions）
C++实现的核心函数（C++ implementations functions）
C++数据库抽象层（C++ database abstraction layer）

Python驱动函数：用户输入的主入口点，主要负责算法的流程控制。通常这些函数的实现包括输入参数验证、SQL语句执行、结果评估，并可能循环执行更多的SQL语句直到达到某些收敛标准。

C++实现的核心函数：这部分函数是由C++编写的核心函数，实现特定机器学习算法。出于性能考虑，这些函数是用C++而不是Python编写的。

C++数据库抽象层：这些函数提供一个编程接口，将所有的Postgres内部细节进行抽象。它们提供了一种机制，使得MADlib能够支持不同的后端平台，从而将关注点集中在内部功能而不是平台集成上。

Apache MADlib 官方网址：https://madlib.apache.org/

Apache RocketMQ：分布式消息传递和流数据平台

ApacheRocketMQ 由阿里巴巴开发并开源的分布式消息系统，基于高可用分布式集群技术，提供低延时的、高可靠的消息发布与订阅服务。同时，广泛应用于多个领域，包括异步通信解耦、企业解决方案、金融支付、电信、电子商务、快递物流、广告营销、社交、即时通信、移动应用、手游、视频、物联网、车联网等。

能够保证严格的消息顺序
提供丰富的消息拉取模式
高效的订阅者水平扩展能力
实时的消息订阅机制
亿级消息堆积能力

Apache RocketMQ 在设计时参考了 Kafka，并做出了自己的一些改进，消息可靠性上比 Kafka 更好。相对于 Kafka ，RocketMQ 有如下的专业术语：

Producer：消息生产者，生产者的作用就是将消息发送到 MQ，生产者本身既可以产生消息，如读取文本信息等。也可以对外提供接口，由外部应用来调用接口，再由生产者将收到的消息发送到 MQ。
Producer Group：生产者组，简单来说就是多个发送同一类消息的生产者称之为一个生产者组。在这里可以不用关心，只要知道有这么一个概念即可。
Consumer：消息消费者，简单来说，消费 MQ 上的消息的应用程序就是消费者，至于消息是否进行逻辑处理，还是直接存储到数据库等取决于业务需要。
Consumer Group：消费者组，和生产者类似，消费同一类消息的多个 consumer 实例组成一个消费者组。
Topic：Topic 是一种消息的逻辑分类，比如说你有订单类的消息，也有库存类的消息，那么就需要进行分类，一个是订单 Topic 存放订单相关的消息，一个是库存 Topic 存储库存相关的消息。
Message：Message 是消息的载体。一个 Message 必须指定 topic，相当于寄信的地址。Message 还有一个可选的 tag 设置，以便消费端可以基于 tag 进行过滤消息。也可以添加额外的键值对，例如你需要一个业务 key 来查找 broker 上的消息，方便在开发过程中诊断问题。
Tag：标签可以被认为是对 Topic 进一步细化。一般在相同业务模块中通过引入标签来标记不同用途的消息。
Broker：Broker 是 RocketMQ 系统的主要角色，其实就是前面一直说的 MQ。Broker 接收来自生产者的消息，储存以及为消费者拉取消息的请求做好准备。
Name Server：Name Server 为 producer 和 consumer 提供路由信息。

Apache RocketMQ 的体系结构如下：

如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop

由这张图可以看到有四个集群，分别是 NameServer 集群、Broker 集群、Producer 集群和 Consumer 集群：

NameServer: 提供轻量级的服务发现和路由。每个 NameServer 记录完整的路由信息，提供等效的读写服务，并支持快速存储扩展。
Broker: 通过提供轻量级的 Topic 和 Queue 机制来处理消息存储,同时支持推（push）和拉（pull）模式以及主从结构的容错机制。
Producer：生产者，产生消息的实例，拥有相同 Producer Group 的 Producer 组成一个集群。
Consumer：消费者，接收消息进行消费的实例，拥有相同 Consumer Group 的 Consumer 组成一个集群。

Apache RocketMQ 官方网址：https://rocketmq.apache.org/

Apache Impala：新一代开源大数据分析引擎

Apache Impala是 Cloudera 公司主导开发的新型查询系统，它提供SQL语义，能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义，但由于Hive底层执行使用的是MapReduce引擎，仍然是一个批处理过程，难以满足查询的交互性。相比之下，Impala的最大特点也是最大卖点就是它的快速。具有以下特点：

Impala不需要把中间结果写入磁盘，省掉了大量的I/O开销。
省掉了MapReduce作业启动的开销。MapReduce启动task的速度很慢（默认每个心跳间隔是3秒钟），Impala直接通过相应的服务进程来进行作业调度，速度快了很多。
Impala完全抛弃了MapReduce这个不太适合做SQL查询的范式，而是像Dremel一样借鉴了MPP并行数据库的思想另起炉灶，因此可做更多的查询优化，从而省掉不必要的shuffle、sort等开销。
通过使用LLVM来统一编译运行时代码，避免了为支持通用编译而带来的不必要开销。
用C++实现，做了很多有针对性的硬件优化，例如使用SSE指令。
使用了支持Data locality的I/O调度机制，尽可能地将数据和计算分配在同一台机器上进行，减少了网络开销。

Impala适合大规模数据的交互式查询，内存要求很高，但它并不太适合海量数据的批处理。因此，常用的方式是使用Hive完成离线批处理过程，之上使用Impala提供交互式即席查询。

Apache Impala 的体系结构如下：

如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop

为了避免延迟，Impala 避免使用 MapReduce，而是通过一个专门的分布式查询引擎直接访问数据，这个引擎非常类似于在商业并行数据库管理系统中发现的引擎。结果是性能比 Hive 快一个数量级。

Apache Impala 官方网址：https://impala.apache.org/

Apache Trafodion：基于 Hadoop 平台的事务数据库引擎

Apache Trafodion 是由惠普开发并开源的基于 Hadoop 平台的事务数据库引擎。提供了一个基于Hadoop平台的交易型SQL引擎。它是一个擅长处理交易型负载的Hadoop大数据解决方案。其主要特性包括：

完整的ANSI SQL语言支持
完整的ACID事务支持。对于读、写查询，Trafodion支持跨行，跨表和跨语句的事务保护
支持多种异构存储引擎的直接访问
为应用程序提供极佳的高可用性保证
采用了查询间(intra-query)并发执行模式。轻松支持大数据应用
同时应用编译时和运行时优化技术，优化了OLTP工作负载的性能

事务管理特性包括

事务串行化基于开源项目HBase-Trx的实现原理，采用多版本并发控制(MVCC)
增强的故障恢复机制保证了数据库中用户数据的一致性
事务管理器支持多线程的SQL客户端应用
支持非事务型数据访问，即直接访问底层HBase表

Apache Trafodion的进程构架

如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop

上图描述了Trafodion的进程构架。主要进程包括：

客户端应用通过JDBC或者ODBC访问Trafodion。Trafodion的ODBC驱动采用了优化的wire protocol，高效地同Master Executor进程进行网络交互。上图演示了一个Type 4的JDBC配置。.
Master Executor是负责执行用户SQL语句的主进程。它内部包含了一份SQL compiler代码的拷贝，因此多数SQL语句可以在Master Executor进程内部进行编译而无需和单独的编译进程进行通信。此外，所有执行计划中的root节点都在Master Executor进程中执行。
少部分SQL语句（比如,DDL和一些应用工具）需要启动第二个独立的编译器进程对SQL语句进行处理；即上图中的CMP进程
Trafodion 支持多种不同形式的并发执行方式。当系统生成了并发查询计划时，系统会动态地启动多个ESP进程，即Executor Server Processes。每一个ESP负责执行查询计划中的一个分段(fragment)
DTM进程负责分布式事务。DTM的职责包括日志管理和事务协调。
Trafodion支持访问原生HBase表，为此，SQL引擎将读取HBase的元数据。为了提供更好的OLTP访问性能，Trafodion还提供了定制的Trafodion表结构，用HBase Table进行存储。Trafodion表拥有自己的元数据，同样存储在HBase中。

Apache Trafodion 官方网址：https://trafodion.apache.org/

你可能感兴趣的:(盘点2017年晋升为Apache TLP的大数据相关项目)

【原创】【4】【辅助工具】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道三块钱0794 ffmpeg 音视频自动化
主要功能目录选择-浏览选择包含视频的目录智能扫描-自动递归扫描所有视频文件️赛道管理-从文件夹名自动获取赛道或手动指定实时进度-显示扫描和导入的实时进度双数据库-支持SQLite（推荐）和MySQL重复检测-自动跳过已存在的视频文件使用场景示例假设您的视频目录结构是：D:\短视频\├──外国人系列\│├──1.mp4│├──2.mp4│└──3.mov├──美食系列\│├──美食1.mp4│└──
大模型——Obsidian加Cursor就是最强个人AI知识库不二人生大模型人工智能爬虫大模型 Obsidian cursor
大模型——Obsidian加Cursor就是最强个人AI知识库这几天因为看到了Obsidian的浏览器剪藏插件的强大（这个下节讲）所以开始玩Obsidian，想要搞一个符合自己要求的本地知识库再加上AI的加持。也装了几个Obsidian的AI插件，结果发现配置非常复杂，体验不太行，想要顺畅使用的话得看文档，甚至还有看文档都无法结局的恶性Bug，我得搜Github其他人的问题才能搞定。这些插件的作用
嵌入式 - i.MX93的GPIO寄存器解读夜流冰嵌入式笔记
有四组GPIO，gpio1~gpio4，每组32个端子，序号从0~31。例如，GPIO1_IO00~GPIO1_IO31。表示GPIO状态时，一组寄存器的32个端子用32bit表示，正好四个字节。每组GPIO都有各自的寄存器，基地址空间不同，但其布局和偏移是一致的。1，偏移0x54寄存器PDDR用来设置整组GPIO的输入输出方向，1表示输出，0表示输入。reset后值为0。2，偏移0x50寄存器P
GESP认证C++编程真题解析 | GESP202409 三级单选题和判断题热爱编程的通信人历年GESP CSP-J CSP-S真题解析 c++开发语言
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
UR Studio仿真工具上线助力协作机器人快速部署与精准配置模拟欣佰特cnbestec 机器人优傲优傲机器人 UR Studio PolyScopeXAI 协作机器人
URStudio仿真工具是专为协作机器人自动化部署打造的一款集成化、在线式仿真平台。它基于PolyScopeXAI平台开发，提供从方案设计到仿真验证的一体化流程，帮助企业提升自动化项目的设计效率与实施成功率。工程师无需复杂操作即可快速上手，轻松应对多变的生产需求。无论是初学者还是资深用户，都能通过直观的界面完成仿真任务，实现智能制造的高效转型。URStudio仿真工具核心优势平台集成，提升协作效率
git配置(1): 根据remote自动选择账号执行commit ArthurBreeze git
git配置(1):根据remote自动选择账号执行commit在公司电脑上，克隆了github的仓库，也克隆了内网gitlab的仓库。希望commit和push到内网gitlab时，使用公司账号；commit和push到github时，使用个人账号。原本以为~/.gitconfig只能配置单个账户：[user]name=my_personal_nameemail=my_personal_email
C++语言学习笔记：常对象和常引用
对于既需要共享、又需要防止改变的数据应该声明为常量。一、常对象1、声明对象时用const修饰，称之为常对象。const类型说明符对象名；2、常对象的数据成员值在对象的整个生存期间不能被改变。常对象必须进行初始化，而且不能被更新。3、在定义一个变量或常量时为它指定初值叫作初始化，而在定义一个变量或常量以后使用赋值运算符修改它的值叫作赋值。4、改变对象的数据成员值有两个途径：一是通过对象名访问其成员对
LeetCode 学习day3 不喜勿喷小小小新人12123 leetcode 学习算法 python
题目：给定一个数组prices，它的第i个元素prices[i]表示一支给定股票第i天的价格。你只能选择某一天买入这只股票，并选择在未来的某一个不同的日子卖出该股票。设计一个算法来计算你所能获取的最大利润。返回你可以从这笔交易中获取的最大利润。如果你不能获取任何利润，返回0。（LeetCode121.买卖股票的最佳时机）问题分析：简而言之为求最大差Python代码：importnumpyasnpc
JSP学习 sakoba 学习 java
文章目录什么是JSP运行原理JSP基础语法JSP表达式JSP脚本片段JSP声明jsp指令九大内置对象&四大域对象内置对象四大域对象代码JSP标签、JSTL标签、EL表达式EL表达式JSP标签JSTL标签什么是JSPJSP（JavaServerPages）是由SUN公司在1996年6月发布的一种基于Java技术的服务器端编程技术，用于开发动态Web应用。从本质上讲，它是一个简化的Servlet设计。
嵌入式原理与应用篇---常见基础知识（9） Atticus-Orion 微处理器原理与应用篇上位机操作篇上位机知识篇网络微处理器原理与应用
冯诺伊曼计算机的组成部分及功能冯诺伊曼计算机的设计基于“存储程序”原理，其核心思想是将程序和数据以二进制形式存储在存储器中，由计算机自动执行。以下是各部分的功能及设计思路：一、运算器（ArithmeticLogicUnit,ALU）功能：负责执行算术运算（如加减乘除）和逻辑运算（如与、或、非），是计算机处理数据的核心部件。设计思路：通过逻辑门电路（如全加器、乘法器）实现基本运算，采用并行计算结构提
上位机知识篇---CRLF Atticus-Orion 微处理器原理与应用篇上位机知识篇上位机操作篇单片机嵌入式硬件微处理器原理与应用串口
串口通信中的CRLF：概念、原理与应用详解一、CRLF的定义与本质CRLF是两个ASCII控制字符的组合，用于表示文本行的结束，在串口通信中作为数据帧的分隔符。其具体含义为：CR（CarriageReturn）：回车符，ASCII码为0x0D（十进制13），早期打字机中表示“将打印头移至行首”；LF（LineFeed）：换行符，ASCII码为0x0A（十进制10），表示“将打印头移至下一行”。组合
基于python的公众号文章爬取思路（总结版）大数据小学僧 python 开发语言爬虫微信公众平台
目录一、技术方案分类1.接口直连模式（推荐）2.网页解析模式3.第三方API模式二、核心技术栈三、爬虫实现步骤1.接口直连模式（微信公众平台API）2.网页解析模式（搜狗微信搜索）3.第三方API模式（如清博大数据）四、可视化界面实现五、数据存储方案六、高级技巧七、注意事项八、推荐工具链一、技术方案分类1.接口直连模式（推荐）2.网页解析模式3.第三方API模式二、核心技术栈三、爬虫实现步骤1.接
OpenCV图像噪点消除五大滤波方法慕婉0307 opencv基础 opencv 人工智能计算机视觉
在数字图像处理中，噪点消除是提高图像质量的关键步骤。本文将基于OpenCV库，详细讲解五种经典的图像去噪滤波方法：均值滤波、方框滤波、高斯滤波、中值滤波和双边滤波，并通过丰富的代码示例展示它们的实际应用效果。一、图像噪点与滤波基础1.1常见图像噪声类型高斯噪声：符合正态分布的随机噪声椒盐噪声：随机出现的黑白像素点泊松噪声：光子计数噪声量化噪声：模拟信号数字化过程中产生1.2滤波方法分类滤波类型特点
打造跨平台应用的全能框架：Dioxus 人工智能我来了 IT技术开源服务器运维
在如今飞速发展的数字世界中，越来越多的开发者开始寻找能够满足跨平台需求的高效框架。而在这些选择中，Dioxus这个全栈应用框架脱颖而出。Dioxus是一款为Web、桌面和移动端开发而设计的全栈框架，采用Rust语言，具备跨平台、一体化的优势。本文将深入介绍Dioxus的独特功能，应用场景以及使用方法。Dioxus的核心特性跨平台支持：一次编写，到处运行Dioxus支持在Web、桌面和移动平台上部署
AutoGPT，自主完成复杂任务小雷FansUnion AI2025 人工智能
AutoGPT是一个开源的AIAgent项目，它的核心目标是让AI能够自主完成复杂任务，而不仅仅是回答单个问题。简单来说，它让AI具备了"自主思考和行动"的能力。1.AutoGPT的核心概念什么是AIAgent？AIAgent（智能代理）是一种能够：自主规划：将大任务分解成小步骤自主决策：根据情况选择最佳行动自主执行：调用各种工具和API完成任务自主反思：评估结果并调整策略AutoGPT的独特之处
设计模式(策略，工厂，单例，享元，门面)+模板方法 sakoba 设计模式数据库 java
文章目录前提策略模式思想实现如何拓展模板方法存在的问题思想实现如何拓展工厂模式实现问题及解决(解耦)配置文件方式使用注解单例模式实现方式1,懒汉式(线程不安全)2,懒汉式(线程安全)3,饿汉式4,双重校验锁机制(面)5,静态内部类6,枚举体现享元模式门面模式前提假设做一个需求，从文件中拿到数据并存在数据库中，文档有多种不同的类型，比如json,excel,csv等等。在做这个去求得在过程中，如何让
嵌入式硬件与应用篇---寄存器GPIO控制
在ARM架构中，通过32位寄存器控制GPIO（通用输入输出）的核心步骤和方法可分为以下几个关键环节，结合不同芯片的实现差异，具体操作需参考对应的数据手册：一、GPIO控制的核心步骤1.使能GPIO时钟必要性：多数ARM芯片的GPIO外设默认处于时钟关闭状态，需先通过时钟控制寄存器激活。示例：STM32F103（Cortex-M3）：使用RCC_APB2PeriphClockCmd函数使能对应GPI
C#区块链共识的3大必杀技：PoW、PoS、DPoS谁才是代码界的“链主”？墨瑾轩一起学学C#【二】c#区块链开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣**3大必杀技，让你的代码成为“链主”**必杀技1：工作量证明（PoW）——“算力擂台赛”问题：为什么比特币的“矿工”要疯狂算哈希？答案：因为他们在参与“算力擂台赛”！PoW核心逻辑：
从阻塞到异步：Java NIO与AIO的高性能网络编程实战全解析小张在编程网络 java nio
引言在高并发网络时代，传统BIO的“一个连接一个线程”模式早已力不从心——当万级连接涌来时，服务器线程池瞬间告急，资源耗尽的警报此起彼伏。JavaNIO与AIO的出现，如同为网络编程装上了“多线程调度器”和“异步引擎”：NIO用非阻塞机制化解并发瓶颈，让单线程管理千个连接成为可能；AIO则更进一步，通过事件回调实现真正异步，让程序在I/O等待时不再“干瞪眼”。本文将从原理到实战，带您揭开这两大高级
容器挂载传播模式学习岳来 #容器运维学习 k8s 容器挂载传播
在容器技术中，挂载传播模式（MountPropagationMode）定义了挂载点在主机和容器之间的传播行为。它决定了当主机或容器中的挂载点发生变化时，这些变化是否会影响到其他挂载点。挂载传播模式在多容器共享挂载、动态挂载更新等场景中非常重要。以下是挂载传播模式的详细解释及其分类：1.挂载传播模式的作用挂载传播模式主要用于控制挂载点的变化如何在主机和容器之间传播。例如：当主机上新增一个挂载点时，是
go build -gcflags 参数学习岳来 golang golang 学习开发语言
文章目录一、常用编译选项二、使用模式与包匹配规则三、应用场景与注意事项四、其他相关参数五、删除-gcflagsall=-N-l对构建的影响参考文档gobuild的-gcflags参数用于向Go编译器（gotoolcompile）传递额外选项，控制编译行为。其格式为-gcflags="[pattern=]arglist"，其中pattern定义作用范围，arglist是空格分隔的编译选项。以下是关键
使用 Simulink 来实现一个简化的电动汽车动力总成控制系统模型 xiaoheshang_123 手把手教你学 MATLAB 专栏 MATLAB 开发项目实例 1000 例专栏数据结构 simulink matlab
目录一、引言教程目标二、准备工作三、实现步骤详解✅步骤1：创建Simulink模型✅步骤2：添加电机与控制器模型✅步骤3：电池管理系统（BMS）✅步骤4：能量回收系统✅步骤5：连接各模块并设置仿真参数示例连线代码：设置仿真参数：✅步骤6：结果可视化✅步骤7：完整框图结构示意（文字版）四、运行仿真并测试效果五、结论与拓展方向✅本章收获：后续建议拓展方向：手把手教你学Simulink——电动车辆的动力
算法优化：前缀和+哈希表雨声敲敲，风声潇潇算法算法 java leetcode 性能优化哈希表
今天在leetcode上写到6952.统计趣味子数组的数目这道题的时候出现了超时问题，由此学习了前缀和+哈希表的方法。目前看到与此知识点相关的题目有如下：560.和为k的子数组，非常经典的前缀和+哈希表，可以从这一道题入手。6952.统计趣味子数组的数目，这道题比上一到稍微难一点，但是不至于困难。下面介绍一下前缀和+哈希表以560题为例，题目：给你一个整数数组nums和一个整数k，请你统计并返回该
hexo php推送百度,Hexo站点主动推送百度-基于Flow.ci 数数科技 hexo php推送百度
写在前面：下面是链接提交方式的对比：如何选择链接提交方式1、主动推送：最为快速的提交方式，推荐您将站点当天新产出链接立即通过此方式推送给百度，以保证新链接可以及时被百度收录。2、自动推送：最为便捷的提交方式，请将自动推送的JS代码部署在站点的每一个页面源代码中，部署代码的页面在每次被浏览时，链接会被自动推送给百度。可以与主动推送配合使用。3、sitemap：您可以定期将网站链接放到sitemap中
Three.js学习10：几何体（1）-平面几何体 stones4zd three.js 学习
-----------------------------华丽的分割线---------------------相关代码均已上传到gitee中：myThree:学习Three.js，努力加油~！Gitee静态演示地址：ThreeJS演示页面-----------------------------华丽的分割线---------------------一、几何体GeometryThree.js中物体
POS（权益证明机制） Chinatesila 区块链
由来：SunnyKing和ScottNadal首先建议使用权益证明作为工作量证明（PoW）的替代方案，并创造了权益一词。他们描述了一种算法，该算法根据个人钱包中代币的数量和年龄选择生产区块的节点。Peercoin（PPC）被创造出来，并成为第一个混合加密货币。PPC使用PoW分发令牌，并使用PoS验证交易。简介：权益证明机制的目的是让所谓的“权益者”、“锻造者”或者“验证者”来代替矿工，他们本质上
python-拆解sklearn中决策树 weixin_41177022 scikit-learn 决策树 python 机器学习编程
获取树结构实体对scikit-learn中DecisionTreeClassifier/Regressor的实例调用.tree_属性可以得到树结构。参考sklearn的决策树的官方说明sklearn.tree.DecisionTreeClassifier（不过里面说的help(sklearn.tree._tree.Tree)似乎不管用）获取决策树基本信息node总数可以用model.tree_.n
pos共识机制_共识机制：权益证明机制（POS） weixin_39737224 pos共识机制
原标题：共识机制：权益证明机制(POS)在区块链系统框架中，共识层提供了全网对交易和区块的共识，是接在区块链中产生信任的方法和机制。目前常用的共识机制有三种：ProofofWork工作量证明，简称PoW；ProofofStaked权益证明，简称Pos；DelegatedProofofStake授权股权证明，简称DPoS。其中，工作量证明PoW是比特币所用的共识机制，也是目前使用最广泛和成熟的共识机
baidusitemap.php,生成百度sitemap站点地图的php类墨墨张
简介：/**SiteMap接口类*/classSitemapActionextendsAction{privatestatic$baseURL='';//URL地址privatestatic$askMobileUrl='http://m.xxx.cn/ask/';//问答移动版地址privatestatic$askPcUrl="http://www.xxx.cn/ask/";//问答pc地址pri
Java爬虫实战指南：按关键字搜索京东商品爬虫程序猿 java 爬虫开发语言
在电商领域，快速获取商品信息对于市场分析、选品上架、库存管理和价格策略制定等方面至关重要。京东作为国内领先的电商平台之一，提供了丰富的商品数据。虽然京东开放平台提供了官方API来获取商品信息，但有时使用爬虫技术来抓取数据也是一种有效的手段。本文将介绍如何利用Java按关键字搜索京东商品，并提供详细的代码示例。一、准备工作（一）Java开发环境确保你的Java开发环境已经安装了以下必要的库：Jsou
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它