成长的小狮子

2022-02-09大数据学习日志——PySpark——Spark框架概述

前言部分：知识回顾及课程目标

[前言1]-大数据技术框架

整个大数据技术框架学习，可以划分为4个阶段：离线分析、内存分析、实时存储和实时分析。

# 第1部分、离线分析（Batch Processing）
	分布式协作服务框架Zookeeper
	大数据基础框架Hadoop（HDFS、MapReduce和YARN）
	大数据数仓框架Hive
	大数据辅助框架：FLUME、SQOOP、Oozie和Hue
	# 实战项目：亿品新零售


# 第2部分、内存分析（In-Memory Processing）
	Apache Spark（Environment环境、Core、SQL等），属于批处理，相比MapReduce快
		将分析数据封装到数据结构：RDD（分布式集合），类似Python中列表list，调用函数处理数据
	# 实战项目：一站制造项目或保险项目


# 第3部分、实时存储
	基于Key-Value内存数据Redis
	大数据NoSQL海量数据库HBase
	分布式消息队列Kafka
	# 实战案例：陌陌综合案例
	

# 第4部分、实时计算
	Apache Flink（实时流式计算框架，天猫双十一实时大屏）：Environment、DataStream和Table API & SQL
		数据流封装DataStream，调用函数处理
		Table API和SQL批处理和流计算
	# 实战项目：车联网项目或今日指数项目

[前言2]-Aapche Spark 学习安排

Apache Spark课程学习，从4个大方面，基于Python语言编程开发（又称为PySpark）。

# 第1方面、Basic Environment（基础环境）：
	Spark 框架安装部署及开发运行，如何在本地模式和集群模式运行，使用spark-shell及PyCharm开发应用程序，测试及打包提交运行集群。
	2天时间


# 第2方面、SparkCore（核心模块）
	数据结构RDD，所有数据封装，分布式集合，处理数据直接调用方法(函数)
	2天时间


# 第3方面、SparkSQL（交互式分析）
	结构化数据处理分析，将数据封装在DataFrame，调用API或者使用SQL分析数据；
	实际企业中使用最多的模块，提供丰富外部数据源
	2天时间

# 第4方面、Spark in Action（实战演练）
	基于Spark框架，进行海量数据分析处理，无论SQL语句还是DSL链式编程
	以案例贯彻，知识巩固
	1天时间

学习目标

Spark第1天，主要学习配置Spark 基础环境
框架概述、快速入门（本地模式）和Standalone 集群
1、Spark 框架概述
2、Spark 快速入门
3、Standalone 集群

Apache Spark是一种闪电般的群集计算技术，专为快速计算而设计。它基于Hadoop MapReduce，它扩展了MapReduce模型以便将其用于更多类型的计算，其中包括交互式查询和流处理。Spark的主要特点是其内存集群计算，可提高应用程序的处理速度。

Spark是Hadoop在2009年在UC Berkeley的Matei Zaharia的AMPLab中开发的子项目之一。它是在2010年根据BSD许可开放源代码。它于2013年捐赠给Apache软件基金会，2014年2月成为顶级Apache项目。

官网：http://spark.apache.org/

01_Spark 风雨十年 [了解]

Apache Spark是一个开源的类似于Hadoop MapReduce的通用的并行计算框架，Spark基于map reduce算法实现的分布式计算，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Spark中的Job中间输出和结果可以保存在内存中，从而不再需要频繁读写磁盘，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。

2009年Spark诞生于伯克利AMPLab，伯克利大学的研究性项目
2010年通过BSD 许可协议正式对外开源发布
2012年Spark第一篇论文发布，第一个正式版（Spark 0.6.0）发布
2013年Databricks公司成立并将Spark捐献给Apache软件基金会
2014年2月成为Apache顶级项目，同年5月发布Spark 1.0正式版本
2015年引入DataFrame大数据分析的设计概念
2016年引入DataSet更强大的数据分析设计概念并正式发布Spark2.0
2017年Structured streaming 发布，统一化实时与离线分布式计算平台
2018年Spark2.4.0发布，成为全球最大的开源项目
2019年11月Spark官方发布3.0预览版
2020年6月Spark发布3.0.0正式版

Aapche Spark 是一种快速、通用、可扩展的大数据分析引擎，2009 年诞生于加州大学伯克利分校 AMPLab，2010 年开源， 2013年6月成为Apache孵化项目，2014年2月成为 Apache 顶级项目，用 Scala进行编写项目框架。

从世界著名的开发者论坛，Stack Overflow的数据可以看出，2015年开始Spark每月的问题提交数量已经超越Hadoop，而2018年Spark Python版本的API PySpark每月的问题提交数量也已超过Hadoop。2019年排名Spark第一，PySpark第二；而十年的累计排名是Spark第一，PySpark第三。按照这个趋势发展下去，Spark和PySpark在未来很长一段时间内应该还会处于垄断地位。

从 GitHub 的数据中可以看到，在 Apache 的所有开源项目中，Spark 的关注度排名第 4（前三位分别是前端可视化框架ECharts、 RPC 服务框架 Dubbo 和可视化平台 Superset），在所有大数据处理技术中排名第 1。

github网站：https://github.com/search?o=desc&q=apache&s=stars&type=Repositories

02_Spark概念及特点 [理解]

Apache Spark是用于大规模数据（large-scala data）处理的统一（unified）分析引擎。

# 官方定义：轻量级lightning、快速fast、大数据和机器学习bigdata&ml、统一分析引擎

1、Apache Spark 官网：http://spark.apache.org/

2、Databricks 官网：https://databricks.com/spark/about

Aapche Spark 是一种快速、通用、可扩展的大数据分析引擎，基于内存分析数据，可以处理任何类型业务分析。

# 1、分析引擎（计算引擎）
	分析处理数据，类似MapReduce框架(分布式处理框架，分而治之思想)

# 2、大规模数据
	海量数据，数据很多，多数据源（存储在任何地方数据）
	
# 3、统一的分析引擎
	离线分析
	实时计算
	机器学习
	图形计算
	科学计算
	
# 4、分布式并行计算
	分而治之思想，与MapReduce计算思想完全一致

Spark具有运行速度快、易用性好、通用性强和随处运行等特点。http://spark.apache.org/

Batch/Streaming data：统一化离线计算和实时计算开发方式，支持多种开发语言
SQL analytics：通用的SQL分析快速构建分析报表，运行速度快于大多数数仓计算引擎
Data science at scale：大规模的数据科学引擎，支持PB级别的数据进行探索性数据分析
Machine learning：支持在笔记本电脑上训练机器学习算法，并使用相同的代码扩展到数千台机器的集群

Spark编程支持5种语言：Java、Scala、Python、R及SQL，满足各种分析需求，目前Python语言全球最多

Spark框架中，最核心要点：抽象，称为RDD，相当于集合，比如列表List，存储数据

Spark程序无处不在运行【Runs Everywhere】

1、数据存储

Spark分析的数据在哪里？任何地方都是可以，最主要还是HDFS、Hive、HBase、Kafka等等
2、程序运行

Spark 编程代码，在何处执行，分析数据？？

本地模式、集群模式【Hadoop YARN、Mesos、Standalone】、容器（K8s）

03_Spark vs MapReduce [掌握]

2014 年的时候Benchmark测试中，Spark 秒杀Hadoop，在使用十分之一计算资源的情况下，相同数据的排序上，Spark 比Map Reduce快3倍！

Spark处理数据与MapReduce处理数据相比，有如下两个不同点：

其一、Spark处理数据时，可以将中间处理结果数据存储到内存中；

其二、Spark Job调度以DAG（有向无环图）方式，并且每个任务Task执行以线程（Thread）方式，并不是像MapReduce以进程（Process）方式执行。

Spark是一个通用的DAG引擎，使得用户能够在一个应用程序中描述复杂的逻辑，以便于优化整个数据流，并让不同计算阶段直接通过本地磁盘或内存交换数据，而不是像MapReduce那样需要通过HDFS。

下面左图是MapReduce生成的DAG数据流，右图是Spark生成的DAG数据流。

Spark 与 MapReduce 比较：Spark 为什么比MapReduce计算要快？

比较方面	MapRedue 计算引擎	Spark 计算引擎
1、Job 程序结构	1 个Map Stage + 1个 Reduce Stage	构架DAG图，多个Stage 多个Map Stage + 多个Redue Stage
2、中间结果存储	本地磁盘Disk	没有Shuffle时，存储内存Memory
3、Task 运行方式	进程Process：MapTask 和Reduce Task	线程Thread：Task，无需频繁启动和销毁
4、程序编程模型	直接读取文件数据，map + reduce	文件数据封装：RDD，调用函数处理

04_Spark 框架模块 [了解]

整个Spark 框架模块包含：Spark Core、 Spark SQL、 Spark Streaming、 Spark GraphX、Spark MLlib，而后四项的能力都是建立在核心引擎之上。

# 1、最核心，最基础
	SparkCore【★★★★★】：RDD 数据结构，分布式集合，目前理解为列表list=[1,2,3,4]

# 2、四大公共模块
	SparkSQL【★★★★★★★★★★】：使用最多模块，提供SQL和DSL编程分析数据
	SparkStreaming：流式计算
	GraphX：图形计算
	MLlib：机器学习库
	
# 3、高级分析模块
	PySpark：基于Python语言编程
	SparkR：基于R语言编程

# 4、新的模块：从Spark 2.0开始
	Structured Streaming：针对流式数据处理模块，官方推荐使用

05_Spark 应用组成 [掌握]

5.1 每个MapReduce运行时（比如运行YARN集群），由2部分组成：

（1）MRAppMaster：MapReduce应用程序管理者，负责申请资源，调度任务执行和监控等；

（2）MapTask或ReducetTask：要么是处理数据任务MapTask，要么是聚合数据任务ReduceTask；

5.2 每个Spark 应用运行在集群上时，有2部分组成：Driver和Executors

（1）Driver Program

（2）Executors

06_Spark运行模式 [了解]

Spark 框架编写的应用程序可以运行在本地模式（Local Mode）、集群模式（Cluster Mode）和云端（K8s），方便开发测试和生产部署。基于当前最新版本：Spark-3.1.2 版本学习。

6.1 本地模式：`Local Mode`，

在当前操作系统，启动1个JVM 进程，指定最多同时运行Task任务数目，以线程Thead方式运行Task任务

当Spark程序运行在本地模式时，设置最多同时运行几个Task：--master local[K]，其中K含义

其一、表示并行Task数目；
其二、表示线程数目（每个Task任务以线程Thread方式运行）；
其三、表示虚拟CPU Cores核数（在Spark程序运行时，1个Task任务，需要1Core CPU）

6.2 集群模式：`Cluster Mode`

以Standalone集群和YARN集群为例讲解

在实际项目中，Spark 应用程序运行最多集群模式：Hadoop YARN。

# 1、Hadoop YARN集群模式（生产环境使用）：
	运行在 YARN 集群之上，由 YARN 负责资源管理，Spark 负责任务调度和计算
	好处：计算资源按需伸缩，集群利用率高，共享底层存储，避免数据跨集群迁移。
	
# 2、Spark Standalone集群模式（开发测试及生成环境使用）：
	类似Hadoop YARN架构，典型的Mater/Slaves模式，使用Zookeeper搭建高可用，避免Master是有单点故障的。
	
# 3、 Apache Mesos集群模式（国内使用较少）：
	运行在 Mesos 资源管理器框架之上，由 Mesos负责资源管理，Spark 负责任务调度和计算。

6.3 云端服务：`Kubernetes` 模式

中小公司未来会更多的使用云服务，Spark 2.3开始支持将Spark 开发应用运行到K8s上。

Gradio全解10——Data Science And Plots：数据科学与绘图龙焰智能 Gradio全解教程 Gradio Plots Data Science Datatime filters eventlistner 交互式绘图聚合绘图
Gradio全解10——DataScienceAndPlots：数据科学与绘图前言本篇摘要10.DataScienceAndPlots：数据科学与绘图10.1API参数10.1.1PlotAPI参数10.1.2EventListenersAPI参数10.2Plots绘图示例10.2.1常用绘图示例1.使用pd.Dataframe绘图2.添加Color并划分系列值3.AggregatingValue
LabVIEW调用Excel宏实现数据可视化 LabVIEW开发 LabVIEW知识 LabVIEW参考程序 LabVIEW知识 LabVIEW程序 LabVIEW功能
通过LabVIEW的ActiveX接口，调用Excel应用程序，实现打开指定Excel工作簿并运行其中宏（如“GraphData”宏），将工作表数据以图表形式展示。通过ActiveX自动化技术，打通LabVIEW与Excel交互通道，让Excel的数据可视化能力为LabVIEW程序所用。内容功能组件交互：利用LabVIEW的ActiveX节点，先创建Excel_Application对象并控制其可
算法备案 | 算法备案必要性、算法类型、备案流程极创信息人工智能 AIGC
一、进行算法备案的必要性在当今的数字化时代，算法已经广泛应用于各个行业，引起了监管部门的高度关注，因为算法产品可能会带来一些潜在的风险。为了规范互联网信息服务中的算法推荐活动，抵制诸如深度生成合成、算法歧视、“大数据杀熟”、诱导沉迷等不合理应用，各个国家都先后出台了一系列关于算法管理的法律法规。在我国，《数据安全法》、《个人信息保护法》、《互联网信息服务算法推荐管理规定》等法律法规明确对算法的使用
集装箱智慧通关系统如何用AI技术重塑物流效率？
在全球贸易和物流高速发展的今天，港口、物流园区及企业的闸口管理面临巨大挑战——如何提升通关效率、保障货物安全并降低运营成本？集装箱智慧通关系统依托先进的AI视觉识别、物联网及大数据技术，为行业提供了智能化解决方案。核心技术：AI视觉+物联网赋能传统闸口依赖人工核验集装箱号、车辆信息，效率低且易出错。而智慧通关系统通过高精度摄像头+AI算法，可自动识别集装箱编号、货车车牌、货物类型等关键信息，准确率
python连接db2的官方库ibm_db的api 数据-脚本-资源-管道 ibm-db python 数据库 python
IBM_DBAPI详细文档ibm_db.active描述检查指定的数据库连接是否处于活动状态传入参数connection:有效的数据库连接资源返回值True:资源处于活动状态False:资源未处于活动状态例子importibm_dbconn=ibm_db.connect("DATABASE=testdb;HOSTNAME=localhost;PORT=50000;PROTOCOL=TCPIP;UI
LabVIEW键盘鼠标监测控制 LabVIEW开发 LabVIEW知识 LabVIEW参考程序 LabVIEW设备控制 LabVIEW知识 LabVIEW程序 LabVIEW功能
通过InputDeviceControlVIs，实现对键盘和鼠标活动的监测。通过AcquireInputDataVI在循环中持续获取输入数据，InitializeKeyboard与InitializeMouseVIs先获取设备ID引用，用于循环内监测操作；运行时可输出按键信息（KeysPressed）、鼠标水平/垂直位置（Horizontal/VerticalMousePosition）、鼠标按键
MySQL语句执行流程 xinghaoyan mysql 数据库
MySQL逻辑架构连接器连接命令一般是这么写的mysql-h$ip-P$port-u$user-p那么什么是连接器？MySQL连接器（MySQLConnector）是用于连接和与MySQL数据库进行交互的驱动程序。它提供了与MySQL数据库服务器通信的功能，包括建立连接、执行查询、更新数据等。MySQL提供了多种连接器，常用的有以下几种：JDBC连接器：JDBC（JavaDatabaseConne
Mysql（SaaS）数据库设计 it_1234 SAAS MySQL 设计模式数据结构 Oracle
MyISAM存储引擎MyISAM是默认存储引擎。它基于更老的ISAM代码，但有很多有用的扩展。（注意MySQL5.1不支持ISAM）。每个MyISAM在磁盘上存储成三个文件。第一个文件的名字以表的名字开始，扩展名指出文件类型。.frm文件存储表定义。数据文件的扩展名为.MYD(MYData)。索引文件的扩展名是.MYI(MYIndex)。要明确表示你想要用一个MyISAM表格，请用ENGINE表选
概述-1-数据库的相关概念 He.ZaoCha MySQL 数据库 mysql
数据库的相关概念用户通过SQL操作数据库管理系统，再通过数据库管理系统操作数据库以及数据库中的数据。数据库数据库是存储数据的仓库,数据是有组织的进行存储,DataBase简称（DB）数据库管理系统操纵和管理数据库的大型软件,DataBaseManagementSystem简称（DBMS）主流的关系型数据库管理系统DB-EnginesRanking根据数据库管理系统的受欢迎程度对其进行排名。排名每月
error: F:\car\dataset\cocoapi-master\pycocotools\_mask.pyx canpian7 python模块安装 cocos
问题描述error:F:\car\dataset\cocoapi-master\pycocotools_mask.pyx安装cocoapi时出现报错代码路径cocoapi当执行pythonPythonAPI\setup.pybuild_extinstall报错runningbuild_extcythoningpycocotools/_mask.pyxtopycocotools_mask.cerro
从单一设备到万物互联：鸿蒙生态崛起的未来之路王子良. 经验分享 harmonyos 华为
目录一、引言：开启智能时代的钥匙二、鸿蒙生态概述：跨设备协同的核心价值三、开发者机遇与挑战：抓住鸿蒙崛起的机会四、鸿蒙生态崛起的前景：万物互联的未来五、开发者在鸿蒙生态中的实践机遇与挑战1.跨设备开发的机遇2.与人工智能和物联网结合的创新空间3.持续创新与生态完善的挑战六、鸿蒙生态未来的多维发展：智能硬件与大数据的深度结合1.智能硬件与大数据的结合2.在智能家居与城市管理中的应用3.行业领域的深度
华为数通认证：适合谁的技术进阶之路？博睿谷IT99_ 华为服务器运维
在当今高度互联的世界里，数据通信网络构成了信息流动的基石。华为数通认证（HuaweiCertifiedICTAssociate/Professional/Expert-Datacom）正是华为公司推出的、针对数据通信网络领域构建、运维与优化的专业能力认证体系。一、划分三个层级，为不同阶段的从业者提供进阶路径1.HCIA-Datacom(华为认证ICT工程师-数据通信)：基础起点。聚焦于中小型网络的
遥感云大数据在灾害、水体与湿地领域典型案例实践及GPT模型应用科研的力量生态遥感双碳 chatgpt GEE 卫星遥感数据
以EarthEngine（GEE）、PIE-Engine为代表全球尺度地球科学数据（尤其是卫星遥感数据）在线可视化计算和分析云平台应用越来越广泛。GEE平台存储和同步遥感领域目前常用的MODIS、Landsat和Sentinel等卫星影像、气候与天气、地球物理等方面的数据集超过80PB，同时依托全球上百万台超级服务器，提供足够的运算能力对这些数据进行处理。相比于ENVI等传统的遥感影像处理工具，G
JavaScript 异步编程的几种方式
在JavaScript中，异步编程是处理延迟操作（如网络请求、文件读写等）的关键技术，确保用户界面保持响应同时处理后台任务。以下是几种主要的异步编程解决方案，包括示例代码：1.回调（Callback）简介：最早的异步处理方式，通过将一个函数（回调函数）作为参数传递给另一个函数，在异步操作完成后执行回调。示例代码：functionfetchData(callback){setTimeout(()=>
SeaTunnel 社区月报（5-6 月）：全新功能上线、Bug 大扫除、Merge 之星是谁？数据库
在5月和6月，SeaTunnel社区迎来了一轮密集更新：2.3.11正式发布，新增对Databend、Elasticsearch向量、HTTP批量写入、ClickHouse多表写入等多个连接器能力，全面提升了数据同步灵活性。同时，近100个修复与优化PR合入，涵盖Spark引擎并行性修复、Paimon精度兼容性增强、Mongo-CDCExactlyOnce默认值优化、OracleDDL类型支持补全
spark数据处理练习题番外篇【上】
一.单选题（共23题，100分）1.(单选题)maven依赖应该加在哪个文件中？A.pom.xmlB.log4j.propertiesC.src/main/scala.resourceD.src/test/scala.resource正确答案:A:pom.xml;Maven依赖应该添加在pom.xml文件中，这是Maven项目的核心配置文件。解释：pom.xml(ProjectObjectMode
**基于Python的数据分析与机器学习实战教程****一、引言**随着大数据时代的到来，数据处理和分析能力已经成为现代软件开发人员的必备技能之一。Python作为一种高效、简洁且功能丰富的编程语言， 2401_89451588 python 数据分析机器学习
基于Python的数据分析与机器学习实战教程一、引言随着大数据时代的到来，数据处理和分析能力已经成为现代软件开发人员的必备技能之一。Python作为一种高效、简洁且功能丰富的编程语言，在数据分析领域得到了广泛的应用。本文将介绍如何使用Python进行数据分析，并结合机器学习算法实现数据驱动的应用。二、Python基础首先，我们需要掌握Python的基本语法和常用的库。Python的语法简洁易懂，上
深入了解大数据领域Zookeeper的ACL权限管理 AGI大模型与大数据研究院大数据 zookeeper wpf ai
深入了解大数据领域Zookeeper的ACL权限管理关键词：Zookeeper、ACL权限管理、大数据安全、分布式系统、访问控制、权限模型、数据保护摘要：本文深入探讨了Zookeeper中的ACL(AccessControlList)权限管理系统。作为分布式协调服务的核心组件，Zookeeper的ACL机制对于保障大数据环境中的数据安全至关重要。文章将从基础概念出发，详细解析ZookeeperAC
微信小程序实现下拉刷新首页数据、上拉加载下一页数据花铛微信小程序微信小程序
下拉刷新首页数据：使用页面的下拉，刷新首页数据：首先需要在页面对应的JSON文件中配置"enablePullDownRefresh":true。然后在页面对应的JS文件中使用微信小程序提供的onPullDownRefresh(){}监听用户下拉动作。//本质是获取首页的数据onPullDownRefresh(){this.setData({pageNum:1},this.getList)},get
场景题：有40亿个QQ号如何去重？仅1GB内存卷福同学社招面试面试阿里云京东云 java
场景题也有一些套路可以考虑，比如去重、判断给定数据是否存在1.大数据去重1.1现在有40亿个QQ号如何去重？仅1GB内存参考链接：https://juejin.cn/post/7396332696660131849介绍2种方法：Bitmap和布隆过滤器方法一：Bitmap首先介绍下什么是位图Bitmap位图是使用bit数组表示的，它只存储0或者1，因此我们可以把全部的QQ号放到位图中，当index
04_MySQL 通过 Docker 在同一个服务器上搭建主从集群（一主一从）耀耀_很无聊【实施】实施日记 mysql docker 服务器
04_MySQL通过Docker在同一个服务器上搭建主从集群（一主一从）准备工作1.拉取MySQL镜像bash复制编辑dockerpullmysql:8.0.262.创建主从配置目录bash复制编辑mkdir-p/root/mysql/master/confmkdir-p/root/mysql/master/datamkdir-p/root/mysql/master/mysql-filesmkdi
极海G32R501双向数字电源解决方案赋能AI服务器及电源应用创新 Geehy极海半导体产品方案人工智能微型逆变器 AI服务器电源光储充
6月26日，Big-Bit商务网主办的2025中国电子热点解决方案创新峰会在东莞召开，峰会以“核心智变、能效跃迁”为主题，聚焦光储充、800V超充、AI服务器、BMS、智能汽车照明与汽车中小电机电控应用。峰会期间，珠海极海半导体有限公司（以下简称“极海”）携芯片级解决方案亮相现场展区，包含：48V/50A双向电源、800W一拖二微型逆变器、低压无感双电机、交流充电桩、UPS电源、6.6kW双向OB
KAIST数据集及使用草莓奶忻 SLAM基础 #SLAM数据集 ubuntu
文章目录KAIST复杂城市数据集KAIST数据集转换为rosbag1.将.gz.tar文件解压到其文件夹中2.克隆并构建此存储库3.使用路径和所需主题编辑配置文件4.为每种传感器类型创建一个rosbag文件5.将所有bag合并为一个参考KAIST复杂城市数据集KAIST-Urban-数据集-论文阅读数据集下载：ComplexUrbanDataset复杂城市数据集KAIST数据集转换为rosbag1
深度剖析数据中台：大数据领域的核心技术架构大数据洞察大数据架构 java ai
深度剖析数据中台：大数据领域的核心技术架构关键词：数据中台、大数据、核心技术架构、数据治理、数据服务摘要：本文旨在对数据中台这一大数据领域的核心技术架构进行深度剖析。首先介绍了数据中台的背景，包括其目的、适用读者、文档结构和相关术语。接着阐述了数据中台的核心概念、原理和架构，通过文本示意图和Mermaid流程图进行直观展示。详细讲解了核心算法原理及具体操作步骤，并结合Python源代码进行说明。引
Emgu-WPF 激光雷达研究-绘制雷达图 DuelCode WPF c#Emgu 激光雷达雷达图
硬件：HokuyoURG04LX环境：VS2017-win10-64Emgu_3.2.0.2682语言：C#WPF数据解析参考：https://sourceforge.net/p/urgnetwork/wiki/Home/https://github.com/bqhdev/urg04lx_data_decoderhttp://sourceforge.net/projects/urgnetwork/
设计哈希集合【set】【拉链法】【位运算法】【定长拉链法】 - 哈希表本质深度解析 weixin_47868976 哈希算法散列表算法
LeetCode705设计哈希集合-哈希表本质深度解析题目描述设计一个哈希集合（HashSet），不使用任何内建的哈希表库，实现以下操作：add(key):向哈希集合中插入值keyremove(key):将给定值key从哈希集合中删除contains(key):返回哈希集合中是否存在这个值key数据范围:0data;public:MyHashSet(){//10^6+1大小的数组，key直接作为索
2025年全球数据安全发展趋势 jinan886 人工智能大数据安全数据分析
随着云计算、大数据、人工智能等技术的迅猛发展，数据已成为驱动经济社会发展的关键生产要素。然而，数据泄露、网络攻击等安全事件频发，给个人隐私、企业利益乃至国家安全带来了前所未有的挑战。全球数据安全发展趋势正随着技术进步和威胁演变而不断变化，以下是主要趋势：1.数据隐私法规加强GDPR（欧盟《通用数据保护条例）和CCPA（加州消费者隐私法案）等法规推动了全球对数据隐私的重视，更多国家和地区正在制定或更
近百万奖金！2024 Web3.0 创新大赛重磅来袭！ DataFountain数据科学 web3 数据竞赛大数据人工智能
10月30日，中国互联网协会与香港Web3.0协会共同组织举办的2024Web3.0创新大赛在上海举行启动会，宣布大赛正式在DataFountain竞赛平台（简称DF平台，http://www.datafountain.cn）启动上线。大赛面向社会各界征集参赛团队，不限年龄、国籍，高校、科研院所、企业人员均可参赛！两大赛区，六大赛道，近百万奖金，你不来吗：https://www.datafount
使用Chaindesk进行简单高效的文档检索 2501_92325368 langchain
##技术背景介绍Chaindesk是一个开源的文档检索平台，它帮助将个人数据与大型语言模型结合起来，实现高效的信息搜索和数据分析。Chaindesk的核心功能是通过创建数据存储库(datastore)并与大型语言模型进行交互，以提供快捷准确的文档检索能力。##核心原理解析Chaindesk通过一种称为Retriever的组件实现数据检索。Retriever可以与不同的数据存储库进行交互，拉取相关文
机器学习在智能仓储中的应用：库存管理与物流优化 Blossom.118 机器学习与人工智能机器学习人工智能深度学习机器人 sklearn tensorflow cnn
最近研学过程中发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。随着电子商务的蓬勃发展，仓储和物流行业面临着前所未有的挑战和机遇。智能仓储通过整合先进的信息技术，如物联网（IoT）、大数据和机器学习，能够实现从货物入库到出库的全流程
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持