E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop离线基础总结
离线
MC强化学习算法(1)
文章目录1.理解
离线
MC强化学习的关键2.什么是重要性采样3.重要性采样定理给我们的一般启示4.重要性采样定理给
离线
蒙特卡洛强化学习的启示1.理解
离线
MC强化学习的关键
离线
强化学习的特点是采样策略π′≠
中年阿甘
·
2024-01-23 10:00
我的强化学习笔记
重要性采样
离线MC强化学习
大数据分布式实时大数据处理框架Storm,入门到精通!
介绍:Storm是一个分布式实时大数据处理框架,被业界称为实时版的
Hadoop
。首先,Storm由Twitter开源,它解决了
Hadoop
MapReduce在处理实时数据方面的高延迟问题。
知识分享小能手
·
2024-01-23 09:42
学习心得体会
大数据
大数据
分布式
storm
记录 aarch 平台,python3 导包失败的解决:Couldnot find lib geos_c or load any of its variants ‘libgeos_c.so‘
记录aarch平台,python3导包失败的解决步骤背景:
离线
安装了aarch平台的python3的Shapely==1.7.1的安装包,线上import的时候老是失败,把libgeos_c.so也都复制到相应文件夹了
BelieveOF
·
2024-01-23 09:38
Linux
后端
linux
大数据开发之Spark(入门)
第1章:Spark概述1.1什么是spark回顾:
hadoop
主要解决,海量数据的存储和海量数据的分析计算。spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。
Key-Key
·
2024-01-23 09:45
大数据
spark
分布式
Sqoop与Kafka的集成:实时数据导入
Sqoop用于将数据从关系型数据库导入到
Hadoop
生态系统中,而Kafka则用于数据流的传输和处理。
晓之以理的喵~~
·
2024-01-23 08:01
sqoop
sqoop
kafka
hadoop
Hadoop
基本介绍
1、
Hadoop
的整体框架
Hadoop
由HDFS、MapReduce、HBase、Hive和ZooKeeper等成员组成,其中最基础最重要元素为底层用于存储集群中所有存储节点文件的文件系统HDFS(
Hadoop
DistributedFileSystem
w蕾丝
·
2024-01-23 08:53
Sqoop数据导入到Hive表的最佳实践
Sqoop是一个开源工具,用于在
Hadoop
生态系统中的数据存储(如HDFS)和关系型数据库之间传输数据。它可以帮助数据工程师和分析师轻松地
晓之以理的喵~~
·
2024-01-23 07:35
sqoop
hive
sqoop
hadoop
【GitHub项目推荐--一个语音机器人项目】【转载】
上图是悟空机器人的功能模块图,悟空机器人包含众多模块,比如智能家居、闲聊、运程控制、技能、NLU、
离线
唤醒等等。闲聊模块:悟空机器人接入了图灵机器人
旅之灵夫
·
2024-01-23 07:30
GitHub项目推荐
机器人
网络安全全栈培训笔记(55-服务攻防-数据库安全&Redis&
Hadoop
&Mysqla&未授权访问&RCE)
第54天服务攻防-数据库安全&Redis&
Hadoop
&Mysqla&未授权访问&RCE知识点:1、服务攻防数据库类型安全2、Redis&
Hadoop
&Mysql安全3、Mysql-CVE-2012-2122
清歌secure
·
2024-01-23 07:24
网络安全全栈学习笔记
web安全
笔记
redis
网络
安全
持久化存储---Sqlite的初步认识
foxy/p/7725010.html目录无标题.png问题&解惑问题1:为什么要用到sqlite这种本地数据库答案:结构化的大量数据存储的最好方式就是数据库形式,而现在的app为了给用户好的体验(主要是
离线
模式
pgydbh
·
2024-01-23 06:47
Yarn 安装和使用教程
它的主要特性有
离线
模式
m0_60092917
·
2024-01-23 06:27
数仓建设 - 维度建模 - DIM维度
2.2ETL任务脚本三、活动维度表3.1表结构设计3.2ETL任务脚本四、地区维度表4.1表结构设计4.2ETL任务脚本五、日期维度表六、用户维度表6.1表结构设计6.2ETL任务脚本前置:准备数据库[
hadoop
m0_46218511
·
2024-01-23 05:14
大数据基础设施搭建
维度建模
数据仓库
flask
离线
安装到linux服务器
现将flask
离线
安装的步骤记录如下,以作备忘。
fufufunny
·
2024-01-23 03:18
Python
flask
Hadoop
-- Hive
文章目录1.什么是hive?1.1基本思想1.2为什么使用hive?1.3hive创建表与查询原理2.hive安装2.1.mysql安装2.2.hive的元数据库配置3.hive使用方式3.1最基本使用方式3.2启动hive服务使用3.3脚本化运行4.建库建表与数据导入4.1建库4.2建表4.2.1基本建表语句4.2.2删除表4.2.3内部表与外部表4.2.4分区表4.2.5外部分区表4.3数据导
Cool_Pepsi
·
2024-01-23 02:12
大数据
hive
Spark运行流程
Spark相对于
Hadoop
的优势
Hadoop
虽然已成为大数据技术的事实标准,但其本身还存在诸多缺陷,最主要的缺陷是其MapReduce计算模型延迟过高,无法胜任实时、快速计算的需求,因而只适用于
离线
批处
Cool_Pepsi
·
2024-01-23 02:12
大数据
spark
Hadoop
-- HDFS
1.什么是
Hadoop
hadoop
中有3个核心组件:分布式文件系统:HDFS——实现将文件分布式存储在很多的服务器上分布式运算编程框架:MAPREDUCE——实现在很多机器上分布式并行运算分布式资源调度平台
Cool_Pepsi
·
2024-01-23 02:42
大数据
hdfs
hadoop
Hadoop
-- ZooKeeper
ZooKeeper就是动物园管理员,他是用来管
hadoop
(大象)、Hive(蜜蜂)等的管理员。
Cool_Pepsi
·
2024-01-23 02:42
大数据
zookeeper
闲置不用的旧手机也有大用处,我教你变废为宝
在手机上安装主流的免费导航地图应用程序,只要提前下载好
离线
地图,就算不上网也能帮你精
_飞鱼
·
2024-01-23 00:41
AndroidStudio使用本地
离线
Gradle
将下载好的gradle-x.x-all.zip放到用户目录下的.gradle/wrapper/dists/gradle-x.x-all/***/中***是一串字符串的文件夹清空后把gradle-x.x-all.zip放进去之后不要解压!!!,as会自动解压windows下路径c:\user\你的用户.gradle\wrapper\distLinux下路径/home/用户名/.gradle/wrap
是昵称呀
·
2024-01-23 00:13
linux常用基础命令
echo命令输出内容重定向符文件持续跟踪vi\vim编辑器的三种工作模式vi\vim删除当前行vi\vim撤销安装/卸载校准时间1.查看防火墙状态2.关闭防火墙3.永久关闭防火墙4.安装软件5.卸载软件6.
离线
安装
脚大江山稳
·
2024-01-22 22:38
linux
运维
服务器
linux检查是否安装了rzsz,linux安装rzsz(lrzsz)
(1)在线安装yum-yinstalllrzsz上传文件rz下载文件szxxx.txt(2)
离线
安装下载安装包:https://ohse.de/uwe/software/lrzsz.htmltar-zxvflrzsz
weixin_39844901
·
2024-01-22 22:23
Java Activiti 工作流引擎 springmvc SSM 流程审批 后台框架源码
即时通讯:支持好友,群组,发图片、文件,消息声音提醒,
离线
消息,保留聊天记录(即时聊天功能支持手机端,详情下面有截图)工作流模块-------------------------------------
开心漠少君
·
2024-01-22 21:30
CDH6.2 集群
离线
部署
文章目录CDH6.2集群
离线
部署服务器集群节点角色规划系统环境准备cm-server配置ssh免密码登录认证在cm-server服务器上下载CDH6.2相关的安装包安装nginx做cm本地yumrepo
那些、快乐。
·
2024-01-22 21:44
大数据
hadoop
linux
hadoop
搭建服务器
一、服务器配置说明1.四台服务器2.每台服务器内存4G3./boot空间3072M4.【可选择配置】/swap交互虚拟内存,40965./根目录空间57G二、服务器网络选择配置1.选择NAT链接网络/桥接2.编辑~/.bashrc文件vim~/.bashrcexportall_proxy=socks5://192.168.197.2:21881exporthttp_proxy=http://192
成_7b38
·
2024-01-22 20:47
Hadoop
RPC解析
网络通信模块是分布式系统中最底层的模块。它直接支撑了上层分布式环境下复杂的进程间通信(Inter-ProcessCommunication,IPC)逻辑,是所有分布式系统的基础。远程过程调用(RemoteProcedureCall,RPC)是一种常用的分布式网络通信协议。它允许运行于一台计算机的程序调用另一台计算机的子程序,同时将网络的通信细节隐藏起来,使得用户无须额外地为这个交互作用编程。由于R
tracy_668
·
2024-01-22 19:51
hadoop
之mapreduce教程+案例学习(一)
第1章MapReduce概述目录第1章MapReduce概述1.1MapReduce定义MapReduce是一个分布式运算程序的编程框架,是用户开发“基于
Hadoop
的数据分析应用”的核心框架。
菜瓜技术联盟
·
2024-01-22 19:04
Hadoop
mapreduce
hadoop
Minimum Array(在线+贪心map /
离线
+扫描线思想+区间删除)
题目长为n(n#include#include#include#includeusingnamespacestd;#definerep(i,a,b)for(inti=(a);i=(b);--i)typedeflonglongll;typedefdoubledb;typedefpairP;#definefifirst#definesesecond#definepbpush_back#definedb
Code92007
·
2024-01-22 19:01
#
线段树/树状数组
思维题
贪心
离线
扫描线思想
区间删除
在线
贪心
Impala:基于内存的MPP查询引擎
Impala的特点1.3、Impala与Hive1、Impala概述1.1、Impala简介Impala是Cloudera公司主导研发的高性能、低延迟的交互式SQL查询引擎,它提供SQL语义,能查询存储在
Hadoop
对许
·
2024-01-22 17:26
Java大数据
#
Hadoop及生态圈
#
数据湖仓
大数据
Hadooop和Hbase是什么关系
HBase是一个基于
Hadoop
的NoSQL分布式列存储数据库,用于存储海量结构化和半结构化数据,并提供高可用、高性能和面向列的操作功能。
wwwyx12138
·
2024-01-22 17:50
hbase
数据库
大数据
大数据平台的硬件规划、网络调优、架构设计、节点规划
1.大数据平台硬件选型要对
Hadoop
大数据平台进行硬件选型,首先需要了解
Hadoop
的运行架构以及每个角色的功能。
小枫@码
·
2024-01-22 17:18
大数据架构师
大数据
数据湖技术之Paimon
社区希望能够将Flink的Streaming实时计算能力和Lakehouse新架构优势进一步结合,推出新一代StreamingLakehouse技术,促进数据在数据湖上真正实时流动起来,并为用户提供实时
离线
一体化的开发体验
小枫@码
·
2024-01-22 17:48
数据湖
大数据
Nginx之Centos7安装及配置代理多个后端服务
Nginx之Centos7安装文章目录Nginx之Centos7安装1.
离线
安装1.下载2.安装依赖3.编译并安装4.启动5.访问6.访问出现403问题处理7.80端口代理多个后端服务2.Nginx常用命令
小袁搬码
·
2024-01-22 15:49
nginx
运维
centos
hadoop
-hdfs-API
处理
hadoop
配置文件及系统环境1.将
hadoop
所有jar包(除了..以外)添进
hadoop
/lib文件夹备用。2.将linux的
hadoop
/bin导出覆盖windows的
hadoop
/bin。
有七段变化
·
2024-01-22 15:43
Apache doris Datax DorisWriter扩展使用方法
DataX是阿里云DataWorks数据集成的开源版本,在阿里巴巴集团内被广泛使用的
离线
数据同步工具/平台。
张家锋
·
2024-01-22 15:27
vscode Extension 插件
离线
安装
下载DownloadExtension(这个必须有网)插件官网https://marketplace.visualstudio.com搜索想要的插件,点击卡片进入详情页搜索DownloadExtension关键字,点击下载安装InstallExtension刚下载好的文件eamodio.gitlens-9.3.0.vsix存放目录c:\download\eamodio.gitlens-9.3.0.
澄澄真可爱
·
2024-01-22 15:40
CentOS7下
Hadoop
2.9.2、Hive 2.3.6安装与实践
参考的安装文章地址:https://blog.csdn.net/pengjunlee/article/details/81607890实际安装的版本为:
hadoop
2.9.2,hive2.3.6;操作系统
流火星空
·
2024-01-22 14:58
大数据
hive
大数据
hive
java大数据
hadoop
2.9.2 Linux安装mariadb和hive
一、安装mariadb版本centos71、检查Linux服务器是否已安装mariadbyumlistinstalledmariadb*2、如果安装了,想要卸载yumremovemariadbrm-rf/etc/my.cnfrm-rf/var/lib/mysql才能完全删除3、安装mariadb在线网络安装yuminstall-ymariadb-server开启服务systemctlstartma
crud-boy
·
2024-01-22 14:26
java大数据
大数据
linux
mariadb
关于Hive架构原理,尚硅谷
最近学习hive时候,在做一个实操案例,具体大概是这样子的:我在dataGip里建了一个表,然后在
hadoop
集群创建一个文本文件里面存储了数据库表的数据信息,然后把他上传到hdfs后,dataGrip
大数据SQLboy
·
2024-01-22 11:41
Hive
hive
架构
hadoop
Impala
最大的特点就是速度快Impala优势Impala的诞生Hive与MR适合
离线
批处理,但是对交互式查询的场景无能为力(快速响应),所以为了积极查询速度问题开发了Impala,Impala抛弃了MR,使用了类似传统的
奋斗的蛐蛐
·
2024-01-22 10:42
Ranger概述及安装配置
二、Ranger2.1、什么是rangerApacheRanger是一个用来在
Hadoop
平台上进行监控,启动服务,以及全方位数据安全访问管理的安全框架。Ranger愿景是在Apa
小枫@码
·
2024-01-22 09:39
大数据运维
安全
运维
【大数据处理技术实践】期末考查题目:集群搭建、合并文件与数据统计可视化
合并文件与数据统计可视化实验目的任务一:任务二:实验平台实验内容及步骤任务一:搭建具有3个DataNode节点的HDFS集群集群环境配置克隆的方式创建Slave节点修改主机名编辑hosts文件生成密钥免认证登录修改
hadoop
汐ya~
·
2024-01-22 09:35
hadoop
linux
虚拟机
java
redis-5.0.8集群环境搭建
单机环境安装redis-3.2.8主从复制架构搭建及哨兵配置如果你对redis的安装很陌生,请看完我以上两期教程,对完成此期教程很有帮助2.下载解压redis-5.0.8.tar.gz[xiaokang@
hadoop
01
小刘新鲜事儿
·
2024-01-22 08:15
redis
redis
大数据技术原理及应用课实验3 :熟悉常用的HBase操作
目录实验3熟悉常用的HBase操作一、实验目的二、实验平台三、实验步骤(每个步骤下均需有运行截图)(一)编程实现以下指定功能,并用
Hadoop
提供的HBaseShell命令完成相同任务:1.列出HBase
Blossom i
·
2024-01-22 08:08
大数据编程
大数据
hbase
数据库
Flink on YARN(下):常见问题与排查思路
杨弢(搏远),阿里巴巴计算平台事业部技术专家,Apache
Hadoop
Committer,目前专注于YARN、Flink、YuniKorn等开源项目的资源调度方向。
Apache Flink
·
2024-01-22 08:33
一张图轻松掌握 Flink on YARN 基础架构与启动流程
杨弢(搏远),阿里巴巴计算平台事业部技术专家,Apache
Hadoop
Committer,目前专注于YARN、Flink、YuniKorn等开源项目的资源调度方向。
zhisheng_blog
·
2024-01-22 08:02
10
Hadoop
的安全模式及权限介绍
1、HDFS工作流程启动NameNode,NameNode加载fsimage到内存,对内存数据执行editslog日志中的事务操作。文件系统元数据内存镜像加载完毕,进行fsimage和editslog日志的合并,并创建新的fsimage文件和一个空的editslog日志文件。NameNode等待DataNode上传block列表信息,直到副本数满足最小副本条件,这个过程NameNode处于安全模式
水无痕simon
·
2024-01-22 08:02
Hadoop
hadoop
安全
大数据
[flink]一Flink部署|配置文件|提交作业|部署模式|独立模式部署|yarn模式部署
一、集群部署集群规划节点服务器
hadoop
1
hadoop
2
hadoop
3
hadoop
4角色JobManagerTaskManagerTaskManagerTaskManagerTaskManager1、
胖胖学编程
·
2024-01-22 08:30
Flink
flink
腾讯云对接华为
离线
推送遇到的问题
一、首先是华为开发者中的处理https://developer.huawei.com/consumer/cn/console/service/AppService1、点击AppGalleryConnect2、点击我的项目3、未添加应用前这里有个小坑,未添加应用前是没有腾讯云说的agconnect-services.json文件的,这里浪费了我很长时间,更别说clientId等信息了。4、补充一点:
开发_李行
·
2024-01-22 08:56
推送
腾讯云
华为
腾讯云
Hadoop
基本概论
目录一、大数据概论1.大数据的概念2.大数据的特点3.大数据应用场景二、
Hadoop
概述1.
Hadoop
定义2.
Hadoop
发展历史3.
Hadoop
发行版本4.
Hadoop
优势5.
Hadoop
1.x/2
LzYuY
·
2024-01-22 08:25
Hadoop
hadoop
大数据
分布式
史上最全深度解析Flink内存管理--大数据技术
目前,大数据计算引擎主要使用Java或基于JVM的编程语言实现的,例如Apache
Hadoop
,ApacheSpark,ApacheDrill,ApacheFlink等。
大数据学习僧
·
2024-01-22 08:50
Flink
大数据
flink
上一页
23
24
25
26
27
28
29
30
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他