E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop初步学习
大模型理论基础
初步学习
笔记——第五章 大模型的数据
大模型理论基础
初步学习
笔记——第五章大模型的数据5.1大语言模型背后的数据5.1.1WebText和OpenWebText数据集5.1.2ColossalCleanCrawledCorpus(C4)5.1.3Benchmark
panda_dbdx
·
2024-01-24 16:49
学习
笔记
语言模型
人工智能
大模型理论基础
初步学习
笔记——第二章 大模型的能力
大模型理论基础
初步学习
笔记——第二章大模型的能力大模型理论基础
初步学习
笔记——第二章大模型的能力2.1概述我们的研究对象:2.1.1基准测试:2.1.2结果:2.1.3结论:2.1.4总结(太长不看版)
panda_dbdx
·
2024-01-24 16:49
学习
笔记
语言模型
人工智能
自然语言处理
大模型理论基础
初步学习
笔记——第一章 引言
大模型理论基础
初步学习
笔记——第一章引言1.1什么是语言模型1.1.1.联合分布表示:1.1.2.自回归语言模型(Autoregressivelanguagemodels):1.1.3.温度参数:1.1.4
panda_dbdx
·
2024-01-24 16:48
学习
笔记
大模型理论基础
初步学习
笔记——第三四章 危害,与模型架构
大模型理论基础
初步学习
笔记——第三四章危害,与模型架构一、危害性部分:二、架构第3章模型架构3.2分词3.2.1基于空格的分词3.2.2BytePairEncoding(BPE)分词算法3.2.2.1Unicode
panda_dbdx
·
2024-01-24 16:46
学习
笔记
架构
2019-05-15
主流程1.关闭防火墙2.机器间实现免密3.zk部署4.
hadoop
部署实现流程2.免密登录ssh-keygen回车一直到最后(有3次)生成本机秘钥后,同步到自己机器和其他机器ssh-copy-idhostxshell
泡泡_bbb9
·
2024-01-24 15:54
C++ 11 多线程库
初步学习
在C++11标准中,可以简单通过使用thread库,来管理多线程。thread库可以看做对不同平台多线程API的一层包装;因此使用新标准提供的线程库编写的程序是跨平台的。使用时需要#include头文件;#include#includeusingnamespacestd;voidtproc(inti){cout<
bcbobo21cn
·
2024-01-24 15:09
VC++
thread
C++11
通过
hadoop
jar命令运行提交MapReduce到YARN中
实现Wordcount大概流程:给定数据输入的路径,给定结果输出的路径;将输入路径内的数据中的单词进行计数,将结果写到输出路径如下:在
hadoop
下找
hadoop
-mapreduce-examples-
%HelloWorld%
·
2024-01-24 13:28
hadoop
大数据
分布式
MapReduce配置 & YARN集群部署
1:编辑mapred-env.sh;添加如下配置#设置jdk路径exportJAVA_HOME=/opt/module/jdk#设置JobHistoryServer进程内存为1Gexport
HADOOP
_JOB_HISTORYSERVER_HEAPSIZE
%HelloWorld%
·
2024-01-24 13:28
mapreduce
数据库
大数据
部署
Hadoop
集群
在node1节点执行,以root身份1:在VMware虚拟机集群上部署HDFS集群1)准备好
hadoop
安装包;目前最新3.3.4;了解:2)上传解压
hadoop
①:上传
hadoop
到node1节点;②
%HelloWorld%
·
2024-01-24 13:27
java
开发语言
Hive在VMware中部署
会在日志文件中生成root用户的一个随机密码,使用下面命令查看密码:如果你想设置简单密码,需要设置mysql密码安全级别:(进入mysql中实行)然后就可以简单密码了:(进入mysql中实行)步骤二:配置
hadoop
%HelloWorld%
·
2024-01-24 13:27
hive
hadoop
数据仓库
Kafka集群的安装与配置(二)
2.2.2生产者命令行操作1)查看操作生产者命令参数[atguigu@
hadoop
102kafka]$bin/kafka-console-producer.sh2)发送消息[atguigu@
hadoop
102kafka
ole_triangle_java
·
2024-01-24 12:59
kafka
linq
分布式
Windows下hive中insert语句报错
报错信息我的
hadoop
和hive版本都是3.0版本(建议
hadoop
3.x版本、hive2.x版本,我在使用中发现有些问题)[08S01][2]Errorwhileprocessingstatement
林园857
·
2024-01-24 10:27
hive
hadoop
数据仓库
hbase 总结
HBase什么是HBasehbase是一个基于java、开源、NoSql、非关系型、面向列的、构建与
hadoop
分布式文件系统(HDFS)上的、仿照谷歌的BigTable的论文开发的分布式数据库。
l靠近一点点l
·
2024-01-24 08:24
大数据
hbase
Hbase原理、基本概念、基本架构
概述HBase是一个构建在HDFS上的分布式列存储系统;HBase是基于GoogleBigTable模型开发的,典型的key/value系统;HBase是Apache
Hadoop
生态系统中的重要一员,主要用于海量结构化数据存储
wyl9527
·
2024-01-24 08:24
Hbase
hbase
存储系统
HBase介绍及简易安装(转)
HBase介绍及简易安装(转)HBase简介HBase是Apache
Hadoop
的数据库,能够对大型数据提供随机、实时的读写访问,是Google的BigTable的开源实现。
weixin_33711647
·
2024-01-24 08:23
大数据
数据库
人工智能
Hadoop
集群(第12期)_HBase简介及安装
HBase简介HBase是Apache
Hadoop
的数据库,能够对大型数据提供随机、实时的读写访问,是Google的BigTable的开源实现。
weixin_30451709
·
2024-01-24 08:23
大数据
数据库
人工智能
HBase学习
HBase简介HBase是Apache
Hadoop
的数据库,能够对大型数据提供随机、实时的读写访问,是Google的BigTable的开源实现。
mm_bit
·
2024-01-24 08:20
HBase
大数据
数据库
HBase详细概述
不过在此之前,你可以先了解
Hadoop
生态系统,若想运行HBase,则需要先搭建好
Hadoop
集群环境,可以参考此文搭建5个节点的
hadoop
集群环境(CDH5)。好了,让我们来学习HBase吧!
a867901084
·
2024-01-24 08:49
大数据
数据库
运维
HBase简易安装和简介
HBase简介HBase是Apache
Hadoop
的数据库,能够对大型数据提供随机、实时的读写访问,是Google的BigTable的开源实现。
滑过的板砖
·
2024-01-24 08:49
Hbase
Hbase 基础理论
Hbase本身是属于NoSQL在
hadoop
的大数据集群框架中可以用来做数据的存储。Hbase本身是Google的Bigtable理论的开源实现。本篇文章
Allocator
·
2024-01-24 08:48
Hbase
hbase
H. Linux查找文件 whereis locate which
[root@
hadoop
01~]#whereiscatcat:/bin/cat/usr/share/man/man1/cat.1.gz[root@
hadoop
01~]#yuminstallmlocate
小猪Harry
·
2024-01-24 08:06
Flink(十五)【Flink SQL Connector、savepoint、CateLog、Table API】
1、常用Connector读写之前我们已经用过了一些简单的内置连接器,比如'datagen'、'print',其它的可以查看官网:Overview|ApacheFlink环境准备:#1.先启动
hadoop
my
hadoop
start
让线程再跑一会
·
2024-01-24 07:17
Flink
flink
大数据
MySQL数据库在CentOS 6.8环境下的安装
二、步骤1、检查本地YUM源检查本地YUM中可用的与mysql相关的软件包[root@
hadoop
00~]#yumlist|grepmysql出现如图所示错误,需要重新挂载一下系统安装镜像[root@
hadoop
00
m0_69595107
·
2024-01-24 06:10
Hadoop
数据库
mysql
centos
大数据
hadoop
Hadoop
安装配置HBase
2、安装切换目录[root@
hadoop
00~]#cd/usr/local新建文件夹[root@
hadoop
00local]#mkdirhbase解压文件[root@
hadoop
00local]#tarzxvf
m0_69595107
·
2024-01-24 06:10
Hadoop
hadoop
hbase
大数据
分布式
centos
Hadoop
伪分布式安装配置
A、添加
hadoop
用户1、添加用户组[root@
hadoop
00~]#groupadd
hadoop
2、添加用户并分配用户组[root@
hadoop
00~]#useradd-g
hadoop
hadoop
3
m0_69595107
·
2024-01-24 06:09
Hadoop
分布式
hadoop
大数据
apache
centos
服务器
虚拟机网络配置及Moba工具的使用
A、设置IP和网关1、设置IP[root@
hadoop
00~]#vi/etc/sysconfig/network-scripts/ifcfg-eth0(修改如下标红内容,没有的就添加)DEVICE=eth0HWADDR
m0_69595107
·
2024-01-24 06:09
Hadoop
网络
database
hadoop
大数据
运维
服务器
Hadoop
中HBase命令行操作
HBase提供了Shell命令行,功能类似于Oracle、MySQL等关系库的SQLPlus窗口那样,用户可以通过命令行模式进行创建表、新增和更新数据,以及删除表的操作。采用的底层存储为HDFS。使用Hbase客户端操作,执行查看Hbase版本、状态、查看帮助命令。创建表、修改表、插入数据、删除数据、查询数据,清空表、退出Hbase命令行、停止HDFS服务。1.启动HDFS服务进程和hbase服务
m0_69595107
·
2024-01-24 06:05
Hadoop
hadoop
hbase
大数据
centos
大数据基础设施搭建 - Hbase
文章目录一、解压压缩包二、配置环境变量三、修改配置文件3.1修改hbase-env.sh3.2修改hbase-site.xml3.3修改regionservers四、解决HBase和
Hadoop
的log4j
m0_46218511
·
2024-01-24 06:04
大数据
hbase
数据库
有了金刚钻,不惧瓷器活 | 在数据文件上轻松使用SQL
当然,如果为了去英国美国,学个英语还算值,这就像学个Python、
Hadoop
,出去找工作也算是个技能。
小黄鸭呀
·
2024-01-24 04:41
hadoop
集群搭建笔记
修改主机名字:hostnamectlset-hostname主机名称修改hosts文件进行解析:xxxx.xxxx.xxxx.xxxx主机名字ssh免密登录:ssh-keygen-trsa生成密钥ssh-copy-idslave1ssh-copy-idslave2每个节点都拷贝公钥ssh-copy-idmaster集群部署2、配置集群1、核心配置文件配置core-site.xmlfs.defaul
阿强的学习笔记
·
2024-01-24 03:42
Flink 架构--官网译文(v1.11)
它与所有常见的群集资源管理器(如
Hadoop
YARN,ApacheMesos和Kubernetes)集成,但也可以设置为作为独立群集甚至库运行。
LQC_gogogo
·
2024-01-24 02:53
Storm和
hadoop
对比及storm组件
storm
hadoop
实时流处理批处理无状态有状态使用zk协同的主从架构无主从zk架构每秒处理数万消息HDFS,MR数分钟,数小时不会主动停止终于完成的时候storm优点:跨语言,可伸缩,低延迟,秒级容错核心概念
smartjiang
·
2024-01-24 02:01
Hadoop
大数据技术有什么市场价值?2019年
Hadoop
大数据技术7大应用领域
由于国家对大数据、AI等等技术的关注,在多次发展规划中都提高了大数据技术,因此大数据技术对于这个时代的发展来说至关重要,大数据也正处于发展期、巩固期,基于已有的技术去完善和不断的发展大数据技术产品,满足互联网不符按发在的需求,使国家的技术产业得到进步和发展。大数据已经成长为时代发展的标志,在各大行业机领域都拥有其应用,今天小编就带着大家一起了解一下,大数据技术到底带来了什么?大数据技术是如何发挥自
金光闪闪耶
·
2024-01-24 01:08
Note25:Azkaban-2.5.0安装配置
安装包下载安装地址:个人选择这个版本Azkaban-2.5.0把安装包上传到/opt/software目录在/opt/module/目录下创建azkaban目录[kevin@
hadoop
112module
K__3f8b
·
2024-01-23 23:43
Hadoop
2.8x安装文档
Hadoop
2.8x安装文档下载下载
Hadoop
Hadoop
.apache.org下载rpm版本的jdkJava.comSsh连接工具XShallXFTPCentos6.8_mini操作系统配置先配置一个虚拟机
A尚学堂Nancy老师
·
2024-01-23 23:01
在hive插入数据时出现“Execution Error, return code 2 from org.apache.
hadoop
.hive.ql.exec.mr.MapRedTask”报错
一.问题重现SQL错误[2][08S01]:Errorwhileprocessingstatement:FAILED:ExecutionError,returncode2fromorg.apache.
hadoop
.hive.ql.exec.mr.MapRedTaskErrorwhileprocessingstatement
絲箹
·
2024-01-23 21:50
hadoop
hive
apache
linux创建虚拟机成功后,第二次使用打不开,(磁盘和文件权限修改)
但如果出现以下提示>替换缺少的文件时出错:权限不足,无法访问该文件就说明文件的权限太高,或者存放文件的磁盘权限太高,导致无法访问文件这时我们需要对文件和磁盘的权限进行修改选中
Hadoop
01文件>鼠标右键
絲箹
·
2024-01-23 21:50
linux
运维
服务器
开源大数据集群部署(六)Keytab文件生成
1、创建keytab文件除了使用明文密码登录之外,Kerberos还可以使用keytab密码文件登陆,现在为testcuser创建它的keytab文件ipa-getkeytab-sipa.hdp.
hadoop
-ptestcuser
云掣YUNCHE
·
2024-01-23 21:35
开源大数据集群部署
开源
大数据
Spark RDD分区数和分区器
TextInputFormat.getInputSplits()方法决定,具体源码追踪及解析如下:valrdd1=sc.textFile("data/tbPerson.txt")①Ctrl+B进入textFiletextFile底层其实就是通过
hadoop
File
maplea2012
·
2024-01-23 15:40
spark
大数据
hadoop
Hadoop
集群配置及测试
Hadoop
集群配置及测试NameNode与SecondaryNameNode最好不在同一服务器ResourceManager较为消耗资源,因而和NameNode与SecondaryNameNode最好不在同一服务器
YUuuuME_
·
2024-01-23 11:07
hadoop
大数据
分布式
大数据分布式实时大数据处理框架Storm,入门到精通!
介绍:Storm是一个分布式实时大数据处理框架,被业界称为实时版的
Hadoop
。首先,Storm由Twitter开源,它解决了
Hadoop
MapReduce在处理实时数据方面的高延迟问题。
知识分享小能手
·
2024-01-23 09:42
学习心得体会
大数据
大数据
分布式
storm
大数据开发之Spark(入门)
第1章:Spark概述1.1什么是spark回顾:
hadoop
主要解决,海量数据的存储和海量数据的分析计算。spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。
Key-Key
·
2024-01-23 09:45
大数据
spark
分布式
Sqoop与Kafka的集成:实时数据导入
Sqoop用于将数据从关系型数据库导入到
Hadoop
生态系统中,而Kafka则用于数据流的传输和处理。
晓之以理的喵~~
·
2024-01-23 08:01
sqoop
sqoop
kafka
hadoop
Hadoop
基本介绍
1、
Hadoop
的整体框架
Hadoop
由HDFS、MapReduce、HBase、Hive和ZooKeeper等成员组成,其中最基础最重要元素为底层用于存储集群中所有存储节点文件的文件系统HDFS(
Hadoop
DistributedFileSystem
w蕾丝
·
2024-01-23 08:53
Sqoop数据导入到Hive表的最佳实践
Sqoop是一个开源工具,用于在
Hadoop
生态系统中的数据存储(如HDFS)和关系型数据库之间传输数据。它可以帮助数据工程师和分析师轻松地
晓之以理的喵~~
·
2024-01-23 07:35
sqoop
hive
sqoop
hadoop
网络安全全栈培训笔记(55-服务攻防-数据库安全&Redis&
Hadoop
&Mysqla&未授权访问&RCE)
第54天服务攻防-数据库安全&Redis&
Hadoop
&Mysqla&未授权访问&RCE知识点:1、服务攻防数据库类型安全2、Redis&
Hadoop
&Mysql安全3、Mysql-CVE-2012-2122
清歌secure
·
2024-01-23 07:24
网络安全全栈学习笔记
web安全
笔记
redis
网络
安全
数仓建设 - 维度建模 - DIM维度
2.2ETL任务脚本三、活动维度表3.1表结构设计3.2ETL任务脚本四、地区维度表4.1表结构设计4.2ETL任务脚本五、日期维度表六、用户维度表6.1表结构设计6.2ETL任务脚本前置:准备数据库[
hadoop
m0_46218511
·
2024-01-23 05:14
大数据基础设施搭建
维度建模
数据仓库
Hadoop
-- Hive
文章目录1.什么是hive?1.1基本思想1.2为什么使用hive?1.3hive创建表与查询原理2.hive安装2.1.mysql安装2.2.hive的元数据库配置3.hive使用方式3.1最基本使用方式3.2启动hive服务使用3.3脚本化运行4.建库建表与数据导入4.1建库4.2建表4.2.1基本建表语句4.2.2删除表4.2.3内部表与外部表4.2.4分区表4.2.5外部分区表4.3数据导
Cool_Pepsi
·
2024-01-23 02:12
大数据
hive
Spark运行流程
Spark相对于
Hadoop
的优势
Hadoop
虽然已成为大数据技术的事实标准,但其本身还存在诸多缺陷,最主要的缺陷是其MapReduce计算模型延迟过高,无法胜任实时、快速计算的需求,因而只适用于离线批处
Cool_Pepsi
·
2024-01-23 02:12
大数据
spark
Hadoop
-- HDFS
1.什么是
Hadoop
hadoop
中有3个核心组件:分布式文件系统:HDFS——实现将文件分布式存储在很多的服务器上分布式运算编程框架:MAPREDUCE——实现在很多机器上分布式并行运算分布式资源调度平台
Cool_Pepsi
·
2024-01-23 02:42
大数据
hdfs
hadoop
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他