E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据开发常用技术
大数据开发
:Hive表的基本操作
今天的
大数据开发
分享,我们就来讲讲Hive表的基本操作。Hive创建表createtable语句遵从sql语法习惯,只不过Hive的语法更灵活。例如,可以定义表的数据文件存储位置,使用的存储格式等。
成都加米谷大数据
·
2023-12-05 20:41
Java
大数据开发
入门教程:使用Hadoop处理海量数据
本文将为大家介绍Java
大数据开发
的基本概念和Hadoop的使用方法,帮助读者入门
大数据开发
。一、什么是
大数据开发
?
大数据开发
是指通过使用分布式计算框架和相关技术,对海量数据
C红毛丹
·
2023-12-05 19:29
大数据
java
hadoop
大数据开发
:Hive on Spark设计原则及架构
今天的
大数据开发
分享,我们来讲讲HiveonSpark设计原则及架构。
成都加米谷大数据
·
2023-12-05 01:44
大数据开发
:Kafka消息存储到Broker的流程
今天的
大数据开发
学习分享,我们就主要来讲讲Kafka消息存储到Broker的流程。
成都加米谷大数据
·
2023-12-04 23:34
大数据开发
:HDFS Erasure Coding机制
今天的
大数据开发
分享,我们就来讲讲HDFSErasureCoding机制。1、HDFS备份机制的问题为了提供容错,HDFS根据复制因子的大小在不同的DataNodes节点复制文件块数据。
成都加米谷大数据
·
2023-12-03 14:29
Mysql基本概念和Sql基本语法
数据库的基本概念DB:表视图索引存储过程触发器EventsDB可以想象成为一个文件夹,表就是文件夹里面的excel文件一般作为
大数据开发
来说只需要掌握前面三个就可以了字段类型1.数值类型int整数long
吃货大米饭
·
2023-12-02 17:19
大数据开发
:Hbase集群安装配置入门
今天的
大数据开发
学习分享,我们就主要来讲讲Hbase集群安装配置入门。
成都加米谷大数据
·
2023-12-01 22:39
零基础学习大数据的方向和路线
大数据三大学习方向:
大数据开发
师、大数据架构师、大数据运维师互联网科技发展蓬勃兴起,人工智能时代来临,抓住下一个
weixin_44386638
·
2023-11-30 18:50
大数据
大数据
大数据学习
大数据开发
大数据入门
如何高效优雅的完成一次机器学习服务部署?一文详解部署难点以及实战案例...
本篇作者fanstuck世界五百强私企大数据工程师,工作与研究方向为
大数据开发
和数据分析,个人喜欢研究技术和算法。数据分析领域优质创
亚马逊云开发者
·
2023-11-30 18:02
机器学习
人工智能
python
大数据
计算机视觉
学Java有什么用?Java就业前景怎么样?
Java语言经过多年的使用和发展建立起了一个庞大的生态体系,在Web开发、Android开发、
大数据开发
、后端开发等领域都有广泛的应用。
程序媛小白
·
2023-11-30 14:49
使用Java+SSM(Spring+SpringMVC+Mybatis)实现在线电影推荐网 电影推荐系统 豆瓣电影爬虫 基于用户、物品的协同过滤推荐算法 机器学习、人工智能、
大数据开发
使用Java+SSM(Spring+SpringMVC+Mybatis)实现在线电影推荐网电影推荐系统豆瓣电影爬虫基于用户、物品的协同过滤推荐算法机器学习、人工智能、
大数据开发
MovieRecommendWeb
linge511873822
·
2023-11-30 05:05
网站模板
基于项目的协同过滤推荐算法
基于用户的协同过滤推荐算法
java
推荐算法
协同过滤
大数据
人工智能
Hadoop
大数据开发
__Spark on YARN模式分布式集群安装部署
1、下载解压sparkcd/home/hadoop/apptar-zxvfspark-3.3.0-bin-hadoop3.tgzrmspark-3.3.0-bin-hadoop3.tgzln-sspark-3.3.0-bin-hadoop3spark2、修改spark-env.shcd/home/hadoop/app/spark/confvispark-env.sh#追加下面的路径HADOOP_C
姚华军
·
2023-11-30 02:32
大数据
大数据
hadoop
spark
Spark
on
YARN
YARN
大数据开发
:Flink容错机制Task Failover策略
那么Flink是怎么处理的呢,今天的
大数据开发
分享,我们就来讲讲这个TaskFailover策略。
成都加米谷大数据
·
2023-11-29 12:37
大数据开发
:实时数仓架构层次设计
今天的
大数据开发
学习分享,我们就主要来讲讲大数据实时数仓架构设计的问题。大数据实时数仓架构,通常来说,分为数据接入、数据计算、数据存储三个大的层次。
成都加米谷大数据
·
2023-11-28 16:52
IM通信技术快速入门:短轮询、长轮询、SSE、WebSocket
文章目录前言即时通讯
常用技术
短轮询(ShortPolling)实现原理优点缺点长轮询(LongPolling)实现原理改进点基于iframe的长轮询实现原理总结Server-SentEvents(SSE
Lorin 洛林
·
2023-11-28 15:06
Java
后端经典面试题
计算机网络
websocket
网络协议
网络
大数据开发
学习笔记linux java hadoop环境变量配置
linux下配置环境变量javahadoopvim/etc/profile在文件最下方加入以下代码exportJAVA_HOME=java目录exportHADOOP_HOME=hadoop目录exportPATH=HADOOP_HOME/bin:PATHexportCLASSPATH=.:JAVA_HOME/lib/tools.jarexportJAVA_HOMEexportHADOOP_HOM
我还不够强
·
2023-11-27 20:39
大数据开发
:数据库中间件的两种设计方案
今天的
大数据开发
分享,我们就来讲讲,数据库中间件的两种设计方案。目前来说,市面上典型的数据库中间件设计方案就是两种:Proxy、Smart-client。数据库中间件的设计原理,其实也很简单。
成都加米谷大数据
·
2023-11-27 20:58
insert overwrite table:数据仓库和数据分析中的
常用技术
一、介绍:INSERTOVERWRITETABLE是用于覆盖(即替换)目标表中的数据的操作。它将新的数据写入表中,并删除原有的数据。这个操作适用于非分区表和分区表。二、使用场景:1、数据更新:当您需要更新表中的数据时,可以使用覆写操作。通过覆写,您可以将新的数据写入表中,替换原有的数据。这在需要定期更新或替换表中数据的情况下非常有用。2、数据重载:如果您需要重新加载表中的数据,覆写操作可以清空表并
linbokang
·
2023-11-27 19:45
数据仓库
数据分析
hive
为什么学习大数据,大数据专家写给大数据分析学习者的10个理由
因为大数据爆发,因此出现了
大数据开发
、大数据分析这两大主流的工作方向,目前这两个方向是很热门,不少人已经在开始转型往这两个方向发展,相较而言,转向大数据分析的人才更多一点,而同时也有不少人在观望中,这边小编收集了十个为什么要学习大数据分析的十个理由
大数据学习01
·
2023-11-27 11:40
0基础转行,学Java和大数据有什么区别?大数据学习步骤是什么?
Java和大数据如何选大数据方向有很多,目前我们经常说的大数据学习,其实指的是
大数据开发
!
大数据开发
顾名思义学习的主要技术就是编程技术,零基础学习大数据是需要从java和linux学起的。
yoku酱
·
2023-11-27 07:45
web开发部署相关术语
最常用于前端开发的技术是HTML+CSS+JavaScript,高级的前端开发人员通常使用这些技术的组合开发应用的前端,另一个前端的
常用技术
就是使用Photoshop设计,配合其他技术共同完成Web页面的制作
jolly_elf
·
2023-11-27 05:44
学java有前途吗?初学者如何学好java?
经过了这么多年的使用和发展,java语言可以说已经是成功的建立奇了一个很庞大的体系,java语言在后端开发、Web开发、
大数据开发
、Android开发等领域都有着非常广泛的应用。
AI小菜鸡一个
·
2023-11-26 03:11
吗
java
开发语言
java-ee
大数据开发
之运维面试题汇总分享
Q1:集群线上扩容如何达到自动化?线上扩容,规模正常都是以10+以上,如果都以课堂所示,人肉操作,时间投入与产出比不匹配,人力造成很大的不必要浪费,想学习老师线上集群实际扩容的方案。A:课堂所示兼顾了小白同学,所以是手把手纯人肉搭建,产线环境扩容数量少则几十多则上百,人肉肯定不行,我们公司的运维分为IAAS运维、大数据运维、应用运维,大数据运维工程师在扩容集群时,需要向IAAS运维工程师以工单的方
at小白在线中
·
2023-11-25 19:43
大数据
运维
big
data
大数据
大数据开发
之Kafka篇----Kafka入门(2)
部署试用篇说了这么就的Kafka理论知识,我们也需要实际操作一波了Zookeeper部署使用Kafka肯定离不开使用Zookeeper的,这里我们介绍一下在3台机器上部署Zookeeper的过程(但我就只在我是在我本机上演示的,就只能展示单机版的了)首先下载Zookeeper的压缩包,然后解压并到Zookeeper目录下tar-xzvfzookeeper-3.4.6.tar.gz-C/home/t
豆豆总
·
2023-11-25 17:40
Kafka
ChatGPT 上新,效果炸裂,知识平台才是大模型的最佳狩猎场
数新网络可提供
大数据开发
管理、安全合规、建模分析、价值流通等多种服务,让大数据、AI和数据价
数新网络
·
2023-11-25 09:22
chatgpt
软件测试要学习的基础知识——白盒测试
白盒测试又被称为:透明盒测试结构化测试逻辑驱动测试基于代码的测试白盒测试的
常用技术
分类一、静态分析:数据流分析控制流分析信息流分二、动态分析:逻辑覆盖循环覆盖基本路径覆盖优缺点一、优点:迫使测试人员去仔细思考软件的实现可以检测代码中的每条分支和路径揭示隐藏在代码中的错误对代码的测试比
软件测试君
·
2023-11-25 03:23
程序员
职场经验
软件测试
学习
java
junit
自动化测试
程序人生
Django框架之Cookie和Session和CBV加装饰器的三种方法
【一】Cookie与SessionCookie和Session是用来在Web应用程序中跟踪用户会话数据的两种
常用技术
。
台州吃柴小男孩
·
2023-11-24 21:53
django
服务器
Spark异步事件总线机制源码分析
收录于话题#大数据
常用技术
15#大数据17#spark2Spark事件总线贯彻整个应用,TaskScheduler、Executor、JobScheduler、SQLExecution等关键交互逻辑离不开
跃ge
·
2023-11-24 16:03
spark
Spark读取外部数据的原理解读
收录于话题#spark2#大数据17#大数据
常用技术
15为了简化理解,该文尝试使用SparkContext.textFile()为入口进行分析。
跃ge
·
2023-11-24 16:33
spark
Kafka集成Flink
集成Flink一、Flink环境准备二、Flink生产者1.在包名下创建java类:FlinkKafkaProducer三、Flink消费者Flink是一个在
大数据开发
中非常常用的组件。
Smartaotao
·
2023-11-24 04:46
Kafka
kafka
大数据开发
之Hive优化篇6-Hive on spark
备注:Hive版本2.1.1一.HiveonSpark介绍Hive是基于Hadoop平台的数据仓库,最初由Facebook开发,在经过多年发展之后,已经成为Hadoop事实上的SQL引擎标准。相较于其他诸如Impala、Shark(SparkSQL的前身)等引擎而言,Hive拥有更为广泛的用户基础以及对SQL语法更全面的支持。Hive最初的计算引擎为MapReduce,受限于其自身的Map+Red
只是甲
·
2023-11-23 12:06
大数据和数据仓库
#
Hive
hive
on
spark
hadoop
hive
spark
DataWorks实践笔记-从入门到精通
DataWorks是阿里出品的一站式
大数据开发
与治理平台,基于MaxCompute/EMR/MC-Hologres等大数据计算引擎,网络上的教程很多,但是一般都比较冗长。
qq_43548990
·
2023-11-22 13:58
云计算
阿里大数据工程师:教你如何快速的搭建数据库
下面我们来讲
大数据开发
核心流程。当我们接到一个需求,首先会进行需求分析,然后做工作流设计,比如这个任务是什么时候跑的、依赖于哪些业务。工作流设计完成后进行数据采集和数据同步。接下去就是数据开发,我们
yoku酱
·
2023-11-22 13:03
大数据学习路线图 让你轻松掌握大数据技术学习
互联网时代每个企业每天都要产生庞大的数据,对数据进行储存,对有效的数据进行挖掘分析并应用需要依赖于
大数据开发
,
大数据开发
课程采用真实商业数据源并融合云计算+机器学习,让学员有实力入职一线互联网企业。
金光闪闪耶
·
2023-11-22 02:59
基于Flink打造实时计算平台为企业赋能
点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源大数据技术与架构点击右侧关注,
大数据开发
领域最强公众号!大数据真好玩点击右侧关注,大数据真好玩!
王知无(import_bigdata)
·
2023-11-21 10:40
大数据
编程语言
hadoop
java
数据库
Scala学习笔记
大数据开发
中常用Scala进行功能开发,而且大数据处理和计算框架Flink和Spark都是基于Scala开发的,学习Scala不仅是进行业务开发的前提,而且是深入研究大数据前言技术的基础。
火影启源
·
2023-11-21 02:02
【2023云栖】大模型驱动DataWorks数据开发治理平台智能化升级
DataWorks产品负责人田奇铣发布了DataWorksCopilot、DataWorksAI增强分析、DataWorks湖仓融合数据管理等众多新产品能力,让DataWorks这款已经发展了14年的
大数据开发
治理平台产品
阿里云大数据AI技术
·
2023-11-20 11:22
大数据
阿里云
大数据开发
(20)-Skew join
&&大数据学习&&系列专栏:哲学语录:承认自己的无知,乃是开启智慧的大门如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦skewjoin的原理是,为倾斜的大key单独启动一个mapjoin任务进行计算,其余key进行正常的commonjoin。在一般情况下,是否开启skewjoin取决于具体的使用场景。skewjoin是一种优化技术,主要用于大数据处理中的join操作。当处理大表
viperrrrrrr
·
2023-11-20 07:06
大数据
大数据开发
(19)-hash table详解
&&大数据学习&&系列专栏:哲学语录:承认自己的无知,乃是开启智慧的大门如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦在Map-side聚合中,每个Map任务(mapper)都会维护一个独立的哈希表(hashtable)。在MapReduce框架中,每个Map任务都是独立的,它们分别处理输入数据集的不同部分。每个Map任务都会创建一个哈希表,用于存储键值对(key-valuep
viperrrrrrr
·
2023-11-20 07:36
大数据
hive
mapreduce
HDFS、MapReduce原理--学习笔记
1.Hadoop框架1.1框架与Hadoop架构简介(1)广义解释从广义上来说,随着
大数据开发
技术的快速发展与逐步成熟,在行业里,Hadoop可以泛指为:Hadoop生态圈。
祈愿lucky
·
2023-11-20 06:33
大数据
hdfs
mapreduce
学习
大数据开发
面试经验总结1(慢慢学习补充)
字节一面1.介绍项目的时候,把自己项目中的数据特点说一下,比如多少字段,多少数据量,大约什么类型,以及输出的‘数据类型和要求,中间进行哪些操作,一步步怎么进行的2.会问到数据库索引数据库索引:官方介绍索引是帮助MySQL高效获取数据的数据结构。更通俗的说,数据库索引好比是一本书前面的目录,能加快数据库的查询速度。一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往是存储在磁盘上的文件中的(
L-JankinLee
·
2023-11-20 01:46
数据库
大数据开发
面试(一)
1、Kafka和Flume的应用场景?Kafka和Flume的应用场景如下:Kafka:定位消息队列,适用于多个生产者和消费者共享一个主题队列的场景。适用于需要高吞吐量、可扩展性和容错能力的场景。主要用于大数据处理、实时数据流分析和日志收集等场景。Flume:定位数据传输,主要用于将数据从源头传输到目标存储系统。适用于需要将大量数据发送到HDFS、HBase等存储系统的场景。具有较强的可靠性、可扩
ChlinRei
·
2023-11-20 01:41
面试
大数据
面试
etl工程师
分组表,分桶表
nohuphive--servicemetastore&(2)启动Metastore服务nohuphive--servicehiveserver2&(3)查看进程信息lsof-i:100002,分区表概述定义:在
大数据开发
中
祈愿lucky
·
2023-11-19 15:29
大数据
大数据
大数据开发
:kafka集群搭建步骤示例
今天的
大数据开发
学习分享,我们主要来讲讲在Hadoop集群上如何搭建和配置kafka集群。一、集群规划首先看一下集群规划,3台节点都搭建kafka,并且每个节点都需要提前安装有zookeeper集群。
成都加米谷大数据
·
2023-11-19 08:53
Numpy+Pandas+Matplotlib,Python数据分析三剑客从入门到进阶
今天小编给大家推荐一个颇具潜力的公众号:小数志,其作者先后经历数据分析师、算法工程师以及
大数据开发
等多个数据岗位,尤其是期间还有过一次真正的跨行转岗经历,所以他的公众号记录了很多真实学习历程和经验心得,
Python数据之道
·
2023-11-19 00:44
人工智能
数据分析
编程语言
nagios
大数据
探索主题建模:使用LDA分析文本主题
LatentDirichletAllocation(LDA)是主题建模的一种
常用技术
。本文将介绍如何使用Python和Gensim库执行LDA主题建模,并探讨主题建模的各个方面。什么是主题建模?
冷月半明
·
2023-11-18 18:31
Pyhon
python
自然语言处理
大数据开发
学习笔记
前言:本文介绍了各个
大数据开发
框架及数据库的学习记录链接有什么问题欢迎大家留言或者私信交流~Hadoophadoop集群搭建+hive安装_hadoop集群安装hive-CSDN博客Hadoop基础入门
THE WHY
·
2023-11-17 16:01
大数据
大数据
学习
笔记
海量数据处理--从分而治之到Mapreduce
海量数据处理
常用技术
概述如今互联网产生的数据量已经达到PB级别,如何在数据量不断增大的情况下,依然保证快速的检索或者更新数据,是我们面临的问题。所谓海量数据处理,是指基于海量数据的存储、处理和操作等。
xiaoranone
·
2023-11-17 09:21
小喵算法经
机器学习笔记
机器在学习
广州云栖大会:阿里云携手虎牙,首次落地直播行业边缘节点及云企业网服务
2018年11月22日,由阿里巴巴集团主办的广东省
大数据开发
者大会暨2018广东云栖大会在广州正式召开,其中以助力游戏企业畅游全球为主题的游戏云专场也在上午如期举办。
阿里云云栖号
·
2023-11-17 06:58
边缘计算
云栖大会
视频加速
大数据应用开发线上班(学徒班)课程大纲
泰迪智能科技大数据应用开发线上班课程使用当下流行的Hadoop+Spark大数据框架,全面、深入地探讨了
大数据开发
、大数据分析、数据仓库等技术。
泰迪智能科技
·
2023-11-16 19:23
大数据
项目实战
大数据
人工智能
python
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他