E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
【大数据开发】
大数据未来发展行情之是否值得转职学习
以至于现在普通的
大数据开发
师的工资能达到2w+的水平,请持续关注小编,每天不定时发布大数据最新消息,学习方法,就业形式大数据背景据职业社交平台LinkedIn发布的《2016年中国互联网最热职位人才报告
风火数据
·
2022-02-18 05:39
疫情在慢慢好转,企业都在复工复产,不想被炒鱿鱼,我们需要靠这份Java面试题来成功逆袭。
需要的加入在移动互联网时代,学习java架构
大数据开发
真的很有必要。入门门槛不高,容易上手,从java基础到架构+大数据双料架构师,普通的
weixin_46785731
·
2022-02-17 11:00
Java
面试
架构
java
编程语言
面试
人工智能
软件开发
从码农到高级工程师:尚学堂1810期大数据全套视频教程全新上线
如今企业对于大数据高端人才的需求度越来越紧迫,在大数据团队主要分三种角色:
大数据开发
工程师、大数据运维工程师、大数据架构师。
北京尚学堂
·
2022-02-16 18:21
大数据学习笔记500条【第一弹】,记得收藏!
【
大数据开发
yoku酱
·
2022-02-16 17:18
为什么大数据要用Python?Python和大数据有什么关系?-太原达内Python培训
做
大数据开发
和分析不仅要用到
热带雨林65
·
2022-02-16 07:33
小白学习大数据掌握这几个方法可轻松入门!
一、兴趣建立在这里我还是要推荐下我自己建的大数据学习交流qq裙:957205962,裙里都是学
大数据开发
的,如果你正在学习大数据,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有
大数据开发
相
金光闪闪耶
·
2022-02-15 04:17
大数据开发
之Hive篇19-Hive分区表详解
备注:Hive版本2.1.1一.Hive分区表概述数据分区的概念以及存在很久了,通常使用分区来水平分散压力,将数据从物理上移到和使用最频繁的用户更近的地方,以及实现其目的。hive中有分区表的概念,我们可以看到分区具重要性能优势,而且分区表还可以将数据以一种符合逻辑的方式进行组织,比如分层存储Hive官方网站对Hivepartition的介绍:可以使用PartitionedBY子句创建分区表。一个
只是甲
·
2022-02-13 14:12
机器学习十大经典算法——随机森林
陆陆续续已经更新到集成学习了,再有三四期这个系列也就结束了,慢慢的发现博客就是为自己写的,为的博客有点高产,主要是一些接的单子,主要是为了方便下次接单,感觉最近学的有点迷茫了,走人工智能的话要高学历,走
大数据开发
又要学
Happy丶lazy
·
2022-02-12 07:04
十大经典算法
数据挖掘
机器学习
技术集锦 | 大数据云原生技术实战及最佳实践系列
随着云平台、容器等技术的不断成熟,云原生大数据解决了传统大数据平台建设和运维中的繁琐,使即时可得,按需分配的高效
大数据开发
平台成为可能。
·
2022-02-11 16:34
云计算大数据云原生
大数据就业方向,求学者、转型者你了解多少?
对于大数据的就业方向,实际上可以划分为三个大类,一、
大数据开发
;二、系统研发;三、大
yoku酱
·
2022-02-11 01:43
月薪30-50K的
大数据开发
工程师们,他们背后是如何学习的
这两天小编去了解了下
大数据开发
相关职位的薪资,主要有hadoop工程师,数据挖掘工程师、大数据算法工程师等,从平均薪资来看,目前大数据相关岗位的月薪均在2万以上,随着项目经验的增长工资会越来越高。
大数据学习01
·
2022-02-10 21:30
技术大牛,快到碗里来
10年学历要求:本科算法工程师20-40K工作地点:北京职位类别:技术类工作年限:3-10年学历要求:本科推荐系统高级工程师20-35K工作地点:北京职位类别:技术类工作年限:3-10年学历要求:本科
大数据开发
工程师
斗米人力资源部
·
2022-02-10 08:15
开课吧9.9元学python靠谱吗-9月程序员工资出炉,女朋友嫌我薪资要少了
尤其是
大数据开发
,在连续几个月降的情况下,依然遥遥领先。特别是懂得更高层的技术,比如推荐算法、源码二次开发等,薪资明显高出不少。但高薪的大数据人才需要具备那些能力呢?绝对不止是掌握各种技术工
weixin_37988176
·
2022-02-09 17:16
阿里p6的
大数据开发
工程师都要学什么?
尤其是
大数据开发
,在连续几个月降的情况下,依然遥遥领先。特别是懂得更高层的技术,比如推荐算法、源码二次开发等,薪资明显高出不少。但高薪的大数据人才需要具备那些能力呢?绝对不止是掌握各种技术工
程序员小灰
·
2022-02-09 17:15
编程语言
xhtml
人工智能
微软
大数据
疫情期间推迟上班,却被炒鱿鱼,但我们可以靠这套java面试题逆袭
需要的加入在移动互联网时代,学习java架构
大数据开发
真的很有必要。入门门槛不高,容易上手,从java基础到架构+大数
Nin-Ja-
·
2022-02-09 08:00
程序人生
java
开发语言
后端
职业生涯-中国未来10年最有前景的十大高薪职业
1、互联网服务人员——目前较热的有电商、视频、搜索、
大数据开发
、移动互联网等。2、网络营销师——大部分企业已加入互联网,并涉及到网络营销,其中一计算机行业、通讯行业、金融行业较为普遍,因
何云静
·
2022-02-07 09:28
复试准备
《计算方法》此书应尽快处理呐英语的笔试、口语、听力面试的简历大数据相关一文读懂大数据计算框架与平台咨询李冲大神关于
大数据开发
的步骤,大数据分析的步骤,可以提及一下。面试问题汇总:请做个简短的自我介绍。
光_武
·
2022-02-06 13:00
大数据开发
技术hive篇
引语
大数据开发
之路漫漫其修远兮,吾将上下而求索。很多入门大数据的小伙伴,可能第一个接触到的,就是一只可爱的“小象”,也就是我们的大数据领域的数据仓库工具hive。
qingdsj
·
2022-02-05 12:49
大数据
人工智能
互联网
hive
大数据
大数据开发
大数据分析
大数据入门
双非本211硕,无实习无项目,自学
大数据开发
,秋招上岸
作为一个双非本211硕无实习无项目的普通人,自学
大数据开发
拿到心仪的offer实属不易。秋招期间在各种网站上收获很多,想回报一下大家,分享出老刘的自学
大数据开发
的学习路线。
大数据老刘2021
·
2022-02-04 16:08
mysql
大数据
面试
职场和发展
大数据开发
之Hive优化篇5-使用ORC文件格式优化Hive
备注:Hive版本2.1.1如果使用Hive作为大数据仓库,强烈建议主要使用ORC文件格式作为表的存储格式一.ORC文件格式概述ORC(OptimizedRowColumnar)文件格式为Hive数据提供了一种高效的存储方式。它的设计是为了克服其他Hive文件格式的限制。使用ORC文件可以提高Hive读写和处理数据时的性能。例如,与RCFile格式相比,ORC文件格式有很多优点,如:单个文件作为每
只是甲
·
2022-02-03 18:14
学习
大数据开发
需要读的书籍有哪些?
大数据开发
书籍推荐介绍
学习大数据少不了平时的技术经验的积累,只有不断的积累才能在熟能生巧中精益求精。今天向大家推荐一批大数据书籍,大家可以在业余的时候阅读,加深对大数据的了解,科多大数据分享给大家看看~1.数据之巅内容简介:在《数据之巅》这本书中,从小数据时代到大数据的崛起,作者以宏大的历史观、文化观、大数据观,给我们描绘了一幅数据科学、智慧文化的全景图。全书从美国建国之基讲起,通过阐述初数时代、内战时代、镀金时代、进
彧11
·
2022-02-03 03:19
Spark概述(入门必看)
本篇学习目标初步认识Spark背景Spark作为一个用来快速实现大规模数据计算的通用分布式大数据计算引擎,是
大数据开发
工程师必备的一项技术栈。
Data跳动
·
2021-12-31 09:37
Pandas系列|一切从爆炸函数开始
Pandas系列|一切从爆炸函数开始前段时间部门有位
大数据开发
的同事离职了,在他和其他开发的同事进行工作项目交接的时候,我去旁听了下,因为涉及到一些公司业务逻辑的问题。
·
2021-12-29 22:58
数据分析python
解析SQL Server CDC配合Kafka Connect监听数据变化的问题
写在前面好久没更新Blog了,从CRUDBoy转型
大数据开发
,拉宽了不少的知识面,从今年年初开始筹备、组建、招兵买马,到现在稳定开搞中,期间踏过无数的火坑,也许除了这篇还很写上三四篇。
·
2021-12-29 10:32
一站式Flink&Spark平台解决方案——StreamX
随着Flink&Spark生态的不断完善,越来越多的企业选择这两款组件,或者其中之一作为离线&实时的
大数据开发
工具,但是在使用他
独孤风
·
2021-12-07 09:00
StarRocks在中移物联网PGW实时会话业务领域的应用
“作者:宁彦辉,中移物联网
大数据开发
工程师,主要从事流计算开发、物联网机器学习
·
2021-11-30 16:53
数据库数据分析dorisdb
大数据开发
之Hive
Hive简介定义Facebook为了解决海量日志数据的分析而开发了hive,后来开源给了Apache基金会组织。hive是一种用SQL语句来协助读写、管理存储在HDFS上的大数据集的数据仓库软件。hive特点▪hive最大的特点是通过类SQL来分析大数据,而避免了写mapreduceJava程序来分析数据,这样使得分析数据更容易。▪数据是存储在HDFS上的,hive本身并不提供数据的存储功能▪hi
·
2021-11-29 12:15
大数据hive
每日一书|建大数据平台太难了,给我发个工程原型吧
今天,很多企业已经完成了早期对大数据技术的尝试和探索转而进入到应用阶段,但不得不说的是,大数据平台的架构体系庞大,技术堆栈非常深,从事
大数据开发
的同学对此应该都深有体会。而在很多细分领域(例如
《新程序员》编辑部
·
2021-11-27 08:00
每日一书
big
data
大数据
大数据开发
之如何用Scala进行spark开发
1、开发第一个Spark程序1)创建一个SparkContext2)加载数据3)把每一行分割成单词4)转换成pairs并且计数2、wordCount程序importorg.apache.spark.{SparkConf,SparkContext}/**@author@date2020-05-1120:
[email protected]
*/defmain(args:Array[String]){valcon
·
2021-11-26 11:03
大数据scalaspark
【干货】
大数据开发
之Spark总结
一、本质Spark是一个分布式的计算框架,是下一代的MapReduce,扩展了MR的数据处理流程二、mapreduce有什么问题1.调度慢,启动map、reduce太耗时2.计算慢,每一步都要保存中间结果落磁盘3.API抽象简单,只有map和reduce两个原语4.缺乏作业流描述,一项任务需要多轮mr三、spark解决了什么问题1.最大化利用内存cache2.中间结果放内存,加速迭代3.将结果集放
·
2021-11-25 12:41
大数据spark
为自学的伙伴打造,
大数据开发
上岸最详细的知识点汇总
作为一个双非本211硕无实习无项目的普通人,自学
大数据开发
拿到心仪的offer实属不易。秋招期间在各种网站上收获很多,想回报一下大家,分享出老刘的自学
大数据开发
的学习路线。
大数据老刘
·
2021-11-24 14:00
正确学习
大数据开发
技术的方法有哪些
大数据开发
技术的应用在我们的生活中也是随处可见的,对于现在来说并不是一个新的开发技术,在
大数据开发
技术的不断发展的过程中,已经趋于成熟,但是零基础小伙伴想要通过大数据培训机构学习来获得开发技术知识,我想是一个比较不错的方式
·
2021-11-24 11:55
大数据
大数据开发
之hive的了解及SQL基础命令分享
hive(数据仓库工具)Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据。它架构在Hadoop之上,总归为大数据,并使得查询和分析方便。并提大数据培训供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。术语“大数据”是大型数据集,其中包括体积庞大,高速,以及各种由与日俱增的数据的集合。使用传统的数据管理系统,它是难以加工大型数据。因此,Apache软件基金
·
2021-11-23 10:52
大数据hivesql
大数据开发
之YARN
YARN是资源管理系统,理论上支持多种资源,目前支持CPU和内存两种资源YARN产生背景直接源于MRv1在几个方面的缺陷扩展性受限单点故障难以支持MR之外的计算多计算框架各自为战,数据共享困难MR:离线计算框架Storm:实时计算框架Spark:内存计算框架YARN设计目标通用的统一资源管理系统同时运行长应用程序和短应用程序长应用程序通常情况下,永不停止运行的程序Service、HTTPServe
·
2021-11-22 13:21
大数据yarn
大数据开发
之HBase异常问题分析
1.问题现象和原因概述1)网卡打满导致请求响应缓慢:通过查看问题发生时段集群服务器的网络流量情况,发现大量的RegionServer所在的服务器出现了网卡打满现象。随着大数据业务的快速发展,Hadoop集群所面临的数据读写压力也在不断增长,千兆网卡在应对大批量的数据通信请求时容易被打满,这种大数据培训情况下就会大大影响数据的传输速度,进而产生请求响应缓慢的问题。2)RegionServer进程JV
·
2021-11-19 11:33
大数据hbase
区块链招聘:
大数据开发
leader
区块链招聘:
大数据开发
leader公司:新锐区块链公司推荐奖:1万地点:上海关键词:
大数据开发
、Scala,Python薪资:80-150万+奖金岗位职责:1.负责设计并不断优化数据工程解决方案,确保其可扩展性
·
2021-11-18 18:25
酷工作
大数据开发
技术之Storm原理与实践
一、Storm简介1.引例在介绍Storm之前,我们先看一个日志统计的例子:假如我们想要根据用户的访问日志统计使用斗鱼客户端的用大数据培训户的地域分布情况,一般情况下我们会分这几步:•取出访问日志中客户端的IP•把IP转换成对应地域•按照地域进行统计Hadoop貌似就可以轻松搞定:•map做ip提取,转换成地域•reduce以地域为key聚合,计数统计•从HDFS取出结果如果有时效性要求呢?•小时
·
2021-11-18 12:14
大数据storm
大数据开发
复习第八篇(Redis篇)
文章目录Redis7.1、Redis的介绍7.2、Redis的数据类型7.2.1、String字符串7.2.2、hash列表7.2.3、list7.2.4、set集合7.3、Redis的持久化7.3.1、rdb(保存快照)7.3.2、AOF(预写日志)7.4、缓存雪崩7.4.1、我们为什么要用缓存(Redis)7.4.2、如果缓存挂了呢7.4.3、雪崩场景7.4.4、如何解决缓存雪崩7.5、缓存穿
落幕7
·
2021-11-17 16:18
大数据开发复习整理
redis
大数据开发
之Kafka
前言Kafka是一个分布式的流处理平台(0.10.x版本),在kafka0.8.x版本的时候,kafka主要是作为一个分布式的、可分区的、具有大数据培训副本数的日志服务系统(Kafka™isadistributed,partitioned,replicatedcommitlogservice),具有高水平扩展性、高容错性、访问速度快、分布式等特性;主要应用场景是:日志收集系统和消息系统为什么使用K
·
2021-11-17 12:30
大数据kafka
大数据开发
工程师需要了解的【数仓中的维度设计】
目录(1)数仓模型如何分层(2)企业数仓模型分层架构(3)维度设计如何理解(4)维表是怎么生成的(5)维度整合的两种策略(6)维度拆分的最佳方案(7)缓慢变化维的处理方式(8)企业中处理缓慢变化维的最佳方案(9)微型维度到底有没有用(10)特殊维度中的递归层次(11)多值维度的处理方式(12)多值属性的处理方式(1)数仓模型如何分层企业常用的数据模型分为三层:操作数据层(ODS)公共维度模型层(C
<一蓑烟雨任平生>
·
2021-11-16 22:07
数据仓库
hive
sql
数据库
大数据开发
运维之YARN运维
1.扩缩容hadoop节点下线nodemanagerStep-by-stepguide下线Nodemanager:在yarn-site.xml中配置以下配置:yarn.resourcemanager.nodes.exclude-path/etc/hadoop/conf/mapred.excludetrue以后有节点下线只需要编辑mapred.exclude文件,每个节点一行以yarn用户执行yar
·
2021-11-16 13:46
大数据yarn
零基础学习大数据有哪些学习技巧
大数据开发
技术在不断发展,在我们生活和工作中也得到了很好的体现,而且其薪资待遇也是非常高的,因此有很多小伙伴将目光都转移到
大数据开发
技术知识的学习上来,想过通过大数据培训的方式来获得开发技术知识,以达到成功入行
大数据开发
的目的
·
2021-11-12 11:11
大数据
各技术实战开发文章整合(持续更新~~)
一、Spring框架开发SpringBoot——第一个项目Spring项目——抵御跨站脚本(XSS)攻击Spring项目——Shiro和JWT技术二、Hadoop
大数据开发
Hadoop——集群搭建(步骤图文超详细版
HuiSoul
·
2021-11-12 00:50
开发笔记
python
大数据
微信小程序
爬虫
java
大数据开发
之数据仓库Hive学习介绍
Hive是什么?Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射成为一张数据库表,并提供类SQL的查询功能。可以将sql语大数据培训句转化为MapReduce任务进行运行。Hive提供了一系列的工具,可以用来进行数据提取转化加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive的架构用户接口:Shell/CLI,CLI,Shell终端命令行,采用
·
2021-11-11 11:55
大数据hive
大数据开发
复习第五篇(Yarn篇)
文章目录3、yarn3.1、介绍yarn3.2、yarn的基本架构3.3、yarn三大组件3.3.1.ResourceManager3.3.2.NodeManager3.3.3.ApplicationMaster3.4、Yarn调度器Scheduler3.4.1.FIFOScheduler3.4.2.CapacityScheduler3.4.3.FairScheduler3.5Yarn的Job提交
落幕7
·
2021-11-10 19:01
大数据开发复习整理
big
data
yarn
hadoop
大数据开发
技术面试注意哪些方面
大数据架构与开发顾名思义大数据是一个以数据为核心的产业。大数据产业从数据的生命周期的传导和演变上可分为这几个部分:数据收集、数据储存、数据建模、数据分析、数据变现。通过各种渠道收集数据,继而通大数据培训过云数据中心储存,再通过数据科学家或业务进行建模和加工,最后数据分析找到大量看似不相关数据背后的因果关系。这些产生的信息可以作为宝贵的资产,帮助业务决策者对未来进行预测,减少试错成本,也可以降低成本
·
2021-11-10 11:43
大数据
普通211研究生
大数据开发
的秋招总结
今天先总结一些秋招结果,下次给伙伴们分享总结的
大数据开发
学习路线。
大数据老刘
·
2021-11-09 19:00
大数据开发
之数据仓库Hive
1.数据仓库的基本概念数据仓库,英文名称为DataWarehouse,可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(DecisionSupport)。它出于分析性报告和决策支持目的而创建。数据仓库本身并不“生产”任何数据,同大数据培训时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。2.数据
·
2021-11-09 12:01
大数据hive
大数据开发
之Spark SQL执行性能的提升
Catalyst是SparkSQL核心优化器,早期主要基于规则的优化器RBO,后期又引入基于代价进行优化的CBO。但是在这些版本中,SparkSQL执行计划一旦确定就不会改变。由于缺乏或者不准确的数据统计信息(如行数、不同值的数量、NULL值、最大/最小值等)和对成本的错误估算导致生成的初始大数据培训计划不理想,从而导致执行效率相对低下。那么就引来一个思考:我们如何能够在运行时获取更多的执行信息,
·
2021-11-08 12:33
大数据spark
大数据开发
基础入门与项目实战(三)Hadoop核心及生态圈技术栈之3.数据仓库工具Hive基础
文章目录1.Hive概述(1)数仓工具Hive的产生背景(2)数仓工具Hive与RDBMS对比(3)数仓工具Hive的优缺点(4)数仓工具Hive的架构原理2.Hive安装与配置(1)安装准备(2)安装MySQL元数据库(3)Hive的安装与配置(4)Hive安装的注意事项(5)参数配置3.数据类型与文件格式(1)基本数据类型及转换(2)集合数据类型(3)Hive文本文件数据编码及读时模式1.Hi
cutercorley
·
2021-11-07 11:54
大数据开发基础入门与项目实战
大数据开发
Hadoop核心及生态圈技术栈
数据仓库工具Hive基础
上一页
17
18
19
20
21
22
23
24
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他