E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据开发常用技术
经历十九家企业
大数据开发
工程师面试复盘(二)
背景引入我个人计划是5月中旬争取拿到offer,但是个人技术太菜了,所以经历了一个多月的面试才有两家企业的offer,全是外包。我本人是应届毕业生,校招学历这块不起眼,选择权很少。至于大厂就基本没面。在面试中小企业我可以给大家一个借鉴。认知篇问题1:我是应届小白,求职比不上工作年限的技术人才,我是不是在一线城市很难找到工作?答:不是的,其实应届小白是可以在秋招或者春招找到实习的,如果企业招应届毕业
南潇如梦
·
2024-01-19 16:36
面试
面试
big
data
java
面试初体验:经历七场面试
大数据开发
工程师岗位总结(一)
我只想总结一下这周面试
大数据开发
岗位的精彩表现。希望可以给需要求职的同学一个好的体验。1招聘信息的收集网上投简历一般进入互联网还是使用boss直聘和拉勾网。
南潇如梦
·
2024-01-19 16:36
面试
面试
java
职场和发展
某小外包公司线上面试-
大数据开发
1.数仓和数据库的区别2.数仓建模3.hive用到的函数4.rank,dense_rank,row_number的区别5.hive数据倾斜的原因有哪些7.如何理解数据质量?6.java,scala会用吗?7.期望薪资多少?(感觉说出来就无了)面的初级岗附上hr问的问题?1.公司开发人员占比?公司规模?
劝学-大数据
·
2024-01-19 16:03
大数据面试题
大数据
德拓外包-
大数据开发
面试
1.面试官要是要看以前写过的代码,要共享屏幕怎么办?都在公司的库里,银行金融项目谁让你把代码带出去的,就是公司业务保密1.自我介绍2.数据采集相关,怎么把kafka中的数据采集到mysql中?忘了3.hive,两张表的重复数据,怎么去重?回答distinct,groupby,开窗取第一条,开窗函数是哪个?没回答上来4.udf函数写过吗,flink消费kafka中的数据写过代码吗,需要看代码?5.使
劝学-大数据
·
2024-01-19 16:03
大数据面试题
大数据
某汽车外包-
大数据开发
-面试
1.自我介绍2.hivesql的执行流程3.mapreduce的原理。4.spark的提交参数有那些命令5.sparkrdd,dataframe,dataSe解释一下。6.clickhouse怎么建表的,什么是分表7.搭建采集过程遇到的问题,关于组件信息8.分桶表和分区表的区别,分桶表的设计未来解决什么问题。9.datax用来干什么的,datax是用什么语言编写的。10.redis用过吗,在项目中
劝学-大数据
·
2024-01-19 16:28
大数据面试题
大数据
大数据工作岗位分析
本文从基础
大数据开发
岗开始分析,思考大数据工作细分有哪些岗位,分别需要什么能力,以此来提供大数据能力发展方向参考
i7杨
·
2024-01-19 13:37
大数据技术分析
大数据工作需求分析
大数据
大数据开发
之Hadoop(优化&新特征)
第1章:HDFS-故障排除注意:采用三台服务器即可,恢复到Yarn开始的服务器快照。1.1集群安全模块1、安全模式:文件系统只接收读数据请求,而不接收删除、修改等变更请求2、进入安全模式场景1)NameNode在加载镜像文件和编辑日志期间处于安全模式2)NameNode再接收DataNode注册时,处于安全模式3)退出安全模式条件dfs.namenode.safemode.min.datanode
Key-Key
·
2024-01-19 10:50
大数据
hadoop
分布式
大数据开发
之Hadoop(MapReduce)
第1章:MapReduce概述1.1MapReduce定义MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上。1.2MapReduce优缺点1.2.1优点1、MapReduce易于编程它简单的实现一些接口,就可以完
Key-Key
·
2024-01-19 06:40
大数据
hadoop
mapreduce
大数据开发
之Hadoop(Yarn)
第1章:Yarn资源调度器思考:1、如何管理集群资源?2、如何给任务合理分配资源?Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而MapReduce等运算程序则相当于运行于操作系统之上的应用程序。1.1Yarn基础架构YARN主要由ResourceManager、NodeManager、ApplicationMaster和Container等组件构成
Key-Key
·
2024-01-19 06:09
大数据
hadoop
分布式
Dinky为大数据框架Flink提供交互式平台,让你学习 FlinkSQL 更加轻松,并且掌握Flink技能!
介绍:Dinky,原名Dlink,于2022年1月17日更名,英译为“小巧而精致的”,体现了其轻量级和复杂
大数据开发
能力的特征。
知识分享小能手
·
2024-01-18 17:59
大数据
学习心得体会
大数据
flink
学习
字节跳动大数据架构面经(超详细答案总结)
我叫xxx,xxxx年x月毕业于xxx学校,xx学历,目前就职于xxx公司xxx部门,职位为:
大数据开发
工程师,主要从事于xxx组件、平台的开发工作。
Python栈机
·
2024-01-18 12:39
面试
职场和发展
python
开发语言
程序人生
MyBatis-Plus删除:物理删除与逻辑删除的实现
本专栏六篇文章围绕MyBatis-Plus的
常用技术
点,结合springboot,实现了对数据库记录的CRUD操作,其他文章请参考:《MyBatis-Plus入门案例:查询数据库中所有记录》《MyBatis-Plus
编程一只蝶
·
2024-01-18 04:54
软件测试要学习的基础知识——白盒测试
白盒测试又被称为:透明盒测试结构化测试逻辑驱动测试基于代码的测试白盒测试的
常用技术
分类一、静态分析:数据流分析控制流分析信息流分二、动态分析:逻辑覆盖循环覆盖基本路径覆盖优缺点一、优点:迫使测试人员去仔细思考软件的实现可以检测代码中的每条分支和路径揭示隐藏在代码中的错误对代码的测试比较彻底让
测试界柠檬
·
2024-01-17 23:11
软件测试
学习
软件测试
自动化测试
功能测试
程序人生
职场和发展
大数据开发
之Hadoop(HDFS)
第1章:HDFS概述1.1HDFS产出背景及定义1、HDFS产生背景随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。2、HDFS定义HDFS(HadoopDistributedFileSystem),它是一个文件系统,用于存储文
Key-Key
·
2024-01-17 10:22
大数据
hadoop
hdfs
大数据开发
之Hadoop(入门)
第1章:Hadoop概述1.1Hadoop是什么1、Hadoop是一个由Apache基金会所开发的分布式系统基础架构。2、主要解决,海量数据的存储和海量数据的分析计算问题。3、Hadoop通常是指一个更广泛的概念-Hadoop生态圈1.2Hadoop优势(4高)1、高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。2、高扩展性:再集群
Key-Key
·
2024-01-17 09:19
大数据
hadoop
分布式
工作十年总结的六条面试技巧,助力你拿到理想的offer
大数据开发
的领域不同,面试的锚定点也不同,从我过往的经验来说,可以大致来将大数据领域的开发分为如下几种:离线开发:数据仓库、离线计算、ETL开发实时开发:流计算开发基础架构:组件二次开发,底层组件稳定性维护大数据运维方向数据平台开发一
KubeData
·
2024-01-17 02:12
个人成长
面试
职场和发展
大数据
MyBatis-Plus添加:常用主键策略的分析及实现
本专栏六篇文章围绕MyBatis-Plus的
常用技术
点,结合springboot,实现了对数据库记录的CRUD操作,其他文章请参考:《MyBatis-Plus入门案例:查询数据库中所有记录》《MyBatis-Plus
编程一只蝶
·
2024-01-16 15:40
只知道HDFS和GFS?你其实并不懂分布式文件系统
点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源大数据技术与架构点击右侧关注,
大数据开发
领域最强公众号!暴走大数据点击右侧关注,暴走大数据!
王知无(import_bigdata)
·
2024-01-16 13:14
分布式
大数据
hadoop
数据库
java
大数据开发
之Flume
第1章:Flume概述1.1Flume定义Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输系统。1.2Flume基础架构1.2.1Agent1、Agent:Flume的部署单元,本质是一个JVM进程,Agent内部是以事件的形式将数据从源头送至目的。2、组成:Agent主要有3个部分组成,Source、Channel、Sink。1.2.2Source1、S
Key-Key
·
2024-01-15 12:35
大数据
flume
大数据开发
之Hive(压缩和存储)
第9章:压缩和存储Hive不会强制要求将数据转换成特定的格式才能使用。利用Hadoop的InputFormatAPI可以从不同数据源读取数据,使用OutputFormatAPI可以将数据写成不同的格式输出。对数据进行压缩虽然会增加额外的CPU开销,但是会节约客观的磁盘空间,并且通过减少内存的数据量而提高I/O吞吐量会更加提高网络传输性能。原则上Hadoop的job时I/O密集型的话就可以采用压缩可
Key-Key
·
2024-01-15 12:34
大数据
hive
hadoop
大数据开发
之Hive(企业级调优)
第10章:企业级调优创建测试用例1、建大表、小表和JOIN后表的语句//创建大表createtablebigtable(idbigint,tbigint,uidstring,keywordstring,url_rankint,click_numint,click_urlstring)rowformatdelimitedfieldsterminatedby'\t';//创建小表createtable
Key-Key
·
2024-01-15 12:34
大数据
hive
hadoop
大数据开发
之Hive(统计影音视频网站的常规指标)
第11章:Hive实战11.1数据结构1、视频表字段备注详细描述videoId视频唯一id(String)11位字符串uploader视频上传者(String)上传视频的用户名Stringage视频年龄(int)视频在平台上的整天数category视频类别(Array)上传视频指定的视频分类length视频长度(Int)整形数字标识的视频长度views观看次数(Int)视频被浏览的次数rate视频
Key-Key
·
2024-01-15 12:34
大数据
hive
hadoop
大数据开发
之Hive(基本概念、安装、数据类型、DDL数据定义、DML数据操作)
第1章:Hive基本概念1.1Hive1.1.1Hive产生背景HDFS来存储海量的数据、MapReduce来对海量数据进行分布式并行计算、Yarn来实现资源管理和作业调度。但是面对海量的数据和负责的业务逻辑,开发人员要编写MR对数据进行统计分析难度极大,所以就产生了Hive这个数仓工具。Hive可以帮助开发人员将SQL语句转化为MapReduce在yarn上跑。1.1.2hive简介Hive是基
Key-Key
·
2024-01-15 12:04
大数据
hive
hadoop
大数据开发
之Hive(查询、分区表和分桶表、函数)
第6章:查询6.1基本语法及执行顺序1、查询语句语法select_expr,select_expr,...FROMtable_reference[WHEREwhere_condition][GROUPBYcol_list][ORDERBYcol_list][CLUSTERBYcol_list|[DISTRIBUTEBYcol_list][SORTBYcol_list]][LIMITnumber]2
Key-Key
·
2024-01-15 12:04
大数据
hive
hadoop
大数据开发
之HA
第1章:HadoopHA高可用1.1HA概述所谓HA(HighAvailablity),即高可用(7*24小时不间断服务)。实现高可用最关键的策略是消除单点故障。HA严格来说应该分成各个组件的HA机制:HDFS的HA和YARN的HA。NameNode主要在以下两个方面影响HDFS集群NameNode机器发生意外,如宕机,集群将无法使用,直到管理员重启。NameNode机器需要升级,包括软件、硬件升
Key-Key
·
2024-01-15 12:03
大数据
hadoop
大数据开发
之Hive(详细版,最后有实战训练)
第1章:Hive基本概念1.1Hive1.1.1Hive产生背景HDFS来存储海量的数据、MapReduce来对海量数据进行分布式并行计算、Yarn来实现资源管理和作业调度。但是面对海量的数据和负责的业务逻辑,开发人员要编写MR对数据进行统计分析难度极大,所以就产生了Hive这个数仓工具。Hive可以帮助开发人员将SQL语句转化为MapReduce在yarn上跑。1.1.2hive简介Hive是基
Key-Key
·
2024-01-15 12:29
hive
hadoop
大数据
大数据开发
之Zookeeper
第1章:Zookeeper入门1.1概述它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper就将负责通知这些已经在Zookeeper上注册的那些观察者做出相应的反应。1.2特点一个领导者(Leader),多个跟随者(Follower)组成的集群。集群中只要有半数以上的节点存活,Zookeeper集群就能正常工作。所以Zookeeper适合安装奇数台
Key-Key
·
2024-01-15 09:25
大数据
zookeeper
分布式
Flutter--
常用技术
文档
配置清华大学flutter镜像exportPUB_HOSTED_URL=https://mirrors.tuna.tsinghua.edu.cn/dart-pubexportFLUTTER_STORAGE_BASE_URL=https://mirrors.tuna.tsinghua.edu.cn/flutter社区镜象exportPUB_HOSTED_URL=https://pub.flutter
HaiJunYa
·
2024-01-14 08:56
flutter
方案
某大公司-
大数据开发
-二面
自我介绍1.来了公司,你知道这个岗位需要做什么吗。2.你之前休息的几个月,你都干了什么。这里我回答:自己刷题,加整理简历。然后对方领导反问我一直在找工作,我说是。觉得有点傻。3.假如我是刚来的,如果我做的任务不是很好,领导和下级觉得我做的不是很满意,我该怎么办。-------------以后打死一天至多面试两场。可能是没有休息好。我觉得我思考问题的时候都慢了半拍。然后一天面试三场真的很累。发现甲方
劝学-大数据
·
2024-01-13 19:23
大数据面试题
大数据
普通程序员转型
大数据开发
需要考虑哪些因素?
大数据工程师平均年薪达20万,在中国顶尖的互联网公司里,
大数据开发
人员的薪酬比同级别的其他职位高出30%以上,这也是很多程序员纷纷选择转型
大数据开发
的原因。
你的社交帐号昵
·
2024-01-13 17:57
大数据开发
工程师需要具备哪些技能?
在回答这个问题之前,需要充分了解一下当前大数据的几个就业方向,可以参考下主流互联网行业的部门架构、职责和JD,
大数据开发
工程师,总体来说有这么几类,不同的公司叫法不一样:1、数仓开发工程师2、算法挖掘工程师
郑小柒是西索啊
·
2024-01-12 21:58
大数据
SpringBoot 原理深入及源码剖析
SpringBoot依赖管理SpringBoot项目间接继承spring-boot-dependencies,该文件对
常用技术
框架进行了统一版本管理,所以在SpringBoot项目pom.xml引入spring-boot-dependencies
zhangjunli
·
2024-01-12 17:12
spring
boot
java
后端
源码
springBoot-自动配置原理
以下笔记内容,整理自B站黑马springBoot视频,抖音Holis1、自动配置原理1.收集Spring开发者的编程习惯,整理开发过程使用的
常用技术
列表一>(技术集A)2.收集
常用技术
(技术集A)的使用参数
象鼻山大王、
·
2024-01-10 11:22
springBoot学习
spring
boot
外包-某行
大数据开发
-一面
估计是因为见到过我这种简历太多了,然后面试官直接问了问题1.clickhouse熟悉吗?2.shell熟悉吗,问了两个问题。1.如何获取文件的第一行?2.shell中怎么拼接两个字符串?3.传统数据库用的多吗?然后问了薪资多少,就没有再问了,合适再聊,就直接挂了我电话。整个过程没有超过5分钟。我回答了自己有写过相关脚本,但是其实当时都是照着抄的,面试官问两个问题我就露馅了,惭愧。从以上情况可以看出
劝学-大数据
·
2024-01-10 07:47
个人面试真题记录
大数据
大数据开发
:Hive基础知识点介绍
今天的
大数据开发
分享,我们来讲讲Hive的基础知识点。Hive简介根据官方文档的定义,Hive是一种用类SQL语句来协助读写、管理那些存储在分布式存储系统上大数据集的数据仓库软件。
加米谷大数据张老师
·
2024-01-09 13:52
大数据
数据库
hive
数据仓库
某外包~
大数据开发
~项目经理二面
一面通过后,hr开始谈工资,以为外包一面就能拿下,没想到还是要我来公司聊一聊。1.介绍之前的项目2.公司是做什么业务的3.对加班的看法4.两道sql题,直接问的1.对于交易明细表中,求每个用户最大的日期的交易记录2.求学生表中,学生的最大成绩,成绩是varchar类型。答案如下:首先进行转换,然后在排序,之所以进行转换,原因是因为varchar类型比较大小时,按照的是位与位进行比较,若2与11va
劝学-大数据
·
2024-01-09 06:12
大数据面试题
大数据
某大厂
大数据开发
-外包面试
1.自我介绍2.具体问项目流程,如项目怎么实现的3.印象最深的问题,怎么发现的,怎么解决的?4.spark用过吗,用到的开发工具5.数据量多少,服务器台数6.数仓每层做了什么事,为什么这样做?笔试题:hive-sql一个表tbl:c_idu_idscore用SQL计算每个班级top5学生的平均分表A(uid,bid),uid代表:用户idbid代表:uid关注的用户id表数据示例:uidbid12
劝学-大数据
·
2024-01-09 06:42
面试
职场和发展
大数据
大数据开发
-某外包公司
1.用过那些组件2.说下HDFS读写流程3.说下varchar和char区别4.说下数据库的事务5.spark的部署模式有哪些6.数据库和数据仓库的区别7.内部表和外部表的区别8.说下数据中台、数据仓库和数据湖的区别9.说下公司的建模模型10.说下hadoop有那些组件面试体会:因为岗位jd上有明确的表示面试可能会问到的问题,比如数据湖,但是我几乎没有复习,所以很遗憾,说的也很糟糕。然后面试官说,
劝学-大数据
·
2024-01-09 06:10
个人面试真题记录
大数据
大数据开发
学习笔记——hbase的rowkey设计
写在最前面:今日都是纯文字的笔记,希望朋友们能耐心看rowkey长度原则rowkey是一个二进制码流,可以是任意字符串,最大长度64kb,实际应用中一般为10-100bytes,以byte[]形式保存,一般设计成定长。建议越短越好,不要超过16个字节,原因如下:目前操作系统都是64位系统,内存8字节对齐,控制在16个字节,8字节的整数倍利用了操作系统的最佳特性。rowkey散列原则如果rowkey
卿卿老祖
·
2024-01-08 21:38
pandas应用和学习
一.pandas的基本内容1.Python在数据处理上有代码灵活,开发快速的特点.尤其是Python的Pandas包,无论是在数据分析领域还是在
大数据开发
场景都具有显著优势:①Pandas是Python
MSJ3917
·
2024-01-08 16:33
pandas
学习
Spark Core进阶知识
小知识:
大数据开发
人员/数据分析人员,必须要对自己统计的指标结果负责!!!
MSJ3917
·
2024-01-08 07:52
spark
大数据
分布式
中原焦点团队秦皇岛站徐娟坚持分享114天
一边是不由自主的担心,因为初级的课自己知道和掌握的情况,自己心里非常清楚,集中复习补功了几天,今晚只能硬着头皮上啦.听刘老师的课非常轻松,时间也过得超快,写了大几页,慢慢接收复习吧:1)中级班学习框架:整体思路,包括
常用技术
平衡木_e706
·
2024-01-07 12:37
有用的技术分享主题
SQLServer数据库和AgentJob集成化监控工具Airflow调度工具的安装和使用Tableau报表开发网络爬虫技术开发PythonGUI应用开发基于S3的数据湖架构设计和
大数据开发
Hive大数据仓库超大数据集去重解决方案
weixin_30777913
·
2024-01-07 10:42
sqlserver
数据库
数据仓库
big
data
etl
Linux常见面试题
题目说明:LINUX类的面试题适合传统行业实施,运维以及
大数据开发
,运维等岗位,在以上提到的岗位面试中均会有所涉及,初级岗位大部分为基础命令考核,难度丌大,但需要准确不熟练,会编写SHELL脚本会成为此类岗位求职优势
莓是草莓的莓
·
2024-01-06 01:17
Hadoop面试题与python基础
python基础(面向
大数据开发
)如果你是面向python开发,那么我的这些应该是不够用的,我的这些只够
大数据开发
人员使用;每一个岗位它对一门语言的要求掌握程度是不一样的;但是我写的这些你必须要会,它是基础中的基础
中长跑路上crush
·
2024-01-05 23:02
hadoop
python
大数据
数据分析求职-入职必备-工具篇
通常所说的数据分析岗位这个大类,细分的话还可以分为3个细类:数据研发/
大数据开发
:专注于数据的清洗和预处理,为后续消费数据的服务(比如数据分析
阿清陪你聊聊数据分析
·
2024-01-05 18:56
求职辅导
数据分析
数据挖掘
求职招聘
就业辅导
大数据开发
-Hive-常用日期函数&&日期连续题sql套路
前面是常用日期函数总结,后面是一道连续日期的sql题目及其解法套路。1.当前日期和时间selectcurrent_timestamp--2020-12-0519:16:29.2842.获取当前日期,当前是2020-12-05SELECTcurrent_date;##ORSELECTcurrent_date();--2020-12-053.获取unix系统下的时间戳SELECTUNIX_TIMEST
Hoult-吴邪
·
2024-01-05 17:37
大数据开发-系列
Hive
日期函数
android
常用技术
整理
菜单菜单知识点总结(kotlin)kotlin代码实现Activity中的MenuResultApi的使用一看就会,对startActivityForResult的几种实现方案的调用与封装Kotlin中获取contextKotlin中获取context单元测试Android单元测试只看这一篇就够了
srmmh
·
2024-01-05 16:01
android
【亚马逊云科技】自家的AI助手 - Amazon Q
本人的技术路线从Java全栈工程师一路奔向
大数据开发
、数据挖掘领域,如今终有小成,愿将昔日所获与大家交流一二,希望对学习路上的你有所助益。
一头小山猪
·
2024-01-05 14:00
征文联动
#
亚马逊云
亚马逊
Amazon
AI
Amazon
Q
人工智能
大数据开发
个人简历范本(2024最新版-附模板)
大数据开发
工程师个人简历范本>男22本科张三计算机科学与技术1234567890个人概述具备深入的Hadoop大数据运维工程师背景,熟悉相关技术和工具具备良好的团队合作能力,善于沟通和协作具有快速学习新知识和解决问题的能力对于数据科学和分析充满热情
itLeeyw
·
2024-01-05 13:53
简历怎么写
大数据
简历
简历工具
个人简历
简历模板
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他