E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
ML&DL-大数据学习
python爬虫代码-python网络爬虫源代码(可直接抓取图片)
我们应该做好前期准备工作,找到要爬的网站,然后查看它的源代码我们这次爬豆瓣美女网站,网址为:用到的工具:pycharm,这是它的图标...博文来自:zhang740000的博客Python新手写出漂亮的爬虫代码1初到
大数据学习
圈子的同学可能对爬虫都有所耳闻
编程大乐趣
·
2023-04-11 20:27
大数据学习
——Flume入门
文章目录一、Flume概述1.1、Flume定义1.2、Flume基础架构二、Flume快速入门2.1、安装Flume部署2.2、入门案例2.2.1、监控端口数据(官方案例)2.2.2、实时监控单个追加文件2.2.3、监控文件升级版2.2.4、监控文件夹变化2.2.5、断点续传——实时监控目录文件追加修改三、Flume进阶3.1、Flume事务3.2、Agent内部原理3.3、拓扑结构3.3.1、
5akura
·
2023-04-11 19:21
个人学习笔记box
大数据
linux
flume
10.
大数据学习
之旅——hive2
Hive解决数据倾斜问题概述什么是数据倾斜以及数据倾斜是怎么产生的?简单来说数据倾斜就是数据的key的分化严重不均,造成一部分数据很多,一部分数据很少的局面。举个wordcount的入门例子,它的map阶段就是形成(“aaa”,1)的形式,然后在reduce阶段进行value相加,得出“aaa”出现的次数。若进行wordcount的文本有100G,其中80G全部是“aaa”剩下20G是其余单词,那
零零天
·
2023-04-11 19:18
大数据学习之旅
大数据
大数据
hive
sqoop
大数据:数字化转型利器
工欲善其事,必先利其器在这里相信有许多想要学习大数据的同学,大家可以+下
大数据学习
裙:95
数据工程师金牛
·
2023-04-08 18:47
大数据
大数据
人工智能
机器学习
数据挖掘
数据分析
[
大数据学习
之ClickHouse]04-ClickHouse表引擎之SummingMergeTree/ReplacingMergeTree
ReplacingMergeTreeReplacingMergeTree是MergeTree子集,是MergeTree的一个变种,与MergeTree几乎无差别,仅仅比MergeTree多了一个去重的功能需要注意的是:数据去重的时间是未知且无法把控的数据的去重是在合并过程中操作的数据的去重只能在分区内,无法跨分区ReplacingMergeTree无法保证数据完全没有重复举个例子:以创建时间为去重
阿月.
·
2023-04-08 17:04
BigData
big
data
学习
大数据
大数据学习
_交互式查询工具 Impala
目录1Impala概述(实时交互式查询工具)1.1Impala是什什么1.2Impala优势1.3Impala的缺点1.4适⽤用场景2Impala安装与入门案例2.1集群准备2.2安装Impala2.2.1集群规划2.2.2具体安装2.3Impala⼊⻔案例3Imapla的架构原理3.1Impala的组件3.2Impala的查询4Impala的使⽤4.1Impala-shell命令参数4.1.1i
Shawlizao
·
2023-04-08 07:22
大数据
impala
大数据开发hive数据库常用命令汇总
在
大数据学习
当中,尤其是Hadoop生态的学习当中,Hive是必备的,也是相对门槛较低,比较好入手的一个组件。今天的大数据开发分享,和大家分享Hive的基础知识点。
爱开发V
·
2023-04-08 07:45
数据仓库
数据库
hive
mysql
大数据
学大数据需要知道什么 零基础能学大数据吗
Java是
大数据学习
需要的编程语言基础,因为大数据的开发基于常用的高级语
千锋郑州
·
2023-04-08 03:45
大数据学习
步骤是什么?
大数据学习
步骤是什么?大数据是什么?有很多朋友问过我,大数据到底是什么?一句话来…学大数据需要什么编程基础?
大数据学习
步骤是什么?学大数据需要什么编程基础?
大数据学习
步骤是什么?大数据是什么?
bengdao8698
·
2023-04-08 03:10
数据库
大数据
操作系统
【大数据是什么】
大数据运维工程师数据仓库开发工程师ETL工程师大数据开发工程师BI工程师算法工程师大数据平台开发工程师大数据架构师讲述一下自己的
大数据学习
之路大数据是做什么的?
BigDataTuTu
·
2023-04-07 16:11
大数据
大数据
阿里云
云计算
漫谈阿里那些大数据技术,
大数据学习
者必看
目前人人都在谈大数据,谈DT时代,但是,大数据是什么,每个人都有自己的一个看法,好比盲人摸象,每个都认为自己摸到是真正的大象。我也担心我所看到的,只是大数据的冰山一角,毕竟,将引领整个人类下一次变革的大数据,不是几篇文章就能说清楚的。一,DT时代大数据这个概念,其实在上世纪九十年代就有人提出来了,当时希望通过将所有零散的数据归并起来,然后进行数据挖掘,以看到以前存在的问题,去预测未来几年的趋势,来
haotian1685
·
2023-04-07 16:39
python
数据清洗
人工智能
大数据
大数据学习
深度学习
大数据
大数据技术
大数据开发
阿里大数据
什么是大数据及其背后的关键技术
在这里我还是要推荐下我自己建的
大数据学习
交流qq裙:957205962,裙里都是学大数据开发的,如果你正在学习大数据,小编欢迎你加入,大家都是软件开发党
数据工程师陈晨
·
2023-04-07 16:07
大数据
大数据
人工智能
机器学习
数据挖掘
数据分析
大数据参考架构和关键技术
大数据参考架构图在这里我还是要推荐下我自己建的
大数据学习
交流qq裙:957205962,裙里都是学大数据开发的,如果你正在学习大数据,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有大数据开发相关的
数据工程师金牛
·
2023-04-07 16:07
大数据
大数据
人工智能
机器学习
数据挖掘
数据分析
新手入门大数据,认识
大数据学习
路线
大数据介绍大数据的由来大数据的应用领域大数据方面核心技术有哪些?一、数据采集与预处理FlumeNGNDCLogstashSqoop流式计算Zookeeper二、数据存储HBasePhoenixYarnMesosRedisAtlasKudu三、数据清洗OozieAzkaban四、数据查询分析HiveImpalaSparkNutchSolrElasticsearch五、数据可视化大数据的由来已经为大家
金光闪闪耶
·
2023-04-07 13:48
apriori算法_
大数据学习
初学者必知的十大机器学习算法
本文先为初学者介绍了必知的十大机器学习(ML)算法,并且我们通过一些图解和实例生动地解释这些基本机器学习的概念。我们希望本文能为理解机器学习基本算法提供简单易读的入门概念。机器学习模型在《哈佛商业评论》发表「数据科学家是21世纪最性感的职业」之后,机器学习的研究广受关注。所以,对于初入机器学习领域的学习者,我们放出来一篇颇受欢迎的博文——《初学者必知的十大机器学习算法》,尽管这只是针对初学者的。机
weixin_39880328
·
2023-04-07 03:19
apriori算法
数据集特征提取
机器学习算法
此文献给正打算入门大数据的朋友:
大数据学习
笔记1000条(2)
501、MapReduce计算框架中的输入和输出的基本数据结构是键-值对。502、Hadoop神奇的一部分在于sort和shuffle过程。503、Hive驱动计算的“语言”是一XML形式编码的。504、Hive通过和Jobtracker通信来初始化MapReduce任务(Job)。505、Metastore(元数据存储)是一个独立的关系型数据库。很多初学者,对大数据的概念都是模糊不清的,大数据是
df_1937
·
2023-04-06 22:48
大数据学习
路线
我可以给你提供最全的【
大数据学习
路线】;帮助你搭建大数据知识体系,从入门到精通;亲自指导你大数据工程师面试的简历该如何撰写!前言本文针对非科班生转
悟空也学代码
·
2023-04-06 13:19
大数据
学习
5g
大数据学习
-Linux Shell脚本快速入门
批量处理数据,难免会有在集群中使用Shell脚本,自动跑程序,下面快速入门Shell脚本编程,本文解决一下问题:什么是Shell脚本?(和shell有什么区别)Shell脚本环境(主要有别于Windows)如何编写并运行Shell脚本Shell常用语法什么是Shell脚本?什么是Shell?其实Shell就是一个用C语言编写的程序,它是用户使用Linux的桥梁。Shell既是一种命令语言,又是一种
慕久久
·
2023-04-05 21:29
大数据学习
笔记-HDFS(四)——HDFS架构
1、HDFS架构HadoopDistributeFileSystem,Hadoop分布式文件系统,HDFS是Hadoop核心组件之一,作为生态圈最底层的分布式服务而存在。HDFS解决的问题就是大数据如何存储。架构图:主从架构(master/slave)。通常包含一个主节点和多个从节点。主节点存储和管理namespace,即文件块、位置、权限、大小、其实地址等等,从节点存储文件数据块1.1角色职责、
天码村
·
2023-04-05 19:50
大数据
hdfs
大数据
学习
【
DL-
安装遇错】卸载:不知道为啥就把TensorFlow-GPU环境装在了C盘
卸载TensorFlow-GPU环境1.先进入之前已经创建好的环境中:我的环境是:activatetf-gpu-py382.执行卸载命令pipuninstalltensorflow-gpu,发现确实是环境撞在了C盘当中,输入Y,开始卸载。问题:卸载之后发现我的C盘还是没有释放多少存储空间,发现2中地址中的文件夹下的包仍然存在,然后就把上面地址中文件夹下的东西给手动删除掉了。3.然后又一次执行删命令
★半岛铁盒
·
2023-04-05 17:28
深度学习
tensorflow
深度学习
Flume详解(包括flume框架,flume安装测试等内容)
CSDN话题挑战赛第2期参赛话题:
大数据学习
成长记录目录一、引入Flume是什么Flume能干什么Flume的特点Flume的版本FlumeOG到FlumeNGFlume的特性二、FlumeNG详解Flume
毫无感情的dj
·
2023-04-05 03:26
flume
大数据
从零开始搭建自己的大数据环境---zookeeper篇
52137951/article/details/115441112【嵌牛导读】本文介绍了如何从零搭建zookeeper环境【嵌牛鼻子】zookeeper大数据【嵌牛提问】如何使用zookeeper开始
大数据学习
之路
川上观鱼
·
2023-04-04 13:27
大数据学习
之hadoop伪分布式集群安装(一)
hadoop的基本概念:Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high
baihuayong9323
·
2023-04-04 08:29
大数据
开发工具
java
HBase架构原理(看之前请先了解HBase数据模型)
HBase整个架构与
大数据学习
生态圈一样以hadoop的HDFS文件系统为基底,通过zookeeper集群的协调建立.而集群又有自己的HMaster和HRegionServer.通过三个框架协调架构运行
请学习好嘛
·
2023-04-04 06:56
hbase
架构
hadoop
zookeeper
大数据
大数据框架:Spark生态实时流计算
今天的
大数据学习
分享,我们就主要来讲讲Spark实时流计算。Spark流计算简介Spark的SparkStreaming是早期的流计算框代表,同时还有Storm,也是针对于流计算,但是随着技术
成都加米谷大数据
·
2023-04-03 21:24
大数据学习
之Hadoop
大数据的关键技术:批处理技术、流计算、图计算、查询分析计算大数据处理架构Hadoop1.Hadoop简介apache软件基金会的开源软件,使用Java开发,但是Hadoop支持多种编程语言,有两大核心HDFS、MapReduceHadoop的特点:高可靠性。多太机器构成集群,冗余副本机制,部分机器发生故障,也不影响剩余机器的服务高效性。用多台机器来做计算,效率自然就高了高可拓展性。机器(节点)的数
@从心
·
2023-04-02 20:27
大数据
hadoop
mapreduce
big
data
大数据学习
Hadoop之HDFS详解二
一、HDFS基础5、HDFS的写流程5.1、写流程图:1、client调用FileSystem.create(filepath)方法,与namenode进行rpc通信,namenodecheck该路径的文件是否存在以及有没有权限创建该文件;如果能创建,就创建一个新文件,但并不关联任何block,返回一个FSdataoutputstream对象;否则,就返回错误的信息。2、client调用FSDat
追风邵
·
2023-04-02 19:13
大数据学习
规划
当我说要做大数据工程师时他们都笑我,直到三个月后……2017年10月25日14:52:16GitChat技术杂谈阅读数:70119版权声明:本文为GitChat作者的原创文章,未经GitChat允许不得转载。https://blog.csdn.net/GitChat/article/details/78341484GitChat作者:Fickr孫啟誠原文:三个月大数据研发学习计划实战解析关注微信公
yhblog
·
2023-04-01 06:06
Hadoop
大数据学习规划
卓飞考资今日更新1125
【2020年二建】【管理】精讲班-
DL-
基础夯实-王强【管理】精讲班-XT-全考点班-陈晨(续)【管理】精讲班-YL-专题班-燃烧先生(续)【管理】精讲班-ZY-基础直播-缴广才(续)【水利】精讲班-HQ
卓飞考资
·
2023-03-31 23:21
大数据学习
----接口获取数据
用kettle的转换和作业实现一、首先写转换1、表输入在这里面写入时间戳的时间,先进行数据库的连接(一般找_metadata的数据库,然后选中timestamp的时间戳字段)SELECTtimestampFROMa_TIMESTAMPWHEREid=''运用好这段sql语句从而获取时间戳的日期时间。2、JavaScript代码一定要去postman上解析接口看他的headers是不是为conten
佛系小樂
·
2023-03-31 22:20
工作
大数据
数据库
大数据学习
路线图(2023完整高清版超详细)
超详细的
大数据学习
路线图来啦,2023版是首发哟!
千锋IT教育
·
2023-03-31 18:08
学习
[
大数据学习
笔记]HDFS包含哪些角色?
1.Namenode:接收客户端的读写请求存储元数据信息接收datanode的心跳报告负载均衡分配数据块的存储节点2.DataNode:真正处理客户端的读写请求向namenode发送心跳向namenode发送块报告真正的数据存储副本之间的相互复制3.Client:进行数据块的物理切分向namenode发送读写请求向namenode发送读写响应
yangyi_33855
·
2023-03-31 01:36
大数据
大数据学习
记录-Hadoop框架核心(HDFS、MapReduce、YARN)
该文章为lagou学习记录笔记,里面的资源和内容来自lagou,作为大数据菜鸡,如果内容部分有错误还请各位大佬指出并纠正,谢谢大数据技术解决的是什么问题?大数据技术解决的主要是海量数据的存储和计算大数据的定义:是指无法在一定时间内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式。大数据的特点:5v(volumn–大量、velocity–高速、variety–多样、veracity真实
对方还不是你的好友
·
2023-03-30 20:46
hadoop
big
data
mapreduce
hdfs
yarn
关于数仓及其分层
目录一、基本介绍二、数据仓库的特点1、面向主题2、数据集成3、相对稳定4.反映历史变化三、数仓工具1、一般工具2、
大数据学习
工具之Hive2.1Hive的
大数据学习
优势2.2Hive数据仓库架构及原理四
Dylan~
·
2023-03-30 02:03
hive
大数据学习
——hadoop分布式计算框架MapReduce之词频获取
MapReduce介绍和优缺点MapReduce是Hadoop中面向大数据并行处理的计算模型,框架和平台。其具有1.易于编程(实现接口便可完成程序)2.平滑无缝的可扩展性(可布置在廉价服务器上,并且只要增加机器数量便可提高MapReduce集群的计算性能)3.高容错性(MapReduce框架有多种有效的错误检测和恢复机制)4.高吞吐量(可处理PB级别的数据)的特点。但是,MapReduce也具有以
我不想学习啊
·
2023-03-26 18:44
大数据学习
java
hadoop
mapreduce
大数据
大数据学习
——Hadoop集群伪分布模式的搭建(超详细)
Hadoop集群伪分布模式的搭建JunLeon——gobigorgohome目录Hadoop集群伪分布模式的搭建1、配置免密登录2、HDFS的配置、启动与停止(配置文件均在hadoop的主目录下操作)(1)配置hadoop-env.sh(2)配置core-site.xml(3)配置hdfs-site.xml(4)格式化HDFS3、YARN的配置、启动与停止(配置文件均在hadoop的主目录下操作)
IT路上的军哥
·
2023-03-26 18:11
大数据学习之路
hadoop
big
data
ssh
java程序员3个月业余时间自学大数据路径
前言:一、背景介绍二、大数据介绍正文:一、大数据相关的工作介绍二、大数据工程师的技能要求三、
大数据学习
规划四、持续学习资源推荐(书籍,博客,网站)五、项目案例分析(批处理+实时处理)前言一、背景介绍本人目前是一名大数据工程师
zl1zl2zl3
·
2023-03-25 17:52
大数据
Java
大数据
大数据学习
路线,芜湖 起飞~
磨拳擦掌!说数据是一个企业最核心的东西之一,我想大家应该都能基本认同吧,毕竟连XXX都说过,这是一个数据为王的时代,谁掌握了数据谁就掌握未来!怪不得个个都磨拳擦掌,都嚷嚷着想搞大数据。注:本文已收录于Github开源项目:github.com/hansonwang99/JavaCollection,里面有各大方向编程的详细自学路线、面试题和面经、编程资料及系列技术文章等,资源持续更新中大数据开发基
CodeSheep程序羊
·
2023-03-25 17:49
技术分享
kylin
flink
kafka
spark
hadoop
自学大数据路线
大数据学习
线路图这个学习线路图,主要是介绍接下来要学习的买个阶段,以及每个阶段能学到什么知识!
weixin_30753873
·
2023-03-25 17:49
人工智能
java
大数据
自学大数据:
大数据学习
线路及各阶段学习书籍
大数据学习
路线及各阶段学习书籍推荐!
bobo79888
·
2023-03-25 17:17
大数据
大数据
大数据学习
大数据开发
大数据入门
人工智能
学习大数据 推荐用这套
大数据学习
路线
我在跟学生的聊天中,了解到,很多小伙伴都想要学习大数据技术,但真的不知道该如何学习,从哪个方向开始,又如何一步一步将大数据技术归为自己技能的呢?我们的大数据开发课程,真实商业数源授课,致力于大数据系统集能及区块链为辅,全程企业真实项目深度实操,带领学生一站式搞定匪夷所思的大数据开发技术。自2017年底推出大数据+人工智能课程,至今大纲标准化迭代5次,近期课程再度升级,新增87个核心技术点,课时增加
QFdongdong
·
2023-03-25 09:10
大数据学习
的思维原理和方法?值得收藏
1、数据核心原理从“流程”核心转变为“数据”核心大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。Hadoop体系的分布式计算框架已经是“数据”为核心的范式。非结构化数据及分析需求,将改变IT系统的升级方式:从简单增量到架构变化。大数据下的新思维——计算模式的转变。例如:IBM将使用以数据为中心的设计,目的是降低在超级计算机之间进行大量数据交换的必要性。大数据下,云计算找到了破茧
金光闪闪耶
·
2023-03-23 23:20
大数据专业应该怎么学习
大数据学习
不能停留在理论的层面上,大数据方向切入应是全方位的,基础语言的学习只是很小的一个方面,编程落实到最后到编程思想。学习前一定要对大数据有一个整体的认识。大数据是数据量多吗?
我想去吃ya
·
2023-03-23 11:20
大数据
学习
hadoop
开发语言
python
sqoop导出solr数据_超详细的
大数据学习
的各个阶段
摘要:第一阶段:Linux课程讲解Linux基础操作,讲的是在命令行下进行文件系统的操作,这是Hadoop学习的基础,后面的所有视频都是基于linux操作的。鉴于很多学员没有linux基础,特增加该内容,保证零linux基础入门。如果你从没有使用过linux,别担心,本节内容可以让你入门。Linux认识linux如何使用vmware安装linux镜像认识linux的桌面环境、shell环境在she
weixin_39986741
·
2023-03-23 02:50
sqoop导出solr数据
大数据学习
之Hadoop——01Hadoop简介
欢迎关注我的CSDN:https://blog.csdn.net/bingque6535一.Hadoop基础:1.大数据特点(4V)Volume:大量Velocity:高速Variety:多样Value:低价值密度2.Hadoop的优势(4高):高可靠性:Hadoop底层维护多个数据副本高扩展性:在集群间分配任务数据,可方便扩展数以千计的节点.高效性:在MapReduce的思想下,Hadoop是并
Jiang锋时刻
·
2023-03-22 09:51
大数据学习
难度剖析
那么人们就会有一些疑问,
大数据学习
难度怎么样,难学吗?有许多0基础的学员没有学习过编程言语,乃至很少触摸过核算机,那就是说0基础的不能学习大数据?答案是否定的。
kuntoria
·
2023-03-20 07:22
学习编程之后最常见的六大谎言,你中了几条?
以及我自己整理了一套最新的
大数据学习
系统教程,包括Hadoop,数据挖掘,数据分析。送给正在学习大数据的小伙伴!这里是
大数据学习
者聚集地,欢迎初学和进阶中的小伙伴!
玩大数据的小轩
·
2023-03-19 21:29
大数据学习
-辅助名称节点的配置
因为原来的节点只有一个名称节点和三个数据节点,现在为了学习辅助名称节点和进行机架感知,对节点进行扩充,添加了一个辅助名称节点和一个数据节点,顺便把namenode和datanode的dir添加一下,添加两个目录是为了防止一个目录中文件损坏另一个目录能继续使用,两个目录中的数据是一样的。在namenode的hdfs-site.xml中添加,并且分发。dfs.namenode.fs-limits.mi
smallgrey
·
2023-03-18 12:54
大数据学习
之路(持续更新中...)
前言在学习大数据之前,先要了解他解决了什么问题,能给我们带来什么价值。一方面,以前IT行业发展没有那么快,系统的应用也不完善,数据库足够支撑业务系统。但是随着行业的发展,系统运行的时间越来越长,搜集到的数据也越来越多,传统的数据库已经不能支撑全量数据的存储工作;另一方面,数据越来越多,单机的计算已经成为瓶颈。因此,基于分布式的大数据系统崭露头角。那么大数据系统里面都有什么东西呢?可以参考下面的图大
爱java的三罗
·
2023-03-18 01:53
大数据学习
之Hadoop——08Mapreduce执行过程详解
欢迎关注我的CSDN:https://blog.csdn.net/bingque6535本文转载于:https://blog.csdn.net/yangshaojun1992/article/details/85003668一、分析MapReduce执行过程MapReduce运行的时候,会通过Mapper运行的任务读取HDFS中的数据文件,然后调用自己的方法,处理数据,最后输出。Reducer任务
Jiang锋时刻
·
2023-03-17 09:42
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他