E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
bigData
虚拟机中的快照与克隆
创建根目录:mkdir/
bigdata
查看根目录:cd/ll虚拟机1个误区:centOS是linux的一个版本。快照:对某一个特定文件系统在某一个特定时间内的一个具有只读属性的镜像。
不开心也要好一生
·
2020-09-15 03:42
通过MapReduce统计每个单子在每个文件中出现的次数(FileSplit的使用),单词作为key,所在文本和次数作为value进行统计...
代码如下:packagecn.toto.
bigdata
.mr.index;importjava.io.IOException;importorg.apache.hadoop.conf.Configuration
weixin_34211761
·
2020-09-15 03:30
Hadoop
Author:李金辉Wechat:m04194514Hadoop笔记一、概述大数据大数据(
BigData
)是指无法在一定时间范围内用常规软件工具进行捕捉、处理和管理的数据集合,需要新处理模式才能具有更强的决策力
塞纳河畔的王子
·
2020-09-15 02:41
大数据
大数据
hadoop
Hadoop(一)大数据急速入门(一看就会)
大数据(
bigdata
):指无法在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发现力和流程观察力的海量,高增长率和多样化的信息资产。
我是余傲:)
·
2020-09-15 01:22
hadoop
大数据
hadoop
mapreduce
hdfs
社会化海量数据采集爬虫框架搭建
社会化海量数据采集爬虫框架搭建随着
BIGDATA
大数据概念逐渐升温,如何搭建一个能够采集海量数据的架构体系摆在大家眼前。
ystar9
·
2020-09-15 01:49
BIG_DATA
乌兰察布,一座被大数据包围的“寂寞”之城
每一条路上都有浓郁的绿化带,松树、草坪、盆景交织在一起,路口处,花草拼出硕大的英文字样——
BigData
。街道上却空无一人,只有洒水车偶尔驶过,吊车、挖掘
虎嗅网
·
2020-09-15 00:00
Spark实现WordCount的几种方式总结
方法一:map+reduceByKeypackagecom.cw.
bigdata
.spark.wordcountimportorg.apache.spark.rdd.RDDimportorg.apache.spark
run_bigdata
·
2020-09-14 20:50
人机交互
spark
isp
rpc
weex
五分钟读懂:大数据和传统数据的区别
数据挖掘的区别是,大数据是互联网的海量数据挖掘,而数据挖掘更多是针对内部企业行业小众化的数据挖掘,数据分析就是进行做出针对性的分析和诊断,大数据需要分析的是趋势和发展,数据挖掘主要发现的是问题和诊断:1、大数据(
bigdata
非科班大数据工程师
·
2020-09-14 17:09
大数据
大数据
大数据开发
传统数据
大数据学习
cent6.5 设置open_files max_user_processes
security/limits.conf增加如下配置:roothardnproc10000rootsoftnproc10000roothardnofile10000rootsoftnofile10000
bigdata
hardnproc10000
bigdata
softnproc10000bi
魏大宾
·
2020-09-14 15:53
大数据
运维
JAVA技术F4
JAVA技术F4本文描述JAVA从基础->web->中间件->
bigdata
:基础篇1算法:1.1排序算法:直接插入排序、希尔排序、冒泡排序、快速排序、直接选择排序、堆排序、归并排序、基数排序1.2二叉查找树
阿力王
·
2020-09-14 15:44
JAVA
Spark编写wordcount程序
{SparkConf,SparkContext}//开发一个scala版本的wordcount/*bin/spark-submit--masterspark://
bigdata
111:7077--classdemo.MyWordCount
sinat_41642318
·
2020-09-14 15:42
大数据笔记
scala练习
1.统计一句话中的单词个数与一串字母中字母出现的个数packagecom.uu.
bigdata
.scala.howeworkobjectWork{defmain(args:Array[String]):
小nove
·
2020-09-14 15:12
大数据
scala
# Sqoop从Mysql导入数据到Hive
Sqoop从Mysql导入数据到Hive连接
bigdata
car数据库展示数据库中所有的表.
MarlonBrando1998
·
2020-09-14 15:40
大数据开发
Flink SQL之维表join-----实时数仓
https://blog.csdn.net/jmx_
bigdata
/article/details/107872332写的还不错~~~~~
专注于大数据技术栈
·
2020-09-14 15:36
Flink
实时数仓
维表join
Sqoop实战案例总结
安装注意事项#Setpathtowherebin/hadoopisavailableexportHADOOP_COMMON_HOME=/app/
bigdata
/hadoop#Setpathtowherehadoop
colby陈伦
·
2020-09-14 13:26
Hive
Mysql
Sqoop
Hadoop大数据系列之NoSql海量数据库Hbase详解原理篇(一)
Hbase的引言一、什么是Hbase1、hbase是Apache组织开源的顶级项目distributed,scalable,
bigdata
store产品。
wunanliu
·
2020-09-14 12:09
大数据
Hbase
数据库
大数据
hbase
java
没看过这5本硬核技术书,就别说你懂大数据
从GoogleTrend上
bigdata
的热度曲线看,2014年大数据似乎到达了顶峰,此后在慢慢“退烧”。近几年,也断断续续出现一些唱衰的声音,但行业的发展只会换一条路继续向前而不会逆转。
大数据v
·
2020-09-14 12:34
Ambari配置&安装的若干坑 centos6.8
centos6.5搭建过程可参考:(1)http://www.ibm.com/developerworks/cn/opensource/os-cn-
bigdata
-ambari/index.html(2
yypiao
·
2020-09-14 12:08
IDEA创建类模板和方法模板
FileandCodeTemplates–>Includes输入类注释模板/***湖北金鹏信息技术有限公司版权所有©Copyright2018**@Description:*@Project:vedio
bigdata
xiaozm1223
·
2020-09-14 12:32
工具
【spark2】“spark2 on yarn client提交模式下报错:XXXX line xx: xxxx 已杀死 ”问题剖析
【spark2】ai-
bigdata
-20200806.sh:行24:10259已杀死spark2-submit……前言描述观点内容问题发现内存原因OOM机制解决方案后记前言报错内容:ai-
bigdata
Jack_Roy
·
2020-09-14 09:08
Spark
Centos
spark
用客户端命令psql连接 PostgreSQL 不输入密码的方法
如下所示,输入命令后提示你输入密码:eg:在192.168.1.22连接数据库ZY-
BigData
,弹出
jack-zhu
·
2020-09-14 03:24
kafka在windows上的安装、运行
2.2安装Zookeeper下载地址:https://zookeeper.apache.org/releases.html下载后,解压放在目录D:\
bigdata
(本文所用的目录)下,关于zookeeper
ryan-su
·
2020-09-14 03:19
技术博客
kafka
kafka
windows
安装
操作日志
环境搭建
Full Text Error (FTG): Exceeded Max Configured Index Size While Indexing....
error:2009/07/2908:01:35AMFullTextmessage:Workareaoverflowndueto
bigdata
.Error-Number=1292009/07/2908:
unicorn00
·
2020-09-14 01:35
DOMINO
database
processing
performance
file
up
Spark消费kafkaf的数据,解析数据并将数据存入到Hive中
啥都不说了,直接贴代码:importkafka.serializer.StringDecoder;importnet.icsoc.
bigdata
.common.config.PropertiesLoad
梦想成真那天
·
2020-09-14 01:34
spark
Spark on Yarn
docs/2.0.2/running-on-yarn.html1.在spark-env.sh中配置HADOOP_CONF_DIR或者YARN_CONF_DIRHADOOP_CONF_DIR=/opt/
bigdata
那山的狐狸
·
2020-09-14 00:21
记录
spark
Centos7 以上 修改 hostname
用以下命令可以查询或修改主机名:查询:hostnamectlstatus修改:hostnamectlset-hostname
bigdata
.server1.com
pk_xz123456
·
2020-09-13 22:01
Linux
centos7 spark平台搭建+sbt打包实现词频统计!
安装spark使用sparkshella//读取本地文件b//读取hdfs文件c//编写wordcount程序额外附加安装sbt打包,实现词频统计centos7机器信息:192.168.189.135
bigdata
128192.168.189.136
bigdata
129192.168.189.137
bigdata
1311
余生思念你的瞳_
·
2020-09-13 20:49
计算机
Hadoop伪分布式模式搭建
1:进入Hadoop安装目录/etc/hadoop/[root@
bigdata
128hadoop-2.7.3]#lsbinetcincludeliblibexecLICENSE.txtNOTICE.txtREADME.txtsbinshare
余生思念你的瞳_
·
2020-09-13 20:49
五个角度浅析大数据与BI的区别
大数据(
BigData
)是从收集的海量数据中,通过算法将这些来自不同渠道、格式的数据进行直接分析,从中寻找到数据之间的相关性。简单而言,大数据更偏重于发现,以及猜测并印证的循环逼近过程。
weixin_34221036
·
2020-09-13 20:13
[Errno 13] Permission denied: ‘D:/
bigData
/0002.csv‘
解决办法:这边有open方法调用时加个r第二:open方法后面的目录只能必须带上文件名,不能只是文件夹。
qq_36405767
·
2020-09-13 19:53
python
python
日本神秘男子开发可自动去码AI,能“伪造”性器,震动业界
来源丨大数据文摘出品(
BigData
Digest)来源丨LINENEWShttps://mp.weixin.qq.com/s/2VM0sX3UplN8a00dMmCbUA马赛克是常见且广泛应用的图像/视频处理方式
iOS_开发
·
2020-09-13 19:27
【实战Apache-Flume采集DB数据到kafka】
是一个优秀的数据采集组件,有些重量级,其本质也是根据SQL语句的查询结果组装成opencsv格式的数据,默认的分隔符号是逗号(,),可以重写opencsv某些类进行修改1、下载[root@hadoop0
bigdata
lijieshare
·
2020-09-13 19:54
大数据之Flume
oracle bi软件_BI软件的7个有用片段
andwasfirstusedtodenoteasetoftechnologiescalleddecisionsupportsystems.Sincethen,thetermhasgrownandisnowlinkedtotheriseof“
bigdata
cunchi8090
·
2020-09-13 18:33
数据仓库
数据库
可视化
大数据
python
大数据集群
使用框架进行快速搭建,常见CDH(ClouderaManager)和HDP(Ambari)https://www.ibm.com/developerworks/cn/opensource/os-cn-
bigdata
-ambari
weixin_30437847
·
2020-09-13 18:07
Bigdata
-Cloudera CDH5生产环境推荐的硬件配置
Bigdata
-ClouderaCDH5生产环境推荐的硬件配置MasterNodeHardwareRecommendationsTypicalconfigurationsforworkernodesWorkerNodes—CPUWorkerNodes—RAMWorkerNodes—Disk
adson1987
·
2020-09-13 17:58
BigData
大数据 vr csdn_VR中的数据可视化如何革命化科学
大数据vrcsdnAstronomyhasbecomea
bigdata
discipline,andtheevergrowingdatabasesinmodernastronomyposemanynewchallengesforanalysts.Scientistsaremorefrequentlyturningtoartificialintelligenceandmachinelearningal
weixin_26713521
·
2020-09-13 16:50
可视化
python
数据可视化
人工智能
java
【MySQL】ERROR 1055 (42000) ROUP BY clause this is incompatible with sql_mode=only_full_group_by
1.背景我本地mysql8执行了一个SQL报错ysql>select*fromtb_emp_
bigdata
groupbyid%10limit150000;ERROR1055(42000):Expression
九师兄
·
2020-09-13 14:22
数据库-mysql
[
bigdata
-100] 从拉勾统计出来的 java架构师 技能树
1.基础知识java语言及其体系Java多线程、高并发、高性能Java设计模式Socket、nio通信编程熟悉TCP/IP、HTTP等各种常用通讯协议maven项目管理多国语言架构设计和开发深入理解Java虚拟机2.web开发熟悉js,jquery,ext,html5,ajax熟练掌握Struts、Spring、Hibernate、JPA、mybatis、ibaties、Jersey框架,有深入了
未济2019
·
2020-09-13 13:08
走进AI时代的文档识别技术 之表格图像识别
本文链接:https://blog.csdn.net/ShuYun
BIGDATA
/article/details/103007795版权
javastart
·
2020-09-13 12:44
图象处理
深度学习
两大数相加java
实现packagecn.mryang.tools;publicclass
BigData
{publicstaticStringadd(Stringn1,Stringn2){StringBu
夜雨mx
·
2020-09-13 11:42
软件工程
Spark报错:Error:scalac: Scala compiler JARs not found (module ‘Spark_two‘): C:\Users\沫小新\.m2\repo
module'Spark_two'):C:\Users\沫小新\.m2\repository\org\scala-lang\scala-compiler\2.11.8\scala-compiler-2.11.8.jar从D:\
BigData
Sof
x我有辣条跟我走。
·
2020-09-13 07:19
报错合集
spark
MySQL Applier for Hadoop
EnablingReal-TimeMySQLtoHDFSIntegration
BigData
istransformingthewayorganizationsharnessnewinsightsfromtheirbusiness
sanlinux
·
2020-09-13 06:13
数据库应用研究
Becoming a data scientist
LaunchingStrataLifeAdviceCareerAdviceComputerScienceMachineLearningStatisticsDataDataScienceDataAnalysisDataMining
BigData
HowdoIbecomeadatas
weixin_33957648
·
2020-09-13 03:49
Becoming a Data Scientist – Curriculum via Metromap
8Jul2013bySwamiChandrasekaran|
BigData
Analytics·DataMining·MachineLearningDataScience,MachineLearning,
CocoKit
·
2020-09-13 03:38
metromap
基于Python Plotly 对 MySQL 存储数据的可视化初步
Pyhon提供强大的可视化工具,除matplotlib外,pandas、seaborn、ggplot、bokeh、pygal、plotly都具有强大的可视功能(http://www.the
bigdata
.cn
liuph_
·
2020-09-12 22:11
数据可视化
文章标题
以下是某些大众比较认可的大数据定义:360百科:大数据(
bigdata
,megadata),或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产
huangshm23
·
2020-09-12 22:57
IT相关
大数据
时代
kafka报错Failed to find any class that implements Connector
在使用kafka的connect的功能时候遇到报错.完整报错如下:[2020-09-1111:14:53,612]ERRORFailedtocreatejobfor/home/appleyuchi/
bigdata
Applied Sciences
·
2020-09-12 22:05
Kafka
ubuntu配置cuda环境
参考:https://blog.csdn.net/
BigData
_Mining/article/details/996706421.安装合适的显卡驱动2.根据英伟达官网给出的命令安装cuda3.下载相应版本的
J_M1
·
2020-09-12 20:38
《Spark权威指南》的翻译综述
本文源地址:《Spark权威指南》的翻译综述前言本系列文章将对《Spark-TheDefinitiveGuide-
Bigdata
processingmadesimple》进行翻译,参照其他译本,取名为:
SnailDove
·
2020-09-12 18:04
spark
分布式计算
LibLinear使用总结(L1,L2正则)
(参考自http://blog.csdn.net/yt
bigdata
/a
瞭望天空
·
2020-09-12 17:36
数据挖掘&机器学习
上一页
20
21
22
23
24
25
26
27
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他