E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark系统性学习专栏
Android系统build.prop文件生成过程
Android系统build.prop生成过程这个文件类似于windows的注册表文件,定义了系统初始的一些参数属性,功能的开放等,通过调整或增加这些参数可以达到校调
系统性
能偏重点和附加功能开启的作用。
Sparky
·
2024-02-09 20:26
高并发系统简单玩!Alibaba全新出品亿级并发设计速成笔记真香
前言如何提升
系统性
能,设计出一个靠谱的系统是每一个架构师或者正在往架构师方向进阶的同僚们都需要考虑的问题。
沐子李青
·
2024-02-09 20:29
ClickHouse-简谈OLAP与ClickHouse
在第一届易观OLAP大赛中,在用户行为分析转化漏斗场景里,ClickHouse比
Spark
快了近10倍。在随后几年的
adson1987
·
2024-02-09 18:00
Database
ClickHouse
OLAP
海量数据分析
statsmodels专栏1——探索数据的起点:Python中的statsmodels库简介
数据分析是一项
系统性
的过程,旨在从大量数据中提取有意义的信息和
theskylife
·
2024-02-09 14:30
数据分析
python学习之旅
python
开发语言
数据分析
线性回归
数学建模
初识kafka
目前越来越多的开源分布式处理系统如Cloudera、Storm、
Spark
、Flink等都支持与Kafka集成。
tracy_668
·
2024-02-09 14:07
69.Kudu、
Spark
2、Kafka安装—CDH
69.1演示环境介绍CDH集群运行正常操作系统版本为:CentOS6.5CM和CDH版本为:5.12.1CM管理员为:admin用户操作系统用户为:root用户69.2操作演示Kudu安装Kudu的Parcel部署下载Kudu的Parcel包:http://archive.cloudera.com/kudu/parcels/5.12.1/KUDU-1.4.0-1.cdh5.12.1.p0.10-e
大勇任卷舒
·
2024-02-09 14:55
spark
开发中的Zip算子灵活使用
本人开发中,需要聚合的文段举个栗子:RDD中有如下元素kv((a,b),List(7,8,9))((a,b),List(1,2,3))((a,b),List(4,5,6))((c,d),List(4,5,6))。。。。。。reducebyke后要对v操作原理将v中的list前后zip再map每个元素进行逐个元组元素(口,口)的累加。a代表v的前一个元素,b代表v的后一个元素如vala=List(7
Hero.Lin
·
2024-02-09 13:35
spark
scala
开发
spark-core
分布式与集群的区别究竟是什么?
IntelDeveloperForum2005)上,Intel首席执行官CraigBarrett就取消4GHz芯片计划一事,半开玩笑当众单膝下跪致歉,给广大软件开发者一个明显的信号,单纯依靠垂直提升硬件性能来提高
系统性
能的时代已结束
程序员吴乘风
·
2024-02-09 12:02
连载47《管理:使命、责任、实务(实务篇)》笔记
许多的悲剧都是
系统性
错误造成的,看似每个部门都按部就班的完成了自己的工作,但最终却偏离了整个目标,导致奶酪穿孔。很可惜的是要达成系统目标,必
医管求索者
·
2024-02-09 11:52
Spark
是什么?与MapReduce的对比
Spark
是一个基于内存的集群计算系统,是一个分布式的计算框架。
Spark
可以将计算任务分发到多个机器并行计算。
Tim在路上
·
2024-02-09 10:27
spark
资源动态释放
通过
spark
-submit会固定占用一占的资源,有什么办法,在任务不运作的时候将资源释放,让其它任务使用呢,yarn新版本默认已经支持了,我们使用的是HDP。
kikiki2
·
2024-02-09 09:54
全网首发,20年架构师手写《架构解密:从分布式到微服务》开源
在日益复杂和多样化的系统需求下,如何设计出既符合业务需求又能够满足
系统性
能、可靠性和可扩展性要求的架构,一直是一个挑战。因此,架构
不会敲代码的谌
·
2024-02-09 09:26
架构
分布式
微服务
后端
java
《认知盈余》——自由时间的力量
本书思维导图2020年的开头很难,这个新年宅家里便度过了,一口气拜读完克莱舍基的《认知盈余》后,对于如今的互联网-共享经济时代的逻辑有了
系统性
的认识,是的,互联网正改变着这个时代,各种各样利用认知盈余创造美好的案例正在发生
6ea0cfdfb999
·
2024-02-09 09:45
macos安装local模式
spark
文章目录配置说明安装hadoop安装
Spark
测试安装成功配置说明Scala-3.18+
Spark
-3.5.0Hadoop-3.3.6安装hadoop从这里下载相应版本的hadoop下载后解压,配置系统环境变量
SparklingTheo
·
2024-02-09 08:52
大数据-linux
macos
spark
大数据
OD课程学习记录-华为人才管理之道
从战略高度上对待人才将人才管理视为企业的核心竞争力,在人才管理和干部管理方面不断精进,管理理念深入人心,组织执行力强;2、用逻辑严密的流程体系来管理人才用人标准、人才招募、人才使用、人才激励等环环相扣、互相约束,整体架构清晰,
系统性
强
王佳_72ac
·
2024-02-09 07:57
pg能够提高可靠性的参数,pg_checksums
PostgreSQL从9.3开始支持数据页的checksum,可以在执行initdb时指定-k或--data-checksums参数开启checksum,但开启checksum可能会对
系统性
能有一定影响
code_feien
·
2024-02-09 06:18
数据库
postgresql
SQL条件判断语句嵌套window子句的应用【易错点】--HiveSql面试题25
目录0需求分析1数据准备3数据分析4小结0需求分析需求:表如下user_idgood_namegoods_typerk1hadoop1011hive1221sqoop2631hbase1041
spark
1351flink2661kafka1471oozie108
莫叫石榴姐
·
2024-02-09 06:00
SQLBOY1000题
sql
HiveSql面试题
sql
HiveSQL——条件判断语句嵌套windows子句的应用
0需求分析需求:表如下user_idgood_namegoods_typerk1hadoop1011hive1221sqoop2631hbase1041
spark
1351flink2661kafka1471oozie108
爱吃辣条byte
·
2024-02-09 06:58
#
HIve
SQL
大数据
数据仓库
Spark
SQL(十一):与
Spark
Core整合
每日top3热点搜索词统计Demo1、数据格式:日期用户搜索词城市平台版本2、需求:1、筛选出符合查询条件(城市、平台、版本)的数据2、统计出每天搜索uv排名前3的搜索词3、按照每天的top3搜索词的uv搜索总次数,倒序排序4、将数据保存到hive表中3、实现思路:1、针对原始数据(HDFS文件),获取输入的RDD2、使用filter算子,去针对输入RDD中的数据,进行数据过滤,过滤出符合查询条件
雪飘千里
·
2024-02-09 06:34
大数据 -
Spark
系列《五》-
Spark
常用算子
Spark
系列文章:大数据-
Spark
系列《一》-从Hadoop到
Spark
:大数据计算引擎的演进-CSDN博客大数据-
Spark
系列《二》-关于
Spark
在Idea中的一些常用配置-CSDN博客大数据
王哪跑nn
·
2024-02-09 05:25
spark
大数据
spark
分布式
SQL、Hive中的SQL和
Spark
中的SQL三者联系与区别
SQL、Hive中的SQL和
Spark
中的SQL(即
Spark
SQL)都是用于处理和分析数据的查询语言,但它们在实现、性能、应用场景等方面存在一些明显的区别和联系。
大数据SQLboy
·
2024-02-09 05:20
数据库
Spark
Hive
数据库
py
spark
操作示例
前置pipinstallpy
spark
为了支持py4j的使用,需要进行如下设置,并修改了java_gateway.py中的env['_PY
SPARK
_DRIVER_CALLBACK_HOST']='127.0.0.1
佛系小懒
·
2024-02-09 05:15
阅读的精确期
工作后开始看教育教学实践性强、更接地气的书籍,也都是听外人评论不错的书,一本一本地买来,并没有什么
系统性
。
文艺清年
·
2024-02-09 05:00
spark
从入门到放弃二十八:
Spark
Sql (1)Data Set
文章地址:http://www.haha174.top/article/details/257834项目源码:https://github.com/haha174/
spark
.git1.简介
Spark
Sql
意浅离殇
·
2024-02-09 03:17
再聊阴影裁剪与高性能视锥剔除
【U
Spark
le专栏】如果你深怀绝技,爱“搞点研究”,乐于分享也博采众长,我们期待你的加入,让智慧的火花碰撞交织,让知识的传递生生不息!
UWA
·
2024-02-09 03:24
厚积薄发
Unity优化
阴影
unity
spark
原理总体介绍
拿到系统后,部署系统是第一件事,那么系统部署成功以后,各个节点都启动了哪些服务?部署图image.png从部署图中可以看到整个集群分为Master节点和Worker节点,相当于Hadoop的Master和Slave节点。Master节点上常驻Master守护进程,负责管理全部的Worker节点。Worker节点上常驻Worker守护进程,负责与Master节点通信并管理executors。Driv
tracy_668
·
2024-02-09 03:48
PDF如何页面插入
操作软件:旋风PDF编辑器下载地址:http://www.679
spark
le.com/pdfeditor1.运行旋风PDF编辑器,打开你想要编辑的文件。
六号_db7a
·
2024-02-09 00:18
文言文那么难懂,中国古代平民说话也用文言文吗?
白话文作为一种全民性的语体,相较于文言文而言,它更加通俗易懂,哪怕是目不识丁未接受过
系统性
文化教育的人,也能听懂并用口语流畅表达出自己的想法。
剑惊禅
·
2024-02-08 23:33
Linux 性能优化的全景指南,都在这一篇里了,建议收藏~
选择指标评估应用程序和
系统性
能为应用程序和系统设置性能目标进行性能基准测试性能分析定位瓶颈性
开源Linux
·
2024-02-08 23:48
linux
性能优化
服务器
运维
java
Linux性能优化知识点总结大全 · 实践+收藏版
选择指标评估应用程序和
系统性
能为应用程序和系统设
开源Linux
·
2024-02-08 23:47
linux
java
操作系统
cpu
面试
「干货」Linux性能优化全景指南
选择指标评估应用程序和
系统性
能为应用程序和系统设置性能目标进行性能基准测试性能
简说Linux内核
·
2024-02-08 23:16
linux
运维
服务器
嵌入式开发
Linux内核
Mysql-性能优化-数据库优化
但是需要注意点是开启慢查询日志会对
系统性
能有一定的影响,可以考虑打开其中一台从服务器的慢查询日志,这样既可以监控慢查询,对
系统性
能影响又小。
njnu@liyong
·
2024-02-08 22:40
数据库
数据库
mysql
性能优化
Flink状态编程
Spark
Streaming在状态管理这块做的不好,很多时候需要借助于外部存储(例如Redis)来手动管理状态,增加了编程的难度.访问redis需要通过网络访问,增大处理时间状态一致性问题,可能会造成数据的不一致
万事万物
·
2024-02-08 22:41
7.0 MapReduce编程实例教程
MapReduce主要是依靠开发者通过
Spark
来实现功能的,开发者可以通过实现Map和Reduce相关的方法来进行数据处理。为了简单的展示这个过程,我们将手工编写一个字数统计程序。
二当家的素材网
·
2024-02-08 18:11
Hadoop
教程
mapreduce
eclipse
大数据
2022年开篇
自我重整,通过2021年一路走下来的过程中留下的痕迹,做了一次
系统性
的总结。那么2022年何去何从便有了清晰的目标。其实,人的认知是受很
求阙者
·
2024-02-08 17:56
Golang数据库编程详解 | 深入浅出Go语言原生数据库编程
Golang
学习专栏
:https://blog.csdn.net/qq_35716689/category_12575301.html前言对数据库的CURD是现代应用程序的必备功能,Go语言当然也对数据库的操作提供了非常完善的支持
鼠鼠我捏,要死了捏
·
2024-02-08 17:17
Golang全栈
golang
数据库
开发语言
后端
云原生
Spark
经典案例之非结构数据处理
需求:根据tomcat日志计算url访问了情况,具体的url如下,要求:区别统计GET和POSTURL访问量结果为:访问方式、URL、访问量测试数据集:在CODE上查看代码片派生到我的代码片196.168.2.1--[03/Jul/2014:23:36:38+0800]“GET/course/detail/3.htmHTTP/1.0”200384350.038182.131.89.195--[03
张明洋_4b13
·
2024-02-08 15:57
深入理解
Spark
的前世今生
文章来源:https://blog.csdn.net/qq_42107047/article/details/80239094感谢大神分享~~~~~一:大数据的概述1.1
Spark
是什么?
闲云野鹤~~~
·
2024-02-08 14:01
Spark
【
Spark
重点难点】你以为的Shuffle和真正的Shuffle
我们的【
Spark
重点难点】系列继续更新。以往的系列:我们在学习
Spark
的时候,到底在学习什么?
王知无(import_bigdata)
·
2024-02-08 14:00
大数据
spark
java
python
数据库
深入理解
Spark
BlockManager:定义、原理与实践
深入理解
Spark
BlockManager:定义、原理与实践1.定义
Spark
是一个开源的大数据处理框架,其主要特点是高性能、易用性以及可扩展性。
涤生大数据
·
2024-02-08 14:57
spark
大数据
分布式
数据可视化教程!我将全程出镜解说
包括方法论,选择图表方法,颜色搭配,美学设计等
系统性
视频教程。同时,我会全程出镜解说,并且公布所有
算法channel
·
2024-02-08 14:43
信息可视化
spark
spark
.shuffle.service.enabled
操作场景
Spark
系统在运行含shuffle过程的应用时,Executor进程除了运行task,还要负责写shuffle数据,给其他Executor提供shuffle数据。
不搬砖的程序员不是好程序员
·
2024-02-08 13:59
spark
spark
GC分析(一)
GC分析是优化了
系统性
能,涉及到CPU、CACHE、IO各个方面都要综合进行考虑,今天只讲一小部分,GC分析。
程序猿想吃肉
·
2024-02-08 13:12
Samtec微波、毫米波连接器系统实现卓越性能
其中之一是各种微波、毫米波连接器系统,这些
系统性
能卓越,令人印象深刻。Samtec射频设计与仿真工程经理MichaelGriesi向我们介绍了演示过程和结果。
SamtecChina2023
·
2024-02-08 13:26
网络
spark
好的文章链接
https://blog.51cto.com/u_16099325/6763760`java
spark
官方文档
spark
javaapi手册http://www.17bigdata.com/book/
spark
Trank-Lw
·
2024-02-08 13:18
spark
大数据
分布式
服务器运存使用率多少正常?
如果服务器的运存使用率长时间超过90%,可能会导致
系统性
能下降、应用程序运行缓慢、甚至出现内存溢出等问题。如果运存
恒创HengHost
·
2024-02-08 13:41
服务器
运维
史上最全OLAP对比
目录1.什么是OLAP2.OLAP引擎的常见操作3.OLAP分类MOLAP的优点和缺点ROLAP的优点和缺点4.并发能力与查询延迟对比5.执行模型对比5.OLAP引擎的主要特点5.2
Spark
SQL、FlinkSQL5.3Clickhouse5.4Elasticsearch5.5Presto5.6Impala5.7Doris5.8Druid5.9Kylin
只会写demo的程序猿
·
2024-02-08 11:04
数仓
spark
hadoop
数据仓库
Spark
:基于莱文斯坦(Levenshtein)距离计算字符串相似度
以下程序代码基于
spark
,使用scala语言,测试时间:2018-08-03str1和str2相似度=1-Levenshtein距离/max(length(str1),length(str2))valdf
xuejianbest
·
2024-02-08 11:25
大数据
算法
编程语言/Scala
大数据/spark
Levenshtein
字符串相似
莱文斯坦距离
spark
scala
系统性
能指数
系统性
能指数QPS每秒查询率QueryPerSecond服务器在一秒的时间内处理了多少个请求计算关系:QPS=并发量/平均响应时间并发量=QPS*平均响应时间我们通常是指HTTP请求,显然数字越大代表服务器的负荷越高
26857259
·
2024-02-08 11:20
技术杂货铺
后端
中间件
性能优化
MML
Spark
+
Spark
:py
spark
+lightGBM应用实践
MML
Spark
,即MicrosoftMachineLearningforApache
Spark
,是微软开源的一个针对Apache
Spark
的深度学习和数据可视化的库。
bensonrachel
·
2024-02-08 10:38
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他