E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据大数据处理etl书籍
大数据
:数字时代的变革引擎
在当今这个数字化飞速发展的时代,
大数据
无疑是最为耀眼的存在,如同变革的引擎,驱动着各个领域的创新与发展。
大数据
的起源可追溯到信息技术发展的早期阶段。
·
2025-01-21 12:50
大数据
【Redis】使用redis-cli的“--bigkeys”选项查找大Key
通常我们会将含有较
大数据
或含有大量成员、列表数的Key称之为大Key,下面我们将用几个实际的例子对大Key的特
奇墨 ITQM
·
2025-01-21 12:55
redis
数据库
缓存
飞轮科技荣获中国电信星海
大数据
最佳合作伙伴奖!
与会期间,为了感谢2024年生态合作伙伴对中国电信数据业务发展工作的支持,会议举行了“星海
大数据
·最佳合作伙伴奖”颁奖仪式。飞轮科技凭借其在数据分析领域的卓越表现与深厚实力,获得这一殊荣。
·
2025-01-21 12:20
用
大数据
“喂养”出来的AI模型ChatGPT 爆火是
大数据
、大算力、强算法的支撑,中国缺乏的什么?
先来了解一下ChatGPT的基本情况ChatGPT本质属于生成式人工智能,属于无监督或半监督的机器学习。与之相关的还有Discriminativemodeling区分式模型,区分式模型大多属于监督式学习。生成性人工智能目前有两种主要的框架:GAN(GenerativeAdversarialNetwork)和GPT(GenerativePre-trainedTransformer)。GAN目前广泛应
Ai17316391579
·
2025-01-21 12:54
深度学习服务器
人工智能
大数据
学习(37)- Flink运行时架构
&&
大数据
学习&&系列专栏:哲学语录:承认自己的无知,乃是开启智慧的大门如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦1)作业管理器(JobManager)JobManager是一个
viperrrrrrr
·
2025-01-21 09:57
学习
flink
大数据
批量作业调度、数据挖掘,这几款应该是今年 “最值得推荐” 的
ETL
工具了
工具传送门:Taskctl商业付费版(付费)TaskctlWeb商业免费版(永久免费)Kettle(开源免费)Datastage(付费)
ETL
是数据仓库中的非常重要的一环,是承前启后的必要的一步。
加菲盐008
·
2025-01-21 06:32
taskctl
Kettle
kettle
etl
批量作业调度
数据挖掘
taskctl
ETL
作业调度工具TASKCTL的两个重大突破
在传统设计理念下,流程图的可视化、作业流的定义设计功能,随着作业量增加,越来越难用,越来越不适用是一个难以避免的问题。就这两个问题,我给大家分享一下TASKCTL是如何转变思路、如何突破、如何带来一些更理想的效果。同时,我也希望通过此次分享,带来一些抛砖引玉的效果,希望业界更多同仁,就批量调度技术更多的问题,敢于突破,使整个批量调度技术变得更完善、更易用。第一部分:两大问题的再分析在传统理念下,流
加菲盐008
·
2025-01-21 06:32
【开源免费】kettle作业调度—自动化运维—数据挖掘—informatica-批量作业工具taskctl
关注公众号"taskctl",关键字回复"领取"即可获权产品简介taskctl是一款由成都塔斯克信息技术公司历经10年研发的
etl
作业集群调度工具,该产品概念新颖,体系完整、功能全面、使用简单、操作流畅
加菲盐008
·
2025-01-21 06:31
Kettle
ETL作业调度工具
taskctl
运维
数据库
linux
大数据
数据挖掘
python转转商超
书籍
信息爬虫
1基本理论1.1概念体系网络爬虫又称网络蜘蛛、网络蚂蚁、网络机器人等,可以按照我们设置的规则自动化爬取网络上的信息,这些规则被称为爬虫算法。是一种自动化程序,用于从互联网上抓取数据。爬虫通过模拟浏览器的行为,访问网页并提取信息。这些信息可以是结构化的数据(如表格数据),也可以是非结构化的文本。爬虫任务的执行流程通常包括发送HTTP请求、解析HTML文档、提取所需数据等步骤。1.2技术体系1请求库:
Python数据分析与机器学习
·
2025-01-21 06:29
爬虫
python
网络爬虫
爬虫
DolphinScheduler × Jiron:打造高效智能的数据调度新生态
gitee.com/642933588/jiron-cloudDolphinScheduler×Jiron:打造高效智能的数据调度新生态DolphinScheduler是一个开源的分布式任务调度平台,专为
大数据
场景下的工作流调度和数据治理而设计
jiron开源
·
2025-01-21 06:26
平台开发
flink
大数据
hadoop
hive
sqoop
spring
cloud
sentinel
一种时序数据模式演化的跟踪与查询方法
摘要在物联网与
大数据
应用蓬勃发展的背景下,各类感知设备产生海量的时序数据,设备管理软件版本的快速迭代导致时序数据的模式演化问题日益凸显.模式演化要求对数据模式进行版本管理,使数据进行模式变更时不产生信息损失
米朵儿技术屋
·
2025-01-21 05:21
智能科学与技术专栏
分类
学习
数据挖掘
FPGA在高速数据采集系统中的应用!!!
以下是FPGA在高速数据采集系统中的详细应用,以及一些具体例子:1.应用背景高速数据采集系统通常用于需要高采样率和
大数据
量处理的场合,如雷达信号处理、医疗成像、高速通信等。
FPGA资料库
·
2025-01-21 05:50
fpga开发
fpga
verilog
物联网
stm32
AWS学习笔记——Chapter5 Identity and Access Management and Security on AWS
前注:学习
书籍
IndexIdentityandAccessManagementandSecurityonAWS1.Authentication(认证)2.Authorization(授权)3.Auditing
坚果壳er
·
2025-01-21 03:35
AWS学习
springboot配置logback日志
SpringBoot的默认日志框架选用的是Logback)在需要记录日志的地方加上staticLoggerlogger=LoggerFactory.g
etL
ogger(Main.class);就可以使用
hrthntyj
·
2025-01-21 02:48
spring
boot
logback
java
Mysql数据库和Sql语句
Mysql数据库和Sql语句一、Mysql数据库1、数据库:组织、存储、管理数据的仓库2、数据库的管理系统(DBMS):实现对数据有效组织、管理和存取的系统软件3、数据库软件:mysql、oracle(
大数据
系统一般使用
Jessica小戴
·
2025-01-21 02:12
数据库
mysql
sql
IDEA+Java+JSP+Mysql+Tomcat实现Web图书管理系统-添加管理员增删改查功能
图书详情欢迎您:安全退出图书详情返回上一级图书编号图书名称图书价格图书作者图书封皮图书出版社图书列表admin_do_addbook.jsp处理新增图书欢迎您:安全退出admin_do_info.jsp
书籍
信息
omofun5541
·
2025-01-21 00:31
java
intellij-idea
mysql
洞见数据未来,StarRocks Summit Asia 2024 即将启幕!
这一切构成了当前
大数据
领域的核心难题。今年12月,StarRocksSummitAsia重磅启动!
·
2025-01-20 22:45
人工智能data
“一起学 HarmonyOS”第二弹获奖名单来啦~
亲爱的小伙伴们,感谢参与“一起学HarmonyOS”第二弹技术问答活动,本次活动的获奖名单来啦~获奖名单学习宣传奖获奖用户完成项李游LeoLevel0Swift社区Level0奖品:技术
书籍
1本社区白银电子勋章
·
2025-01-20 22:08
harmonyos
国产海光CPU平台兼容性指南-基础软件分册-20231013(附各系统下载链接)
2.2.1VMwarevSphere上的虚拟机操作系统2.2.2KVM上的虚拟机操作系统2.2.3WindowsHyper-V上的虚拟机操作系统2.2.4VirtualBox上的虚拟机操作系统三、分布式存储四、数据库五、中间件六、
大数据
七
技术瘾君子1573
·
2025-01-20 20:59
服务器&存储
服务器
兼容列表
海光
CPU
云计算
大数据
操作系统
数据驱动销售预测的未来:ScriptEcho赋能高效决策
然而,随着
大数据
的兴起和人工智能技术的飞速发展,数据驱动决策正成为现代企业提升竞争力的关键。
·
2025-01-20 18:27
前端
序与内容摘要:现代计算机技术
书籍
中的编写技巧
在现代计算机类技术
书籍
中,序和内容摘要是两个重要但又经常被忽视的部分。这两部分不仅仅是为
书籍
“锦上添花”,更是吸引读者、引导理解的关键环节。
嵌入式Jerry
·
2025-01-20 16:41
写书
开发语言
linux
物联网
嵌入式硬件
系统架构
minio免费文件管理器(windows版本),若依RuoYi-Vue-Plus框架使用,有需要的可以下载,因为官网下载特别慢
MinIO设计为高性能、安全且易于使用,适合存储大量的非结构化数据,如图片、文档、视频以及
大数据
分析中的日志文件等。
程序员WANG
·
2025-01-20 10:43
工具
windows
vue.js
容器
分布式系统理论基础二-CAP
GitHub:https://github.com/wangzhiwubigdata/God-Of-BigData关注公众号,内推,面试,资源下载,关注更多
大数据
技术~
大数据
成神之路~预计更新500+篇文章
王知无(import_bigdata)
·
2025-01-20 10:41
大数据
湖仓一体架构未来思考
湖仓一体架构是最近1-2年时间开始频繁出现在数据开发领域的新名词。也是各大公司竞相投入的对象。网络上关于湖仓一体架构的实践文章很多,看得也很眼花缭乱。我们今天站在一个「接地气」的角度,来说一说湖仓一体架构中未来需要关注的核心框架有哪些。文章内容也没有经过仔细的斟酌,完全是一点不成熟的想法,而且站的角度不是高屋建瓴的而是从下往上的。一个基本判断是湖仓一体架构在形式上不止一种大家可以从网上看到很多关于
王知无(import_bigdata)
·
2025-01-20 09:27
架构
大数据
是什么?用浅显的语言揭开神秘面纱
大数据
是什么?用浅显的语言揭开神秘面纱在我们生活的时代,“
大数据
”已经从一个技术术语,成为了街头巷尾时常听到的词汇。然而,究竟什么是
大数据
?它离我们有多远?我们该如何理解这个复杂又常用的概念?
Echo_Wish
·
2025-01-20 08:23
大数据
大数据
单例模式
2.slf4j入口
SLF4JServiceProvider四、总结一、故事引入故事要从下面这段代码说起publicclassApp{privatestaticfinalLoggerlogger=LoggerFactory.g
etL
ogger
uncleqiao
·
2025-01-20 07:09
slf4j
slf4j
在 Python 中使用 Ollama API
无论你是想进行简单的聊天对话、使用流式响应处理
大数据
、还是希望在本地进行模型的创建、复制、删除等操作,本文都可以为你提供指导。
一路追寻
·
2025-01-20 06:05
大模型
Python
Ollama
LLM
linux
python
AI与API的融合:构建智能互联技术世界的基石
一、AI与API融合的背景随着
大数据
、云计算、物联网等技术的快速发展,人工
IT数据V+I7809804594
·
2025-01-20 05:55
人工智能
数据分析
python
爬虫
大数据
Hadoop 和 Spark 的内存管理机制分析
大数据
技术:涵盖Hadoop(HDFS)、Hive、Spark、Fli
王子良.
·
2025-01-20 03:27
经验分享
hadoop
spark
大数据
2025最新
大数据
毕业设计选题汇总:创新课题推荐
学长给大家整理了
大数据
专业最新精选选题,如遇选题困难或选题有任何疑问,都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇总
HaiLang_IT
·
2025-01-20 02:51
毕业设计选题
大数据
毕业设计
python
PL/SQL语言的文件操作
PL/SQL语言的文件操作引言PL/SQL(ProceduralLanguage/SQL)是Oracle数据库提供的一种过程化编程语言,它结合了SQL的强
大数据处理
能力和过程性编程的灵活性。
云端 架构师
·
2025-01-20 01:41
包罗万象
golang
开发语言
后端
黑客常备十大编程语言,每一个都不容易学,但每一个又很有用
、Python3、SQL4、Javascript5、PHP6、C++编程7、JAVA8、Ruby9、Perl10、BashPython学习资源分享1、Python所有方向的学习路线2、学习软件3、精品
书籍
一秋的编程笔记
·
2025-01-20 00:59
Python
编程
计算机科技
数据库
sql
爬虫
python
自动化
编程语言
【Python】已解决:WARNING: pip is configured with locations that require TLS/SSL, however the ssl module i
文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍
书籍
分享点我跳转
书籍
作为获取知识的重要途径,对于IT从业者来说更是不可或缺的资源。
屿小夏
·
2025-01-19 23:53
python
pip
ssl
已解决RNING: pip is configured with locations that require TLS/SSL, however the ssl module in Python
pip升级报错:WARNING:pipisconfiguredwithlocationsthatrequir
eTL
S/SSL,howeverthesslmoduleinPythonisnotavailable.Lookinginindexes
I'mAlex
·
2025-01-19 22:47
pip
ssl
python
大数据
学习(五):如何使用 Livy提交spark批量任务--转载
Livy是一个开源的REST接口,用于与Spark进行交互,它同时支持提交执行代码段和完整的程序。Livy封装了spark-submit并支持远端执行。启动服务器执行以下命令,启动livy服务器。./bin/livy-server这里假设spark使用yarn模式,所以所有文件路径都默认位于HDFS中。如果是本地开发模式的话,直接使用本地文件即可(注意必须配置livy.conf文件,设置livy.
zuoseve01
·
2025-01-19 22:15
livy
Spark Livy 指南及livy部署访问实践
背景:ApacheSpark是一个比较流行的
大数据
框架、广泛运用于数据处理、数据分析、机器学习中,它提供了两种方式进行数据处理,一是交互式处理:比如用户使用spark-shell,编写交互式代码编译成spark
house.zhang
·
2025-01-19 22:40
大数据-Spark
大数据
大数据
学习(四):Livy的安装配置及pyspark的会话执行
一个基于Spark的开源REST服务,它能够通过REST的方式将代码片段或是序列化的二进制代码提交到Spark集群中去执行。它提供了以下这些基本功能:提交Scala、Python或是R代码片段到远端的Spark集群上执行;提交Java、Scala、Python所编写的Spark作业到远端的Spark集群上执行;提交批处理应用在集群中运行。从Livy所提供的基本功能可以看到Livy涵盖了原生Spar
猪笨是念来过倒
·
2025-01-19 21:08
大数据
pyspark
《Spring微服务实战》读书笔记
还是比较习惯中文阅读,因为速度足够快,毕竟我这样的菜逼要看的
书籍
太多,啃英文不知道得啃到什么时候(读英文文档不是问题,毕竟小硕毕业)。百度下载的这个中译本是迷途书童翻译的,很感谢。
johnny233
·
2025-01-19 19:50
读书笔记
Spring
网络爬虫——分布式爬虫架构
分布式爬虫在现代
大数据
采集中是不可或缺的一部分。随着互联网信息量的爆炸性增长,单机爬虫在性能、效率和稳定性上都面临巨大的挑战。
好看资源分享
·
2025-01-19 18:40
网络爬虫
Python
爬虫
分布式
架构
Python-玩转数据-数据分析之分析思维
二、
大数据
思维自从几年前
大数据
开始兴起,
大数据
思维已经逐渐被更动的人接受,随着其进一步发展,产生了巨大的生产效果。
人猿宇宙
·
2025-01-19 17:33
数据分析
python
big
data
面试经验分享-回忆版某小公司
首先是ODS层,连接数据源和数据仓库,数据会进行简单的
ETL
操作,数据来源通常是业务数据库,用户日志文件或者来自消息队列的数据等中间是核心的数据仓库层,可以细分为DWD,DIM,DWS层。
兔子宇航员0301
·
2025-01-19 16:20
数据开发面经分享
面试
经验分享
职场和发展
火星数据电竞数据,世界杯数据接口api,足球数据资料库
电竞数据包含的内容有很多,比如说基础数据(实时比分,关键事件,赛后数据等等),统计数据(阵容分析,选手分析,地图分析等),还有资料库数据(赛事战队,赛程赛果,赛况榜单等等),众多的数据组合而成形成如今的电竞
大数据
Tina0898
·
2025-01-19 14:04
数据分析
构建高效GPU算力平台:挑战、策略与未来展望
引言随着深度学习、高性能计算和
大数据
分析等领域的快速发展,GPU(图形处理器)因其强大的并行计算能力和浮点运算速度而成为首选的计算平台。
Mr' 郑
·
2025-01-19 11:43
gpu算力
Databricks:打造数据国度的“金砖四国”
Databricks,一个并不算熟悉的名字,是
大数据
国度的后起之星。成立不够一年,但却阵容强大,创始人都是开源圈子里面的重要级人物,值得关注。
weixin_33832340
·
2025-01-19 11:40
大数据
一文详解大厂数据中台架构
在
大数据
发展的黄金期,几乎所有的高科技企业都在思考一个问题:海量数据作为大多数企业发展不可避免的一个趋势之后,企业该怎么去应用这部分数据资产,会对其商业产生什么影响,如何使数据对企业产生正面的推动而不是成为企业的负担
isNotNullX
·
2025-01-19 10:06
架构
大数据
性能优化
大数据
公司 Databricks 详解
Databricks是一家在
大数据
和人工智能领域具有重要影响力的美国企业软件公司,以下是关于它的详细技术解析:1.起源与背景:Databricks成立于2013年,由来自加州大学伯克利分校AMP实验室的
Bj陈默
·
2025-01-19 10:00
大数据
5分钟看懂数据中台的典型架构
在这一层中,运用高效的数据采集工具和技术是核心要点,常见的工具涵盖
ETL
(提取、
java全套学习资料
·
2025-01-19 09:27
架构
hive小文件合并机制_hive小文件的问题弊端以及合并
,包括位置大小分块信息等,都保存在NN内存中,在小文件数较多的情况下,会造成占用大量内存空间,导致NN性能下降;2、在读取小文件多的目录时,MR会产生更多map数,造成GC频繁,浪费集群资源;3、现在
大数据
平台文件总数超过
做生活的创作者
·
2025-01-19 08:49
hive小文件合并机制
数仓建模(五)选择数仓技术栈:Hive & ClickHouse & 其它
在
大数据
技术的飞速发展下,数据仓库(DataWarehouse,简称数仓)成为企业处理和分析海量数据的核心工具。
昊昊该干饭了
·
2025-01-19 08:45
数仓建模
大数据
hive
clickhouse
hadoop
Hive 数据类型全解析:
大数据
开发者的实用指南
在
大数据处理
领域,Hive作为一款基于Hadoop的数据仓库工具,被广泛应用于数据的存储、查询和分析。
大鳥
·
2025-01-19 08:42
sql
hive
数据仓库
上一页
16
17
18
19
20
21
22
23
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他