E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据---hive
Java 大视界 -- Java
大数据
机器学习模型的可解释性增强技术与应用(107)
一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:
大数据
新视
青云交
·
2025-03-05 18:55
大数据新视界
Java
大视界
大数据
java
可解释性
AI
SHAP
LIME
因果推理
可视化交互
Java 大视界 -- Java
大数据
在智慧环保污染源监测与预警中的应用(104)
一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:
大数据
新视
青云交
·
2025-03-05 18:25
大数据新视界
Java
大视界
java
大数据
智慧环保
污染源监测
实时预警
Flink
LSTM
Java 大视界 -- Java
大数据
分布式文件系统的性能调优实战(101)
一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:
大数据
新视
青云交
·
2025-03-05 18:25
大数据新视界
Java
大视界
java
大数据
Java
大数据
分布式文件系统
性能调优
HDFS
Impala
Java 大视界 -- 深入剖析 Java
大数据
实时 ETL 中的数据质量保障策略(97)
一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:
大数据
新视
青云交
·
2025-03-05 18:25
大数据新视界
Java
大视界
Java大数据
实时ETL
数据质量保障
数据清洗
数据校验
机器学习算法
统计方法
Java 大视界 -- 绿色
大数据
:Java 技术在节能减排中的应用与实践(90)
一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:
大数据
新视
青云交
·
2025-03-05 18:55
大数据新视界
Java
大视界
java
大数据
绿色大数据
节能减排
算法优化
分布式计算
资源管理
Java 大视界 --
大数据
伦理与法律:Java 技术在合规中的作用与挑战(87)
一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:
大数据
新视
青云交
·
2025-03-05 18:25
大数据新视界
Java
大视界
java
大数据
大数据伦理
大数据法律
数据加密
访问控制
应对策略
Java 大视界 -- 区块链赋能 Java
大数据
:数据可信与价值流转(84)
一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:
大数据
新视
青云交
·
2025-03-05 18:24
大数据新视界
Java
大视界
java
大数据
数据可信
价值流转
智能合约
共识机制
区块链
安装mysql
1、安装数据库下载链接https://downloads.mysql.com/arc
hive
s/community/下载zip安装包,解压到某个路径下,将bin文件夹添加到系统环境变量。
大霞上仙
·
2025-03-05 17:51
数据库
mysql
数据库
Java 大视界 -- 基于 Java 的
大数据
流处理容错机制与恢复策略(113)
一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:
大数据
新视
青云交
·
2025-03-05 17:50
大数据新视界
Java
大视界
java
大数据
流处理
容错机制
Checkpoint
Exactly-Once
故障恢复
Databend 产品月报(2025年2月)
从MySQL迁移到DatabendDatabend推荐使用db-arc
hive
r进行MySQL批量迁移,使用FlinkCDC进行实时变更数据捕获(CDC)迁移。
·
2025-03-05 15:15
数据库
大智能:
大数据
+大模型+大算力_大算力
大数据
大模型
在近日举行的“2022中国人工智能产业年会”主论坛上,中国人工智能学会监事长、中国工程院院士蒋昌俊在报告中表示,人工智能的发展已经历了数十年的过程,大模型ChatGPT在今年春节前后突然出现,大家还没有来得及深度思考就已经“扑面而来”。蒋昌俊大智能的研究进展科学技术的研究约分为两大范式,一是牛顿力学奠定了理论计算的范式,二是开普勒开启数据的范式。之后经历了实验归纳、理论的逻辑推演,以及计算模拟、最
AI学习不迷路
·
2025-03-05 14:13
大数据
大模型
人工智能
语言模型
ai
产品经理
算力
场景题:有40亿个QQ号如何去重?仅1GB内存
仅1GB内存场景题也有一些套路可以考虑,比如去重、判断给定数据是否存在1.
大数据
去重1.1现在有40亿个QQ号如何去重?
·
2025-03-05 11:11
后端java面试
国产化替代 | 星环科技TDH替代IBM数仓,助力城商行构建湖仓一体平台
某城市商业银行在此背景下,启动数据仓库系统升级项目,将数据仓库从IBMNetezza迁移到星环科技
大数据
基础平台TDH,不但成功实现了数据仓库的国产化替代,还建设了新一代的湖仓一体平台,为银行业务发展提供新
·
2025-03-05 11:08
ibm
doris:
Hive
自2.1.3版本开始,ApacheDoris支持对
Hive
的DDL和DML操作。用户可以直接通过ApacheDoris在
Hive
中创建库表,并将数据写入到
Hive
表中。
向阳1218
·
2025-03-05 11:17
大数据
hive
hadoop
数据仓库
doris
大数据
与网络安全讲座
点击文末小卡片,免费获取网络安全全套资料,资料在手,涨薪更快
大数据
的价值为大家公认。
黑客Jack
·
2025-03-05 10:10
大数据
web安全
单例模式
FlinkCEP社区资源指南:学习与交流平台
FlinkCEP社区资源指南:学习与交流平台1.背景介绍ApacheFlink是一个开源的分布式
大数据
处理引擎,支持有状态计算和准确一次的流处理语义。
AI大模型应用之禅
·
2025-03-05 10:09
DeepSeek
R1
&
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
深入探秘FlinkCDC:实时数据处理的新利器
一、写在前面在
大数据
领域持续蓬勃发展的当下,数据的实时处理与分析变得愈发关键。
lucky_syq
·
2025-03-05 10:08
大数据
大数据
flink
Spark是什么?可以用来做什么?
它最初由加州大学伯克利分校开发,现已成为
大数据
处理领域的核心工具之一。相比传统的HadoopMapReduce,Spark在速度、易用性和功能多样性上具有显著优势。
Bugkillers
·
2025-03-05 10:37
大数据
spark
大数据
分布式
hive
-DML语法(超级详细)
N.0变量使用setwindow_day=50--定义变量select${
hive
conf:window_day}--使用变量N.1单表查询语句N.1.1语法
研发咨询顾问
·
2025-03-05 06:47
核心库-大数据
hive
hadoop
数据仓库
Hive
SQL 优化
标题一、
HIVE
SQL执##标题行顺序了解
hive
sql的执行顺序,有助于写出更高质量的代码。
大数据侠客
·
2025-03-05 06:45
大数据
相关技术
文档总结
hive
sql
性能优化
Hive
--桶表
目录1.为什么要使用桶表???2.桶表分桶规则3.桶表的创建3.1DLL3.2数据3.3DML3.4查看桶表里面的数据3.5临时表创建并加载数据3.6把临时表的数据加载到桶表里面4.桶表的查询4.1桶表查询全表的数据4.2桶表查看第一个桶里面的数据4.3查看第二个桶里面的数据4.4查看第三个桶里面的数据4.5查看桶表固定行数据4.6桶表查询语法4.7其他查询5桶表、分区表的区别6两个桶表之间的Jo
XK&RM
·
2025-03-05 06:44
Hive
hive
HIVE
的执行计划实操
HIVE
(我们的自驾工具)提供了EXPLAIN命令来展示一个查询的执行计划(什么路线),这个执行计划对于我们
不爱学习的小枫
·
2025-03-05 06:43
大数据
hive
大数据
hive
alter table add columns 是否使用 cascade 的方案
结论altertablexxxaddcolumns时加上cascade时,会把所有的分区都加上此字段。如果不加则只有新的分区会加上此字段,旧的分区没有此字段,即便数据文件里有对应的数据,也不能显示内容。如果分区都是insertoverwrite生成的,并且旧分区的数据不再重新生成,可以在addcolumns不用cascade,这样旧的分区对应的列显示null。新的分区正常显示新增的列。如果分区都是
houzhizhen
·
2025-03-05 06:12
hive
hive
Hive
Exception: Too many counters: 2001 max=2000 的解决方法
在
hive
任务的执行过程中,可能出现Toomanycounters的异常。如果执行引擎时tez,则说明当前作业的counters数量超过tez默认的counters限制。
houzhizhen
·
2025-03-05 06:12
hive
hive
hadoop
big
data
Hive
3.1 在 metastore 运行的 remote threads
Remotethreads是仅当
Hive
metastore作为单独的服务运行是启动,请求需要开启compactor。
houzhizhen
·
2025-03-05 05:07
hive
hive
hadoop
数据仓库
遨游防爆智能终端“问诊”工业制造,开出数据采集“良方”
在数据驱动的时代,唯有采集足够规模的工业数据,方能支撑起基于工业
大数据
的深度分析与智能决策,从而驱动传统产业的蜕变与升级。但是,数据采集之路并非坦途,面临着设备协议多样、接口不一等挑战。
AORO_BEIDOU
·
2025-03-05 00:51
制造
Elasticsearch冷热分离与索引生命周期管理
背景信息当今
大数据
时代,数据时刻在更新变化。尤其是随着时间的积累,存储在Elasticsearch中的数据会越来越多,当数据达到一
Cloud_Tech
·
2025-03-04 23:44
elasticsearch
大数据
数据分析
数据库
阿里云
什么是预训练?
一、介绍预训练模型诞生背景:对于某种特殊任务只存在少量的相关训练数据,以至于模型不能从中学习到有用的规律(标注资源稀缺,无
大数据
支持)举例:想对一批法律领域的文件进行关系抽取,就需要投入大量的精力(意味着时间和金钱的大量投入
卡卡大怪兽
·
2025-03-04 23:44
自然语言处理
如何使用DeepSeek进行高效数据挖掘与分析
##摘要随着
大数据
时代的到来,数据挖掘与分析技术在各行各业中扮演着越来越重要的角色。DeepSeek作为一种先进的数据挖掘工具,能够帮助用户从海量数据中提取有价值的信息。
Small踢倒coffee_氕氘氚
·
2025-03-04 22:09
笔记
经验分享
迭代器模式
通过spark-redshift工具包读取redshift上的表
spark用户可以读取各种各样数据源的数据,比如
Hive
表、JSON文件、列式的Parquet表、以及其他表。通过spark包可以获取第三方数据源。
stark_summer
·
2025-03-04 22:02
spark
spark
redshift
parquet
api
数据
大数据
面试临阵磨枪不知看什么?看这份心理就有底了-
大数据
常用技术栈常见面试100道题
目录1描述Hadoop的架构和它的主要组件。2MapReduce的工作原理是什么?3什么是YARN,它在Hadoop中扮演什么角色?4Spark和HadoopMapReduce的区别是什么?5如何在Spark中实现数据的持久化?6SparkStreaming的工作原理是什么?7如何优化Spark作业的性能?8描述HBase的架构和它的主要组件。9HBase的读写流程是怎样的?10HBase如何处理
大模型大数据攻城狮
·
2025-03-04 21:59
大数据
面试
职场和发展
面试题
数据仓库
算法
2023年上海市浦东新区网络安全管理员决赛理论题样题
正确(1)保护对象改变等保1.0保护的对象是信息系统,等保2.0增加为网络和信息系统,增加了云计算、
大数据
、工业控制系统、物联网、移动物联技术、网络基础设施等保护对象,实现了全方面的覆盖。
afei00123
·
2025-03-04 20:50
网络安全&云安全
考证狂魔
web安全
安全
网络安全
阿里云
基于springboot+vue在线小说阅读平台系统(源码+lw+部署文档+讲解等)
等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌主要内容:SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、
大数据
QQ3295391197
·
2025-03-04 20:16
Java毕业设计项目
spring
boot
vue.js
后端
《DataWorks:为人工智能算法筑牢高质量数据根基》
阿里巴巴的DataWorks,作为一款强大的
大数据
开发治理平台,在
·
2025-03-04 19:16
人工智能深度学习
基于Generator生成器的分离式导出CSV
在这个过程中,我发现了PHP中的生成器(Generator),这是一个非常强大的工具,特别适合处理
大数据
场景。本文将详细介绍生成器的概念、工作原理、优势以及如何利用生成器
·
2025-03-04 18:15
DAMA数据管理知识体系全接触-数据治理-
大数据
第1章数据管理1.1引言数据管理的定义:是为了交付、控制、保护并提升数据和信息资产的价值,在其整个生命周期中制定计划、制度、规程和实践活动,并执行和监督的过程。数据管理专业人员的定义:是指从事数据管理各方面的工作(从数据全生命周期的技术管理工作,到确保数据的合理利用及发挥作用),并通过其工作1.1.1业务驱动因素数据管理的主要驱动力:使组织能够从其数据资产中获取价值。1.1.2目标1)理解并支撑企
我思故我在6789
·
2025-03-04 18:38
运维专栏
架构师专栏
大数据专栏
架构
安全
【
大数据
专题】Flink题库
1.简述什么是ApacheFlink?ApacheFlink是一个开源的基于流的有状态计算框架。它是分布式地执行的,具备低延迟、高吞吐的优秀性能,并且非常擅长处理有状态的复杂计算逻辑场景2.简述Flink的核心概念?Flink的核心概念主要有四个:EventStreams、State、Time和Snapshots。(1)EventStreams:即事件流,事件流可以是实时的也可以是历史的。Flin
我思故我在6789
·
2025-03-04 18:37
大数据专栏
大数据
flink
工作流调度必看!2025年这四大核心趋势你不能不懂
而
大数据
工作流调度系统,就像是一位精准的指挥家,协调着数据处理流程中的各个环节,确保数据的高效流动与价值释放。那么,究竟什么是
大数据
工作流调度系统?它在当前的技术版图中处于何种地位?
·
2025-03-04 18:36
数据库
UBuntu 软件安装
sudoapt-getupdatesudoapt-getdist-upgradesudoapt-getupgrade-y有一个简单办法可以使更新速度更快,把以前更新的时候下载的软件包备份一下,把var/cache/apt/arc
hive
s
denlee
·
2025-03-04 17:53
Linux
ubuntu
deb
windows
firefox
linux
工具
Java软件架构中的服务拆分与数据库分片实践
随着电商、金融等行业系统规模的不断扩大,传统的单体架构往往难以满足性能和扩展性要求,服务拆分与数据库分片已成为高并发、
大数据
场景下的核心解决方案。
省赚客app开发者
·
2025-03-04 16:50
java
数据库
开发语言
初学者如何用 Python 写第一个爬虫?
大数据
技术:涵盖Hadoop(HDFS)、
Hive
、Spark
ADFVBM
·
2025-03-04 16:19
面试
学习路线
阿里巴巴
python
爬虫
开发语言
14个Flink SQL性能优化实践分享
在
大数据
处理领域,ApacheFlink以其流处理和批处理一体化的能力,成为许多企业的首选。然而,随着数据量的增长,性能优化变得至关重要。
快乐非自愿
·
2025-03-04 15:40
flink
sql
性能优化
LeetCode 题目 49:字母异位词分组 5种算法实现与典型应用案例【python】
会一些的技术:数据分析、算法、SQL、
大数据
相关、python欢迎加入社区:码上找工作作者专栏每日更新:LeetCode解锁1000题:打怪升级之旅python数据分析可视化:企业实战案例备注说明:方便大家阅读
数据分析螺丝钉
·
2025-03-04 15:07
LeetCode刷题与模拟面试
算法
leetcode
python
数据结构
职场和发展
树莓集团董事长谋略:构建全国第五代产业园的智慧
在智慧方面,引入物联网、
大数据
、人工智能等先进技术,实现园区的智能化管理。例如,通过智能传感器实时监测园区内的能源消耗、环境质量等数据,进行智能化调控,提高园区的运营效率和管理水平。
树莓集团
·
2025-03-04 09:21
百度
创业创新
大数据
物联网
科技
启智平台上传较
大数据
集
1.安装anconda2.安装openi(python38)C:\Users\33659>pipinstall-Uopeni-ihttps://pypi.tuna.tsinghua.edu.cn/simple3.输入token获取token的方式见官方教程:https://openi.pcl.ac.cn/docs/index.html#/api/tokenopenilogin(python38)C
失眠的树亚
·
2025-03-04 05:57
python
问题记录
服务器
python
conda
数据挖掘与数据分析两者的区别
随着
大数据
爆发式增长,市场上对
大数据
相关人才的需求与日俱增,导致
大数据
行业人才需求紧缺,引发了关于
大数据
的学习浪潮,在这个过程中,人们也会不时将数据分析与数据挖掘的关系混淆,什么是数据挖掘?
中琛源科技
·
2025-03-04 03:44
数据挖掘与数据分析
数据挖掘vs.数据分析特征数据挖掘数据分析目标从
大数据
中自动发现知识和模式通过系统分析数据,得出有意义的结论重点数据模式的自动发现、预测模型的构建数据理解、数据清洗、数据总结、假设验证方法机器学习、聚类
dundunmm
·
2025-03-04 03:11
数据挖掘
数据挖掘
数据分析
人工智能
Hive
之正则表达式
Hive
版本:
hive
-3.1.2目录一、
Hive
的正则表达式概述1.1字符集合1.2边界集合1.3量词(重复次数)集合1.4转义操作符1.5运算符优先级二、
Hive
正则表达式案例2.1like2.2rlike2.3regexp2.4regexp_replace
三生暮雨渡瀟瀟
·
2025-03-04 03:39
hive
hive
正则表达式
Hive
之正则表达式RLIKE详解及示例
目录一、RLIKE语法及核心特性1.基本语法2.核心特性二、常见业务场景及示例场景1:过滤包含特定模式的日志(如错误日志)场景2:验证字段格式(如邮箱、手机号)场景3:提取复杂文本中的关键词场景4:排除无效数据(如非数字字符)三、高级用法与技巧1.忽略大小写匹配2.匹配多行文本3.组合多个条件四、性能优化建议1.避免全表扫描2.预编译正则模式3.简化正则表达式五、常见问题与注意事项1.转义字符问题
三生暮雨渡瀟瀟
·
2025-03-04 03:09
hive
hive
正则表达式
《基于
大数据
的相州镇新农村商务数据分析与研究》开题报告
目录一、选题依据1.选题背景2.国内外研究现状与水平(1)国外研究现状(2)国内研究现状3.发展趋势4.研究意义二、研究内容1.学术构思与思路(1)主要研究内容(2)拟解决的关键问题或技术2.拟采取的研究方法、技术路线、实施方案及可行性分析(1)研究方法(2)技术路线(3)实施方案(4)可行性分析三、参考文献一、选题依据1.选题背景随着信息技术的快速发展,尤其是互联网技术的普及,农村商务环境正在经
Python数据分析与机器学习
·
2025-03-04 02:07
毕业论文/研究报告
大数据
数据分析
数据挖掘
算法
人工智能
python
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他