E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
云存储文件系统大数据
Ruby Dir 类和方法详解
RubyDir类和方法详解引言在Ruby中,Dir是一个非常有用的类,用于处理
文件系统
中的目录。它提供了许多方便的方法来列出目录内容、搜索文件、以及处理
文件系统
的其他相关操作。
froginwe11
·
2025-01-28 06:38
开发语言
系统设计面试题
文章目录**设计一个短网址服务**:如何将长网址转换为短网址,并支持短网址的生成、存储、解析和重定向等功能**设计一个分布式
文件系统
**:考虑如何实现文件的存储、访问、备份、容错等功能,以及如何处理大规模数据和高并发访问
慢慢慢时光
·
2025-01-28 03:14
面试准备
面试
系统设计
TaskManager的JVM OOM退出配置
在
大数据
领域中,TaskManager是执行并行任务的关键组件之一。它负责管理任务的执行和资源分配。在处理大规模数据时,内存管理是一个重要的考虑因素。
艾丽丝的爱情
·
2025-01-28 02:06
jvm
大数据
JVM垃圾回收器的原理和调优详解!
全文目录:开篇语前言摘要概述垃圾回收器分类及原理1.Serial垃圾回收器2.Parallel垃圾回收器3.CMS垃圾回收器4.G1垃圾回收器源码解析示例代码使用案例分享案例1:Web服务的GC调优案例2:
大数据
任务的
喵手
·
2025-01-28 02:34
零基础学Java
jvm
NAS 网络附加存储 (配置与访问简述)
万字带你从小白变身高端玩家,群晖DS920+保姆级教程-少数派目录基本概念核心功能存储技术系统与操作应用与扩展性数据保护安全性适用场景成本效益选择与购买NAS服务器配置与使用硬件安装初始化设置系统安装与更新存储配置
文件系统
与共享用户账户管理远程访问设置安全设置应用安装与使用维护与监控性能优化技术支持以群晖
木合杉
·
2025-01-27 23:40
服务器及相关产品
网络
功能测试
服务器
EmEditort v24.5.3世界上最快的文本编辑器
支持宏,Unicode,代码段插件,还能处理
大数据
以及CSV文件,无需Excel,堪称最强CSV编辑器。软件自带简体中文,支持32位和64位版
jiamianAA
·
2025-01-27 23:39
经验分享
电脑
Crawl4AI:用几行代码打造强大的网页爬虫
Crawl4AI:用几行代码打造强大的网页爬虫在人工智能和
大数据
时代,数据的获取和处理变得尤为重要。尤其是在大型语言模型(LLM)的研究和应用中,如何高效地抓取和整理网络数据成为了一个关键的挑战。
海豹工匠
·
2025-01-27 21:30
爬虫
大数据
技术之MapReduce
一、MapReduce概述1、MapReduce简介MapReduce是一个分布式运算程序的编程框架,是基于Hadoop的数据分析计算的核心框架。MapReduce处理过程分为两个阶段:Map和Reduce。Map负责把一个任务分解成多个任务,Reduce负责把分解后多任务处理的结果汇总。2、MapReduce优缺点MapReduce优点:MapReduce易于编程:它简单的实现一些接口,就可以完
wespten
·
2025-01-27 20:21
Hadoop
Hive
Spark
大数据安全
大数据
mapreduce
hadoop
数据存储容量不足,查询性能下降的解决方法
采用
云存储
:如果本地存储无法满足需求,可以考虑将数据迁移到
云存储
平台,这样可以灵活扩展存储,并且无需担心硬件维护。二、优化数据存储架构分区表:对大
是小邪邪呀
·
2025-01-27 19:18
oracle
数据库
非凸科技荣登脉脉2024“年度职得去雇主”榜单
本届评选依据脉脉独有的“雇主指数”以及专家评审意见综合评选而出,综合考量了企业在脉脉社区广场、同事圈、行业圈等多个频道口碑,并基于职场
大数据
训练的专属大模型,客观反映企业在职场人心中的口碑。
·
2025-01-27 18:39
招聘
2024第五届全球数字经济产业大会:前沿技术引领未来
云计算与
大数据
云计算和
大数据
技术作为数字经济的基石,一直是大会的焦点。本届大会上,众多企业展示了他们在云计算平台的创新和
大数据
应用方面的最新进展。通
·
2025-01-27 18:36
javascript
5.3-docker仓库配置文件
docker-registry源码安装,在config_sample.yml文件中,该文件位于docker-registry源码目录下,可以看到一些现成的模板段:common:基础配置local:存储数据到本地
文件系统
安心Smile
·
2025-01-27 17:02
docker
docker仓库配置
docker
registry
anaconda中pyspark_自学
大数据
——9 Anaconda安装与使用pyspark
首先从Anaconda官网上下载Anaconda。一、解压安装包sudobashAnaconda3-2020.07-Linux-x86_64.shchown-Rhadoop:hadoop/opt/anaconda/vi/etc/profileexportANACONDA_HOME=/opt/anacondaexportPATH=$PATH:$ANACONDA_HOME/bin:source/etc
步六孤陆
·
2025-01-27 17:59
PySpark数据处理过程简析
PySpark可以直接使用Hadoop
文件系统
、HDFS来存储数据,也可以通过S3、GCS、ADLS等
云存储
平台保存数据。因此,在不同的数据源之间移动数据时,只需要复制一次数据就可以完成
AI天才研究院
·
2025-01-27 17:28
Python实战
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
2022-02-09
大数据
学习日志——PySpark——Spark快速入门&Standalone集群
第一部分Spark快速入门01_Spark快速入门【Anaconda软件安装】[掌握]使用Python编写Spark代码,首先需要安装Python语言包,此时安装Anaconda科学数据分析包。Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。Anaconda是跨平台的,有Windows、MacOS、Linux版本。#下载地址:ht
王络不稳定
·
2025-01-27 17:28
spark
big
data
大数据
Linux的
文件系统
一、结构Linux
文件系统
采用树形结构依次描述各个目录的功能:/:根目录,所有目录的顶点boot:存放系统的启动程序bin:存放二进制可执行命令sbin:和bin相似,但只有拥有管理员权限的人可以使用lib
KLllr
·
2025-01-27 17:27
Linux笔记
linux
大数据
之Spark运行流程
文章目录前言(一)SparkOnYarn集群的Client模式运行流程(二)SparkOnYarn集群的Cluster模式运行流程总结前言上篇文章有讨论到SparkOnYarn的两种部署模式,如果有不清楚的地方,可以再看看,附上对应文章的链接:Spark的部署模式,本篇文章主要讨论SparkOnYarn两种部署模式的运行流程。(一)SparkOnYarn集群的Client模式运行流程该模式的Dri
「已注销」
·
2025-01-27 15:17
Spark
大数据
spark
hadoop
R语言学习笔记6-数据框
DataFrame)介绍数据框用途创建数据框从矩阵创建数据框索引和切片添加和修改列数据框的预处理数据框的排序数据框的筛选处理缺失值应用函数处理数据重塑数据框使用dplyr进行数据框的管道操作数据框的时间序列操作
大数据
框的处理数据框的绘图数据框的文本处理数据框的连接与关联按行或列连接数据框按键值关联数据框数据框的条件处理与逻辑操作条件筛选逻辑操作数据框的汇总与统计分析
Colin♛
·
2025-01-27 15:17
r语言
学习
笔记
开发语言
信息可视化
华为OD机试C卷-- 精准核酸检测(Java & JS & Python & C)
现在根据传染病流调以及
大数据
分析,得到了每个人之间在时间、空间上是否存在轨迹交叉。现在给定一组确诊人员编号(X1,X2,X3,…,Xn),在所有人当中,
飞码创造者
·
2025-01-27 14:35
华为OD机试题库
华为od
c语言
java
javascript
python
matlab
大数据
计算技巧(持续更新中)
在matlab中,当数据比较大时,运算起来就困难了,有时候还会outofmemory(例如4000*4000的矩阵,要算矩阵乘法都比较吃力)。此文会记录我学到的一些解决办法:1.将数据的存储类型从double转换成single在matlab中double数据类型占8个字节,single类型占4个字节。把数据类型从double类型转换成single类型可以节省一半的空间。单精度浮点数single的取
tina_lulu_21
·
2025-01-27 14:04
matlab
matlab
string
存储
Matlab:读取和处理
大数据
表格文本文件
Matlab:读取和处理
大数据
表格文本文件在实际的数据分析应用中,往往需要处理海量数据。针对大型数据文件,Matlab提供了快速高效的读取和处理工具,可以便捷地完成数据处理任务。
追逐程序梦想者
·
2025-01-27 13:01
matlab
大数据
开发语言
赛事 Q&A × 培训预告:2024 年(第 17 届)中国大学生计算机设计大赛
大数据
主题赛正式开赛!
大赛下设不同领域的十一个大类,和鲸科技自2021年起,连续四年作为
大数据
应用大类中
大数据
主题赛的协办方倾力配合大赛组委会与各承办单位,
ModelWhale
·
2025-01-27 13:30
中国大学生计算机设计大赛
大数据
人工智能
编程
竞赛
大数据
StarRocks(六) :Catalog_starroccks支持oracle外部表了吗(1)
StarRocks自2.3版本起支持Catalog(数据目录)功能,实现在一套系统内同时维护内、外部数据,方便您轻松访问并查询存储在各类外部源的数据。1.基本概念内部数据:指保存在StarRocks中的数据。外部数据:指保存在外部数据源(如ApacheHive™、ApacheIceberg、ApacheHudi、DeltaLake、JDBC)中的数据。2.Catalog当前StarRocks提供两
2401_84181975
·
2025-01-27 11:51
程序员
大数据
oracle
数据库
基于SpringBoot+Vue码头船只货柜管理系统
期待与各位高校教师、企业讲师以及同行交流合作主要内容:Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与
大数据
、单片机开
qq_469603589
·
2025-01-27 08:28
Java项目实战
信息管理类项目
spring
boot
vue.js
后端
推荐开源项目:WeDataSphere - 智慧数据服务平台
推荐开源项目:WeDataSphere-智慧数据服务平台去发现同类优质开源项目:https://gitcode.com/是一款由微众银行金融科技团队开发的开源
大数据
处理和应用框架,旨在简化数据分析流程,
劳泉文Luna
·
2025-01-27 07:52
Java 大视界 -- Java
大数据
中的隐私增强技术全景解析(64)
一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:
大数据
新视
青云交
·
2025-01-27 07:51
大数据新视界
Java
大视界
java
使用Pyecharts绘制地理图表
Pyecharts是一个基于Python的强
大数据
可视化库,它提供了丰富的图表类型和交互功能。其中,Pyecharts能够轻松绘制地理图表,帮助我们展示地理数据的分布和变化趋势。
前端设计家
·
2025-01-27 05:14
信息可视化
python
数据分析
Python
Alluxio Enterprise AI on K8s FIO 测试教程
fio是业内常用的磁盘与
文件系统
性能测试工具,下面内容将通过文字方式介绍Alluxioonk8s进行fio测试的教程。
Alluxio
·
2025-01-27 05:44
人工智能
kubernetes
大数据
平台建设整体架构设计方案
《
大数据
平台建设整体架构设计方案》关键词:
大数据
平台、分布式存储、分布式计算、数据仓库、数据湖、数据安全、数据质量管理、数据治理、数据挖掘、机器学习、图计算、自然语言处理、Hadoop、Spark、Flink
AI天才研究院
·
2025-01-27 02:55
ChatGPT
AI大模型企业级应用开发实战
大数据AI人工智能
大厂Offer收割机
面试题
简历
程序员读书
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
企业信息化5:后勤管理系统
前言:随着企业各业务板块在信息化的浪潮中积极转型升级,后勤板块往往成为了一个企业信息化的短板,后勤业务
大数据
无法融入企业信息化数据湖,进而影响企业整体运营的效率和质量。
mosquito_lover1
·
2025-01-27 02:52
制造业企业全业务流程信息化
python
flask
开源
大数据
Lambda架构
Lambda架构介绍Lambda是用于同时处理离线和实时数据,可容错、可扩展的分布式系统架构。有批处理层、加速层、服务层。同时以流计算和批处理计算合并视图。Lambda架构的批处理层采用不可变存储模型,不断地往主数据集后追加新的数据。Lambda架构优缺点<
奋进学堂
·
2025-01-26 23:00
系统架构设计师考试
架构
Lambda架构
原文地址:https://www.cnblogs.com/xiaodf/p/11642555.html首先我们来看一个典型的互联网
大数据
平台的架构,如下图所示:在这张架构图中,
大数据
平台里面向用户的在线业务处理组件用褐色标示出来
leveretz
·
2025-01-26 22:54
大数据
lambda
ES聚合分析原理与代码实例讲解
ES聚合分析原理与代码实例讲解作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着
大数据
时代的到来,企业级应用需要处理的数据量呈爆炸式增长
AI大模型应用之禅
·
2025-01-26 22:21
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
大数据
技术4:Lambda和Kappa架构区别_lambda架构和kappa架构区别
Lambda架构缺点:虽然Lambda架构使用起来十分灵活,并且可以适用于很多的应用场景,但在实际应用的时候,Lambda架构也存在着一些不足,主要表现在它的维护很复杂。(1)同样的需求需要开发两套一样的代码:这是Lambda架构最大的问题,两套代码不仅仅意味着开发困难(同样的需求,一个在批处理引擎上实现,一个在流处理引擎上实现,还要分别构造数据测试保证两者结果一致),后期维护更加困难,比如需求变
2401_84181501
·
2025-01-26 22:50
大数据
架构
Redis线上阻塞要如何排查
哪些情况会让指令变慢:1.指令获取的数据很多,比如
大数据
量下执行keys、hgetall、smembers等指令。
思静鱼
·
2025-01-26 17:12
#
Redis-缓存
redis
数据库
缓存
解决Python中libhdfs.so的共享库找不到的问题
这个错误通常发生在使用Python访问Hadoop分布式
文件系统
(HadoopDistributedFileSystem,简称HDFS)时,由于缺少libhdfs.so共享库文件而
code_welike
·
2025-01-26 16:34
python
开发语言
Python
Apache Hive 聚合函数与 OVER 窗口函数:从基础到高级应用
在
大数据
时代,ApacheHive是处理和分析海量数据的强大工具。Hive提供了丰富的聚合函数和强大的OVER窗口函数,能够帮助我们高效地进行数据分析。
大鳥
·
2025-01-26 11:04
sql
hive
apache
hive
hadoop
大数据
治理实战指南:数据质量、合规与治理架构
个人主页:一ge科研小菜鸡-CSDN博客期待您的关注引言随着企业数字化转型的加速,
大数据
已成为驱动业务决策的核心资产。然而,数据治理的缺失或不完善,可能导致数据质量问题、合规风险以及业务价值的流失。
一ge科研小菜鸡
·
2025-01-26 11:28
大数据
大数据
Redis学习笔记
NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,特别是
大数据
应用难题。NoSQL特点方便扩展(
csdn_bobo_6
·
2025-01-26 06:47
redis
学习
数据库
mysql的单表数据导入到hive数据库中
1、将mysql的数据导出借助dbeaver工具,将单表数据table1格式导出为csv文件2、将csv的后缀名手动改为txt后缀,为了让每行的的字段是以,分隔3、将得到的txt文件上传到hdfs
文件系统
中
熏陶
·
2025-01-26 05:43
数据库
mysql
hive
《Spark
大数据
分析与内存计算》——第三章
第三章作业及答案快捷查找:Ctrl+F在搜索框中输入题目一.单选题(共17题)1.(单选题)并不是所有企业都能自己产生数据,从而用于决策辅助,而更多的互联网企业如电商等大部分是要靠什么来抓取互联网数据进行分析A.HadoopB.pythonC.SparkD.网路爬虫正确答案:D:网路爬虫;2.(单选题)什么负责即席查询的应用A.MLlibB.SparkStreamingC.GraphXD.Spar
阿万古
·
2025-01-26 05:07
课程作业
spark
数据分析
大数据
联合
文件系统
介绍
联合
文件系统
介绍联合
文件系统
一个可堆叠统一的
文件系统
,该系统可以合并多个目录(分支)的内容,同时保持其物理内容独立。
软件架构师笔记
·
2025-01-26 04:01
服务器
android
数据库
理解inode
inode是一个重要概念,是理解Unix/Linux
文件系统
和硬盘储存的基础。
zhanshenyn
·
2025-01-26 04:31
linux
table
unix
file
存储
user
探秘FreeMovie:一个开源的电影推荐系统
技术分析FreeMovie的核心架构包括以下关键组件:数据处理-项目采用Hadoop进行
大数据
预处
孟振优Harvester
·
2025-01-26 02:39
Lambda离线实时分治架构深度解析与实战
一、引言在
大数据
技术日新月异的今天,Lambda架构作为一种经典的数据处理模型,在应对大规模数据应用方面展现出了强大的能力。
喜欢猪猪
·
2025-01-26 01:36
架构
“大模型横扫千军”背后的
大数据
挖掘--浅谈MapReduce
文章目录O背景知识1数据挖掘2邦费罗尼原则3TF.IDF4哈希函数5分布式
文件系统
一、MapReduce基本介绍1.Map任务2.按键分组3.Reduce任务4.节点失效处理5.小测验:在一个大型语料库上有
绒绒毛毛雨
·
2025-01-26 01:35
大数据挖掘
数据挖掘
mapreduce
人工智能
基于
大数据
的电影数据分析可视化系统设计与应用
基于
大数据
的电影数据分析可视化系统设计与应用作者:禅与计算机程序设计艺术1.背景介绍1.1
大数据
时代的电影行业随着互联网技术和数字化的发展,电影行业已经进入
大数据
时代。
AI架构设计之禅
·
2025-01-26 00:02
大数据AI人工智能
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Command Center AI
它集成了
大数据
处理、实时情报分析、优化调度、决策模拟等功能,为指挥官提供多维度的决策支持。
由数入道
·
2025-01-26 00:53
应急管理
人工智能
机器学习
智能体
【2025优质学术推荐】征稿控制科学、仪器、智能系统、通信、计算机、电子信息、人工智能、
大数据
、机器学习、软件工程、网络安全方向
【2025优质学术推荐】征稿控制科学、仪器、智能系统、通信、计算机、电子信息、人工智能、
大数据
、机器学习、软件工程、网络安全方向【2025优质学术推荐】征稿控制科学、仪器、智能系统、通信、计算机、电子信息
努力学习的大大
·
2025-01-25 22:43
学术会议推荐
人工智能
大数据
深度学习
神经网络
Github上最热门的11个Java开源项目你会了吗
2dolphinscheduler(地址见文末)ApacheDolphinScheduler是一个可视化的分布式
大数据
工作流任务调
Java小叮当
·
2025-01-25 22:37
项目
Github
项目
java
程序员
IT
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他