E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据hadoop-填坑
数据挖掘的建模流程
1、定义数据挖掘目标任务理解指标确定2、数据取样建模抽样(
大数据
是用过滤后的全量数据)抽样之前需要衡量数据质量衡量的标准主要有以下几点:资料完整无缺,各类指标齐全数据准确无误,反映的都是正常状态下的数据数据抽样的方式
慢跑的Liam
·
2025-03-03 23:08
算法
数据挖掘
算法流程
模型构建
避免Hive和Spark生成HDFS小文件
HDFS是为
大数据
设计的分布式文件系统,对
大数据
做了存储做了针对性的优化,但却不适合存储海量小文件。
穷目楼
·
2025-03-03 22:36
数据库
大数据
大数据
spark
hive
hadoop
人工智能时代的伦理挑战与隐私保护
例如,“
大数据
杀熟”现象,即通过分
经海路大白狗
·
2025-03-03 20:48
狗哥梦话职场
人工智能
大数据
与人工智能:数据隐私与安全的挑战_ai 和 数据隐私
前言1.背景介绍随着人工智能(AI)和
大数据
技术的不断发展,我们的生活、工作和社会都在不断变化。这些技术为我们提供了许多好处,但同时也带来了一系列挑战,其中数据隐私和安全是最为关键的之一。
程序员七海
·
2025-03-03 20:14
大数据
人工智能
安全
Python
大数据
处理实验报告(三)
实验目的本次实验的目的是练习使用Python编程语言和相关库进行网络爬虫和数据处理任务。具体来说,您将学习以下内容:使用Python中的requests库和BeautifulSoup库来爬取当当网某一本书的网页内容,并将其保存为html格式文件。学习使用Python中的requests库和正则表达式来爬取豆瓣网上某本书的前50条短评内容,并计算评分的平均值。了解如何使用Python中的reques
小李独爱秋
·
2025-03-03 20:13
python
开发语言
pycharm
大数据
数据清洗与统计分析原理与代码实战案例讲解
《数据清洗与统计分析原理与代码实战案例讲解》关键词:数据清洗、统计分析、Python、R语言、数据预处理、数据分析、机器学习、
大数据
摘要:本文将深入探讨数据清洗与统计分析的原理,并通过丰富的实战案例展示如何在实际项目中应用这些技术
AI天才研究院
·
2025-03-03 19:35
ChatGPT
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
大厂Offer收割机
面试题
简历
程序员读书
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
Kafka 迁移 AutoMQ 时 Flink 位点管理的挑战与解决方案
凭借其与Kafka的完全兼容性可以与用户已有的Flink等
大数据
基础设施进行轻松整合。Flink是重要的流处理引擎,与Kafka有着密切的关系。
·
2025-03-03 17:20
后端java
大数据
经典技术解析:Hadoop+Spark
大数据
分析原理与实践
作者:禅与计算机程序设计艺术1.简介
大数据
时代已经来临。随着互联网、移动互联网、物联网等新兴技术的出现,海量数据开始涌现。而在这些海量数据的基础上进行有效的处理,成为迫切需要解决的问题之一。
AI天才研究院
·
2025-03-03 10:27
Python实战
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
python读取redis
大数据
_
大数据
系列——Redis学习笔记
1.Redis的简介Redis是一个开源(BSD许可),内存存储的数据结构服务器,可用作数据库,高速缓存和消息队列代理它支持字符串、哈希表、列表、集合、有序集合,位图,hyperloglogs等数据类型内置复制、Lua脚本、LRU收回、事务以及不同级别磁盘持久化功能,同时通过RedisSentinel提供高可用,通过RedisCluster提供自动分区。简言之,Redis是一种面向“键/值”对数据
weixin_39661345
·
2025-03-03 09:19
英伟达DeepStream学习笔记30——kafka和AMQP的区别
作为消息队列来说,企业中选择mq的还是多数,因为像Rabbit,Rocket等mq中间件都属于很成熟的产品,性能一般但可靠性较强,而kafka原本设计的初衷是日志统计分析,现在基于
大数据
的背景下也可以做运营数据的分析统计
翟羽嚄
·
2025-03-03 08:15
英伟达TX2
/Xavier
/deepstream开发
kafka
学习
rabbitmq
XLNet:超越BERT的新星
随着
大数据
时代的到来,海量的自然语言数据不断涌现,对NLP技术的需求与日俱增。NLP技术已广泛应用于机器翻译、智能问答、信息检索、情感分析等诸多领域,为人类生产和生活带来了巨大便利。1.2预
AI天才研究院
·
2025-03-03 07:03
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
探讨Hadoop的基础架构及其核心特点
而不仅仅是处理
大数据
,Hadoop的真正价值在于其对于数据的高容错性、可扩展性以及相对低成本的存储和处理能力。以下是探
xx155802862xx
·
2025-03-03 06:58
hadoop
大数据
分布式
Java应用实战:从入门到精通的全面指南
无论是企业级应用、移动应用开发,还是
大数据
处理、云计算平台,Java都扮演着举足轻重的角色。
听风吟丶
·
2025-03-03 05:53
java
开发语言
ubantu(20.04)+ollama+dify+摩尔线程S80,新手避坑指南
前言,ubantu(20.04)+ollama+dify+摩尔线程S80,在组装过程中,作为新手会遇到不少的坑,特别写了这系列教程,是为增强新手上路的
填坑
能力。
chaonghoeoh
·
2025-03-03 04:07
ubuntu
docker
大数据
技术学习框架(更新中......)
Hadoop相关HDFS分布式文件系统MR(MapReduce)离线数据处理MR-图解YARN集群资源管理ZooKeeperZooKeeper分布式协调框架Hive相关Hive-01之数仓、架构、数据类型、DDL、内外部表Hive-02之分桶表、数据导入导出、静动态分区、查询、排序、hiveserver2Hive-03之传参、常用函数、explode、lateralview、行专列、列转行、UDF
小技工丨
·
2025-03-03 04:05
大数据技术学习
大数据
学习
【自学笔记】
大数据
基础知识点总览-持续更新
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录
大数据
基础知识点总览1.
大数据
概述2.
大数据
处理技术3.数据仓库与数据挖掘4.
大数据
分析与可视化5.
大数据
平台与架构6.
大数据
安全与隐私总结
大数据
基础知识点总览
Long_poem
·
2025-03-03 01:17
笔记
大数据
大数据
处理实践探索 ---- 笔试面试题:ElasticSearch
ES中的倒排索引是什么?传统的检索方式是通过文章,逐个遍历找到对应关键词的位置。倒排索引,是通过分词策略,形成了词和文章的映射关系表,也称倒排表,这种词典+映射表即为倒排索引。其中词典中存储词元,倒排表中存储该词元在哪些文中出现的位置。有了倒排索引,就能实现O(1)时间复杂度的效率检索文章了,极大的提高了检索效率。加分项:倒排索引的底层实现是基于:FST(FiniteStateTransducer
shiter
·
2025-03-03 01:44
大数据机器学习实践探索
笔试面试题
elasticsearch
.Net Core HttpClient处理响应压缩
确实,如今分布式和负载均衡技术这么成熟,很多需要处理高并发
大数据
的场景都可以通过增加服务器节点来进行。但是,在资
溪源More
·
2025-03-03 00:10
python
java
编程语言
spring
http
破解高并发难题:百万到亿级系统架构实战指南
参考书籍《架构真意-企业级应用架构设计方法论与实践》作者范刚孙玄机械工业出版社本书通过架构设计方法论、分布式架构设计与实践和
大数据
架构设计三部分内容,系统阐述了在软件开发的时候,如何设计软件架构,并且对
繁华之中悟静
·
2025-03-03 00:09
架构
数据结构
软件需求
软件工程
微服务
软件构建
【update 更新数据语法合集】.NET开源ORM框架 SqlSugar 系列
一、实体对象更新1.1单条与批量1.2不更新某列1.3只更新某列1.4NULL列不更新1.5无主键/指定列1.6更新添加条件1.7
大数据
更新1.8重新赋值1:list中的值修改1.9重新赋值2:列中的值
m0_74823595
·
2025-03-02 15:21
面试
学习路线
阿里巴巴
.net
开源
爬虫实战分享:高效爬取汽车官方销售排行榜的技术方案
随着
大数据
技术的飞速发展,爬虫技术在各行各业中得到了广泛应用。汽车行业作为一个信息密集型行业,销售数据、排行榜和车型趋势等内容成为了汽车公司、市场研究者和消费者关注的重点。
威哥说编程
·
2025-03-02 11:50
python
网络爬虫
入门Apache Spark:基础知识和架构解析
介绍ApacheSparkSpark的历史和背景ApacheSpark是一种快速、通用、可扩展的
大数据
处理引擎,最初由加州大学伯克利分校的AMPLab开发,于2010年首次推出。
juer_0001
·
2025-03-02 08:19
java
spark
用大白话解释数据库分库分表sharding是什么 有什么用 怎么用
技术定义:把一个
大数据
库拆分成多个小数据库(分片),分散到不同服务器上,解决单台服务器性能不足的问题。比如原本一个数据库存10亿条用户数据,拆成10个库,每个存1亿条。
心心祥蓉
·
2025-03-02 07:15
数据库
云计算相关工作岗位有哪些,薪资怎么样?
云计算、
大数据
、人工智能作为新一代信息技术产业,未来发展前景不可估量,就业前途一片光明,自然薪资待遇也不会差。
欧米说云
·
2025-03-02 06:07
云计算
腾讯云
阿里云
云计算
Flink架构体系:深入解析Apache Flink的架构与工作原理
Flink架构体系:深入解析ApacheFlink的架构与工作原理ApacheFlink是一种高性能、分布式、流式处理引擎,被广泛应用于
大数据
处理和实时分析场景。
雨中徜徉的思绪漫溢
·
2025-03-02 05:25
flink
架构
apache
大数据
《Kafka 理解: Broker、Topic 和 Partition》
本文将从Kafka的核心组件、工作原理、实际应用场景等方面进行详细解析,帮助读者深入理解Kafka的架构设计及其在
大数据
领域的重要性。
频繁输入,积极输出
·
2025-03-01 23:48
kafka
分布式
11个
大数据
在日常生活中的应用场景
这就是
大数据
发挥魔力的地方。
大数据
技术和工具的出现有助于应对这些挑战,使世界认识到该技术提供的广泛应用,企业从中受益以进行扩张。什么是
大数据
?
雪兽软件
·
2025-03-01 23:45
科技前沿
大数据
【
大数据
】es ElasticSearch常用操作:查询与聚合篇
0说明基于es5.4和es5.6,列举的是个人工作中经常用到的查询(只是工作中使用的是JavaAPI),如果需要看完整的,可以参考官方相关文档https://www.elastic.co/guide/en/elasticsearch/reference/5.4/search.html。1查询先使用一个快速入门来引入,然后后面列出的各种查询都是用得比较多的(在我的工作环境是这样),其它没怎么用的这里
roshy
·
2025-03-01 20:56
大数据
【FL0093】基于SSM和微信小程序的微信点餐系统小程序
博主介绍全网粉丝10W+,CSDN全栈领域优质创作者,博客之星、掘金/知乎/b站/华为云/阿里云等平台优质作者、专注于Java、小程序/APP、python、
大数据
等技术领域和毕业项目实战,以及程序定制化开发
猿毕设
·
2025-03-01 18:42
小程序
微信小程序
微信
spring
boot
python
后端
java
代理 IP 行业现状与未来趋势分析
在
大数据
时代,企业对于数据的渴望日益强烈,数据采集工作需要大量的代理IP来突破网站限制,获取全面准确的信息。同时,网络营销从业者为了精准投放广告、
跨境Kevin
·
2025-03-01 17:38
tcp/ip
网络
web安全
互联网医院实时数据监测智能分析系统设计概述(上)
互联网医疗借助互联网、
大数据
、人工智能等技术手段,实现了医疗服务的线上化、智能化和便捷化,为患者提供了更加高效、优质的医疗服务。
Allen_LVyingbo
·
2025-03-01 13:12
医疗高效编程研发
python
健康医疗
python
互联网医院
人工智能
Linux 学习必杀技:从菜鸟到高手的蜕变密码
无论是服务器领域、嵌入式系统,还是云计算、
大数据
等新兴技术,Linux都发挥着核心作用。对于初学者来说,掌握Linux系统不仅能拓宽职业道路,还能深入理解计算机系统的底层
羑悻的小杀马特.
·
2025-03-01 12:59
linux
学习
运维
服务器
Linux
大数据
查重-哈希表应用2
大数据
查重-哈希表应用模拟问题有一个字符串,这个字符串里有重复的字符,也有没有重复的字符,让你找出来第一个没有重复出现过的字符。
liujjjiyun
·
2025-03-01 12:59
算法
数据结构
大数据
散列表
数据结构
算法
python 推荐算法库_[译] 详解个性化推荐五大最常用算法
量子位编译如下:现在,许多公司都在用
大数据
来向用户进行相关推荐,驱动收入增长。推荐算法有很多种,数据科学家需要根据业务的限制和要求选择最好的算法。
weixin_39612733
·
2025-03-01 06:10
python
推荐算法库
利用Python生成器和迭代器高效处理
大数据
文件
利用Python生成器和迭代器高效处理
大数据
文件在Python中,处理大型数据文件时,内存管理是一个重要的考虑因素。
清水白石008
·
2025-03-01 02:16
计算机
Python题库
python
python
KaiwuDB 智能综采应用项目获中国信通院数据库星河“典型案例”
12月18日,在中国通信标准化协会主办的2024数据资产管理大会上,中国信息通信研究院(以下简称“信通院”)、中国通信标准化协会
大数据
技术标准推进委员会联合颁发2024
大数据
“星河(Galaxy)”案例获奖证书
·
2025-03-01 01:14
数据库
阿里云PAI大模型RAG对话系统最佳实践
去年4月至9月,阿里云人工智能平台PAI团队与
大数据
基础工程技术团队合作,构建了基于知识库检索增强的大模型答疑对话机器人,并在阿里云官方答疑链路、研发小蜜、钉钉
大数据
技术服务助手等多个线上场景上线,显著提升答疑效率
阿里云云栖号
·
2025-03-01 00:04
云栖号技术分享
阿里云
云计算
云原生
ai
人工智能
2001-2022年 上市公司数字赋能指数(TF-IDF)数据:评估企业数字化转型的关键指标
该指数通过量化分析企业在
大数据
、云计算、人工智能等数字技术应用方面的能力,反映企业数字化转型的深度和广度。
小王毕业啦
·
2025-02-28 21:44
大数据
tf-idf
大数据
社科数据
人工智能
精彩回顾 | KaiwuDB 携手信通院举办能源行业数据库研讨沙龙
10月12日,KaiwuDB联合中国通信标准化协会
大数据
技术标准推进委员会、信通院数据库应用创新实验室举办的“数据库技术助力能源行业数字化转型”主题研讨沙龙在上海圆满落幕。
·
2025-02-28 20:06
数据库
Stream流式输出:一种高效的数据处理方式
在当今的
大数据
时代,数据量呈爆炸式增长,如何高效地处理这些海量数据成为了一个重要的问题。Stream流式输出作为一种新型的数据处理方式,能够实时处理数据,提高数据处理效率,因此受到了广泛的关注和应用。
萧鼎
·
2025-02-28 20:34
机器学习算法与实战
python
算法
流式输出stream
通义升级2.1文生视频模型
作者公众号
大数据
与AI杂谈(TalkCheap),转载请标明出处年底果然各家AI视频厂商扎堆更新,昨天才写了一篇Vidu2.0版本更新的测评文章,同天通义也更新了他的文生视频模型,最新版本是2.1版和我两个月前做的测试相比
彩色蚂蚁
·
2025-02-28 16:07
AIGC应用
AIGC
图像生成
音视频
中国信通院“护证计划”正式启动,合合信息入选首批技术支撑单位
近日,由中国互联网协会中小企业发展工委会主办的“卓信
大数据
计划”2025年度会议在京召开。
·
2025-02-28 16:59
大模型人工智能算法
构建智慧校园:推动教育现代化的重要路径
它强调利用
大数据
、人工智能、物联网等前沿技术,实现教学过程的智能化、个性化与高效化。
智慧校园-合肥自友科技
·
2025-02-28 14:24
智慧校园
数字化校园
智慧校园平台
智慧校园
智慧校园系统
智慧校园平台
智慧校园建设
智慧校园软件
智慧校园方案
智慧校园厂商
自然语言处理入门:从基础概念到实战项目
随着
大数据
和深度学习的发展,NLP技术在文本分类、机器翻译、问答系统、情感分析等领域得到了广泛应用。
范范0825
·
2025-02-28 14:22
自然语言处理
人工智能
大数据
、云计算系统高级架构师课程学习路线图
大数据
之Linux+
大数据
开发篇
大数据
的前景和意义也就不言而喻了,未来,
大数据
能够对大量、动态、能持续的数据,通过运用新系统、新工具、新模型的挖掘,从而获得具有洞察力和新价值的东西。
juan188
·
2025-02-28 12:09
大数据
大数据开发
程序员
spark
Linux
大数据学习
人工智能
数据分析
hadoop
大数据学习
大数据开发
大数据入门
大数据技术
大数据
Java I/O 与 NIO 核心区别及应用场景详解
InputStream/OutputStream)双向通道(Channel)数据操作单元基于字节/字符流基于缓冲区(Buffer)线程模型一个连接一个线程单线程管理多连接(Selector)适用场景低并发、
大数据
量传输高并发
豪宇刘
·
2025-02-28 12:37
数据库
服务器
前端
深入探讨Ceph:分布式存储架构的未来
Ceph以其卓越的性能、高可靠性、强大的扩展性以及开源的特性,在众多分布式存储系统中脱颖而出,被广泛应用于云计算、
大数据
、人工智能等前沿领域。无论是
深度Linux
·
2025-02-28 10:50
ceph
分布式
架构
C/C++
Spark技术系列(一):初识Apache Spark——
大数据
处理的统一分析引擎
Spark技术系列(一):初识ApacheSpark——
大数据
处理的统一分析引擎1.背景与核心价值1.1
大数据
时代的技术演进MapReduce的局限性:磁盘迭代计算、中间结果落盘导致的性能瓶颈Spark
数据大包哥
·
2025-02-28 09:06
#
Spark
大数据
《AI 大模型 ChatGPT 的传奇》
《AI大模型ChatGPT的传奇》——段方某世界100强企业
大数据
/AI总设计师教授北京大学博士后助理:1三6三二四61四五41AI大模型的概念和特点1.1什么是”大模型、多模态“?
武昌库里写JAVA
·
2025-02-28 04:33
面试题汇总与解析
课程设计
spring
boot
vue.js
算法
数据结构
十、
大数据
资源平台功能架构
一、
大数据
资源平台的功能架构图总体结构
大数据
资源平台功能架构图关键组件:1.用户(顶行)此部分标识与平台交互的各种利益相关者。
moton2017
·
2025-02-28 03:47
大数据治理
大数据
大数据治理
数据资产
数据管理
元数据
架构
数据资源
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他