E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据仓库数据挖掘
python 查找两列不同的值、相同的值(dataframe数据探索)
在做
数据挖掘
时,查看训练集、测试集数据的情况时,有时需要查看两者之间不同的值和相同的值。
蓝翔厨师长
·
2024-02-04 09:56
python
数据预处理
python
数据挖掘
大数据领域的
数据仓库
在大数据领域,
数据仓库
(DataWarehouse)是一个用于存储、管理和分析大量数据的集中式系统。
薛定谔的zhu
·
2024-02-04 09:43
大数据
数据仓库
软考笔记--
数据仓库
技术
数据仓库
是一个面向主题的,集成的,相对稳定的、反映历史变化的数据集合,用于支持管理决策。数据源是
数据仓库
系统的基础,是整个系统的数据源泉。
赤露水
·
2024-02-04 07:12
软考
笔记
数据仓库
Hadoop大数据实战系列文章之Hive
hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,Hive定义了简单的类SQL查询语言,称为HQL,它允许熟悉SQL的用户查询数据可以将
测试帮日记
·
2024-02-04 05:45
大学python题库及答案,大一python期末
有这一篇就足够干货满满不看后悔个人主页→
数据挖掘
博主ZTLJQ的主页个人推荐python学习系列:☄️爬虫JS逆向系列专栏-爬虫逆向教学☄️python系列专栏-从零开始学python目录数据类型和变量
chatgpt001
·
2024-02-04 04:09
windows
服务器
linux
深度学习
第七章 主管信息系统和
数据仓库
[TOC]第七章主管信息系统和
数据仓库
7.0前言EIS是数仓之前的概念EIS没有注重基础结构(数据源、数据质量、数据流通等)DSS是现代的EIS,与数仓紧密相连7.1EIS概述EIS典型用途趋势分析关键指标度量和跟踪向下钻取问题监控竞争分析关键性能指标监控
晨磊的微博
·
2024-02-04 04:53
《机器学习与
数据挖掘
》学习笔记(二)-续
沿着PAC学习理论,讨论有限假设空间的样本复杂度,并用Hoeffding不等式来界定概率边界。假设空间的样本复杂度PAC可学习性很大程度上由所需的训练样本数量决定。随着问题规模的增长所带来的所需训练样本的增长称为学习问题的样本复杂度(samplecomplexity)。在多数实际问题中,最限制学习器成功的因素是有限的可用的训练数据。我们通常都喜欢能与训练数据拟合程度更高的假设,当一个学习器在可能时
产品扫地僧
·
2024-02-03 21:22
SPSS 27 下载安装教程,保姆级教程,小白也能轻松搞的,附安装包
前言IBMSPSSStatistics简称为SPSS,是全球领先的统计分析、
数据挖掘
、预测建模产品及解决方案,提供高级统计分析、丰富的机器学习算法、文本分析、开源可扩展性、与大数据的集成以及无缝部署到应用程序中等功能
石用软件
·
2024-02-03 20:20
SPSS
【读书笔记】
数据仓库
- Apache Kylin权威指南
ApacheKylin权威指南(第2版)◆1.2.1为什么要使用ApacheKylin它们的主要技术是“大规模并行处理”(MassivelyParallelProcessing,MPP)和“列式存储”(ColumnarStorage)◆1.2.2ApacheKylin怎样解决关键问题基于以上两点,我们得到一个新的思路——“预计算”。应尽量多地预先计算聚合结果,在查询时刻也尽量使用预计算的结果得出查
KevinBrain
·
2024-02-03 19:16
大数据
数据仓库
apache
kylin
大数据
分布式
最简
数据挖掘
|房租价格预测
目录一、数据介绍二、数据统计分析1、数据基本统计2、数据缺失统计3、特征分布统计4、相关系数矩阵三、回归模型划重点少走10年弯路一、数据介绍数据源自最简
数据挖掘
系列,内容包括位置、出租方式、卧室/客厅/
Python风控模型与数据分析
·
2024-02-03 19:03
数据分析
机器学习
数据挖掘
数据挖掘
人工智能
[Python] 如何使用scikit-learn的preprocessing和impute模块进行数据预处理(数据无量纲化,缺失值填充,对分类型特征编码与哑变量,对连续型特征进行二值化与分段)
数据挖掘
的五大流程获取数据从各种来源收集数据,包括但不限于数据库、
数据仓库
、互联网、传感器、社交媒体等。获取数据的方式可以通过数据抓取、数据爬取、数据采集工具等方法进行。
老狼IT工作室
·
2024-02-03 18:16
机器学习
python
机器学习
scikit-learn
python
数仓建模&维度建模理论知识
0.思维导图第1章
数据仓库
概述1.1
数据仓库
概述
数据仓库
是一个为数据分析而设计的企业级数据管理系统。
韩顺平的小迷弟
·
2024-02-03 16:02
#
大数据开发
spark
大数据
数据仓库
hadoop
hive
DoubleEnsemble:基于样本重加权和特征选择的金融数据分析方法
此外,随着各种机器学习和
数据挖掘
工具在量化交易中的应用越来越广泛,许多交易公司已经提取了越来越多的特征(也称为因子factors)。因此,如何自动选择有效特征成为一个迫在眉睫的问题。
tzc_fly
·
2024-02-03 16:57
论文阅读笔记
金融
数据分析
人工智能
基于
数据挖掘
的微博事件分析与可视化大屏分析系统
设计原理,是指一个系统的设计由来,其将需求合理拆解成功能,抽象的描述系统的模块,以模块下的功能。功能模块化后,变成可组合、可拆解的单元,在设计时,会将所有信息分解存储在各个表中,界面不会显示所有定义的字段。在设计时,会有几大要求,抽象、模块化、信息隐藏、耦合低、内聚等特性,本系统的设计也符合以上几大特性。制作和显示流程都属于程序员需要分析研究的一部分。每个模块都是相对独立的,系统前台不显示账号操作
QQ_402205496
·
2024-02-03 14:30
数据挖掘
人工智能
离线数仓-数据治理
目录一、前言1.1数据治理概念1.2数据治理目标1.3数据治理要解决的问题1.3.1合规性元数据合规性数据质量合规性数据安全合规性1.3.2成本存储资源成本计算资源成本二、
数据仓库
发展阶段2.1初始期2.2
爱吃辣条byte
·
2024-02-03 13:51
数据治理
大数据
数据仓库
深入数仓离线数据同步:问题分析与优化措施
一、前言在
数据仓库
领域,离线数仓和实时数仓是常见的两种架构类型。离线数仓一般通过定时任务在特定时间点(通常是凌晨)将业务数据同步到
数据仓库
中。
Light Gao
·
2024-02-03 10:14
数据仓库
实时数仓
数据库
数据仓库
大数据
数据分析
数仓日常维护:剖析每日增量同步的内部机制
而数据的实时性和准确性对于确保
数据仓库
的有效性至关重要。而离线数仓中常见的数据同步方式是T+1,其中同步方式主要分为两种:全量同步和增量同步。本文聚焦于探讨增量同步的原理,解析其工作机制和实
Light Gao
·
2024-02-03 10:14
数据仓库
大数据
数据库
大数据
数据仓库
数据同步
sql
【马来西亚站 | SPIE独立出版,ISSN: 0277-786X | 往届均已ei检索】诚邀投稿参会
第三届电子信息工程与数据处理国际学术会议(EIEDP2024)可点击投稿/参会/了解会议详情重要信息时间地点:2024年3月15-17日马来西亚·吉隆坡征稿主题:算法、计算机视觉、人工智能、图像处理、信号处理、
数据挖掘
等相关主题提交检索
AEIC学术交流中心—李老师
·
2024-02-03 08:56
算法
人工智能
图像处理
自然语言处理
数据挖掘
科技
大数据是什么?华为云学院带你探索大数据之旅
自上世纪九十年代至本世纪初,随着
数据挖掘
理论和数据库技术的逐步成熟,一批商业智能工具和知识的管理技术也开始得
舒意从生
·
2024-02-03 08:53
数据湖系列之一 | 你一定爱读的极简数据平台史,从
数据仓库
、数据湖到湖仓一体
从
数据仓库
、数据湖,到现在的湖仓一体,业界建设数据平台的新方法和新技术层出不穷。理解这些方法和技术背后隐藏的演进脉路、关键问题、核心技术原理,可以帮助企业更好地建设数据平台。
百度智能云技术站
·
2024-02-02 23:04
百度沧海·存储
数据湖
百度
对象存储
计算机毕业设计 基于SpringBoot的车辆违章信息管理系统的设计与实现 Java实战项目 附源码+文档+视频讲解
博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及
数据挖掘
、小程序项目开发和Android项目开发等。
IT学长编程
·
2024-02-02 21:08
计算机毕业设计1000套
毕业论文
毕业设计
课程设计
Java
springboot
Vue
前后端分离
计算机毕业设计 基于SpringBoot的城市垃圾分类管理系统的设计与实现 Java实战项目 附源码+文档+视频讲解
博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及
数据挖掘
、小程序项目开发和Android项目开发等。
IT学长编程
·
2024-02-02 21:05
计算机毕业设计1000套
毕业设计
课程设计
毕业论文
Java
spring
boot
前后端分类
MySQL
Python 深度学习实战:聊天机器人
1.背景介绍深度学习是人工智能领域的一个重要分支,它涉及到神经网络、机器学习、
数据挖掘
等多个领域知识。深度学习的核心思想是通过多层次的神经网络来进行数据的处理和分析,从而实现对复杂问题的解决。
Python人工智能大数据
·
2024-02-02 20:47
Python入门实战
Java入门实战
React入门实战
大数据
人工智能
语言模型
Java
Python
React
架构设计
回归统计在 echarts 中的实现
接下来我们看看回归算法如何把数据分析与echarts图表结合的.这里我们需要借助echarts的一个扩展库:echarts-stat.jsecStat是ECharts的统计和
数据挖掘
工具。
贵在随心
·
2024-02-02 20:20
卷积神经网络
领域:在图像领域,NLP领域的文本分类、软件工程的
数据挖掘
中软件缺陷预测等问题上获得较优的效果卷积神经网络是一种层次模型,输入为元素数据:RGB图像,原始音频数据主要运算:1.卷积convonlution2
冉然_7236
·
2024-02-02 19:15
Hive和Hbase的各自适用场景
Hive:Hive是Hadoop
数据仓库
,严格来说,不是
yoku酱
·
2024-02-02 17:36
记-
数据挖掘
-
数据挖掘
概述认识
数据挖掘
概述
数据挖掘
概念随着爆炸性的数据增长,我们拥有丰富大量的数据,但却不足以提供有用的信息。我们亟需一些工具帮助我们从海量数据中提取有用的信息。
Andrew0000
·
2024-02-02 16:42
超详细【入门精讲】
数据仓库
原理&实战 一步一步搭建
数据仓库
内附相应实验代码和镜像数据和脚本
文章对应的博客园链接:点击这里文章目录0.B站相关课程链接和搭建
数据仓库
资源及脚本下载食用指南:建议先把博客整体看一遍之后再进行操作文章最后有常见问题及解决方法1.项目介绍及整体流程1.1项目介绍1.2
Oraer_
·
2024-02-02 16:29
数据仓库
大数据分析
数据仓库
数据库
hadoop
银行
数据仓库
体系实践(18)--数据应用之信用风险建模
信用风险银行的经营风险的机构,那在第15节也提到了巴塞尔新资本协议对于银行风险的计量和监管要求,其中信用风险是银行经营的主要风险之一,它的管理好坏直接影响到银行的经营利润和稳定经营。信用风险是指交易对手未能履行约定契约中的义务而给银行造成经济损失的风险。典型的表现形式包括借款人发生违约或信用等级下降。借款人因各种原因未能及时、足额偿还债务/银行贷款、未能履行合同义务而发生违约时,债权人或银行必将因
南极找南
·
2024-02-02 13:10
银行数据仓库
数据仓库
银行
数据仓库
体系实践(15)--数据应用之巴塞尔新资本协议
巴塞尔新资本协议介绍在银行管理中经常会听到巴3、新资本协议等专用词,那这都是指《巴塞尔资本协议》,全称《关于统一国际银行资本衡量和资本标准的协议》。新资本协议的五大目标是:促进金融体系的安全性和稳健性(保持总体资本水平不变);继续促进公平竞争;更全面地反映风险;更敏感地反映银行头寸及其业务的风险程度;重点放在国际活跃银行,基本原则适用于所有银行。最新的《巴塞尔协议III》(第3版)于2010年9月
南极找南
·
2024-02-02 13:40
银行数据仓库
数据仓库
银行
数据仓库
体系实践(16)--数据应用之财务分析
总账系统在所有公司中,财务分析的基础都是核算,那在银行的系统体系中,核算功能在业务发生时由业务系统如核心、贷款、理财中实现登记,各业务系统会在每天切日后统计当天各机构的核算科目的发生额与余额,并统一送到总账系统,总账系统进行全行会计核算的汇总、调整并每天统计出全银行的资产负债表、利润表和现金流表,使银行的经营情况一目了然。后续的许多财务应用以及监管报送中,总账数据是必不可少的一部分。而且数据质量校
南极找南
·
2024-02-02 13:40
银行数据仓库
数据仓库
银行
数据仓库
体系实践(10)--汇总指标层和集市模型设计
建立多层次的数据访问服务体系,有力提升
数据仓库
的价值。基于指标汇总层、集市层、可以提供面向业务人员的即席数据查询、以及面向应用开发者的数据接口、应用访问接口,满足不同类型应用的需要。
acumen_leo
·
2024-02-02 13:38
银行数据仓库
大数据
数据仓库
汇总层
指标层
数据中台
银行
数据仓库
体系实践(17)--数据应用之营销分析
营销是每个银行业务部门重要的工作任务,银行产品市场竞争激烈,没有好的营销体系是不可能有立足之地,特别是随着互联网金融发展,金融脱媒”已越来越普遍,数字化营销方兴未艾,银行的营销体系近些年也不断发展,从客户经理为主逐步转变为客户经理+互联网营销的模式。在客户经理阶段,银行主要通过CRM系统进行产品销售管理。对产品、客户经理、团队的绩效进行统计。那随着互联网营销的发展和数据量的增加,单个CRM系统已经
南极找南
·
2024-02-02 13:06
银行数据仓库
数据仓库
新书速览|Python数据科学应用从入门到精通
数据清洗、特征工程、数据可视化、
数据挖掘
与建模等已成为高校师生和职场人士迎接数字化浪潮、与时俱进提升专业技能的必修课程。
全栈开发圈
·
2024-02-02 12:47
python
算法
数据挖掘
——考试复习
数据挖掘
——考试复习考点填空欧几里得距离余弦相似度简单匹配系数Jaccard系数数据集的ClassficationError数据集的Gini值召回率和精度问答支持向量机的“最大边缘”原理软边缘支持向量机的基本工作原理非线性支持向量机的基本工作原理计算朴素贝叶斯分类
hzx99
·
2024-02-02 11:02
考试复习
数据挖掘
考试复习
医疗设备卓健控费系统的特点
医疗设备卓健控费系统的特点:卓健ZJ-V6.0控费系统基于人工智能的医疗设备智能控费系统,具有强大的
数据挖掘
、数据处理和深度学习分析能力,可以读取设备内部图像和项目信息,深度学习图像并分析患者检查部位、
zhengzhouliuhaha
·
2024-02-02 02:10
软件需求
健康医疗
系统架构
卓健智能控费系统与医院收费系统
二、系统特点:卓健智能控费系统拥有强大的
数据挖掘
、数据处理和深度学
henanzhuojian
·
2024-02-02 02:37
人工智能
健康医疗
服务器
数据仓库
表级血缘应用
表血缘热度文章目录数仓血缘应用(一):表血缘热度前言一、价值衡量指标——应用层二、血缘节点应用——热度1、指标透传(应用层——>数仓)2、指标应用(热度)2.1、数仓血缘节点关系2.2、热度2.3、热度应用总结前言在
数据仓库
的建设过程中
零壹Ture
·
2024-02-02 02:24
数据仓库
大数据
spark
数据库
数据分析
单细胞转录组数据分析||用10X软件分析已发表的10X数据
---大师大师,我想学单细胞转录组数据分···要不先下载一个示例
数据挖掘
一下?单细胞是生命科学的一个里程碑事件,而单细胞转录组是这个里程碑的上冠花。
周运来就是我
·
2024-02-01 20:03
聚类分析的相关理论
随着数据对我们当今生产生活的影响不断加深,
数据挖掘
开始成为了人们更加深入了事物本质的重要方法,聚类分析作为一项十分重要的
数据挖掘
手段,是使用某种相似度度量方法将数据集分为组内尽可能相似,组间尽可能相异的分组
Merry_hj
·
2024-02-01 13:44
群智能算法
大数据之Spark
的通用并行计算框架拥有HadoopMapReduce所具有的优点但不同于MapReduce的是Job中间输出结果可以缓存在内存中,从而不再需要读写HDFS,减少磁盘数据交互因此Spark能更好地适用于
数据挖掘
与机器学习等需要迭代的算法
进击的-小胖子
·
2024-02-01 12:37
大数据
spark
big
data
scala
大数据
实时大数据
springboot+mysql智能停车场管理系统-计算机毕业设计源码41692
摘要由于数据库和
数据仓库
技术的快速发展,智能停车场管理系统建设越来越向模块化、智能化、自我服务和管理科学化的方向发展。
vx2_Biye_Design
·
2024-02-01 09:10
spring
boot
mysql
css
html5
ajax
vue.js
java
大数据开发之离线数仓项目(用户行为采集平台)(可面试使用)
第1章:
数据仓库
概念
数据仓库
,是为企业指定决策,提供数据支持的,可以帮助企业,改进业务流程、提高产品质量等。
数据仓库
的输入数据通常包括:业务数据、用户行为数据和爬虫数据等。
Key-Key
·
2024-02-01 08:46
大数据
面试
职场和发展
hadoop
分布式
弹性分布式数据集
spark
java如何用代理ip?
随着互联网的日益发展,网络爬虫和
数据挖掘
等技术逐渐成为各行各业的需求。在这个领域中,代理IP扮演着重要的角色。那么,什么是Java代理IP?如何使用Java实现代理IP访问网站呢?
小熊HTTP
·
2024-02-01 06:59
java
tcp/ip
爬虫
搜株逮兔:李正伟老师教你,外卖商家如何做好品牌运营?
外卖门店的营运,大体上能够分成以下一些板块:包括品牌营销板块、
数据挖掘
、数据分析板块、产品研发板块、线上运营板块、售后管理板块、用户管理系统
李正伟老师
·
2024-02-01 05:01
大
数据挖掘
培训就业前景怎么样?好找工作吗?
那么越来越多的应用涉及到大数据,因此,大
数据挖掘
培训还是很容易找工作的,况且,大数据的就业前景也不错。
kuntoria
·
2024-02-01 04:52
Hadoop 大数据技术原理与应用
价值研究意义应用场景医疗,金融,零售Hadoop概述历史优势扩容能力强,成本低,高效率,可靠性,高容错Hadoop生态分布式存储系统(HDFS)分布式计算框架(MapReduce)资源管理(YARN)数据迁移(Sqoop)
数据挖掘
算法库
kk8_
·
2024-02-01 04:33
hadoop
大数据
hdfs
2022年最新数据库经典面试题及答案汇总(含PostgreSQL、Oracle、MySQL)
我们梳理了墨天轮平台上2022年最新的一批数据库经典面试题,主要包含PostgreSQL、MySQL和Oracle、
数据仓库
等方面的内容,希望能够帮助到各位正在或即将求职DBA的朋友们。
MoMoSQL666
·
2024-02-01 02:44
数据库
oracle
sql
postgresql
面试
数据库基础理论
(
数据仓库
)数据:描述事务的符号记录,包含但不限于数字、文字、图形、图像、声音、语言等。数据有多重形式,它们都可以经过数字化后存入计算机。数据库:
数据仓库
。
sour moon
·
2024-02-01 00:59
数据库
oracle
火山引擎ByteHouse:分析型数据库如何设计列式存储
作为云原生
数据仓库
的ByteHouse,也采用列式存储设计,保证读写性能、支持事务一致性,又适用大规模的数据计算,为用户提供极速分析体验和海量数据处理能力,提升企业数字化转型能力。
字节数据平台
·
2024-01-31 22:37
火山引擎
数据库
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他