Keep hunger

离线项目（三）数据仓库的设计

文章目录

- 离线项目（三）数据仓库的设计
- - 一：数据仓库的分层
  - - ODS 层
    - DWD层
    - DWS层
    - ADS层
  - 二：关于数据仓库和数据集市
  - - 1.**数据仓库**：
    - 2.**数据集市**：
    - 3.数据仓库和数据集市的区别：
  - 三：数仓模型（星型模型和雪花模型）
  - - 1.星型模型
    - 2.雪花模型
  - 四：项目相关
  - - 1.分层
    - - ODS层：
      - DWD层：
      - DWS层：
      - 1.dws_visit,访客表
        
        2.按照时间维度统计
        
        3.按照终端维度进行统计
        
        4.按照页面维度进行统计分析
        
        5.按照来源维度进行统计和分析
      - ADS层：

一：数据仓库的分层

ODS 层

原始数据层，存放原始数据，直接加载原始日志、数据，数据保持原貌不做处理。或者只是对数据进行一些很简单的处理。

DWD层

明细数据层
结构和粒度与ods层保持一致，对ods层数据进行清洗(去除空值，脏数据，超过极限范围的数据)，可以将数据进行拆分，减低维度，减轻事实表和维度表的关联。本项目中预处理之后的数据，是按照空格进行切分，一行数据一行数据的进行处理，除掉了不完整的数据以及静态页面相关的数据，文件名是dwd_weblog

DWS层

服务数据层
以dwd为基础，进行轻度汇总。一般聚集到以用户当日，设备当日，商家当日，商品当日等等的粒度。
在这层通常会有以某一个维度为线索，组成跨主题的宽表，比如一个用户的当日的签到数、收藏数、评论数、抽奖数、订阅数、点赞数、浏览商品数、添加购物车数、下单数、支付数、退款数、点击广告数组成的多列表。dws层算是集市层，属于维度建模的范畴，这里一般按照主题进行划分。

ADS层

数据应用层，也有公司或书把这层成为app层、dal层、dm层，叫法繁多。面向实际的数据需求，以DWD或者DWS层的数据为基础，组成的各种统计报表。统计结果最终同步到RDS以供BI或应用系统查询使用。这一层的数据就可以直接导入到mysql中，方便业务应用

看到https://www.jianshu.com/p/2b0509851df1写的数据仓库的一个架构，感觉蛮好的：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YDZhUT2t-1573727897092)(D:\CSDN图片\数据仓库.png)]

二：关于数据仓库和数据集市

进行数据处理的最终目的是生成报表，用于决策。

1.数据仓库：

是一个集成的面向主题的数据集合，设计的目的是支持DSS（决策支持系统）的功能，在数据仓库里，每个数据单元都和特定的时间相关。数据仓库包括原子级别的数据和轻度汇总的数据。数据仓库是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化（不同时间）的数据集合，用以支持经营管理中的决策制定过程。

2.数据集市：

是一个小型的部门或工作组级别的数据仓库。有两种类型的数据集市——独立型和从属型。独立型数据集市直接从操作型环境获取数据。从属型数据集市从企业级数据仓库获取数据。从长远的角度看，从属型数据集市在体系结构上比独立型数据集市更稳定。从属型的数据仓库，数据来源与数据仓库的DWS层（服务数据层）

3.数据仓库和数据集市的区别：

数据仓库中数据结构采用的规范化模式（关系数据库设计理论），数据集市的数据结构采用的星型模式（多维数据库设计理论）；数据仓库中数据的粒度比数据集市的细；

关于数据仓库和数据库，推荐文章http://www.360doc.com/showweb/0/0/872875827.aspx

三：数仓模型（星型模型和雪花模型）

1.星型模型

星型架构是一种非正规化的结构，多维数据集的每一个维度都直接与事实表相连接，不存在渐变维度，所以数据有一定的冗余。例如湖北省有武汉市和黄石市，存储两条数据（湖北省武汉市）（湖北省黄石市），湖北省的信息被存储的两次，产生了冗余

2.雪花模型

当有一个或多个维表没有直接连接到事实表上，而是通过其他维表连接到事实表上时，其图解就像多个雪花连接在一起，故称雪花模型。雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化，原有的各维表可能被扩展为小的事实表，形成一些局部的 " 层次 " 区域，这些被分解的表都连接到主维度表而不是事实表。如图，将地域维表又分解为国家，省份，城市等维表。它的优点是 : 通过最大限度地减少数据存储量以及联合较小的维表来改善查询性能。雪花型结构去除了数据冗余。

四：项目相关

1.分层

ODS层：

dos_log，存储简单清洗之后的数据

is_avalible	boolean	本条数据是否有效
remote_addr	String	IP
time_local	String	访问时间
request	String	请求的URL
status	int	状态码
body_bytes_sent	int	发送的字节数
http_referer	String	外部链接
http_user_agent	String	用户浏览器信息

在Hive中创建数据库LOG_ODS,并且建立基础数据表ods_log,可以创建一个分区表，因为日志是每天都会更新的，我们可以创建一个分区表，时间作为分区字段。

create database if not exists LOG_ODS;
use LOG_ODS;
create table if not exists ods_log (
is_avalible String,
remote_addr String,
time_local String,
request string,
status string,
body_bytes_sent string,
http_referer string,
http_user_agent string)
partitioned by (datestr string)
row format delimited 
fields terminated by '\001';

ods_log_session，存储进行会话流划分之后的点击流数据，每条数据都有sessionid，处于此次会话的第几个page，以及所有的基础数据，是一个宽表。

sessionId	String	会话id
remote_addr	String	ip
time_local	String	访问时间
request	String	请求url
status	int	状态码
body_bytes_sent	int	发送字节数
step	int	处于会话的第几个页面
staytime	int	停留时间
http_referer	String	外部链接
http_user_agent	String	用户浏览器信息

create table if not exists ods_log_session (
sessionId String,
remote_addr String,
time_local String,
request string,
status string,
body_bytes_sent string,
step string,
staytime string,
http_referer string,
http_user_agent string)
partitioned by(datestr string)
row format delimited 
fields terminated by '\001';

导入原始数据到ods_log表中，导入点击流数据到ods_log_session表中

load data inpath '/dianshang/data/pre_out' overwrite into table ods_log   partition(datestr='2019-11-14');

load data inpath '/dianshang/data/pre_click' overwrite into table 
ods_log_session partition(datestr='2019.11.14');

DWD层：

dwd_log对url和时间进行了拆分

sessionId	String	会话id
remote_addr	String	ip
time_local	String	完整访问时间
daystr	String	访问日期
timestr	String	访问时间
year	String	访问年
month	String	访问月
day	String	访问日
hour	String	访问时
request	String	请求url
status	int	状态码
body_bytes_sent	int	发送字节数
step	int	处于会话的第几个页面
staytime	int	停留时间
http_referer	String	外部链接
host	String	外部链接域名
path	String	外部链接路径
query	String	外部链接的参数
query_id	String	外部链接的参数值
http_user_agent	String	用户浏览器信息

在Hive中创建DWD层的明细数据表dwd_log_insert

create table if not exists dwd_log(
sessionId string comment "会话id",
remote_addr string comment "来源 IP",
time_local string comment "访问完整时间",
daystr string comment "访问日期",
timestr string comment "访问时间",
year string comment "访问年",
month string comment "访问月",
day string comment "访问日",
hour string comment "访问时",
request string comment "请求的 url",
request_host string comment "请求的域名",    
status string comment "响应码",
body_bytes_sent string comment "传输字节数",
http_referer string comment "来源 url",
host string comment "来源的 host",
path string comment "来源的路径",
query string comment "来源参数 query",
query_id string comment "来源参数 query 的值",
http_user_agent string comment "客户终端标识") 
partitioned by(datestr string) 
row format delimited 
fields terminated by '\001';

解析 URL 中的信息：

1、抽取 refer_url 到中间：dwd_tmp_referurl

2、将来访 url 分离出 host path query query id

sessionId	String	会话id
remote_addr	String	ip
time_local	String	访问时间
request	String	请求url
status	int	状态码
body_bytes_sent	int	发送字节数
step	int	处于会话的第几个页面
staytime	int	停留时间
http_referer	String	外部链接
http_user_agent	String	用户浏览器信息
host	String	域名
path	String	路径
query	String	参数
query_id	String	参数值

create table dwd_tmp_referurl  as 
SELECT a.*, b.* 
FROM ods_log_session a 
LATERAL VIEW parse_url_tuple(regexp_replace(http_referer, "\"", ""), 'HOST', 'PATH', 'QUERY', 
'QUERY:id') b 
as host, path, query, query_id;

检查一下：
select * from dwd_tmp_referurl a where a.host is not null limit 3;

19a806cd-5377-4aea-bb9b-6283de767fd7
1.202.186.37
2013-09-18 15:39:19
/wp-content/themes/silesia/images/bullets/5.gif
200
62
5
0
“http://blog.fens.me/nodejs-async-windjs/”
“Mozilla/5.0(Macintosh;IntelMacOSX10_8_4)AppleWebKit/537.36(KHTML,likeGecko)Chrome/29.0.1547.65Safari/537.36”
blog.fens.me
/nodejs-async-windjs/
NULL
NULL

解析时间字符串字段：

1、抽取转换 time_local 字段到中间表明细表：dwd_log

2013-09-18 12:26:31

注意：这里的subString()函数默认的下标是1，第一个下标是1，当然0也可以

create table dwd_tmp_timeAndurl as 
select b.*,substring(time_local,0,10) as daystr,
substring(time_local,11,9) as tmstr,
substring(time_local,0,4) as year,
substring(time_local,6,2) as month,
substring(time_local,9,2) as day,
substring(time_local,12,2) as hour 
From dwd_tmp_referurl b;

检查一下：
select * from dwd_tmp_timeAndurl limit 5;

19a806cd-5377-4aea-bb9b-6283de767fd7

1.202.186.37

2013-09-18 15:39:19

/wp-content/themes/silesia/images/bullets/5.gif

200

62

5

0

“http://blog.fens.me/nodejs-async-windjs/” “Mozilla/5.0(Macintosh;IntelMacOSX10_8_4)AppleWebKit/537.36(KHTML,likeGecko)Chrome/29.0.1547.65Safari/537.36”

2019.11.14

blog.fens.me

/nodejs-async-windjs/

NULL

NULL

2013-09-18

15:39:19

2013

09

18

15

DWS层：

按照多个维度和主题划分的多个宽表,对数据进行了轻度汇总

1.dws_visit,访客表

sessioned	String	会话id
starttime	String	开始时间
startpage	String	开始页面
outtime	String	结束时间
outpage	String	结束页面
pagecount	String	访问的页面数
addr	String	ip
http_user_agent	String	用户浏览器信息

在hive中建表dws_visit

create table if not exists dws_visit(
sessioned string,
starttime string,
startpage string,
outtime string,
outpage string,
pagecunt string,
addr string) 
partitioned by(datestr string)
row format delimited 
fields terminated by '\001';

检查一下：
select * from dws_visit limit 6;

00fbf89c-2ea2-409b-b413-fd547e823196

2013-09-18 09:46:57

/tag/ng-view/

2013-09-18 09:47:01

/wp-content/uploads/2013/05/favicon.ico

6

118.166.91.239

2019.11.14

导入数据：

load data inpath '/dianshang/data/visit' overwrite into table dws_visit partition(datestr="2019.11.14");

2.按照时间维度统计

select year, month, day, hour, count(*) from dwd_tmp_timeAndurl group by year, month,day, hour;

按照时间小时统计的PV，建立表dws_PV_hour

create table dws_PV_hour(year string, month string, day string, hour string, pvs bigint) partitioned by(datestr string);


insert into table dws_PV_hour partition(datestr='2019.11.14')
select a.year as year, a.month as month, a.day as day, a.hour as hour, count(1) as pvs 
from dwd_tmp_timeAndurl a 
where a.datestr='2019.11.14' 
group by a.year, a.month, a.day, a.hour;

检查一下：
select * from dws_PV_hour limit 10;

按照天统计PV,建立表dws_PV_day

create table if not exists dws_PV_day(
year string, 
month string,
day string,
pvs bigint);

Insert into table dws_PV_day 
select year, month, day,sum(pvs) as pvs
from  dws_PV_hour 
group by year, month, day having day='18';


select * from dws_PV_day limit 5;

按照月统计PV,建立表dws_PV_year

create table if not exists dws_PV_month(
year string,
month string,
pvs bigint);


insert into table dws_PV_month 
select year,month,sum(pvs) as pvs
from dws_PV_day 
group by year,month having month="09";

select * from dws_PV_month limit 5;

3.按照终端维度进行统计

create table dws_user_agent as select distinct(http_user_agent) from dwd_tmp_timeAndurl where 
http_user_agent like '%Mozilla%';

select * from dws_user_agent limit 10;

4.按照页面维度进行统计分析

每个访问深度有多少个页面

select step,count(1) 
from dwd_tmp_timeAndurl  
group by step limit 10;

创建表dws_page

create table if not exists dws_page(
step string,count bigint) 
clustered by(step) 
sorted by(step) into 10 buckets;

insert into table dws_page select step,count(1) 
from dwd_tmp_timeAndurl group by step;

select * from dws_page limit 20;

5.按照来源维度进行统计和分析

create table dws_url as select distinct(http_referer) from dwd_tmp_timeAndurl where 
http_referer like '%blog.fens.me%';

select * from dws_url limit 20;

ADS层：

人均流量

独立访客

visit分析

【YOLOv8改进】 YOLOv8 更换骨干网络之 GhostNet ：通过低成本操作获得更多特征 (论文笔记+引入代码) YOLO大师 YOLO 论文阅读
YOLO目标检测创新改进与实战案例专栏专栏目录：YOLO有效改进系列及项目实战目录包含卷积，主干注意力，检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例介绍摘要在嵌入式设备上部署卷积神经网络（CNNs）由于有限的内存和计算资源而变得困难。特征图中的冗余是那些成功的CNNs的一个重要特性，但在神经架构设计中很少被研究。本文提出了一种新颖的Ghost模块，
Java全栈项目--校园餐饮点评平台项目实战天天进步2015 Java项目实战 java 开发语言
项目介绍本项目是一个面向校园师生的餐饮点评平台，用户可以在平台上查看校园内各个餐厅的信息、菜品评价、发表点评等。项目采用SpringBoot+Redis+MySQL实现，包含用户登录、商户查询、优惠券秒杀、点评发布等功能。技术栈后端：SpringBoot、MyBatis-Plus、Redis前端：Vue.js、ElementUI数据库：MySQL缓存：Redis核心功能实现1.登录功能采用Redi
Python 毕业设计怎样选题？500 到 Python 毕业设计题目推荐程序员徐师兄 Python 毕业设计 python 课程设计开发语言 Python毕业设计选题
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝30W+,Csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌前言文章首发地址地址选择一个合适的Python毕业设计题目，是一个重要的决策，它将影响你未来几个月的工作。以下是一些关于如何选择一个合适的Python毕业设计题目，以及如何避免踩坑的建议：1、自己选题的不要凭空进行想象，一定要做到不
MySQL DCL数据控制语言青花锁 mysql 数据库 DCL 数据控制语言
作者主页：青花锁简介：Java领域优质创作者、Java微服务架构公号作者简历模板、学习资料、面试题库、技术互助文末获取联系方式往期热门专栏回顾专栏描述Java项目实战介绍Java组件安装、使用；手写框架等Aws服务器实战AwsLinux服务器上操作nginx、git、JDK、VueJava微服务实战Java微服务实战，SpringCloudNetflix套件、SpringCloudAlibaba套
PCL 点云随机渲染颜色 MelaCandy PCL点云算法与实战案例 3d 算法计算机视觉人工智能 c++
目录一、概述1.1原理1.2实现步骤1.3应用场景二、代码实现2.1关键函数2.2完整代码三、实现效果PCL点云算法汇总及实战案例汇总的目录地址链接：PCL点云算法与项目实战案例汇总（长期更新）一、概述本文将介绍如何使用PCL库为点云中的每个点随机渲染颜色，并在PCL的可视化窗口中显示。这种方法适用于需要对点云中的不同点进行颜色区分的场景，可以帮助更直观地观察和分析点云数据。1.1原理在点云处理中
【2025最新计算机毕业设计】基于SSM的旅游与自然保护平台【提供源码+答辩PPT+文档+项目部署】万码堂源码计算机毕设精品实战案例实战项目源码课程设计 vue.js 前端计算机毕业设计毕设项目 spring boot
作者简介：✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流。✌主要内容：Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、单片机开发、物联网设计与开发设计、简历模板、学习资料、面试题库、技术互助、就业指导等。业务范围：免费功能设计、开题报告、任务书
【源码+文档】基于SpringBoot+Vue旅游网站系统【提供源码+答辩PPT+参考文档+项目部署】万码堂源码实战项目源码计算机毕设精品实战案例 spring boot vue.js 旅游
作者简介：✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流。✌主要内容：Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、单片机开发、物联网设计与开发设计、简历模板、学习资料、面试题库、技术互助、就业指导等。业务范围：免费功能设计、开题报告、任务书
自动驾驶中的混合决策架构 AI天才研究院 ChatGPT AI大模型企业级应用开发实战大数据AI人工智能大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
自动驾驶中的混合决策架构关键词：自动驾驶、混合决策架构、决策模型、算法、数学模型、项目实战摘要：本文将深入探讨自动驾驶中的混合决策架构，从基础理论到实际应用，全面解析这一领域的核心概念、算法原理及其在自动驾驶中的具体应用。通过详细的项目实战案例，本文旨在为读者提供全面的技术指导和深刻的思考。第一部分：自动驾驶基础理论第1章：自动驾驶概述自动驾驶技术的发展背景源于人类对便捷、安全和高效的交通出行的需
【YOLOv8改进- Backbone主干】YOLOv8更换主干网络之ConvNexts，纯卷积神经网络，更快更准，，降低参数量！ YOLO大师 YOLO 网络 cnn 目标检测论文阅读 yolov8
YOLOv8目标检测创新改进与实战案例专栏专栏目录：YOLOv8有效改进系列及项目实战目录包含卷积，主干注意力，检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLOv8基础解析+创新改进+实战案例介绍摘要视觉识别的“咆哮20年代”开始于视觉Transformer（ViTs）的引入，ViTs迅速取代了卷积神经网络（ConvNets）成为最先进的图像分类模型。然而，普通的ViT在应用于诸
springboot+vue项目实战一-创建SpringBoot简单项目苹果酱0567 面试题汇总与解析 spring boot 后端 java 中间件开发语言
这段时间抽空给女朋友搭建一个个人博客，想着记录一下建站的过程，就当做笔记吧。虽然复制zjblog只要一个小时就可以搞定一个网站，或者用cms系统，三四个小时就可以做出一个前后台都有的网站，而且想做成啥样也都行。但是就是要从新做，自己做的意义不一样，更何况，俺就是专门干这个的，嘿嘿嘿要做一个网站，而且从零开始，首先呢就是技术选型了，经过一番思量决定选择-SpringBoot做后端，前端使用Vue做一
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
基于nodejs+vue的美妆彩妆网站的设计与实现(源码+LW+调试文档+讲解等) 程序员gelei nodejs毕业设计项目 vue.js 前端 javascript
目录：博主介绍：完整视频演示：系统技术介绍：后端Java介绍前端框架Vue介绍具体功能截图：部分代码参考：Mysql表设计参考：项目测试：项目论文：为什么选择我：源码获取：博主介绍：博主：程序员gelei：全网拥有20W+粉丝、CSDN作者、博客专家、全栈领域优质创作者、平台优质Java创作者、专注于Java、小程序、python、安卓技术领域和毕业项目实战✌Java精品实战案例《1000套》20
Java 基于 SpringBoot+vue 的大学生科创项目在线管理系统（附源码）程序员徐师兄 java spring boot vue.js 大学生科创项目管理系统大学生科创项目
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》Python项目实战《100套》
计算机毕业设计选题推荐-基于Python框架项目推荐（中）计算机毕设大佬 Java毕设实战项目 Python毕设实战项目爬虫+大数据毕设实战项目 python 计算机毕业设计 django 计算机毕业设计如何选题 25届计算机毕业设计如何选题计算机毕业设计选题推荐 24届计算机毕设选题推荐
博主介绍：✌十余年IT大项目实战经验、在某机构培训学员上千名、专注于本行业领域✌技术范围：Java实战项目、Python实战项目、微信小程序/安卓实战项目、爬虫+大数据实战项目、Nodejs实战项目、PHP实战项目、.NET实战项目、Golang实战项目。主要内容：系统功能设计、开题报告、任务书、系统功能实现、功能代码讲解、答辩PPT、文档编写、文档修改、文档降重、一对一辅导答辩。获取源码可以联系
Django+Vue基于OpenCV的人脸识别系统的设计与实现赵广陆 project django vue.js opencv
目录1项目介绍2项目截图3核心代码3.1需要的环境3.2Django接口层3.3实体类3.4config.ini3.5启动类3.5Vue4数据库表设计5文档参考6计算机毕设选题推荐7源码获取1项目介绍博主个人介绍：CSDN认证博客专家，CSDN平台Java领域优质创作者，全网30w+粉丝，超300w访问量，专注于大学生项目实战开发、讲解和答疑辅导，对于专业性数据证明一切！主要项目：javaweb、
项目实战 ---- 商用落地视频搜索系统（10）---后台搜索Cache优化 PhoenixAI8 AI Python 商用视频搜索系统 vector db milvus redis cache
目录背景技术实现策略视频预处理阶段的cache技术视频搜索阶段的cache技术技术实现预处理阶段cache策略实现逻辑代码运行结果问题及注意点搜索阶段cache策略实现系统配置层面逻辑低版本GPUCPU本项目的配置高版本描述goahead策略cache加载策略本项目配置应用层搜索参数的配置配置项本项目的实际配置背景但目前为止，视频搜索系统已经可以正常使用和运转。并且他是基于多策略搜索算法的，能够在
启动速度与执行效率优化项目实战（二）：启动黑白屏解决 bug音音
img为什么会有黑白屏在桌面点击应用图标后，在app进程没有创建的情况下，需要时间创建app进程，初始化资源，以及启动首页Activity的（这里讨论的首页是指AndroidManifest里面标志的启动页），这就意味点击图标不能马上看到启动页。为了不让用户有卡顿的感觉，谷歌有了PreviewWindow，在启动页没有绘制完成时，会先初始化一个Window，我们通常看到的黑屏或白屏，就是这个预览窗
【小贪】项目实战——Zero-shot根据文字提示分割出图片目标掩码贪钱算法还我头发 #Deep Learning #Computer Vision AI 目标检测深度学习 python 语义分割 Zero-shot
目标描述给定RGB视频或图片，目标是分割出图像中的指定目标掩码。我们需要复现两个Zero-shot的开源项目，分别为IDEA研究院的GroundingDINO和Facebook的SAM。首先使用目标检测方法GroundingDINO，输入想检测目标的文字提示，可以获得目标的anchorbox。将上一步获得的box信息作为SAM的提示，分割出目标mask。具体效果如下（测试数据来自VolumeDef
springcloud项目实战家教信息平台系统的设计与实现-微服务-分布式 Python大数据爬虫项目辅导 Java项目 spring cloud 微服务分布式
专业毕设定制，上千套成品任选，所有项目包含开题、答辩PPT、lunwen文末获取源码联系感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人计算机毕设项目java毕业设计源码定做论文定制springcloud的家教信息平台系统_哔哩哔哩_bilibiliIT实战课堂-项目资料网址:www.itszkt.com软件下载地址:https://www
【Python】成功解决IndexError: list index out of range 高斯小哥 BUG解决方案合集 python list 新手入门学习 debug
【Python】成功解决IndexError:listindexoutofrange下滑查看解决方法欢迎莅临我的个人主页这里是我静心耕耘深度学习领域、真诚分享知识与智慧的小天地！博主简介：985高校的普通本硕，曾有幸发表过人工智能领域的中科院顶刊一作论文，熟练掌握PyTorch框架。技术专长：在CV、NLP及多模态等领域有丰富的项目实战经验。已累计一对一为数百位用户提供近千次专业服务，助力他们少走
SprinBoot+Vue远程教育网站的设计与实现赵广陆 project vue.js 前端 javascript
目录1项目介绍2项目截图3核心代码3.1Controller3.2Service3.3Dao3.4application.yml3.5SpringbootApplication3.5Vue4数据库表设计5文档参考6计算机毕设选题推荐7源码获取1项目介绍博主个人介绍：CSDN认证博客专家，CSDN平台Java领域优质创作者，全网30w+粉丝，超300w访问量，专注于大学生项目实战开发、讲解和答疑辅导
滚雪球学MyBatis(11)：项目实战 bug菌¹ 《滚雪球学MyBatis》mybatis java 零基础入门
前言欢迎回到我们的MyBatis系列教程。在前几期中，我们详细探讨了MyBatis的进阶使用，包括多数据源配置、动态SQL生成器、MyBatisGenerator的使用以及实现复杂查询的方法。这些知识点帮助我们在复杂的业务场景中更高效地使用MyBatis。本期内容中，我们将结合前面的所有知识点，进行一个完整的项目实战。通过实际项目的练习，大家将能够更好地巩固所学知识，并将其应用到实际开发中。11.
项目实战系列三: 家居购项目第五部分 ~ 小团子 #家居购项目 python 开发语言
显示订单[订单管理]暂时缺货需求分析1.如果某家居库存为0,首页的"AddtoCart"按钮显示为"暂时缺货"2.后台也加上校验.只有在库存>0时,才能添加到购物车代码实现1.修改web/views/customer/index.jspAddToCart[缺货]0}">AddToCart2.修改src/com/zzw/furns/web/CartServlet.java,当添加购物车时,要保证商品
Rust模块std::thread 夏天又到了 Rust编程与项目实战 rust java 算法
【图书介绍】《Rust编程与项目实战》-CSDN博客《Rust编程与项目实战》(朱文伟，李建英)【摘要书评试读】-京东图书(jd.com)Rust到底值不值得学，之一-CSDN博客Rust到底值不值得学，之二-CSDN博客Rust多线程编程概述-CSDN博客12.3.2等待所有线程完成在前面的实例中，主线程没等到派生线程执行完毕就结束了，从而整个进程就会结束。那么怎么让派生线程执行完毕呢？答案是通
Android-Jetpack架构组件（二）带你了解Lifecycle，给2021的移动开发一些建议 flutter架构师程序员面试移动开发 android
@OverrideprotectedvoidonResume(){super.onResume();myPresenter.onResume();}@OverrideprotectedvoidonPause(){super.onPause();myPresenter.onPause();}}classMyPresenter{《Android学习笔记总结+最新移动架构视频+大厂安卓面试真题+项目实战
总结50位大咖运营项目实战经验，这5大条件缺一不可，实用所有行业 1bdcc660f394
文：轻腾创者圈子不同，认知不同。思维不同，行为所异。一位大咖在他的博客中说：想要学习一项技能，最好的方法就是选择这个行业比较优秀的人对标，然后把他们所有的朋友圈及文章文案，全部从头到尾研究一篇。不得不说，从这句话，我真实的去学习和研究很多大咖他们的内容，确实学到不少东西。每一次学习，都可以从中吸取自己想要的内容，然后自己总结应用，就可以形成自己的体系。今年我至少有总结过50位大咖运营项目的实战经验
自然语言处理系列六十六》对话机器人项目实战》对话机器人原理与介绍陈敬雷-充电了么-CEO兼CTO python 人工智能算法自然语言处理机器人人工智能 AIGC chatgpt gpt ai
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《自然语言处理原理与实战》（人工智能科学与技术丛书）【陈敬雷编著】【清华大学出版社】文章目录自然语言处理系列六十六对话机器人项目实战》对话机器人原理与介绍对话机器人项目代码实战总结自然语言处理系列六十六对话机器人项目实战》对话机器人原理与介绍对话机器人是一个用来模拟人类对话或聊天的计算机程序，本质上是通过机器学习和人工智能等技术让
SprinBoot+Vue动漫交流与推荐平台的设计与实现赵广陆 project vue.js 前端 javascript
目录1项目介绍2项目截图3核心代码3.1Controller3.2Service3.3Dao3.4application.yml3.5SpringbootApplication3.5Vue4数据库表设计5文档参考6计算机毕设选题推荐7源码获取1项目介绍博主个人介绍：CSDN认证博客专家，CSDN平台Java领域优质创作者，全网30w+粉丝，超300w访问量，专注于大学生项目实战开发、讲解和答疑辅导
WebView交互架构项目实战（三），androidstudio地图开发 wq221aas 程序员架构移动开发 android
不过根据官方文档，AppCache已经不推荐使用了，标准也不会再支持。现在主流的浏览器都是还支持AppCache的，以后就不太确定了。同样给出Android端启用AppCache的代码。WebViewmyWebView=(WebView)findViewById(R.id.webview);WebSettingswebSettings=myWebView.getSettings();webSett
WebView交互架构项目实战（三），史上超级详细 m0_66264881 程序员架构移动开发 android
returnsplashTargetPath+“/”;}***1：常用JS本地化及延迟加载*******资源等文件(不需要更新)本地存储，在需要的时候直接从本地获取。哪些资源需要我们去存储在本地呢，当然是一些不会被更新的资源，例如图片文件，js文件，css文件，比预加载更粗暴的优化方法是直接将常用的JS脚本本地化，直接打包放入apk中。比如H5页面获取用户信息，设置标题等通用方法，就可以直接写入一
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。

离线项目（三）数据仓库的设计