不急吃口药

hive经典案例需求

=============hql补强点！练习题===============================

01,01,80
01,02,90
01,03,99
02,01,70
02,03,80
03,03,80
04,01,50
04,02,30

create table test1(
name int,
course int,
score int
)
row format delimited
fields terminated by ',';

left join(很好的利用了反向，) --- 推荐！
select *
from test1 t
left join(
select name
from test1
where score < 80
) tmp
on t.name = tmp.name
where tmp.name is null;

----

编写sql完成如下查询，一次查询实现最好，也可以写多次查询实现:

1、查出每个学期每门课程最高分记录(包含全部5个字段)

---- 又有聚合结果，又有详细信息； 1、开窗（聚合操作） 2、自连接，双join

select id,
       userid,
       course,
       score,
       term
       from (
                select id,
                       userid,
                       course,
                       score,
                       term,
                       row_number() over (partition by term,course order by score desc) maxScore
                from course_score
            ) tt
where tt.maxScore=1;

---

select
    s.id,
    s.userid,
    s.course,
    s.score,
    s.term
from
    course_score s
        join
    (select
         course,
         userid,
         max(score) score
     from course_score
     group by course,userid) t1

    on s.course=t1.course               ----》 多个条件确定唯一一行值
        and
     s.userid=t1.userid
        and
     s.score=t1.score
;

2、查出单个学期中语文课在90分以上的学生的数学成绩记录(包含全部5个字段)

---- 理解有些偏差，符合条件的单个学期的学生对应的该学期的数学成绩，还是对应所有学期数学成绩（注意：的，的，理解就对了-这里偏所有）

select
    s.id,
    s.userid,
    s.course,
    s.score,
    s.term
from
    course_score s
        join
    (select
         id,
         userid,
         course,
         score,
         term
     from
         course_score
     where
             score >=70
       and
             course="语文") t1
    on s.userid=t1.userid
where s.course="数学"
and   s.term = t1.term        ----》  加一个判断就是，对应的该学期的数学成绩
;

解法二：select * from course_score t1 join course_score t2 on t1.userid = t2.userid and t1.course='语文' and t1.score>=90 and t2.id is not null and t2.course='数学'

---------------------------------

5分钟连续点击日志3次（当前点击日志时间 - 前3次点击时间 < 300s）

1,2011-12-07 13:01:03
1,2011-12-07 13:03:04
1,2011-12-07 13:02:03
1,2011-12-07 13:06:04
1,2011-12-07 13:08:09
2,2011-12-07 13:01:12
2,2011-12-07 13:01:15
2,2011-12-07 13:02:12
2,2011-12-07 13:03:12
2,2011-12-07 13:04:12
3,2011-12-07 13:04:12
3,2011-12-07 13:05:12
3,2011-12-07 13:07:12
3,2011-12-07 13:06:12
3,2011-12-07 13:10:12

create table url(
uid int,
dt timestamp
)
row format delimited
fields terminated by ',';

load data local inpath '/root/url.txt' into table url;

select distinct tmp.uid
from (
select uid,dt,
lag(dt,3) over(partition by uid order by dt asc) t
from url
) tmp
where (unix_timestamp(tmp.dt)-unix_timestamp(tmp.t))/60 < 5

=================================================

用一条语句写出每个人的居住地址和工作地址

user1
1,001,002
2,003,002
3,005,002
4,007,002

region
001,北京
002,上海
003,杭州

create table user1(
id int,
hc string,
jc string
)
row format delimited
fields terminated by ','

load data local inpath '/root/user1.txt' into table user1;

create table region(
code string,
city string
)
row format delimited
fields terminated by ','

load data local inpath '/root/region.txt' into table region;

select u1.id,r1.city,r2.city
from user1 u1
left join region r1
on u1.hc=r1.code
left join region r2
on u1.jc = r2.code

-------------------列转行-----------------------------

id,name,math,computer,english
1,huang,34,58,67
2,quan,54,60,69

create table score(
id int,
name string,
math int,
computer int,
english int
) row format delimited
fields terminated by ','

load data local inpath '/root/score.txt' into table score;

select id,name,course,score
from score
lateral view explode(str_to_map(concat('Math',':',Math,',','Computer',':',Computer,',','English',':',English),',')) tmp as course,score

结果：
id,name,course,score
1,huang,Math,34
1,huang,Computer,58
1,huang,English,67
2,quan,Math,54
2,quan,Computer,60
2,quan,English,69

select id,name,'Math' as course,math as score from score
union all
select id , name,'Computer' as course,computer as score from score
union all
select id,name,'English' as course,english as score from score

0 as computer：直接写0会有默认的别名，可以自己设置as
常数可以直接输出呀！
select name,1 as computer from score

--------------

ID	type_flag	tags
10001	3	11_20_30,11_22_34,12_23_30,13_24_36
10002	2	11_20,11_22,12_23,13_24
10003	1	11,12

ID   type_flag   tag1   tag2   tag3
10001   3   11   20   30
10001   3   11   22   34
10001   3   12   23   30
10001   3   13   24   36
10002   2   11   20
10002   2   11   22
10002   2   12   23
10002   2   13   24
10003   1   11
10003   1   12

巧思：1、建表 2、type_flag对应数组的个数：type_flag in (1,2,3)，

create table flag
(
ID bigint,
type_flag int,
tags array
)
row format delimited
fields terminated by '\t'
collection items terminated by ',';

select
    ID,type_flag,
    (case when type_flag in (1,2,3) then arraySplit[0] else '' end) tag1,
    (case when type_flag in (2,3) then arraySplit[1] else '' end) tag2,
    (case when type_flag in (3) then arraySplit[2] else '' end) tag3
from (

         select
             ID,type_flag,
             split(temptag,'_') arraySplit
         from flag
                  lateral view explode(tags) temp as temptag

     ) tmp;

------------------

叶子：如果这个节点没有任何孩子节点。

根：如果这个节点是整棵树的根，即没有父节点。

内部节点：如果这个节点既不是叶子节点也不是根节点。

写一个查询语句，输出所有节点的编号和节点的类型，并将结果按照节点编号排序。

id p_id ====》 id Type
1 null ====》 1 Root
2 1 ====》 2 Inner
3 1 ====》 3 Leaf
4 2 ====》 4 Leaf
5 2 ====》 5 Leaf

create  table stu(
    id int,
    p_id int
)row format delimited
fields terminated by ' ';


SELECT DISTINCT t1.id,
                (CASE
                     WHEN t1.p_id IS NULL
                     THEN 'Root'
                     ELSE
                         CASE
                             WHEN t2.id IS NULL
                             THEN 'Leaf'
                             ELSE 'Inner'
                          END
                  END) AS Type
FROM stu t1  LEFT JOIN stu t2   ON t1.id=t2.p_id

----------------每个用户连续登录最大天数-------------------------------

id datetime
1,2019-07-26
1,2019-07-27
1,2019-07-30
1,2019-07-31
1,2019-08-01
2,2019-07-26
2,2019-07-27
2,2019-07-28
2,2019-07-30
2,2019-07-31

每个用户连续登录最大天数

create table login(
id int,
datetime string
) row format delimited
fields terminated by ','

load data local inpath '/root/login.txt' into table login;

select temp.id,max(temp.num)
from(
select tmp.id id,count(1) num
from (
select id,date_sub(datetime,row_number() over(partition by id order by datetime asc)) t
from login
group by id,datetime      -- 保证同一天只有一条数据
) tmp
group by tmp.id,tmp.t
) temp
group by temp.id

最近七天内连续三天活跃用户数：
select mid_id
from
(
select mid_id
from
(
select
mid_id,
date_sub(dt,rank) date_diff
from
(
select
mid_id,
dt,
dense_rank() over(partition by mid_id order by dt) rank
from "$APP".dws_uv_detail_day
where dt>=date_add('$do_date',-6) and dt<='$do_date'
)t1
)t2
group by mid_id,date_diff
having count(*)>=3
)t3
group by mid_id

--------------两人通话记录总时长----------------------------------------

大不了自定义udf解决！

b,a,13:01:03 b,a,13:01:03
b,a,14:01:05 b,a,14:01:05
a,b,13:01:09 a,b,13:01:09
b,d,13:01:03 b,d,13:01:03
c,a,23:01:13 c,a,23:01:13
d,b,15:03:03 d,b,15:03:03

create table phone(
name string,
other string,
talktime string
) row format delimited
fields terminated by ','

load data local inpath '/root/phone.txt' overwrite into table phone;

from_unixtime(cast(sum(tt) as bigint),'mm'): 转换成日期格式，如果超过24小时会轮回的
所以这里只能使用累加分钟数即可(+号)
字符串比较大小等于(>、<、=)，连接用concat

case when：对一行数据进行判断数据；可以有多个case when输出多列；
sum(case when) : 适用于分组后，多行值；可以有多个case when输出多列；

select tmp.`one`,tmp.`two`,sum(tmp.`duration`)
from(
select
case when name>=other then name else other end as `one`,
case when name>=other then other else name end as `two`,
split(talktime,':')[0]*60*60 + split(talktime,':')[1]*60 + split(talktime,':')[2] as `duration`
from phone
) tmp
group by tmp.`one`,tmp.`two`

----------------------------------------------------------------------

======== 需求三：用户留存主题===============================

留存率:留存用户占当时新增用户(活跃用户)的比例即是留存率

10日对于11日留存率：
10日新增设备数的留存率= 10日新增设备数且 11日活跃数 / 10日的新增设备数

`create_date` string comment '设备新增时间',
`retention_day` int comment '截止当前日期留存天数' （1，2，3，4，n）

留存怎么验证是否有数据呢？（修改成事务表）
把数据导出成文件，修改日期，再导回去？

（1,2,3,n天留存用户明细表）： union all （开窗、left join、left semi join、join 、union all看情况选用）
insert overwrite table dws_user_retention_day
partition(dt="2019-09-22")
select
nm.mid_id,
nm.user_id,
nm.version_code,
nm.version_name,
nm.lang,
nm.source,
nm.os,
nm.area,
nm.model,
nm.brand,
nm.sdk_version,
nm.gmail,
nm.height_width,
nm.app_time,
nm.network,
nm.lng,
nm.lat,
nm.create_date,
1 retention_day
from dws_uv_detail_day ud join dws_new_mid_day nm on ud.mid_id =nm.mid_id
where ud.dt='2019-09-22' and nm.create_date=date_add('2019-09-22',-1)

union all
select
nm.mid_id,
nm.user_id ,
nm.version_code ,
nm.version_name ,
nm.lang ,
nm.source,
nm.os,
nm.area,
nm.model,
nm.brand,
nm.sdk_version,
nm.gmail,
nm.height_width,
nm.app_time,
nm.network,
nm.lng,
nm.lat,
nm.create_date,
2 retention_day
from dws_uv_detail_day ud join dws_new_mid_day nm on ud.mid_id =nm.mid_id
where ud.dt='2019-09-22' and nm.create_date=date_add('2019-09-22',-2)

union all
select
nm.mid_id,
nm.user_id ,
nm.version_code ,
nm.version_name ,
nm.lang ,
nm.source,
nm.os,
nm.area,
nm.model,
nm.brand,
nm.sdk_version,
nm.gmail,
nm.height_width,
nm.app_time,
nm.network,
nm.lng,
nm.lat,
nm.create_date,
3 retention_day
from dws_uv_detail_day ud join dws_new_mid_day nm on ud.mid_id =nm.mid_id
where ud.dt='2019-09-22' and nm.create_date=date_add('2019-09-22',-3);

-----------

ADS层
留存用户数：
retention_ratio decimal(10,2)

create external table ads_user_retention_day_count
(
create_date string comment '设备新增日期',
retention_day int comment '截止当前日期留存天数',
retention_count bigint comment '留存数量'
)COMMENT '每日用户留存情况'
row format delimited fields terminated by '\t'
location '/warehouse/gmall/ads/ads_user_retention_day_count/';

insert into table ads_user_retention_day_count
select
create_date,
retention_day,
count(*) retention_count
from dws_user_retention_day
where dt='2019-09-22'
group by create_date,retention_day;

留存用户比率:
create external table ads_user_retention_day_rate
(
stat_date string comment '统计日期',
create_date string comment '设备新增日期',
retention_day int comment '截止当前日期留存天数',
retention_count bigint comment '留存数量',
new_mid_count bigint comment '当日设备新增数量',
retention_ratio decimal(10,2) comment '留存率'
) COMMENT '每日用户留存情况'
row format delimited fields terminated by '\t'
location '/warehouse/gmall/ads/ads_user_retention_day_rate/';

insert into table ads_user_retention_day_rate
select
'2019-09-22', //指定一下，'统计日期'，用于查看数据
ur.create_date,
ur.retention_day,
ur.retention_count,
nc.new_mid_count,
ur.retention_count/nc.new_mid_count*100
from ads_user_retention_day_count ur join ads_new_mid_count nc
on nc.create_date=ur.create_date;

------------------------------------------

表user_id,visit_date,page_name,plat

1，请统计近7天每天到访的新用户数；（注意：“新”字）

思路：1.求出每个用户及其第一次登陆的日期，也就是成为新用户的那天，过滤出近7天；2.在第1步所得表基础上提取每个用户成为新用户的日期，按这个时间分组，求得每天的用户数

select temp.firstDate, count(temp.user_id)

from
(select user_id, min(date_format(visit_date,'yyyy-MM-dd')) as firstDate
from person_visit
group by user_id
having firstDate >=date_sub(current_date(),7) and

firstDate ) as temp
group by temp.firstDate;

2，统计每个访问渠道plat7天前的新用户的3日留存率和7日留存率 (注意：7天前(D-7)的那一天的新用户)

思路：1.求得每个渠道7前的总的新用户数；2.求3日留存用户数；3.求7日留存用户数；4.手动计算留存率

3日后的用户数/七天前的新用户数 = 3日留存；
3日留存/七天前的新用户数=3日留存率；

七天前的新用户数

select tmp.firstDate, tmp.plat, count(tmp.user_id) from(
   select temp.user_id user_id,temp.firstDate firstDate,pv.plat plat
   from
   (select user_id, min(date_format(visit_date,'yyyy-MM-dd')) as firstDate
   from person_visit
   group by user_id
   havng firstDate=date_sub(current_date(),7)
   ) as temp join person_visit pv
   on temp.user_id=pv.user_id and temp.firstDate=date_format(pv.visit_date,'yyyy-MM-dd')
)tmp
group by tmp.plat;

3日留存
select plat,count(user_id)
from person_visit
where date_format(visit_date,'yyyy-MM-dd')=date_sub(current_date(),4)
and user_id in
(
select user_id
   from person_visit
   group by user_id
   having min(date_format(visit_date,'yyyy-MM-dd'))=date_sub(current_date(),7)
) as temp
group by plat

C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
NGS测序基础梳理02-簇生成（Cluster Generation）及flow cell介绍 qq_21478261 #生物信息生物信息学
本文图解Illumina测序平台，flowcell表面簇生成（ClusterGeneration）过程。写作时间：2020，有问题可留言或者我的公众号。本文将了解到什么？1flowcell2簇生成为何要进行簇生成？簇生成步骤1）文库与flowcell表面P5杂交与互补链合成2）双链变性3）桥式PCR扩增4）反链切除5）DNA链3'封闭参考资料：1flowcell为何要先介绍flowcell？因为簇
.NET 一款基于BGInfo的红队内网渗透工具 dot.Net安全矩阵网络 .net 安全 .netcore web安全矩阵
01阅读须知此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等（包括但不限于）进行检测或维护参考，未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失，均由使用者本人负责。本文所提供的工具仅用于学习，禁止用于其他方面02基本介绍在内网渗透过程中，白名单绕过是红队常见的技术需求。Sharp4Bginfo.exe是一款基于微软签名工具
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
Javaweb学习之Vue模板语法（三）不要数手指啦 vue.js 学习前端
目录学习资料前情回顾本期介绍（vue模板语法）文本插值Vue的Attribute绑定使用JavaScript表达式综合实例代码：学习资料Vue.js-渐进式JavaScript框架|Vue.js(vuejs.org)前情回顾项目的创建大家可以看这篇文章Vue学习之项目的创建-CSDN博客本期介绍（vue模板语法）首先，找到我们编写代码的地方找到自己项目的src文件夹，打开之后点击component
Ubuntu 服务器虚拟主机,ubuntu云服务器虚拟机 Gamer42 Ubuntu 服务器虚拟主机
ubuntu云服务器虚拟机内容精选换一换通过云服务器或者外部镜像文件创建私有镜像时，如果云服务器或镜像文件所在虚拟机的网络配置是静态IP地址时，您需要修改网卡属性为DHCP，以使私有镜像发放的新云服务器可以动态获取IP地址。本节以WindowsServer2008R2操作系统为例。其他操作系统配置方法略有区别，请参考对应操作系统的相关资料进行操作，文档中不对此进行详细说明后端虚拟机绑定EIP。登录
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
Flink时间窗口详解 bxlj_jcj Flink flink 大数据
一、引言在大数据流处理的领域中，Flink的时间窗口是一项极为关键的技术，想象一下，你要统计一个电商网站每小时的订单数量。由于订单数据是持续不断产生的，这就形成了一个无界数据流。如果没有时间窗口的概念，你就需要处理无穷无尽的数据，难以进行有效的统计分析。而时间窗口的作用，就是将这无界的数据流按照时间维度切割成一个个有限的“数据块”，方便我们对这些数据进行处理和分析。比如，我们可以定义一个1小时的时
探索实时流处理的未来：Kafka Streams 深度指南秋或依
探索实时流处理的未来：KafkaStreams深度指南项目介绍欢迎进入KafkaStreams：实时流处理的世界！这不仅仅是一本书，更是一个通往流处理领域深层奥秘的门户。由PrashantPandey编著，这本书以ApacheKafka2.1中的KafkaStreams库为核心，为读者铺就了一条从理解基础概念到熟练掌握KafkaStreams编程的路径。无论是软件工程师、数据架构师，还是对大数据处
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
两台pc如何高速度传输大文件费城之鹰其他两台电脑高速传输文件局域网不适用U盘传输资料网线直连两台电脑传资料
今天笔记本跑一个大一点的项目，8G的内存直接100%，i5的CPU直接75%并且在超频工作了，原本1.6Ghz的频率直接飙到了3.8Ghz，由于项目性质原因，采用的是公司配的笔记本，但是年初采购的联想E480，还在三包时间段内，公司不允许拆机增加内存，只能换一台新的台式机，听起来挺爽，有新设备，但是办公区域不准使用U盘这一类的存储设备，这就蛋疼了，大半年了项目代码，资料全在这个不够用的笔记本里，问
本地部署大模型的几种方式 AI产品经理语言模型人工智能自然语言处理 chatgpt 学习
现在大模型可谓是满天飞,只要你稍微关注时下的AI资讯,几乎每天都有新的AI大模型出现.这之中当然有诸如GhatGPT,Gemini这样的私有化大模型,更吸引人关注的可能是开源的可私有化部署的一些大模型.比如Meta前两天开放的Lamma3,Google的Gemma开源模型,国内也有Qwen以及YI等.前排提示，文末有大模型AGI-CSDN独家资料包哦！无论私有的大模型,还是开源的可私有化部署的大模
推荐系统中的归因分析 liliangcsdn 人工智能大数据
推荐系统中，归因分析(AttributionAnalysis)分析用户完成转化前到底是哪个渠道最起决定性作用。参考网络相关资料，常用的用户转化归因分析模型有如下6种，现收录参阅。1）最后点击归因转化全部归因于用户转化前最后一次点击的渠道。用户8月1日小红书种草，8月5日搜索官网，8月10日淘宝广告点击并完成下单。“最后点击归因”将此次转化归于淘宝广告，适用电商促销季投放归因。2）首次点击归因转化价
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
低成本作弊神器？使用ESP32将通义千问AI接入学生计算器
前因：IT之家9月24日消息，YouTube频道ChromaLock于9天前发布视频，介绍了名为TI-32的改造电路板，加装在德州仪器TI-84Plus图形计算器上，可以接入ChatGPT。IT之家查询公开资料，在PSAT、SAT和ACT大学入学考试、IB和AP考试中，标准化组织已经批准考生使用TI-84Plus图形计算器。ChromaLock探索了该计算器的连接端口，设计了名为TI-32的改造电
当前主体已达注册上限怎么办？微信公众号主体注册数量提升方法今日热点 java 开发语言
目前，微信官方对公众号注册数量做了调整：1.个人主体注册公众号数量上限由2个调整为1个；2.企业类主体注册公众号数量上限由5个调整为2个。也就是说，一个企业营业执照正常只能注册2个公众号了。但是很多企业只注册2个号是不够的，如果想多注册一些公众号该怎么办呢？公众号注册数量提升方法提升公众号主体注册数量需准备营业执照、法人身份证号码、管理员信息、登录邮箱等；资料准备好后，可联系公众平台服务商——美基
小程序主体变更全攻略：流程、资料与异常处理方案今日热点小程序微信开放平台企业微信微信经验分享微信公众平台
一、什么是小程序主体变更？小程序主体变更是微信公众平台提供的账号迁移功能，允许开发者将小程序的运营权限、主体信息、业务数据从原账号转移至其他开发者账号。适用于企业重组、业务转让、账号交接等场景，变更后原账号主体将失去小程序控制权。二、主体变更必备资料清单材料类型具体要求主体资质文件原/目标主体营业执照照片（加盖公章，清晰露出四角及年检章）法人身份证明双方法人身份证正反面照片（有效期内，人像清晰无遮
华为L1-L6流程体系核心框架 jmoych 华为大数据数据库
最近项目上讨论流程体系比较多，结合前面笔者发布的关于流程的文章，今天将华为的L1-L6流程体系简单分享一下，该体系是企业级流程管理的核心框架，通过分层设计实现战略到执行的垂直贯通。想获取完整资料的朋友，可加入知识星球，会员可无限制下载所有资料。流程分类框架体系设计应该梳理到L5还是L6?面向离散制造企业复杂业务，流程体系建设覆盖从L1到L5/L6的全层级框架？以下从架构设计、功能定位、层级关系三个
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python爬虫：从图片或扫描文档中提取文字数据的完整指南 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言数据挖掘 c++
1.引言随着大数据技术的不断进步，图像数据逐渐成为了许多行业中重要的数据源之一。图像中不仅包含了丰富的视觉信息，还可能蕴含着大量的文字数据。对于科研、企业、政府等多个领域而言，如何从图片或扫描文档中提取出有价值的文字信息是一个亟待解决的问题。在这一过程中，OCR（OpticalCharacterRecognition，光学字符识别）技术成为了解决这一问题的重要工具。在本文中，我们将探讨如何使用Py
【osgEarth】在osgEarth中实现的一些模型效果：雷达波、通信链路、爆炸、尾焰、轨迹、文字标牌等 bailang_zhizun OSG osgEarth QT qt c++
学习osgEarth也有一段时间了，记录一下最近一段时间的学习成果。主要是在osgEarth三维场景中实现了一些模型效果，部分模型参考借鉴了西安恒歌的一些显示效果（当然是不能和他们比的doge），期间也从杨总(freesouths)的一些资料、文章中学到了很多，在此也感谢杨总他们的无私奉献。1、简单的仿真小场景简单的仿真小场景，感兴趣的可以看看。基于osgEarth制作的一个简单的飞机对抗仿真小场
【C语言经典面试题】memcpy函数有没有更高效的拷贝实现方法？架构师李肯嵌入式物联网开发进阶 c语言面试性能优化
【C语言经典面试题】memcpy函数有没有更高效的拷贝实现方法？我相信大部分初中级C程序员在面试的过程中，可能都被问过关于memcpy函数的问题，甚至需要手撕memcpy。本文从另一个角度带你领悟一下memcpy的面试题，你可以看看是否能接得住？文章目录1写在前面2源码实现2.1函数申明2.2简单的功能实现2.3满足大数据量拷贝的功能实现3源码测试4小小总结5更多分享1写在前面假如你遇到下面的面试
python基于Hadoop的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
大数据技术之集群数据迁移
dfs.namenode.rpc-address.nameservice1.namenode30hadoop104:8020dfs.namenode.rpc-address.nameservice1.namenode37hadoop106:8020dfs.namenode.http-address.nameservice1.namenode30hadoop104:9870dfs.namenode.
如何通过YashanDB优化企业大数据处理流程数据库
在当今数据驱动的商业环境中，企业面临着巨大的数据处理挑战。性能瓶颈、数据一致性问题和可扩展性需求使得大数据处理成为一项复杂任务。作为一种新兴的数据库管理系统，YashanDB以其独特的架构设计和强大的数据处理能力，在解决这些挑战方面提供了有效的手段。本文旨在探讨如何利用YashanDB优化大数据处理流程，为企业提供高效、可靠的解决方案。YashanDB的体系架构与部署形态YashanDB支持多种部
物联网入门资料收集 Robin罗兵物联网
1、动动手做一个简单的物联网门禁，手机远程开锁，还带本地射频遥控https://blog.csdn.net/qq_40582683/article/details/796439082、一张图读懂基于微信硬件平台的物联网架构：https://blog.csdn.net/yueqian_scut/article/details/491534053、疯狂物联的控制模块：https://s.taobao.
Pandas 学习教程 _pass_ Data-Alaysis pandas 信息可视化
目录定义基本操作一维数组操作二维数组操作数据选择过滤数据处理数据清洗数据转换数据分析排序分组聚合数据透视表高级操作合并数据时间序列处理自定义函数调用数据可视化集成数据导出和导入大数据分块处理定义全称：'paneldata'and'pythondataanalysis'Analy:Series(一维数据)、DataFrame(二维数据)主要应用：数据清洗：处理缺失数据、重复数据等数据转换：改变数据的
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

hive经典案例需求

你可能感兴趣的:(大数据资料笔记整理)