清风明月一壶酒

CK数据库

clickhouse常用

CREATE DATABASE IF NOT EXISTS tutorial;
show databases;

CREATE TABLE tutorial.hits_v1
(
    `WatchID` UInt64,
    `JavaEnable` UInt8,
    `Title` String,
    `GoodEvent` Int16,
    `EventTime` DateTime,
    `EventDate` Date,
    `CounterID` UInt32,
    `ClientIP` UInt32,
    `ClientIP6` FixedString(16),
    `RegionID` UInt32,
    `UserID` UInt64,
    `CounterClass` Int8,
    `OS` UInt8,
    `UserAgent` UInt8,
    `URL` String,
    `Referer` String,
    `URLDomain` String,
    `RefererDomain` String,
    `Refresh` UInt8,
    `IsRobot` UInt8,
    `RefererCategories` Array(UInt16),
    `URLCategories` Array(UInt16),
    `URLRegions` Array(UInt32),
    `RefererRegions` Array(UInt32),
    `ResolutionWidth` UInt16,
    `ResolutionHeight` UInt16,
    `ResolutionDepth` UInt8,
    `FlashMajor` UInt8,
    `FlashMinor` UInt8,
    `FlashMinor2` String,
    `NetMajor` UInt8,
    `NetMinor` UInt8,
    `UserAgentMajor` UInt16,
    `UserAgentMinor` FixedString(2),
    `CookieEnable` UInt8,
    `JavascriptEnable` UInt8,
    `IsMobile` UInt8,
    `MobilePhone` UInt8,
    `MobilePhoneModel` String,
    `Params` String,
    `IPNetworkID` UInt32,
    `TraficSourceID` Int8,
    `SearchEngineID` UInt16,
    `SearchPhrase` String,
    `AdvEngineID` UInt8,
    `IsArtifical` UInt8,
    `WindowClientWidth` UInt16,
    `WindowClientHeight` UInt16,
    `ClientTimeZone` Int16,
    `ClientEventTime` DateTime,
    `SilverlightVersion1` UInt8,
    `SilverlightVersion2` UInt8,
    `SilverlightVersion3` UInt32,
    `SilverlightVersion4` UInt16,
    `PageCharset` String,
    `CodeVersion` UInt32,
    `IsLink` UInt8,
    `IsDownload` UInt8,
    `IsNotBounce` UInt8,
    `FUniqID` UInt64,
    `HID` UInt32,
    `IsOldCounter` UInt8,
    `IsEvent` UInt8,
    `IsParameter` UInt8,
    `DontCountHits` UInt8,
    `WithHash` UInt8,
    `HitColor` FixedString(1),
    `UTCEventTime` DateTime,
    `Age` UInt8,
    `Sex` UInt8,
    `Income` UInt8,
    `Interests` UInt16,
    `Robotness` UInt8,
    `GeneralInterests` Array(UInt16),
    `RemoteIP` UInt32,
    `RemoteIP6` FixedString(16),
    `WindowName` Int32,
    `OpenerName` Int32,
    `HistoryLength` Int16,
    `BrowserLanguage` FixedString(2),
    `BrowserCountry` FixedString(2),
    `SocialNetwork` String,
    `SocialAction` String,
    `HTTPError` UInt16,
    `SendTiming` Int32,
    `DNSTiming` Int32,
    `ConnectTiming` Int32,
    `ResponseStartTiming` Int32,
    `ResponseEndTiming` Int32,
    `FetchTiming` Int32,
    `RedirectTiming` Int32,
    `DOMInteractiveTiming` Int32,
    `DOMContentLoadedTiming` Int32,
    `DOMCompleteTiming` Int32,
    `LoadEventStartTiming` Int32,
    `LoadEventEndTiming` Int32,
    `NSToDOMContentLoadedTiming` Int32,
    `FirstPaintTiming` Int32,
    `RedirectCount` Int8,
    `SocialSourceNetworkID` UInt8,
    `SocialSourcePage` String,
    `ParamPrice` Int64,
    `ParamOrderID` String,
    `ParamCurrency` FixedString(3),
    `ParamCurrencyID` UInt16,
    `GoalsReached` Array(UInt32),
    `OpenstatServiceName` String,
    `OpenstatCampaignID` String,
    `OpenstatAdID` String,
    `OpenstatSourceID` String,
    `UTMSource` String,
    `UTMMedium` String,
    `UTMCampaign` String,
    `UTMContent` String,
    `UTMTerm` String,
    `FromTag` String,
    `HasGCLID` UInt8,
    `RefererHash` UInt64,
    `URLHash` UInt64,
    `CLID` UInt32,
    `YCLID` UInt64,
    `ShareService` String,
    `ShareURL` String,
    `ShareTitle` String,
    `ParsedParams` Nested(
        Key1 String,
        Key2 String,
        Key3 String,
        Key4 String,
        Key5 String,
        ValueDouble Float64),
    `IslandID` FixedString(16),
    `RequestNum` UInt32,
    `RequestTry` UInt8
)
ENGINE = MergeTree()
PARTITION BY toYYYYMM(EventDate)
ORDER BY (CounterID, EventDate, intHash32(UserID))
SAMPLE BY intHash32(UserID);

CREATE TABLE tutorial.visits_v1
(
    `CounterID` UInt32,
    `StartDate` Date,
    `Sign` Int8,
    `IsNew` UInt8,
    `VisitID` UInt64,
    `UserID` UInt64,
    `StartTime` DateTime,
    `Duration` UInt32,
    `UTCStartTime` DateTime,
    `PageViews` Int32,
    `Hits` Int32,
    `IsBounce` UInt8,
    `Referer` String,
    `StartURL` String,
    `RefererDomain` String,
    `StartURLDomain` String,
    `EndURL` String,
    `LinkURL` String,
    `IsDownload` UInt8,
    `TraficSourceID` Int8,
    `SearchEngineID` UInt16,
    `SearchPhrase` String,
    `AdvEngineID` UInt8,
    `PlaceID` Int32,
    `RefererCategories` Array(UInt16),
    `URLCategories` Array(UInt16),
    `URLRegions` Array(UInt32),
    `RefererRegions` Array(UInt32),
    `IsYandex` UInt8,
    `GoalReachesDepth` Int32,
    `GoalReachesURL` Int32,
    `GoalReachesAny` Int32,
    `SocialSourceNetworkID` UInt8,
    `SocialSourcePage` String,
    `MobilePhoneModel` String,
    `ClientEventTime` DateTime,
    `RegionID` UInt32,
    `ClientIP` UInt32,
    `ClientIP6` FixedString(16),
    `RemoteIP` UInt32,
    `RemoteIP6` FixedString(16),
    `IPNetworkID` UInt32,
    `SilverlightVersion3` UInt32,
    `CodeVersion` UInt32,
    `ResolutionWidth` UInt16,
    `ResolutionHeight` UInt16,
    `UserAgentMajor` UInt16,
    `UserAgentMinor` UInt16,
    `WindowClientWidth` UInt16,
    `WindowClientHeight` UInt16,
    `SilverlightVersion2` UInt8,
    `SilverlightVersion4` UInt16,
    `FlashVersion3` UInt16,
    `FlashVersion4` UInt16,
    `ClientTimeZone` Int16,
    `OS` UInt8,
    `UserAgent` UInt8,
    `ResolutionDepth` UInt8,
    `FlashMajor` UInt8,
    `FlashMinor` UInt8,
    `NetMajor` UInt8,
    `NetMinor` UInt8,
    `MobilePhone` UInt8,
    `SilverlightVersion1` UInt8,
    `Age` UInt8,
    `Sex` UInt8,
    `Income` UInt8,
    `JavaEnable` UInt8,
    `CookieEnable` UInt8,
    `JavascriptEnable` UInt8,
    `IsMobile` UInt8,
    `BrowserLanguage` UInt16,
    `BrowserCountry` UInt16,
    `Interests` UInt16,
    `Robotness` UInt8,
    `GeneralInterests` Array(UInt16),
    `Params` Array(String),
    `Goals` Nested(
        ID UInt32,
        Serial UInt32,
        EventTime DateTime,
        Price Int64,
        OrderID String,
        CurrencyID UInt32),
    `WatchIDs` Array(UInt64),
    `ParamSumPrice` Int64,
    `ParamCurrency` FixedString(3),
    `ParamCurrencyID` UInt16,
    `ClickLogID` UInt64,
    `ClickEventID` Int32,
    `ClickGoodEvent` Int32,
    `ClickEventTime` DateTime,
    `ClickPriorityID` Int32,
    `ClickPhraseID` Int32,
    `ClickPageID` Int32,
    `ClickPlaceID` Int32,
    `ClickTypeID` Int32,
    `ClickResourceID` Int32,
    `ClickCost` UInt32,
    `ClickClientIP` UInt32,
    `ClickDomainID` UInt32,
    `ClickURL` String,
    `ClickAttempt` UInt8,
    `ClickOrderID` UInt32,
    `ClickBannerID` UInt32,
    `ClickMarketCategoryID` UInt32,
    `ClickMarketPP` UInt32,
    `ClickMarketCategoryName` String,
    `ClickMarketPPName` String,
    `ClickAWAPSCampaignName` String,
    `ClickPageName` String,
    `ClickTargetType` UInt16,
    `ClickTargetPhraseID` UInt64,
    `ClickContextType` UInt8,
    `ClickSelectType` Int8,
    `ClickOptions` String,
    `ClickGroupBannerID` Int32,
    `OpenstatServiceName` String,
    `OpenstatCampaignID` String,
    `OpenstatAdID` String,
    `OpenstatSourceID` String,
    `UTMSource` String,
    `UTMMedium` String,
    `UTMCampaign` String,
    `UTMContent` String,
    `UTMTerm` String,
    `FromTag` String,
    `HasGCLID` UInt8,
    `FirstVisit` DateTime,
    `PredLastVisit` Date,
    `LastVisit` Date,
    `TotalVisits` UInt32,
    `TraficSource` Nested(
        ID Int8,
        SearchEngineID UInt16,
        AdvEngineID UInt8,
        PlaceID UInt16,
        SocialSourceNetworkID UInt8,
        Domain String,
        SearchPhrase String,
        SocialSourcePage String),
    `Attendance` FixedString(16),
    `CLID` UInt32,
    `YCLID` UInt64,
    `NormalizedRefererHash` UInt64,
    `SearchPhraseHash` UInt64,
    `RefererDomainHash` UInt64,
    `NormalizedStartURLHash` UInt64,
    `StartURLDomainHash` UInt64,
    `NormalizedEndURLHash` UInt64,
    `TopLevelDomain` UInt64,
    `URLScheme` UInt64,
    `OpenstatServiceNameHash` UInt64,
    `OpenstatCampaignIDHash` UInt64,
    `OpenstatAdIDHash` UInt64,
    `OpenstatSourceIDHash` UInt64,
    `UTMSourceHash` UInt64,
    `UTMMediumHash` UInt64,
    `UTMCampaignHash` UInt64,
    `UTMContentHash` UInt64,
    `UTMTermHash` UInt64,
    `FromHash` UInt64,
    `WebVisorEnabled` UInt8,
    `WebVisorActivity` UInt32,
    `ParsedParams` Nested(
        Key1 String,
        Key2 String,
        Key3 String,
        Key4 String,
        Key5 String,
        ValueDouble Float64),
    `Market` Nested(
        Type UInt8,
        GoalID UInt32,
        OrderID String,
        OrderPrice Int64,
        PP UInt32,
        DirectPlaceID UInt32,
        DirectOrderID UInt32,
        DirectBannerID UInt32,
        GoodID String,
        GoodName String,
        GoodQuantity Int32,
        GoodPrice Int64),
    `IslandID` FixedString(16)
)
ENGINE = CollapsingMergeTree(Sign)
PARTITION BY toYYYYMM(StartDate)
ORDER BY (CounterID, StartDate, intHash32(UserID), VisitID)
SAMPLE BY intHash32(UserID);



curl https://datasets.clickhouse.com/hits/tsv/hits_v1.tsv.xz | unxz --threads=`nproc` > hits_v1.tsv
curl https://datasets.clickhouse.com/visits/tsv/visits_v1.tsv.xz | unxz --threads=`nproc` > visits_v1.tsv


---客户端链接工具
clickhouse-client -m -u root -p root

查询正在进行执行的sql操作
SHOW PROCESSLIST

建表语句

create TABLE test.test( id Int32,create_date Date ,c2 Nullable(String) ) 
engine=MergeTree(create_date,id,(c3,c2),8192);

表变更预计

ALTER查询只支持MergeTree表，。该查询有几个变体。
ALTER TABLE [db].name [ON CLUSTER cluster] ADD|DROP|MODIFY COLUMN
--更改列的类型

alter TABLE test.ontime_wpp_t MODIFY COLUMN TailNum Nullable(String);

alter TABLE test.ontime_wpp_t ADD COLUMN TailNum2 Nullable(String)  after   Div5TailNum ;

alter TABLE test.ontime_wpp_t drop COLUMN TailNum2;

表变更数据系统监控
select * from system.mutations where is_done = 0 order by create_time desc limit 1;

删除表
drop table cdm_dwd.dwd_ord_car_sharing_df on cluster crm_4shards_1replicas;

删除数据

truncate table cdm_dwd.dwd_ord_car_sharing_df on cluster crm_4shards_1replicas;
 

变更表名
RENAME TABLE test.ontime_wpp_t to test.ontime_wpp_t2;

集群操作
RENAME TABLE cdm_dwd.dwd_ord_carsh_base_df2 to cdm_dwd.dwd_ord_carsh_base_df on cluster crm_4shards_1replicas;

1，数据导出
在相关节点执行：
echo 'select * from test.ads_user_portrait_vertical_df_cls' | curl localhost:8123?database=test -uroot:root -d @- > table_name.sql


2、导入数据，以tab作为分割符：

导入数据库的本机执行：

cat table_name.sql | clickhouse-client --query="INSERT INTO database.table_name FORMAT TabSeparated"
     

cat /root/user_lable_local_mid_cluster.tgz | clickhouse-client --user hadoop --password hadoop --query="INSERT INTO lmmbase.user_lable_local_mid_cluster FORMAT CSV";
cat /home/hadoop/work_wpp/user_label_uid_cluster | clickhouse-client --user hadoop --password hadoop --query="INSERT INTO lmmbase.user_label_uid_cluster FORMAT CSV";

cat /tmp/test_user2| clickhouse-client --user hadoop --password hadoop --query="INSERT INTO lmmbase.test_user2 FORMAT CSV";


插入语句
不严格插入数据，没有出现的列自动填充为默认值
INSERT INTO [db.]table [(c1, c2, c3)] VALUES (v11, v12, v13), (v21, v22)

严格插入数据，每一列都必须出现在上面
INSERT INTO [db.]table [(c1, c2, c3)] FORMAT Values (v11, v12, v13), (v21, v22, v23)

cat /tmp/user_point_info | clickhouse-client --query="INSERT INTO test.user_point_info FORMAT CSV";

clickhouse-client -m --user hadoop --password hadoop --query="truncate table lmmbase.user_label_uid on cluster crm_4shards_1replicas";

ssh hadoop@dn1 "/bin/bash /home/hadoop/app/otherApp/truncate_user_label_uid_data.sh"

clickhouse-client --query=" alter table  test.ads_user_portrait_vertical_df delete where create_time ='2019-10-17' ";

 

 

 

                              相关压测，同时执行相关sql，看下机器负载
*/2 * * * * clickhouse-client -m --query="select t_mac,t_type,count(*) cnt from carendpoint_porlog_cls group by t_mac,t_type order by cnt desc limit 100;"
*/2 * * * * clickhouse-client  -m --query="select t_mac,count(*) cnt from carendpoint_porlog_cls group by t_mac order by cnt desc limit 100;"
*/2 * * * * clickhouse-client  -m --query="select t_type,count(*) cnt from carendpoint_porlog_cls group by t_type order by cnt desc limit 100;"

*/1 * * * * clickhouse-client  -m --query="select t_ip,t_type,count(*) cnt from carendpoint_porlog_cls group by t_ip,t_type order by cnt desc limit 100;" >> /root/wpp1.log
*/1 * * * * clickhouse-client  -m --query="select t_ip,count(*) cnt from carendpoint_porlog_cls group by t_ip order by cnt desc limit 100;" >> /root/wpp2.log
*/1 * * * * clickhouse-client  -m --query="select event,count(*) cnt from carendpoint_porlog_cls group by event order by cnt desc limit 100;" >> /root/wpp2.log
————————————————
版权声明：本文为CSDN博主「wppwpp1」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/wppwpp1/article/details/106021619/


近期因为涉及Clickhouse 的一些操作、记录下自己的一些操作。

1.由于我们库使用的是MergeTree的引擎、所以支持update 和 delete

2.开始记录操作：

 以下是数据update 的脚本 、多个column的update 、只需要再update 后面跟上即可。

alter table summer_cn.bi_ime_sale_history update sale_date = toDateTime('2020-03-31 00:00:00')  where id in (
'IDVIVO_sale1245122',
'IDVIVO_sale1245174',
'IDVIVO_sale1245233',
'IDVIVO_sale1245173');
接下来是delete的sql、where条件后面跟的是筛选条件

alter table summer_cn.bi_ime_sale_history delete  where id in (
'IDVIVO_sale1245122',
'IDVIVO_sale1245174',
'IDVIVO_sale1245233',
'IDVIVO_sale1245173');
接下来是select 的sql、select的和普通数据库的查询方式是一致的。

select * from summer_cn.bi_ime_sale_history  where id in (
'IDVIVO_sale1245122',
'IDVIVO_sale1245174',
'IDVIVO_sale1245233',
'IDVIVO_sale1245173');




#!/bin/bash
#!/bin/bash
#两个参数：起始时间和终止时间，循环输出每天
#输入格式：20191001 20191031
#输出格式：2019-10-01 2019-10-31
startdate=`date -d "+0 day $1" +%Y%m%d`
enddate=`date -d "+0 day $2" +%Y%m%d`

while [[ $startdate -le $enddate ]]
do
date=$startdate
startdateother=`date -d "+0 day $date" +%Y-%m-%d`
dateother=$startdateother
echo "$dateother" >> /root/success.txt
startdate=`date -d "+1 day $date" +%Y%m%d`
startdateother=`date -d "+1 day $date" +%Y-%m-%d`

sql1="insert into database.table select '$dateother' as stat_date,vehicleno,vehiclecolor,count(vehicleno) as cn from database.table where up_date between '$dateother 00:00:00' and '$dateother 23:59:59' group by vehicleno,vehiclecolor"

sql2="insert into database.table select '$dateother' stat_date,vehicleno ,(max( toUInt32OrZero(vec3)) - min( toUInt32OrZero(vec3))) mileage,vehiclecolor,now() create_date from database.table where up_date between '$dateother 00:00:00' and '$dateother 23:59:59' group by vehicleno,vehiclecolor"

clickhouse-client --host XXX --port 9000 --user your user --password your password --multiquery -q"${sql1};${sql2}"

echo "$dateother 已完成" >> /root/success.txt

done

./xxx.sh 20191001 20191031
vim /root/success.txt

https://blog.51cto.com/wujianwei/3034589


CREATE TABLE test_table( 
    province        String, 
    province_name         String, 
    create_date           date 
) ENGINE = MergeTree(create_date, (province), 8192);



对建表sql的格式要求说明：
ENGINE：是表的引擎类型，最常用的MergeTree。还有一个Log引擎也是比较常用。MergeTree要求有一个日期字段，还有主键。Log没有这个限制。
create_date：是表的日期字段，一个表必须要有一个日期字段。
province：是表的主键，主键可以有多个字段，每个字段用逗号分隔
8192：是索引粒度，用默认值8192即可。

cat > test_table.csv << EOF
WA,WA_NAME,2020-08-25
CA,CA_NAME,2020-09-25
OR,OR_NAME,2020-10-25
EOF

/opt/data/test_table.csv


clickhouse-client --password 'N03P6VHv)bnz1@%xOg' --query "INSERT INTO tutorial.test_table FORMAT CSV" < test_table.csv;

cat test_table.csv | clickhouse-client --query “INSERT INTO tutorial.test_table FORMAT CSV”


clickhouse-client  -udefault --password='N03P6VHv)bnz1@%xOg' --query "select * from tutorial.test_table limit 2";
WA	WA_NAME	2020-08-25
CA	CA_NAME	2020-09-25
[root@tidb06 ~]# 
[root@tidb06 ~]# clickhouse-client  -udefault --password='N03P6VHv)bnz1@%xOg' --query "select * from tutorial.test_table01 limit 2";

hive外部分区表

-- dwd.p_min_yield_val definition

CREATE external TABLE `dwd.p2_min_yield_val`(
  `key` string, 
  `id` string, 
  `name` string, 
  `host_id` string, 
  `model_id` string, 
  `dev_group` string, 
  `path_id` string, 
  `staff_id` string, 
  `staff_name` string, 
  `class_type` string, 
  `variety` string, 
  `yarn_count` string, 
  `class_order` string, 
  `class_order_alias` string, 
  `efficiency` string, 
  `factor` string, 
  `output_m` string, 
  `output_kg` string, 
  `output_add_m` string, 
  `output_add_kg` string, 
  `htime` string, 
  `crt` string, 
  `online` string, 
  `current_shift` string)
PARTITIONED BY ( 
  `year` string, 
  `month` string, 
  `day` string, 
  `producer_id` string);
  
  
--0x10
-- dwd.p2_min_yield_val definition

CREATE EXTERNAL TABLE `dwd.p2_min_yield_val`(
  `key` string, 
  `id` string, 
  `name` string, 
  `host_id` string, 
  `model_id` string, 
  `dev_group` string, 
  `path_id` string, 
  `staff_id` string, 
  `staff_name` string, 
  `class_type` string, 
  `variety` string, 
  `yarn_count` string, 
  `class_order` string, 
  `class_order_alias` string, 
  `efficiency` string, 
  `factor` string, 
  `output_m` string, 
  `output_kg` string, 
  `output_add_m` string, 
  `output_add_kg` string, 
  `htime` string, 
  `crt` string, 
  `online` string, 
  `current_shift` string)
PARTITIONED BY ( 
  `year` string, 
  `month` string, 
  `day` string, 
  `producer_id` string)
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  'hdfs://edh/user/hive/warehouse/dwd.db/p2_min_yield_val'
TBLPROPERTIES (
  'transient_lastDdlTime'='1639188365');

  
--0x11

hive 分区表

-- dwd.p_min_yield_val definition

CREATE TABLE `dwd.p_min_yield_val`(
  `key` string, 
  `id` string, 
  `name` string, 
  `host_id` string, 
  `model_id` string, 
  `dev_group` string, 
  `path_id` string, 
  `staff_id` string, 
  `staff_name` string, 
  `class_type` string, 
  `variety` string, 
  `yarn_count` string, 
  `class_order` string, 
  `class_order_alias` string, 
  `efficiency` string, 
  `factor` string, 
  `output_m` string, 
  `output_kg` string, 
  `output_add_m` string, 
  `output_add_kg` string, 
  `htime` string, 
  `crt` string, 
  `online` string, 
  `current_shift` string)
PARTITIONED BY ( 
  `year` string, 
  `month` string, 
  `day` string, 
  `producer_id` string)
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe' 
WITH SERDEPROPERTIES ( 
  'path'='hdfs://edh/user/hive/warehouse/dwd.db/p_min_yield_val') 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat'
LOCATION
  'hdfs://edh/user/hive/warehouse/dwd.db/p_min_yield_val'
TBLPROPERTIES (
  'spark.sql.partitionProvider'='catalog', 
  'spark.sql.sources.provider'='parquet', 
  'spark.sql.sources.schema.numPartCols'='4', 
  'spark.sql.sources.schema.numParts'='1', 
  'spark.sql.sources.schema.part.0'='{\"type\":\"struct\",\"fields\":[{\"name\":\"key\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"id\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"name\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"host_id\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"model_id\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"dev_group\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"path_id\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"staff_id\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"staff_name\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"class_type\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"variety\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"yarn_count\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"class_order\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"class_order_alias\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"efficiency\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"factor\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"output_m\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"output_kg\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"output_add_m\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"output_add_kg\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"htime\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"crt\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"online\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"current_shift\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"year\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"month\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"day\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}},{\"name\":\"producer_id\",\"type\":\"string\",\"nullable\":true,\"metadata\":{}}]}', 
  'spark.sql.sources.schema.partCol.0'='year', 
  'spark.sql.sources.schema.partCol.1'='month', 
  'spark.sql.sources.schema.partCol.2'='day', 
  'spark.sql.sources.schema.partCol.3'='producer_id', 
  'transient_lastDdlTime'='1638949169');

hive 分区分桶表

-- dwd.p_min_yield_val definition

CREATE external TABLE `dwd.p3_min_yield_val`(
  `key` string, 
  `id` string, 
  `name` string, 
  `host_id` string, 
  `model_id` string, 
  `dev_group` string, 
  `path_id` string, 
  `staff_id` string, 
  `staff_name` string, 
  `class_type` string, 
  `variety` string, 
  `yarn_count` string, 
  `class_order` string, 
  `class_order_alias` string, 
  `efficiency` string, 
  `factor` string, 
  `output_m` string, 
  `output_kg` string, 
  `output_add_m` string, 
  `output_add_kg` string, 
  `htime` string, 
  `crt` string, 
  `online` string, 
  `current_shift` string)
PARTITIONED BY ( 
  `year` string, 
  `month` string, 
  `day` string, 
  `producer_id` string) clustered by (host_id) into 3 buckets;
  

CREATE external TABLE `dwd.p4_min_yield_val`(
  `key` string, 
  `id` string, 
  `name` string, 
  `host_id` string, 
  `model_id` string, 
  `dev_group` string, 
  `path_id` string, 
  `staff_id` string, 
  `staff_name` string, 
  `class_type` string, 
  `variety` string, 
  `yarn_count` string, 
  `class_order` string, 
  `class_order_alias` string, 
  `efficiency` string, 
  `factor` string, 
  `output_m` string, 
  `output_kg` string, 
  `output_add_m` string, 
  `output_add_kg` string, 
  `htime` string, 
  `crt` string, 
  `online` string, 
  `current_shift` string)
PARTITIONED BY ( 
  `year` string, 
  `month` string, 
  `day` string, 
  `producer_id` string) clustered by (class_order) into 3 buckets;



--- 向分区分桶表加载数据
---- start 分区+分桶 按class_order分桶
set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nostrick;

insert into dwd.p4_min_yield_val partition(year,month,day,producer_id)  select key, id, name, host_id, model_id, dev_group, path_id, staff_id, staff_name, class_type, variety, yarn_count, class_order, class_order_alias, efficiency, factor, output_m, output_kg, output_add_m, output_add_kg, htime, crt, online, current_shift
,SUBSTR(htime,1,4) year,SUBSTR(htime,1,7) month,SUBSTR(htime,1,10) day,producer_id from hs_spin.ext_min_yield_val where crt='2021-12-10 09:00:03'
cluster by (class_order);


insert into dwd.p4_min_yield_val partition(year,month,day,producer_id)  select key, id, name, host_id, model_id, dev_group, path_id, staff_id, staff_name, class_type, variety, yarn_count, class_order, class_order_alias, efficiency, factor, output_m, output_kg, output_add_m, output_add_kg, htime, crt, online, current_shift
,SUBSTR(htime,1,4) year,SUBSTR(htime,1,7) month,SUBSTR(htime,1,10) day,producer_id from hs_spin.ext_min_yield_val where crt='2021-12-11 03:02:02'
cluster by (class_order);


---- end





  --01
  -- dwd.p3_min_yield_val definition

CREATE EXTERNAL TABLE `dwd.p3_min_yield_val`(
  `key` string, 
  `id` string, 
  `name` string, 
  `host_id` string, 
  `model_id` string, 
  `dev_group` string, 
  `path_id` string, 
  `staff_id` string, 
  `staff_name` string, 
  `class_type` string, 
  `variety` string, 
  `yarn_count` string, 
  `class_order` string, 
  `class_order_alias` string, 
  `efficiency` string, 
  `factor` string, 
  `output_m` string, 
  `output_kg` string, 
  `output_add_m` string, 
  `output_add_kg` string, 
  `htime` string, 
  `crt` string, 
  `online` string, 
  `current_shift` string)
PARTITIONED BY ( 
  `year` string, 
  `month` string, 
  `day` string, 
  `producer_id` string)
CLUSTERED BY ( 
  host_id) 
INTO 3 BUCKETS
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  'hdfs://edh/user/hive/warehouse/dwd.db/p3_min_yield_val'
TBLPROPERTIES (
  'transient_lastDdlTime'='1639188765');
  
  
-- 02  
设置强制分桶属性：

set hive.enforce.bucketing=false/true

如果reduce的个数和分桶的个数不一致时，请手动设置reduce的个数：
设置reduce task的个数：

set mapreduce.job.reduces=4;

分桶查询测试：

select * from buc1
cluster by (uid)

1、查询全部：

	select * from buc3;
	select * from buc3 tablesample(bucket 1 out of 1)  
	
	select *
from dwd.p4_min_yield_val tablesample(bucket 1 out of 1 on class_order)
WHERE producer_id = '2162304858206502921';


	 
查询第几桶：

select * from buc3 tablesample(bucket 1 out of 4 on uid);                            //除4余0
select * from buc3 tablesample(bucket 1 out of 2 on uid);  


-- 查询第3桶数据
select *
from dwd.p4_min_yield_val tablesample(bucket 1 out of 3 on class_order)  //除3余0
WHERE producer_id = '2162304858206502921';

-- 查询第2桶数据 //除2余0
select *
from dwd.p4_min_yield_val tablesample(bucket 1 out of 2 on class_order)
WHERE producer_id = '2162304858206502921';	 


-- 查询 class_order=2 的数据
select *
from dwd.p4_min_yield_val tablesample(bucket 1 out of 2 on class_order)
WHERE producer_id = '2162304858206502921';	


select *
from dwd.p4_min_yield_val tablesample(bucket 1 out of 3 on class_order)
WHERE producer_id = '2162304858206502921';	

select *
from dwd.p4_min_yield_val tablesample(bucket 0 out of 2 on class_order)
WHERE producer_id = '2162304858206502921';

-- 查询 class_order=2 偶数 的数据
select *
from dwd.p4_min_yield_val tablesample(bucket 1 out of 2 on class_order)
WHERE producer_id = '2162304858206502921';


-- 查询 class_order=1 奇数 的数据
select *
from dwd.p4_min_yield_val tablesample(bucket 2 out of 2 on class_order)
WHERE producer_id = '2162304858206502921';




set hive.enforce.bucketing = true;
1.让hive强制分桶，自动按照分桶表的bucket 进行分桶。(推荐)

set  hive.enforce.bucketing = true;



2.手动指定reduce数量

set mapreduce.job.reduces = num;

/

set mapreduce.reduce.tasks = num;

并在 SELECT 后增加CLUSTER BY 语句








	 
	 
解释一下：

	tablesample(bucket x out of y on uid)  
	x：代表从第几桶开始查询
	y：查询的总桶数，y可以是总的桶数的倍数或者因子；x不能大于y

	不压缩不拉伸：1 out of 4
	for 1 to 4
	1 2 3 4 1 2 3 4
	1       1 + 4

	压缩： 1 out of 2
	1 2 3 4
	1 2 1 2 1 2
	1   1 + 4/2 1+4/2+4/2

	拉伸：1 out of 8
	1 2 3 4 5 6 7 8
	1 2 3 4
 
等于是重新对所有数据进行分桶：

例子：
查询uid为奇数：（tablesample一定要紧跟在表名之后）

select * from buc3 tablesample(bucket 2 out of 2 on uid)

查询：

select * from part_tmp limit 3;
select * from part_tmp tablesample(3 rows);
select * from part_tmp tablesample(13 percent);
select * from part_tmp tablesample(56B); ###k B M G T P
 
 
 
随机查询3条数据：

select * from part_tmp order by rand() limit 3;
select rand() as rand1,* from part_tmp;
 
 
分桶总结：

	1、定义：
	clustered by (uid) – 指定分桶的字段
	sorted by (uid desc) – 指定数据的排序规则，表示预期的数据就是以这里设置的字段以及排序规则来进行存储

	2、导数据
	cluster by (uid) – 指定getPartition以哪个字段来进行hash散列，并且排序字段也是指定的字段，默认以正序进行排序

	distribute by(uid) – 指定getPartition以哪个字段来进行hash散列

	sort by(uid asc) – 指定排序字段，以及排序规则
	–更灵活的方式，这种数据获取方式可以分别指定getPartition的字段和sort的字段

	cluster by (uid)与distribute by(uid) sort by (uid asc)结果是一样的

分区下的分桶：

举例说明一下：按照性别进行分区（1男2女），在分区中按照uid的奇偶进行分桶：

1 gyy1 1
2 gyy2 2
3 gyy3 2
4 gyy4 1
5 gyy5 2
6 gyy6 1
7 gyy7 1
8 gyy8 2
9 gyy9 1
10 gyy10 1
11 gyy11 2
12 gyy12 1
 
 
 
1、创建临时表：

create table if not exists stu_temp(
uid int,
uname string,
usex int
)
row format delimited 
fields terminated by ' '
;



加载数据：

load data local inpath '/usr/local/hivedata/stu.dat' into table stu_temp;


创建分区分桶表：

create table if not exists stus(
uid int,
uname string
)
partitioned by (sex int)
clustered by (uid) into 2 buckets
row format delimited 
fields terminated by ' '
;

//insert into方式：

insert into table stus partition(sex)
select uid,uname,usex from stu_temp
cluster by (uid)
;


insert into dwd.p4_min_yield_val partition(year,month,day,producer_id)  select key, id, name, host_id, model_id, dev_group, path_id, staff_id, staff_name, class_type, variety, yarn_count, class_order, class_order_alias, efficiency, factor, output_m, output_kg, output_add_m, output_add_kg, htime, crt, online, current_shift
,SUBSTR(htime,1,4) year,SUBSTR(htime,1,7) month,SUBSTR(htime,1,10) day,producer_id from hs_spin.ext_min_yield_val limit 30;

insert into dwd.p4_min_yield_val partition(year,month,day,producer_id)  select key, id, name, host_id, model_id, dev_group, path_id, staff_id, staff_name, class_type, variety, yarn_count, class_order, class_order_alias, efficiency, factor, output_m, output_kg, output_add_m, output_add_kg, htime, crt, online, current_shift
,SUBSTR(htime,1,4) year,SUBSTR(htime,1,7) month,SUBSTR(htime,1,10) day,producer_id from hs_spin.ext_min_yield_val cluster by (class_order) limit 30;


---- start 分区+分桶 按class_order分桶
set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nostrick;

insert into dwd.p4_min_yield_val partition(year,month,day,producer_id)  select key, id, name, host_id, model_id, dev_group, path_id, staff_id, staff_name, class_type, variety, yarn_count, class_order, class_order_alias, efficiency, factor, output_m, output_kg, output_add_m, output_add_kg, htime, crt, online, current_shift
,SUBSTR(htime,1,4) year,SUBSTR(htime,1,7) month,SUBSTR(htime,1,10) day,producer_id from hs_spin.ext_min_yield_val where crt='2021-12-10 09:00:03'
cluster by (class_order);

---- end

hive.enforce.bucketiong=true;


需求：
查询性别为女性的、并且学号为奇数的学生：

select *
from stus tablesample(bucket 2 out of 2 on uid)
where sex=2;

-- SELECT * FROM dwd.p_min_yield_val WHERE day = '2021-12-09' AND producer_id = '2162304858206502921' ORDER BY crt DESC;
--  查询class_order=1 的白班数据
select *
from dwd.p4_min_yield_val tablesample(bucket 2 out of 2 on class_order)
WHERE producer_id = '2162304858206502921';



/user/hive/warehouse/dwd.db/p4_min_yield_val/year=2021/month=2021-12/day=2021-12-10



注意：
1、分区使用的是表外字段，分桶使用的是表内字段
2、分桶是更细粒度的划分、管理数据，更多用来做数据抽样、JOIN操作
————————————————
版权声明：本文为CSDN博主「brz_em」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/qq_35180983/article/details/82902943

你可能感兴趣的:(数据库)

《Redis可扩展：轻松应对数据增长与流量高峰》猕员桃 redis 数据库缓存
Redis可扩展：轻松应对数据增长与流量高峰在数字化时代，企业业务不断发展，数据规模呈爆炸式增长，流量高峰也频繁出现。面对这样的挑战，数据库的可扩展性成为关键因素。Redis凭借出色的可扩展能力，成为众多开发者应对数据增长与流量高峰的得力工具。接下来，我们将深入剖析Redis实现可扩展的核心技术与策略，探究它是如何在复杂多变的业务场景中保持高效运行的。一、水平扩展：数据分片的力量1.1数据分片的核
新手向:从零开始MySQL超详细安装、配置与使用指南 nightunderblackcat 基础环境配置 mysql 数据库
什么是MySQL？一句话解释：MySQL是全球最流行的开源关系型数据库，像淘宝、Facebook等大型网站都在使用它存储数据！它采用表格形式管理数据（类似Excel），支持SQL语言进行数据操作。第一步：安装MySQL（多系统详解）Windows系统下载安装包：访问官网：https://dev.mysql.com/downloads/mysql/选择MySQLInstallerMSI（Window
Redis 实现消息队列雾缘枯 redis 数据库缓存
一、为什么选择Redis作为消息队列？在分布式系统架构中，消息队列是实现异步通信和解耦的核心组件。Redis作为一个高性能的内存数据库，凭借其卓越的速度和丰富的数据结构，成为轻量级消息队列的理想选择：1.1核心优势超高性能：10万+QPS的处理能力毫秒级延迟：内存操作带来的极致响应速度丰富数据结构：多种队列实现模式可选零外部依赖：无需额外中间件，降低运维复杂度持久化支持：可配置持久化保证消息可靠性
mongoose中数组循环查询find结果的同步实现 shuhaha mongoose mongoose find 数组查询同步
在项目中，mongoose的find方法查询是异步查询的，所以得到的结果是异步的结果，看下面的例子。根据试卷的id号查找对应试卷中的试题，找到试题id后找到试题信息。加入试题数据库信息如下：{"_id":ObjectId("59dc79ddcf9bb828c4689284"),"quesType":"1","quesStem":"第1单选","quesAns":"A","quesAla":"第1单
基于flask+vue框架的法律咨询公司管理信息系统的分析与设计[开题+论文+程序]-计算机毕设 zhihao508 flask vue.js 课程设计
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容研究背景随着社会的快速发展和法律意识的普遍增强，法律咨询服务需求日益增长，成为现代社会不可或缺的服务之一。传统法律咨询模式受限于时间、地域及信息不对称等问题，难以满足广大客户高效、便捷的服务需求。与此同时，法律咨询公司内部管理也面临挑战，如客户信息管理混乱、律师资源分配不
Redis 与其他数据库的比较 jarenyVO redis 数据库 redis 缓存
Redis与其他数据库的比较以下是Redis与传统关系型数据库及其他NoSQL数据库的对比列表：Redisvs关系型数据库(MySQL/Oracle)对比维度Redis关系型数据库数据模型键值对、丰富数据结构（String/Hash/Set等）表结构，严格的行列模型持久化可配置（RDB快照/AOF日志）默认持久化，WAL日志+数据文件事务支持简单事务（无回滚）ACID事务，支持复杂回滚查询能力仅支
对比2个数据库：google Cloud Firestore 和 supabase waterHBO 数据库云端数据库
帮我对比一下：CloudFirestore和supabase尤其是，是否免费，注册难度，是否需要银行卡注册，我没有国外的银行卡（我在中国大陆）。以及免费额度是多少，上手难度，即，学习曲线因为我平时一般是写小项目，我的数据库一般使用json或是sqlite3第1个回答好问题！下面是CloudFirestore（Firebase）和Supabase的全面对比，特别关注了中国大陆用户关心的注册、费用、学
基于vue框架的宠物店管理系统的设计与实现4czn0（程序+源码+数据库+调试部署+开发环境）系统界面在最后面。小光学长数据库
系统程序文件列表项目功能：用户,商品分类,服务类型,商品信息,商品订单,宠物服务,服务预约,服务评价,商品咨询开题报告内容基于Vue框架的宠物店管理系统的设计与实现开题报告一、引言随着宠物行业的蓬勃发展，宠物店作为宠物产品与服务的重要提供者，其管理效率和服务质量直接关系到顾客的满意度和店铺的竞争力。传统的管理方式往往依赖于手工记录和纸质文档，这种方式不仅效率低下，而且容易出错，难以满足现代宠物店日
基于vue框架的CIA报价平台的设计与实现1xv02（程序+源码+数据库+调试部署+开发环境）系统界面在最后面。
系统程序文件列表项目功能：用户,供应商,产品分类,产品信息,在线咨询,资质申请开题报告内容基于Vue框架的CIA报价平台的设计与实现开题报告一、选题背景随着市场竞争的日益激烈，企业对于成本控制与效率提升的需求愈发迫切。在采购与供应链管理领域，传统的手工报价方式不仅耗时耗力，还难以保证报价的准确性和时效性，给企业的运营带来了不小的挑战。特别是针对复杂多变的采购需求，如何快速、准确地生成报价，同时有效
SQL规范检查独步秋风 Mysql mysql sql 规范检查
序号规则规则等级数据库类型1Update/Delete需要带上where条件errorMysql2不允许使用Truncatetable语句errorMysql3Update/Delete不允许带limit条件errorMysql4Update/Delete不允许带orderby条件errorMysql5不使用“SELECT*”这样的语句errorMysql6不使用DML广播语句errorMysql
Flask + GPT 实践红鼻子时代 flask项目 flask gpt python
一、前言本篇文章会介绍从零开始构建一个基于Flask+GPT的小项目的过程。总共有四个版本的迭代，包括：1、调用GPT接口并渲染到前端页面；2、使用Flask提供的session来实现登录和登出功能；3、用SQLAlchemy管理数据库，实现用户注册和登录；4、记录和分页查看用户与GPT的对话历史。二、项目环境与依赖Python版本：建议3.7+Flask：最常用的PythonWeb框架之一ope
【C#】两个list根据某个元素比较差集 weixin_30594001 c#
1.今天突然跟前端有一点小小的分歧，传输数据和数据库里的数据做比对，该前端做处理还是后端，(并不是都不愿意做，相反，都愿意在自己那端处理==)2.最后终于归结我这了，好久之前做过list比对，记得刚写代码的时候，两个list比对？那就无限foreach呗，当然实现是能实现，这就很影响比对效果和代码的整洁度了。3.接下来，我回忆起来了我之前写过的一个比较方法，拿出来记录一下//重写比较方法publi
java+vue+SpringBoo智慧旅游系统（程序+数据库+报告+部署教程+答辩指导）
源代码+数据库+LW文档（1万字以上）+开题报告+答辩稿ppt+部署教程+代码讲解+代码时间修改工具技术实现开发语言：后端：Java前端：vue框架：springboot数据库：mysql开发工具JDK版本：JDK1.8数据库：mysql数据库工具：Navicat开发软件：idea主要角色及功能介绍本次系统的用例图做出了十分明确的功能划分，在设计时可以有很好的设计思路进行设计和延展。（1）管理员用
【力扣数据库知识手册】数据库优化 soso（找工作版数据库八股数据库
系统的吞吐量瓶颈往往出现在数据库的访问速度上，因为数据是放在磁盘上的，读写速度无法和内存相比。数据库结构优化在数据库设计中，需要考虑数据冗余，查询和更新的速度、字段的数据类型是否合理等多方面的内容。将字段很多的表分解成多个表。如果有些字段的使用频率很低，可以将这些字段分离出来。增加中间表。对于经常要联合查询的表，通过建立中间表以提高查询效率，具体地，将需要通过联合查询的数据插入到中间表中，然后将原
【力扣数据库知识手册】关于redis soso（找工作版数据库八股数据库 redis
Key-Value数据库（键值数据库）是一种非关系型数据库（NoSQL），它使用简单的键值对(key-value)方式来存储数据，是最简单的数据库模型之一。Redis定义全称为RemoteDictionaryServer，本质上是一个Key-Value类型的内存数据库，整个数据库统统加载在内存当中进行操作，定期通过异步操作把数据库数据写入磁盘或把修改操作写入追加的记录文件，并且在此基础上实现Mas
数据库连接池优化深度解析后端
在Java企业级应用中，数据库连接池作为数据库访问的核心组件，其性能直接影响系统的整体吞吐量与稳定性。本文从连接池核心参数、性能调优策略、监控与故障诊断及面试高频问题四个维度，结合主流连接池实现（HikariCP、Druid）与工程实践，系统解析数据库连接池的优化方法与最佳实践。一、连接池核心原理与关键参数1.1连接池工作流程1.2关键参数解析（以HikariCP为例）参数作用推荐值maximum
Oracle应急处理：Oracle RAC 集群节点进程通信出现报错
小亦平台会持续给大家科普一些Oracle数据库的应急处理方案，运维朋友们可以在往期文章中查看更多案例。问题概述•核心问题：监控日志中出现IPCSENDTimeout错误。•主要现象：RAC集群监控日志中报告了Inter-ProcessCommunication(IPC)发送超时错误。问题分析IPCSENDTimeout错误通常表明OracleRAC集群中节点间进程通信（IPC）出现了问题。IPC是
分享一些 SQL 优化工具王宇帆avalanche sql 数据库
一、数据库自带的性能监控和分析工具MySQL：MySQLEnterpriseMonitor：这是MySQL官方推出的一款企业级监控工具，它提供了全面的数据库性能监控和管理功能。功能特点：可以实时监控MySQL服务器的各种关键性能指标，如查询响应时间、吞吐量、连接数、缓存命中率等。它还能深入分析SQL查询的执行计划，帮助用户找出性能瓶颈和优化点。通过直观的图形界面，管理员可以轻松了解数据库的运行状态
pgsql处理文档类型数据_PostgreSQL数据类型
http://blog.csdn.net/neo_liu0000/article/category/797059第六章数据类型6.1概述PostgreSQL提供了丰富的数据类型。用户可以使用CREATETYPE命令在数据库中创建新的数据类型。PostgreSQL的数据类型被分为四种，分别是基本数据类型、复合数据类型、域和伪类型。基本数据类型是数据库内置的数据类型，包括integer、char、va
centos7下docker安装postgresql+postgis
环境:centos7/docker最初直接拉取的postgresql数据，在导入.bakup文件时始终会报错，最后才想到该数据库默认不带postgis空间组件###一、拉取镜像这里我们拉取postgres和gis组合的镜像目前组合的版本有如下几个-11.0-2.5-10.0-2.4-9.6-2.4这里以拉取postgresqlv11.0和postgisv2.5的镜像为例dockerpullkart
PostgreSQL数据类型总结渝州居士 PostgreSQL postgresql 数据库
PostgreSQL数据库相比其他数据库，支持更多的数据类型，包括常用的数值类型、字符串类型、日期/时间类型外，还有几何类型、网络地址类型、xml类型和json类型，且还可以使用CREATETYPE自行添加数据类型，本文主要介绍PostgreSQL数据库主要的数据类型1.数值类型常用数值类型如下表所示：名称别名存储大小范围描述与其他数据库对比smallintint22字节-225~215-1有符号
探秘高效数据库备份利器：pg_probackup 郦岚彬Steward
探秘高效数据库备份利器：pg_probackuppg_probackuppg_probackup是一个开源的PostgreSQL备份和恢复工具，用于在PostgreSQL中进行在线备份和恢复操作。-功能：PostgreSQL备份和恢复工具；在线备份；恢复操作。-特点：易于使用；轻量级；支持多种编程语言；高性能。项目地址:https://gitcode.com/gh_mirrors/pg/pg_pr
Squirrel：通用SQL、NoSQL客户端 antui1957
安装配置数据库配置驱动配置连接如果你的工作中，需要使用到多个数据库，又不想在多种客户端之间切换来切换去。那么就需要找一款支持多数据库的客户端工具了。如果你要连接多个关系型数据库，你就可以使用NavicatPremium。但是如果你有使用到NOSQL（譬如HBase、MongoDB等），还是建议使用SquirrelSQLClient。1、安装下载地址：http://squirrel-sql.sour
postgresql增量备份系列二 pg_probackup necessary653 postgresql postgresql 数据库
已经很久没有发文章了，主要是最近工作上的内容都不适合发文章公开。可能往后文章发表也不这么频繁了，不过大家有问题我们可以交流。之前有写过PG增量备份的其他工具使用方法，pg_probackup也是应用比较多的PG备份工具。一.pg_probackuppg_probackup是一个用于管理PostgreSQL数据库集群备份与恢复的实用工具，截止2.5.15版本，支持PostgreSQL11-16及以上
Django 4.x Models App settings 模型应用设置 Mr数据杨 Python Web开发 python django 模型 model 配置
在Django框架中，模型（Model）是用于定义和操作数据库表结构的核心组件。模型通过使用Python类的形式，帮助简化数据库操作，自动生成SQL语句，使得开发者能够专注于业务逻辑的实现，而无需直接编写复杂的SQL代码。Django的ORM（对象关系映射）提供了一种便捷的方式，将Python对象与数据库记录进行映射操作，从而有效地管理数据交互。对于那些想要在项目中使用Django构建数据库应用的
OpenGauss数据库-L.应用开发(Python)-选做 lovane_630 数据库 python oracle
第1关：简单查询#加载数据库模块importpsycopg2#连接数据库,创建连接并返回连接对象defconnect():conn=psycopg2.connect(database="finance",user="gaussdb",password="Passwd123@123",host="localhost")returnconn#建立与数据库连接mydb=connect()#获取游标#执行
Statement 和 PreparedStatement 详解风起携月归 java JavaEE SQL python 数据库开发语言
Statement和PreparedStatement详解文章目录Statement和PreparedStatement详解一、定义二、Statement三、PreparedStatement四、Statement和PreparedStatement的区别一、定义在Java数据库编程中，Statement和PreparedStatement是两种用于执行SQL语句的接口理解：在Java语句里执行S
国产化关系型数据库都有哪些？哪些数据库使用的频次最高？信创天地数据库开发语言 java 大数据网络安全运维开发
以下是国产化关系型数据库的主要产品及其在信创项目中的应用频次分析，结合技术特性、行业适配性和市场占有率综合评估：一、主流国产关系型数据库列表1.传统集中式数据库数据库名称厂商技术路线核心特点达梦DM武汉达梦自研内核（兼容Oracle）高兼容Oracle，政务/金融领域占有率第一人大金仓KingBase人大金仓PostgreSQL分支优化军工背景，党政机关标配GaussDB华为自研（兼容Postgr
JDBC中PreparedStatement对象详解（认真看完包学会）码力无边-OEC java 后端
JDBC（JavaDatabaseConnectivity）是Java用于访问数据库的标准API。PreparedStatement是JDBC中用于执行预编译的SQL语句的接口，能够有效地防止SQL注入，并提高性能。以下是关于PreparedStatement的详细讲解：1.什么是PreparedStatementPreparedStatement是一种SQL语句的预编译版本。与Statement
对象池模式：减少GC的Kotlin实战指南时小雨 Android实战与技巧 android kotlin
对象池模式通过对象复用机制，将对象生命周期从"创建-销毁"转变为"借出-归还"，显著减少GC压力。下面通过完整实例展示其实现细节。一、对象池工作原理图解是否对象池初始化预创建对象对象池客户端请求对象从池中借出对象创建新对象使用对象归还对象到池二、数据库连接池完整实现（Kotlin）importjava.util.concurrent.ArrayBlockingQueueimportjava.uti
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>