阿里云云栖号

RedShift到MaxCompute迁移实践指导

简介： 本文主要介绍Amazon Redshift如何迁移到MaxCompute，主要从语法对比和数据迁移两方面介绍，由于Amazon Redshift和MaxCompute存在语法差异，这篇文章讲解了一下语法差异

1.概要

本文档详细介绍了Redshift和MaxCompute之间SQL语法的异同。这篇文档有助于加快sql任务迁移到MaxCompute。由于Redshift和MaxCompute之间语法存在很多差异，因此我们需要修改Redshift上编写的脚本,然后才能在MaxCompute中使用，因为服务之间的SQL方言不同。

2.迁移前RedShift于MaxCompute的各项对比差异

2.1.1数据类型对比及类型转化

类别		MaxCompute	建议转化成MaxCompute类型	Redshift
数值类型	smallint	Y	Y	Y
	integer	N	int	Y
	bigint	Y	int	Y
	decimal	Y	Y	Y
	numeric	N	decimal	Y
	real	N	float	Y
	double	Y	Y	Y
	float	Y	float	Y
	TINYINT	Y	smallint	N
字符类型	varchar(n)	Y	Y	Y
	char(n)	Y	Y	Y
	STRING	Y
	text	N	string	Y
日期	TIMESTAMP	Y	Y	Y
	TIMESTAMPTZ	N		Y
	DATE	Y	Y	Y
	TIME	N		Y
	DateTime	Y		N
boolean 数据类型	boolean	Y	Y	Y
复杂数据类型	ARRAY	Y	Y	N
	MAP	Y	Y	N
	STRUCT	Y	Y	N
	HLLSketch	N		Y

MaxCompoute数据类型参考2.0数据类型版本 - MaxCompute - 阿里云

2.1.2语法对比

MaxCompute没有schenma、group、库、存储过程的概念。只有project、表、分区,MaxCompute建表时没有自增序列外键等，不支持指定编码默认utf-8，内部表不支持指定存储格式默认Aliorc

主要区别
表结构	不能修改分区列列名，只能修改分区列对应的值。
	支持增加列，但是不支持删除列以及修改列的数据类型。
SQL 常见问题	INSERT 语法上最直观的区别是：Insert into/overwrite 后面有个关键字 Table。
	数据插入表的字段映射不是根据 Select 的别名做的，而是根据 Select 的字段的顺序和表里的字段的顺序
UPDATE/DELETE	只有事务表支持UPDATE/DELETE
join	Join 必须要用 on 设置关联条件，不支持笛卡尔积
触发器	不支持触发器、
创建外部函数	maxCompute没有外部函数
精度	DOUBLE 类型存在精度问题。不建议在关联时候进行直接等号关联两个 DOUBLE字段，建议把两个数做减法，如果差距小于一个预设的值就认为是相同，例如 abs(a1- a2) < 0.000000001。目前产品上已经支持高精度的类型 DECIMAL。
日期	MaxCompute主要的日期类型是datetime(格式yyyy-mm-dd hh:mi:ss) timestamp date,datetime支持的内建函数更加丰富，建议日期转成datetime做运算，日期函数链接
存储过程	使用MaxCompute的pyodps修改

物化视图	要更新物化化视图中的数据，MaxCompute只能手动更新，不支持自动更新
redshift 支持在select语句中引用别名如 select money/100 as a ,round(money/100,3) from table	MaxCompute修改 select money/100 as a ,round(a,3) from table

2.1.3复合表达式

	MaxCompute	REDAHIFT
+、-	Y	Y
^、\|/、\|\|/	Y	Y
*、/、%	Y	Y
@	N	Y
&、\|、	Y	Y
\|\|	Y	Y
#、~、<<、>>	使用shift函数替换	Y

2.1.4条件比较

	MaxCompute	REDAHIFT
<> 或 !=	Y	Y
like	Y	Y
BETWEEN expression AND	Y	Y
IS [ NOT ] NULL	Y	Y
EXISTS	Y	Y
POSIX 运算符	N	Y
SIMILAR TO	N	Y
IN	Y	Y
正则 ~	Rlike	Y
~~	like	Y

2.1.5DDL语法

主要差异：

1.MaxCompute不支持主键自增和PRIMARY KEY

2.指定默认值default]不支持使用函数

3.decimal指定默认值不支持-1

语法	MaxCompute	REDSHIFT
CREATE TABLE—PRIMARY KEY	N	Y
CREATE TABLE—NOT NULL	Y	Y
CREATE TABLE—CLUSTER BY	Y	N
CREATE TABLE—EXTERNAL TABLE	Y(OSS, OTS, TDDL)	N
CREATE TABLE—TEMPORARY TABLE	N	Y
table_attributes	N(Mc内部表不需要添加属性)	Y
CREATE TABLE—AS	Y	Y
create materialized view	Y	Y

2.1.6DML语法差异

语法	MaxCompute	REDSHIFT
CTE	Y	Y
SELECT—into	N	Y
SELECT—recursive CTE	N	Y
SELECT—GROUP BY ROLL UP	Y	N
SELECT—GROUPING SET	Y	Y
SELECT—IMPLICT JOIN	Y	Y
SEMI JOIN	Y	N
SELEC TRANSFROM	Y	N
SELECT—corelated subquery	Y	Y
LATERAL VIEW	Y	Y
SET OPERATOR—UNION (disintct)	Y	Y
SET OPERATOR—INTERSECT	Y	Y
SET OPERATOR—MINUS/EXCEPT	Y	Y
INSERT INTO ... VALUES	Y	Y
INSERT INTO (ColumnList)	Y	Y
UPDATE … WHERE	Y(事务表支持)	Y
DELETE … WHERE	Y(事务表支持)	Y
ANALYTIC—reusable WINDOWING CLUSUE	Y	Y
ANALYTIC—CURRENT ROW	Y	Y
ANALYTIC—UNBOUNDED	Y	Y
ANALYTIC—RANGE …	Y	Y
WHILE DO	N	Y
VIEW WITH PARAMETERS	Y	N
select * into	N	Y

2.1.7内建函数对比

其他未列出的redshift函数不支持。

函数类型	MaxCompute	POSTGRESQL	在MaxCompute SQL中是否支持分区剪裁
日期函数	无	ADD_MES
	无	CONVERT_TIMEZONE
	无	DATE_CMP_TIMESTAMP
	无	DATE_CMP_TIMESTAMPTZ
	无	DATE_PART_YEAR
	无	DATE_CMP
	无	INTERVAL_CMP
	无	+
	无	SYSDATE
	无	TIMEOFDAY
	无	TIMESTAMP_CMP
	无	TIMESTAMP_CMP_DATE
	无	TIMESTAMP_CMP_TIMESTAMPTZ
	无	TIMESTAMPTZ_CMP
	无	TIMESTAMPTZ_CMP_DATE
	无	TIMESTAMPTZ_CMP_TIMESTAMP
	无	to_timestamp
	无	TIMEZONE
	DATEDIFF	DATEDIFF	MaxCompute模式下：支持。 Hive模式下：不支持。
	DATE_ADD	DATEADD	MaxCompute模式下：不支持（建议使用DATEADD）。 Hive模式下：支持。
	DATEPART	date_part	MaxCompute模式下：支持。 Hive模式下：不支持。
	DATETRUNC	date_trunc	MaxCompute模式下：支持。 Hive模式下：不支持。
	FROM_UNIXTIME	无	MaxCompute模式下：支持。 Hive模式下：支持。
	GETDATE	CURRENT_DATE	MaxCompute模式下：支持。 Hive模式下：不支持。
	ISDATE	无	MaxCompute模式下：支持。 Hive模式下：不支持。
	LASTDAY	无	MaxCompute模式下：支持。 Hive模式下：不支持。
	TO_DATE	TO_DATE	MaxCompute模式下：支持。 Hive模式下：不支持。
	TO_CHAR	to_char	MaxCompute模式下：支持。 Hive模式下：支持。
	UNIX_TIMESTAMP	extract	MaxCompute模式下：支持。 Hive模式下：支持。
	WEEKDAY	无	MaxCompute模式下：支持。 Hive模式下：不支持。
	WEEKOFYEAR	无	MaxCompute模式下：支持。 Hive模式下：不支持。
	YEAR	extract	MaxCompute模式下：不支持。 Hive模式下：不支持。
	QUARTER	EXTRACT	MaxCompute模式下：不支持。 Hive模式下：不支持。
	MONTH	EXTRACT	MaxCompute模式下：不支持。 Hive模式下：不支持。
	DAY	EXTRACT	MaxCompute模式下：不支持。 Hive模式下：不支持。
	DAYOFMONTH	无	MaxCompute模式下：不支持。 Hive模式下：支持。
	HOUR	EXTRACT	MaxCompute模式下：不支持。 Hive模式下：不支持。
	MINUTE	EXTRACT	MaxCompute模式下：不支持。 Hive模式下：不支持。
	CURRENT_TIMESTAMP	CURRENT_TIMESTAMP	MaxCompute模式下：不支持。 Hive模式下：不支持。
	ADD_MONTHS	运算符+	MaxCompute模式下：不支持。 Hive模式下：不支持。
	LAST_DAY	LAST_DAY	MaxCompute模式下：不支持。 Hive模式下：不支持。
	NEXT_DAY	NEXT_DAY	MaxCompute模式下：不支持。 Hive模式下：不支持。
	MONTHS_BETWEEN	MONTHS_BETWEEN	MaxCompute模式下：不支持。 Hive模式下：不支持。
数学函数	无	exp
	无	ATAN2
	无	DEXP
	无	DLOG1
	无	DLOG10
	ABS	ABS	MaxCompute模式下：支持。 Hive模式下：支持。
	ACOS	ACOS	MaxCompute模式下：支持。 Hive模式下：支持。
	ASIN	ASIN	MaxCompute模式下：支持。 Hive模式下：支持。
	ATAN	ATAN	MaxCompute模式下：支持。 Hive模式下：支持。
	CEIL	CEIL	MaxCompute模式下：支持。 Hive模式下：支持。
	CONV	convert	MaxCompute模式下：支持。 Hive模式下：支持。
	COS	COS	MaxCompute模式下：支持。 Hive模式下：支持。
	COSH	ACOS	MaxCompute模式下：支持。 Hive模式下：支持。
	COT	COT	MaxCompute模式下：支持。 Hive模式下：支持。
	EXP	EXP	MaxCompute模式下：支持。 Hive模式下：支持。
	FLOOR	FLOOR	MaxCompute模式下：支持。 Hive模式下：支持。
	LN	LN	MaxCompute模式下：支持。 Hive模式下：支持。
	LOG	LOG	MaxCompute模式下：支持。 Hive模式下：支持。
	POW	power	MaxCompute模式下：支持。 Hive模式下：支持。
	RAND	random	MaxCompute模式下：支持。 Hive模式下：支持。
	ROUND	ROUND	MaxCompute模式下：支持。 Hive模式下：支持。
	SIN	SIN	MaxCompute模式下：支持。 Hive模式下：支持。
	SINH	asin	MaxCompute模式下：支持。 Hive模式下：支持。
	SQRT	SQRT	MaxCompute模式下：支持。 Hive模式下：支持。
	TAN	TAN	MaxCompute模式下：支持。 Hive模式下：支持。
	TANH	atan	MaxCompute模式下：支持。 Hive模式下：支持。
	TRUNC	TRUNC	MaxCompute模式下：支持。 Hive模式下：支持。
	LOG2	LOG	MaxCompute模式下：支持。 Hive模式下：支持。
	LOG10	LOG	MaxCompute模式下：支持。 Hive模式下：支持。
	BIN	无	MaxCompute模式下：支持。 Hive模式下：支持。
	HEX	无	MaxCompute模式下：支持。 Hive模式下：支持。
	UNHEX	无	MaxCompute模式下：支持。 Hive模式下：支持。
	RADIANS	RADIANS	MaxCompute模式下：支持。 Hive模式下：支持。
	DEGREES	DEGREES	MaxCompute模式下：支持。 Hive模式下：支持。
	SIGN	SIGN	MaxCompute模式下：支持。 Hive模式下：支持。
	E	无	MaxCompute模式下：支持。 Hive模式下：不支持。
	PI	PI	MaxCompute模式下：支持。 Hive模式下：不支持。
	FACTORIAL	无	MaxCompute模式下：支持。 Hive模式下：支持。
	CBRT	CBRT	MaxCompute模式下：支持。 Hive模式下：支持。
	SHIFTLEFT	<<	MaxCompute模式下：不支持。 Hive模式下：不支持。
	SHIFTRIGHT	>>	MaxCompute模式下：不支持。 Hive模式下：不支持。
	SHIFTRIGHTUNSIGNED	>>>	MaxCompute模式下：不支持。 Hive模式下：不支持。
窗口函数	无	CUME_DIST
	无	FIRST_VALUE/LAST_VALUE
	无	LISTAGG
	无	NTH_VALUE
	无	PERCENTILE_CONT
	无	PERCENTILE_DISC
	无	RATIO_TO_REPORT ( ratio_expression ) OVER ( [ PARTITION BY partition_expression ] )
	无	STDDEV_SAMP
	无	VAR_SAMP \| VARIANCE \| VAR_POP
	无	PERCENT_RANK
	DENSE_RANK	DENSE_RANK	MaxCompute模式下：支持。 Hive模式下：支持。
	RANK	RANK	MaxCompute模式下：支持。 Hive模式下：支持。
	LAG	LAG	MaxCompute模式下：支持。 Hive模式下：支持。
	LEAD	LEAD	MaxCompute模式下：支持。 Hive模式下：支持。
	PERCENT_RANK	PERCENT_RANK	MaxCompute模式下：支持。 Hive模式下：支持。
	ROW_NUMBER	ROW_NUMBER	MaxCompute模式下：支持。 Hive模式下：支持。
	CLUSTER_SAMPLE	无	MaxCompute模式下：支持。 Hive模式下：支持。
	NTILE	NTILE	MaxCompute模式下：支持。 Hive模式下：支持。
聚合函数	PERCENTILE_APPROX	APPROXIMATE PERCENTILE_DISC
	无	LISTAGG
	无	PERCENTILE_CONT
	ANY_VALUE	ANY_VALUE
	COUNT	COUNT	MaxCompute模式下：支持。 Hive模式下：支持。
	AVG	AVG	MaxCompute模式下：支持。 Hive模式下：支持。
	MAX	MAX	MaxCompute模式下：支持。 Hive模式下：支持。
	MIN	MIN	MaxCompute模式下：支持。 Hive模式下：支持。
	MEDIAN	PERCENTILE_disc	MaxCompute模式下：支持。 Hive模式下：支持。
	STDDEV	STDDEV	MaxCompute模式下：支持。 Hive模式下：支持。
	STDDEV_SAMP	STDDEV_SAMP	MaxCompute模式下：支持。 Hive模式下：支持。
	SUM	SUM	MaxCompute模式下：支持。 Hive模式下：支持。
	WM_CONCAT	string_agg	MaxCompute模式下：支持。 Hive模式下：支持。
	COLLECT_LIST	无	MaxCompute模式下：支持。 Hive模式下：支持。
	COLLECT_SET	无	MaxCompute模式下：支持。 Hive模式下：支持。
	VARIANCE/VAR_POP	VARIANCE/VAR_POP	MaxCompute模式下：支持。 Hive模式下：支持。
	VAR_SAMP	VAR_SAMP	MaxCompute模式下：支持。 Hive模式下：支持。
	COVAR_POP	COVAR_POP	MaxCompute模式下：支持。 Hive模式下：支持。
	COVAR_SAMP	COVAR_SAMP	MaxCompute模式下：支持。 Hive模式下：支持。
	PERCENTILE	PERCENTILE_disc	MaxCompute模式下：支持。 Hive模式下：支持。
字符串函数	无	\|\|	MaxCompute模式下：支持。 Hive模式下：支持。
	无	BPCHARCMP
	无	BTRIM
	无	CHAR_LENGTH
	无	CHARACTER_LENGTH
	无	CHARINDEX
	无	COLLATE
	无	CRC32
	无	DIFFERENCE
	无	INITCAP
	无	OCTETINDEX
	无	OCTET_LENGTH
	无	QUOTE_IDENT
	无	QUOTE_LITERAL
	无	POSITION
	无	REPEAT
	无	LEFT /RIGHT
	无	STRPOS
	无	STRTOL
	CHAR_MATCHCOUNT	无	MaxCompute模式下：支持。 Hive模式下：支持。
	CHR	CHR	MaxCompute模式下：支持。 Hive模式下：支持。
	CONCAT	CONCAT\|array_concat	MaxCompute模式下：支持。 Hive模式下：支持。
	GET_JSON_OBJECT	无	MaxCompute模式下：支持。 Hive模式下：不支持。
	INSTR	无	MaxCompute模式下：支持。 Hive模式下：支持。
	IS_ENCODING	无	MaxCompute模式下：支持。 Hive模式下：不支持。
	KEYVALUE	无	MaxCompute模式下：支持。 Hive模式下：支持。
	LENGTH	LENGTH	MaxCompute模式下：支持。 Hive模式下：支持。
	LENGTHB	LEN	MaxCompute模式下：支持。 Hive模式下：支持。
	MD5	无	MaxCompute模式下：支持。 Hive模式下：支持。
	REGEXP_EXTRACT	无	MaxCompute模式下：支持。 Hive模式下：支持。
	REGEXP_INSTR	REGEXP_INSTR	MaxCompute模式下：支持。 Hive模式下：不支持。
	REGEXP_REPLACE	REGEXP_REPLACE	MaxCompute模式下：支持。 Hive模式下：支持。
	REGEXP_SUBSTR	REGEXP_SUBSTR	MaxCompute模式下：支持。 Hive模式下：不支持。
	REGEXP_COUNT	REGEXP_COUNT	MaxCompute模式下：支持。 Hive模式下：不支持。
	SPLIT_PART	SPLIT_PART	MaxCompute模式下：支持。 Hive模式下：支持。
	SUBSTR	SUBSTR	MaxCompute模式下：支持。 Hive模式下：支持。
	SUBSTRING	SUBSTRING	MaxCompute模式下：支持。 Hive模式下：支持。
	TOLOWER	LOWER	MaxCompute模式下：支持。 Hive模式下：支持。
	TOUPPER	UPPER	MaxCompute模式下：支持。 Hive模式下：支持。
	TRIM	TRIM	MaxCompute模式下：支持。 Hive模式下：支持。
	LTRIM	LTRIM	MaxCompute模式下：支持。 Hive模式下：支持。
	RTRIM	RTRIM	MaxCompute模式下：支持。 Hive模式下：支持。
	REVERSE	REVERSE	MaxCompute模式下：支持。 Hive模式下：支持。
	REPEAT	REPEAT	MaxCompute模式下：支持。 Hive模式下：支持。
	ASCII	ASCII	MaxCompute模式下：支持。 Hive模式下：支持。
	CONCAT_WS	CONCAT_WS	MaxCompute模式下：支持。 Hive模式下：支持。
	LPAD	LPAD	MaxCompute模式下：支持。 Hive模式下：支持。
	RPAD	RPAD	MaxCompute模式下：支持。 Hive模式下：支持。
	REPLACE	REPLACE	MaxCompute模式下：支持。 Hive模式下：支持。
	SOUNDEX	SOUNDEX	MaxCompute模式下：支持。 Hive模式下：不支持。
	SUBSTRING_INDEX	SUBSTRING_INDEX	MaxCompute模式下：不支持。 Hive模式下：不支持。
	TRANSLATE	TRANSLATE	MaxCompute模式下：不支持。 Hive模式下：不支持。
	URL_DECODE	无	MaxCompute模式下：支持。 Hive模式下：不支持。
	URL_ENCODE	无	MaxCompute模式下：支持。 Hive模式下：不支持。
	CRC32	无	MaxCompute模式下：支持。 Hive模式下：支持。
其他函数	CAST	CAST	MaxCompute模式下：支持。 Hive模式下：支持。
	COALESCE	COALESCE	MaxCompute模式下：支持。 Hive模式下：支持。
	DECODE	DECODE	MaxCompute模式下：支持。 Hive模式下：不支持。
	GET_IDCARD_AGE	无	MaxCompute模式下：支持。 Hive模式下：支持。
	GET_IDCARD_BIRTHDAY	无	MaxCompute模式下：支持。 Hive模式下：不支持。
	GET_IDCARD_SEX	无	MaxCompute模式下：支持。 Hive模式下：支持。
	GREATEST	GREATEST	MaxCompute模式下：支持。 Hive模式下：支持。
	ORDINAL	无	MaxCompute模式下：支持。 Hive模式下：支持。
	LEAST	LEAST	MaxCompute模式下：支持。 Hive模式下：支持。
	MAX_PT	无	MaxCompute模式下：支持。 Hive模式下：支持。
	UUID	uuid_generate_v1	MaxCompute模式下：支持。 Hive模式下：支持。
	SAMPLE	无	MaxCompute模式下：支持。 Hive模式下：不支持。
	IF	IF	MaxCompute模式下：支持。 Hive模式下：支持。
	CASE WHEN	CASE WHEN	MaxCompute模式下：支持。 Hive模式下：支持。
	SPLIT	SPLIT	MaxCompute模式下：支持。 Hive模式下：不支持。
	STR_TO_MAP	无	MaxCompute模式下：支持。 Hive模式下：不支持。
	EXPLODE	split_to_array	MaxCompute模式下：支持。 Hive模式下：支持。
	MAP	无	MaxCompute模式下：支持。 Hive模式下：支持。
	MAP_KEYS	无	MaxCompute模式下：支持。 Hive模式下：支持。
	MAP_VALUES	无	MaxCompute模式下：支持。 Hive模式下：支持。
	NVL	NVL	MaxCompute模式下：支持。 Hive模式下：支持。
	ARRAY	ARRAY	MaxCompute模式下：支持。 Hive模式下：支持。
	SIZE	get_array_length	MaxCompute模式下：支持。 Hive模式下：支持。
	ARRAY_CONTAINS	@>	MaxCompute模式下：支持。 Hive模式下：支持。
	POSEXPLODE	无	MaxCompute模式下：支持。 Hive模式下：支持。
	TRANS_ARRAY	无	MaxCompute模式下：支持。 Hive模式下：支持。
	INLINE	无	MaxCompute模式下：支持。 Hive模式下：支持。
	NAMED_STRUCT	无	MaxCompute模式下：支持。 Hive模式下：支持。
	无	SUBARRAY

2.1.8 MaxCompute 产品特性

功能	MaxCompute 产品组件	特性介绍
数据存储	MaxCompute 表 (基于盘古分布式存储)	MaxCompute 支持大规模计算存储，适用于 TB 以上规模的存储及计算需求，最大可达 EB 级别。同一个 MaxCompute 项目支持企业从创业团队发展到独角兽的数据规模需求；数据分布式存储，多副本冗余，数据存储对外仅开放表的操作接口，不提供文件系统访问接口 MaxCompute 支持大规模计算存储，适用于 TB 以上规模的存储及计算需求，最大可达 EB 级别。同一个 MaxCompute 项目支持企业从创业团队发展到独角兽的数据规模需求；数据分布式存储，多副本冗余，数据存储对外仅开放表的操作接口，不提供文件系统访问接口；自研数据存储结构，表数据列式存储，默认高度压缩，后续将提供兼容 ORC的Ali-ORC存储格式；支持外表，将存储在OSS 对象存储、OTS表格存储的数据映射为二维表；支持Partition、Bucket 的分区、分桶存储；更底层不是 HDFS，是阿里自研的盘古文件系统，但可借助 HDFS 理解对应的表之下文件的体系结构、任务并发机制使用时，存储与计算解耦，不需要仅仅为了存储扩大不必要的计算资源；
存储	Pangu	阿里自研分布式存储服务，类似 HDFS。 MaxCompute 对外目前只暴露表接口，不能直接访问文件系统。
资源调度	Fuxi	阿里自研的资源调度系统，类似 Yarn
数据上传下载	Tunnel Streaming Tunnel	不暴露文件系统，通过 Tunnel 进行批量数据上传下载
开发&诊断	Dataworks/Studio/Logview	配套的数据同步、作业开发、工作流编排调度、作业运维及诊断工具。开源社区常见的 Sqoop、Kettle、Ozzie 等实现数据同步和调度
用户接口	CLT/SDK	统一的命令行工具和 JAVA/PYTHON SDK
SQL	MaxCompute SQL	TPC-DS 100%支持，同时语法高度兼容 Hive，有Hive 背景，开发者直接上手，特别在大数据规模下性能强大。 * 完全自主开发的 compiler，语言功能开发更灵活，迭代快，语法语义检查更加灵活高效 * 基于代价的优化器，更智能，更强大，更适合复杂的查询 * 基于LLVM 的代码生成，让执行过程更高效 * 支持复杂数据类型(array,map,struct) * 支持Java、Python语言的UDF/UDAF/UDTF * 语法：Values、CTE、SEMIJOIN、FROM倒装、Subquery Operations 、 Set Operations(UNION /INTERSECT /MINUS)、 SELECT TRANSFORM 、User Defined Type、 GROUPING SET(CUBE/rollup/GROUPING SET)、脚本运行模式、参数化视图 * 支持外表(外部数据源+StorageHandler，支持非结构化数据)
Spark	MaxCompute Spark	MaxCompute提供了Spark on MaxCompute 的解决方案，使 MaxCompute 提供兼容开源的 Spark 计算服务，让它在统一的计算资源和数据集权限体系之上，提供 Spark 计算框架，支持用户以熟悉的开发使用方式提交运行 Spark 作业。 * 支持原生多版本 Spark 作业： Spark1.x/Spark2.x作业都可运行； * 开源系统的使用体验：Spark-submit 提交方式，提供原生的 Spark WebUI供用户查看； * 通过访问OSS、OTS、database 等外部数据源，实现更复杂的 ETL 处理，支持对 OSS 非结构化进行处理； * 使用 Spark 面向 MaxCompute 内外部数据开展机器学习，扩展应用场景
机器学习	PAI	MaxCompute 内建支持的上百种机器学习算法，目前 MaxCompute 的机器学习能力由 PAI 产品进行统一提供服务，同时 PAI提供了深度学习框架、Notebook 开发环境、GPU计算资源、模型在线部署的弹性预测服务。MaxCompute 的数据对PAI产品无缝集成。
数据接入	目前支撑通过 DTS或者 DataWorks数据集成功能	数据集成是稳定高效、弹性伸缩的数据同步平台，丰富的异构数据源之间高速稳定的数据移动及同步能力。支持实时任务和批任务写入MaxCompute
整体	不是孤立的功能，完整的企业服务	不需要多组件集成、调优、定制，开箱即用

3、RedShift到MaxCompute迁移工具介绍

从数据库表导入到 Amazon S3

卸载数据 - Amazon Redshift

在线迁移上云服务

AWS S3 迁移教程 - 在线迁移服务 - 阿里云

将数据从OSS迁移至同区域的MaxCompute项目load命令

LOAD - MaxCompute - 阿里云

语法校验工具二选一

MaxCompute studio

认识MaxCompute Studio - MaxCompute - 阿里云

DataWorks sql节点

创建ODPS SQL节点 - DataWorks - 阿里云

4、迁移整体方案

数据库迁移主要包含以下内容

迁移实施计划:

序号	项目	预估时间
1	调研评估	1~2周
2	方案设计	1~2周
3	资源规划	1周
4	改造与测试验证	5~7周，需要根据复杂度评估
5	生成割接	1~2周

5、迁移详细方案

5.1. 现状分析及需求分析

5.2. 迁移方案设计

用户根据自身现有 RedShift数据量、QPS、TPS 等性能指标、高可用需求和未来业务增长需求，制定合理化的迁移方案。

5.3. 资源规划

用户需要准备好 MaxCompute 的相关环境，同时获取到对应需要使用的迁移工具。迁移工具的相关内容请参考《 RedShift到MaxCompute迁移工具介绍》章节。

5.4. 改造及测试验证

5.4.1. 改造

迁移工具可以利用MaxCompute studio（或者DataWorks新建sql节点）客户端语法校验，新建一个sql文件，如图不支持的语法会报红

MaxCompute Studio安装文档认识MaxCompute Studio - MaxCompute - 阿里云

5.4.1.1. 建表

在RedShift中获取表列表和表字段定义，按照Maxcompute支持的字段值进行转换，对于有update和delete语句的表必须建成Transactional表

类型转化参考《数据类型对比及类型转化》章节

建表语法

--创建新表。

create [external] table [if not exists]

[( [not null] [default ] [comment ], ...)]

[comment ]

[partitioned by ( [comment ], ...)]

--用于创建聚簇表时设置表的Shuffle和Sort属性。

[clustered by | range clustered by ( [, , ...]) [sorted by ( [asc | desc] [, [asc | desc] ...])] into buckets]

--仅限外部表。

[stored by StorageHandler]

--仅限外部表。

[with serdeproperties (options)]

--仅限外部表。

[location ]

--指定表为Transactional表，后续可以对该表执行更新或删除表数据操作，但是Transactional表有部分使用限制，请根据需求创建。

[tblproperties("transactional"="true")]

[lifecycle ];

--基于已存在的表创建新表并复制数据，但不复制分区属性。

create table [if not exists] [lifecycle ] as ;

--基于已存在的表创建具备相同结构的新表但不复制数据。

create table [if not exists] like [lifecycle ];

说明：

⚫ 表名与列名均对大小写不敏感。

⚫ 在创建表时，如果不指定 if not exists选项而存在同名表，则返回报错；若指定此选项，则无论是否存在同名表，即使原表结构与要创建的目标表结构不一致，均返回成功。已存在的同名表的元信息不会被改动。

⚫ 表名、列名中不能有特殊字符，只能用英文的 a-z、A-Z 及数字和下划线（_），

且以字母开头，名称的长度不超过 128 字节。

⚫tblproperties("transactional"="true")：可选(有update和delete语句必须设置)。设置表为Transactional表。后续可以对Transactional表执行update、delete操作实现行级更新或删除数据。更多信息，请参见更新或删除数据（UPDATE | DELETE）。

⚫ Partitioned by 指定表的分区字段，目前仅支持 string类型。分区值不可以有双字节字符（如中文），必须是以英文字母 a-z、A-Z开始后可跟字母数字，名称的长度不超过 128 字节。允许的字符包括：空格、冒号（:）、下划线（_）、美元符$）、井号（#）、点（.）、感叹号（!）和@，出现其他字符行为未定义，例如：“\t”、“\n”、“/”等。当利用分区字段对表进行分区时，新增分区、更新分区内数据和读取分区数据均不需要做全表扫描，可以提高处理效率。

⚫ 注释内容是长度不超过 1024 字节的有效字符串。

⚫ lifecycle 指明此表的生命周期，单位：天。create table like 语句不会复制源表

的生命周期属性。

⚫ 理论上源表分区最多只能 6 级，但考虑极限存储的分区膨胀方式，请尽可能少用

分区。

⚫ 一个表允许的分区个数支持按照具体的 project 配置，默认 60000 个。

⚫ 在create table ... as select ...语句中，如果在 select 子句中使用常量作为列的

值，建议指定列的名字。

⚫ 如果希望源表和目标表具有相同的表结构，可以尝试使用 create table ... like 操

作。

5.4.1.1.1建表具体案例

列名双引号要去掉
形如BIGINT primary key identity(1,1)主键⾃增列要去掉，只保留默认值default 1
numeric数据类型要转为decimal
形如::character varying，'1900/01/01'::text这种，两个冒号及后⾯内容要删除，MC不⽀持
形如"n_car_no" numeric DEFAULT -1::numeric，MC不⽀持默认值为-1，需要去掉
形如"ts_req_time" timestamp without time zone DEFAULT to_timestamp('1900/00/00 00:00:00'::text, 'YYYY-MM-DD HH24:MI:SS.MS'::text),需要去掉timezone，并改为timestamp DEFAULT timestamp "1900-01-01 00:00:00"
形如INTERLEAVED SORTKEY(vc_trans_id)，MC不⽀持交错排序列功能，可以考虑替换为 zorder。
MC不⽀持时区time zone，有关time zone的需要删除。
物化视图修改去掉 AUTO REFRESH YES，同时MaxCompute物化视图不支持窗口函数

5.4.1.2. SQL 迁移

SQL 迁移实际上就是根据 Oracle 和MaxCompute 两者间 SQL 的差异进行转化，将RedShift中的 SQL 转化成 MaxCompute 中的 SQL，从而使 SQL 可用。具体的 SQL间差异请参考《迁移前RedShift于MaxCompute的各项对比差异》章节中的相关内容

5.4.1.2.1 SQL 迁移具体案例

DML语句

1.执行updae或者delet的语句需要创建事务表("transactional"="true")

2. 形如COMMENT ON column atzc_dev_dw.t_com_fact_auto_pay_gw_trans_pay_gw."n_trans_amt" is 'dml';给列添加注释，需要改为MC⽀持的语法alter table change column comment '';

DQL语句

	问题现象	迁移指导
cte(with)语句	with语句写在insert into下面语法解析报错	with语句移动到insert into上面
cte(with)语句	with a as ( with b as () ) 嵌套使用 MC不支持嵌套的with 需要将with拿出来	with a as () , b as ()
类型转化	redshift都使用的是 :: 如：a::date	使用cast(a as date)
正常匹配	redshift使用的是 ~	使用rlike替换
group by	redshift group by中的整型常量会被当做select的列序号处理如：group by 1,2.	SQL语句设置了属性，即set odps.sql.groupby.position.alias=true;一起提交
类型转化 ::	redshift ::代表类型转化	使用cast函数转化
数据类型	varchar	需要指定位数varchar(100)或者直接指定string
	decimal 类型常量1	改成1bd
	smallint 常量	1s
join	join的不等值	mc不支持普通join不等值表达式，可以使用mapjoin

内建函数

RedShift	MaxCompute	RS举例	MC举例
多行注释/* xxxxx */	框选所需注释内容，ctrl+/，进行注释
DATEADD( datepart, interval, {date\|time\|timetz\|timestamp} )	datetime dateadd(date\|datetime\|timestamp , bigint , string )	dateadd(day,1,f.dt_date)	dateadd(f.dt_date,1,'dd')
DATEDIFF ( datepart, {date\|time\|timetz\|timestamp}, {date\|time\|time\|timestamp} )	bigint datediff(date\|datetime\|timestamp , date\|datetime\|timestamp , string )	datediff(min,a,b)	datediff(b,a,'mi')
current_date-n/current_date+n	dateadd(GETDATE(),n) dateadd可以加减时间，getdate可以获取当前时间	current_date-1	dateadd(GETDATE(),1,'dd')
类型转化 ::	cast转	a::date	cast(a as date)
正则 ~	rlike
日期加减current_date+30	date_add(current_date(),30)
CEILING 或 CEIL 函数用于将数字向上舍入到下一个整数。	ceil	select ceiling(commission)	select ceil(1.1);
TO_TIMETAMP 将时间戳字符串转换为时间标记	bigint unix_timestamp(datetime )	to_timestamp('1900/00/00 00:00:00'as string, 'YYYY-MM-DD HH24:MI:SS.MS'as string)	unix_timestamp(cast ("1900-00-00 00:00:00" as datetime）)
dateadd按指定的时间间隔递增日期、时间、时间或时间戳值	datetime dateadd(date\|datetime\|timestamp , bigint , string )	dateadd(month,-6,a.dt_end_date)	dateadd(a.dt_end_date,-6,"mm")
LISTAGG 聚合函数根据 ORDER BY 表达式对该组的行进行排序，然后将值串联成一个字符串	wm_concat(string , string )	listagg(remark)	wm_Concat(",",remark)
CURRENT_DATE获取当前日期	CURRENT_DATE() MaxCompute需要添加括号
EXTRACT(week from $1)提取函数从 TIMESTAMP 值或表达式	weekofyear()
EXTRACT(weekday from $1) 和 extract(DOW from $1)	weekday($1)
DATEPART(WEEKDAY,T3.dt_report)	WEEKDAY(cast(T3.dt_report as DATETIME))
LEN 函数返回一个整数，表示输入字符串中的字符的数量	bigint length(string )	len	length
LOWER 函数返回与输入字符串具有相同数据类型的字符串	tolower(string )	lower
CONVERT ( TIMESTAMP, id_card_back_overdue) 函数将值从一种数据类型转换为另一种数据类型	转为cast()	CONVERT ( TIMESTAMP, id_card_back_overdue)	cast(id_card_back_overdue as TIMESTAMP)
sysdate返回当前会话时区（默认为 UTC）中的当前日期和时间	getdate() 返回DATETIME ‘2017-11-11 00:00:00’
charindex() 返回指定子字符串在字符串中的位置	INSTR()	charindex('fish', 'dogfish')	instr('dogfish','fish')
left()这些函数返回指定数量的位于字符串最左侧	substr()
right()这些函数返回指定数量的位于字符串最右侧	reverse(substr(reverse()))
DATE_TRUNC 函数根据您指定的日期部分（如小时、周或月）截断时间戳表达式或文字 date_trunc('month'）	datetrunc(,'month')
json_extract_path_text 函数返回键:Value对引用 JSON 字符串中的一系列路径元素	改为get_json_object写法get_json_object(content,'$.DeviceID')	根据key路径获取json字符串的value	json_extract_path_text('{"f2":{"f3":1},"f4":{"f5":99,"f6":"star"}}','f4', 'f6') 返回 ‘star’
json_extract_array_element_text	使用atzc_dev_dw.json_extract_array_element_text	根据索引返回数组元素	json_extract_array_element_text('[111,112,113]', 2) 返回 ‘113’
POSITION返回指定子字符串在字符串中的位置	改成：instr
BTRIM 函数通过删除前导空格和尾随空格或删除	TRIM maxCompute只能删除左右空格不能删除指定位置空格，删除指定位置需要自己写udf实现
date_part()从表达式中提取日期部分值	datepart()
mod() 函数返回一个数字结果	$1%$2
~~	like
date_part(w,time)	weekofyear()

4.4.1.2存储过程迁移

建议改成临时表或者pyodps的方式

5.4.2数据迁移

序号	描述
①	将Amazon Redshift数据导出至Amazon S3数据湖（简称S3）。
②	通过对象存储服务OSS的在线迁移上云服务，将数据从S3迁移至OSS。
③	将数据从OSS迁移至同区域的MaxCompute项目中，并校验数据完整性和正确性。

数据迁移参考文档：

Amazon Redshift数据迁移至MaxCompute - MaxCompute - 阿里云

5.4.3. 测试验证

目前RedShift到MaxCompute 迁移的数据测试验证工作，还没有工具可以支持，需要

自行编写脚本工具完成，常用校验方案有如下几种：

⚫ 表结构校验，从 RedShift和MaxCompute 分别导出数据表列及类型定义后计算

md5 进行校验

⚫ 数据表行数比对，执行 SQL 语句分别在 RedShift和MaxCompute 统计相同表的

数据行数进行逐行比对

⚫ 数据全量校验，一般用于核心表且数据量较小的校验场景，导出全量数据计算

md5 进行校验，或全量数据分段计算 md5 进行校验

⚫ 数据抽样校验，一般用于核心大表的数据校验场景，按一定抽样规则从源和目标

抽取数据进行校验。

原文链接

本文为阿里云原创内容，未经允许不得转载。

你可能感兴趣的:(云栖号技术分享,amazon)

AWS Nitro架构简介河马虚拟化计算机架构虚拟化 aws 虚拟机架构
AWS（AmazonWebServices）Nitro架构为Amazon的云服务提供了底层的支持。Nitro架构的总体设计思想是：轻量化的hypervisor配合定制化的硬件，让用户无法区分出运行在虚拟机内和运行在裸金属上操作系统的性能差异。为了实现定制化的硬件（ASIC），Amazon和以色列的一家芯片公司——Annapurna实验室合作，并在后面将其收购，其芯片的logo就是Annapurna
7款Java 微服务框架剑海风云 J2EE Middleware #SpringBoot java 微服务 Springboot Quarkus Micronaut Helidon Chronicle
1.微服务的历史微服务的概念源于21世纪初盛行的面向服务架构(SOA)。然而，“微服务”一词本身直到2012年左右才出现，当时它开始在软件架构活动和软件架构博客上被讨论。微服务的早期先驱包括Netflix、Amazon和eBay等公司。例如，2009年，Netflix开始从单体架构过渡到微服务架构，以更好地处理快速扩展的客户群。其他大公司也纷纷效仿，意识到单体架构模型在处理大规模复杂系统时存在局限
分布式中间件-几个常用的消息中间件问道飞鱼分布式技术分布式中间件
文章目录常见消息中间件1.RabbitMQ2.ApacheKafka3.RedisPub/Sub4.ActiveMQ5.AmazonSimpleNotificationService(SNS)和SimpleQueueService(SQS)6.RocketMQ差异总结消息协议1.AMQP(AdvancedMessageQueuingProtocol)2.STOMP(SimpleTextOrient
亚马逊AI产品Amazon Q被指出有各种问题，这将导致客户流失至微软市象人工智能网络科技
近日，泄露的消息显示，亚马逊的重要AI产品AmazonQ在发布初期面临不少挑战，并且存在客户转向微软Copilot的风险。这款备受期待的产品在四月份公开发布后，遇到了一系列的问题。内部备忘录显示，八月份时，一些亚马逊网络服务（AWS）的员工在内部Slack频道中表达了对AmazonQ的看法，指出该产品存在功能不足、成本较高以及难以与其他软件集成等问题。更有员工担心，这些问题可能导致客户转投微软的C
性能、成本与 POSIX 兼容性比较： JuiceFS vs EFS vs FSx for Lustre Juicedata 云原生人工智能运维
JuiceFS是一款为云环境设计的分布式高性能文件系统。AmazonEFS易于使用且可伸缩，适用于多种应用。AmazonFSxforLustre则是面向处理快速和大规模数据工作负载的高性能文件系统。在本文中，我们将通过一系列测试，来评估这三种主流文件系统的性能与成本表现，帮助用户快速了解这些产品。01测试环境测试采用了AWS的c5.4xlarge实例（16核，32GB内存，10Gbps网络带宽），
ClickHouse与其他数据库的对比九州Pro ClickHouse 数据库 clickhouse 数据仓库大数据 sql
目录1与传统关系型数据库的对比1.1性能差异1.2数据模型差异1.3适用场景差异2与其他列式存储数据库的对比2.1ApacheCassandra2.2HBase3与分布式数据库的对比3.1GoogleBigQuery3.2AmazonRedshift3.3Snowflake4ClickHouse的缺点5ClickHouse的其他优点1与传统关系型数据库的对比1.1性能差异ClickHouse是一种
大数据面试题：说下为什么要使用Hive？Hive的优缺点？Hive的作用是什么？蓦然_ 大数据面试题 hive 大数据开发面试题大数据面试
1、为什么要使用Hive？Hive是Hadoop生态系统中比不可少的一个工具，它提供了一种SQL(结构化查询语言)方言，可以查询存储在Hadoop分布式文件系统（HDFS）中的数据或其他和Hadoop集成的文件系统，如MapR-FS、Amazon的S3和像HBase（Hadoop数据仓库）和Cassandra这样的数据库中的数据。大多数数据仓库应用程序都是使用关系数据库进行实现的，并使用SQL作为
Anthropic的Claude 3 Sonnet 基础模型现已可在亚马逊的Bedrock平台上运行李白的好朋友人工智能 AI写作 claude3 AI 生成式AI AI助手 AI智能写作
在2023年9月，我们宣布与Anthropic建立了战略合作伙伴关系。双方将在安全的人工智能（AI）技术和专业知识方面进行整合。这次合作的目标是加速Anthropic的Claude基础模型（FMs）的开发过程，并将其广泛应用于亚马逊云科技的客户。如今，通过AmazonBedrock，您可以体验到Anthropic的Claude模型的独特功能，从而改变用户体验、重塑商业模式并加速您的生成式AI之旅。
如何在 AWS S3 中设置跨区域复制数云界 aws java 数据库
如何在AWSS3中设置跨区域复制概述欢迎来到雲闪世界。AmazonSimpleStorageService(S3)是一种可扩展的对象存储服务，广泛用于存储和检索数据。其主要功能之一是跨区域复制(CRR)，允许跨不同的AWS区域自动异步复制对象。此功能对于灾难恢复、数据冗余以及改善不同地理区域的数据访问延迟至关重要。在本文中，我们将介绍在AWSS3中设置跨区域复制的过程，确保您的数据在各个区域之间安
Elasticsearch：无状态世界中的数据安全 Elastic 中国社区官方博客 Elasticsearch Serverless Elastic elasticsearch 大数据搜索引擎人工智能全文检索 serverless
作者：来自ElasticHenningAndersen在最近的博客文章中，我们宣布了支持ElasticCloudServerless产品的无状态架构。通过将持久性保证和复制卸载到对象存储（例如AmazonS3），我们获得了许多优势和简化。从历史上看，Elasticsearch依靠本地磁盘持久性来确保数据安全并处理陈旧或孤立的节点。在本博客中，我们将讨论无状态的数据持久性保证，包括我们如何使用安全检
AWS SES 开源项目教程强苹旖
AWSSES开源项目教程aws-sesProvidesaneasyrubyDSL&interfacetoAWSSES项目地址:https://gitcode.com/gh_mirrors/aw/aws-ses项目介绍aws-ses是一个用于与AmazonSimpleEmailService(SES)进行交互的开源Ruby库。AmazonSES是一个灵活且成本效益高的电子邮件服务，适用于数字营销人员
如何进行 AWS 云监控 ManageEngine卓豪云安全云监控 AWS AWS 云安全云监控 AWS云监控
什么是AWS？AmazonWebServices（AWS）是Amazon提供的一个全面、广泛使用的云计算平台。它提供广泛的云服务，包括计算能力、存储选项、网络功能、数据库、分析、机器学习、人工智能、物联网和安全。使用AWS有哪些好处？使用AWS可为企业提供可扩展性、成本效益、可靠性、安全性、灵活性、全球覆盖和创新等。凭借对计算资源的按需访问、即用即付定价、全球基础设施、强大的安全功能以及广泛的服务
python爬亚马逊数据_python爬虫----（6. scrapy框架，抓取亚马逊数据） weixin_39628342 python爬亚马逊数据
利用xpath()分析抓取数据还是比较简单的，只是网址的跳转和递归等比较麻烦。耽误了好久，还是豆瓣好呀，URL那么的规范。唉，亚马逊URL乱七八糟的....可能对url理解还不够.amazon├──amazon│├──__init__.py│├──__init__.pyc│├──items.py│├──items.pyc│├──msic││├──__init__.py││└──pad_urls.p
Python批量采集商品数据并使用多线程（含完整源码）魔王不会哭爬虫 python python pycharm 编程语言计算机网络
前言嗨喽，大家好，这里是魔王~本次目的:Python批量采集商品数据知识点:爬虫基本流程非结构化数据解析csv数据保存线程池的使用开发环境:python3.8pycharmrequests>>>pipinstallrequestsparsel>>>pipinstallparsel网站思路分析:找到数据来源https://www.amazon.cn/s?rh=n%3A106200071&fs=tru
目前支持云计算的有哪些厂家？江河之流计算机的工具开发 #专升本 #改善自己的生活方式云计算
目前市场上提供云计算服务的厂家众多，以下是一些主要的云计算服务提供商：1.**亚马逊网络服务（AmazonWebServices,AWS）**：全球市场份额最大的云服务提供商。2.**微软Azure**：微软提供的云计算平台，提供全面的云服务和解决方案。3.**谷歌云平台（GoogleCloudPlatform,GCP）**：谷歌提供的云计算服务，以其强大的数据分析和机器学习能力著称。4.**阿里
缓存解决方案。Redis 和 Amazon ElastiCache 比较数云界缓存 AWS 云计算
欢迎来到雲闪世界。Redis和AmazonElastiCache等缓存解决方案是通过将频繁访问的数据存储在内存中来提高应用程序性能的热门选择。让我们从实施简单性、性能、成本和维护方面对它们进行比较。实施简单设置Redis需要在基础设施或云实例上安装和配置Redis服务器。它可能涉及更多手动设置和配置。AmazonElastiCache是一项托管服务，因此它消除了许多底层设置的复杂性。您可以通过AW
ubuntu使用postfix和AWS-SES发送邮件 MaxFang
在日常开发中，邮件发送是个比较常见的场景。因此出现了很多相关的软件和服务，各大云厂商也推出自己的邮件服务。今天笔者就像大家介绍一种常见的组合，AWS的邮件服务SES与邮件服务器postfix的配置和使用方法。概述什么是AWS-SESAmazonSimpleEmailService(SES)是一种经济高效、灵活且可扩展的电子邮件服务，使开发人员能够从任何应用程序中发送电子邮件。您可以快速配置Amaz
培育钻石在哪里拿货，推荐10个拿货渠道美表之家
培育钻石在哪里拿货，推荐10个拿货渠道培育钻石是一项精密而复杂的过程，它涉及到科学技术、专业知识和大量的时间与精力投入。在选择拿货渠道时，我们需要考虑供应商的信誉、产品质量以及价格等因素。以下是我推荐的10个拿货渠道。微信:17350898965(定制各类钻石款式)1、菲依恋培育钻石公司：全球最大的实验室培育钻石生产商，专注于高品质碳晶体钻石的研发和生产。2、亚马逊（Amazon）：全球最大的电商
零基础5分钟上手亚马逊云科技 - AI模型内容安全过滤佛州小李哥 AWS技术科技云计算 aws 亚马逊云科技人工智能语言模型安全
在上一篇文章中，小李哥带大家深入调研亚马逊云科技AI模型平台AmazonBedrock热门开发功能，了解了模型平台的文字/图片生成、模型表现评估和模型内容安全审核的实践操作。这次我们将继续介绍如何利用API的形式，利用Python代码的形式对AI模型内容安全过滤，阻止输入、输出中有危害的内容，提升模型在用户使用过程中的安全性。方案所需基础知识什么是AmazonBedrockGuardrails？A
在亚马逊云科技上搭建云原生生成式AI教育学习平台佛州小李哥 AWS技术科技云原生人工智能云计算架构 aws 亚马逊云科技
项目简介：小李哥将继续每天介绍一个基于亚马逊云科技AWS云计算平台的全球前沿AI技术解决方案，帮助大家快速了解国际上最热门的云计算平台亚马逊云科技AWSAI最佳实践，并应用到自己的日常工作里。本次介绍的是如何利用亚马逊云科技大模型托管服务AmazonBedrock和云原生容器管理服务，将生成式AI和亚马逊Titan大模型应用到教育和学习场景，利用Titan大模型的向量化、文字和图片生成能力构建云端
亚马逊Prime day欧美区凉凉？会员日战绩解读 TIANGEKUAJING 网络
亚马逊2022年primeday已经落幕了，大家的战绩如何呢？据亚马逊称，在今年的PrimeDay活动中，全球范围内的亚马逊Prime会员每分钟购买超过10万件商品。今年亚马逊primeday是有史以来站点数最多的一次，达到24个。活动期间，全球最畅销品类包括AmazonDevices、消费电子产品和家用电器。其中，部分全球最畅销商品来自高端美妆品牌，包括兰芝和NuFace；还有像AppleWat
AWS云计算 4-5知识测验答案 BHDDGT AWS aws 云计算
模块四知识测验哪些属性是选择AmazonElasticComputeCloud(AmazonEC2)的原因？(请选择两项。)答：能够运行任何类型的工作负载完全掌控计算资源使用Amazon系统映像(AMI)有什么好处？(请选择三项。)答：使用相同配置启动实例将AMI用作AmazonElasticComputeCloud(AmazonEC2)实例的服务器备份销售或共享打包为AM1I的软件解决方案系统管
[大译] drone delivery service 飞行器快递服务苹果放阳台
收听语音：http://xima.tv/x53ZdInewssource新闻来源:https://www.msn.com/en-us/news/technology/google-just-beat-amazon-to-launching-one-of-the-first-ever-drone-delivery-services/ar-BBVKRibWing,astartupownedbyGoog
REST 表征状态转移架构师之路 JAVA REST 表征状态转移
REST表征状态转移（英文：RepresentationalStateTransfer，简称REST）是RoyFielding博士在2000年他的博士论文中提出来的一种软件架构风格。目前在三种主流的Web服务实现方案中，因为REST模式的Web服务与复杂的SOAP和XML-RPC对比来讲明显的更加简洁，越来越多的web服务开始采用REST风格设计和实现。例如，Amazon.com提供接近REST风
在亚马逊云科技上利用生成式AI开发用户广告营销平台佛州小李哥 AWS技术科技人工智能 aws 架构亚马逊云科技云计算开发
项目简介：小李哥将继续每天介绍一个基于亚马逊云科技AWS云计算平台的全球前沿AI技术解决方案，帮助大家快速了解国际上最热门的云计算平台亚马逊云科技AWSAI最佳实践，并应用到自己的日常工作里。本次介绍的是如何利用亚马逊云科技大模型托管服务AmazonBedrock和个性化推荐算法服务AmazonPersonalize搭建面向用户的广告营销平台，将生成式AI应用到用户的广告营销场景，提升用户产品转化
Amazon EFS：云端弹性文件系统的多元化应用场景 ivwdcwso 运维 EFS AWS
引言AmazonElasticFileSystem(EFS)作为AWS生态系统中的关键组件，为用户提供了一个可扩展、完全托管的弹性NFS文件系统。本文将深入探讨EFS的多样化应用场景，帮助读者了解如何在不同的业务需求中充分利用这一强大的存储解决方案。1.大数据分析与处理在大数据时代，EFS为企业提供了理想的存储平台，支持海量数据的存储和高性能分析。应用：Hadoop、Spark等大数据框架优势：高
centos7安装jdk17 小丛的知识窝 java
AmazonCorretto是亚马逊提供的一个免费的、兼容OpenJDK的JDK发行版。以下是在CentOS7系统上安装AmazonCorrettoJDK17的步骤：下载AmazonCorrettoJDK：wgethttps://corretto.aws/downloads/latest/amazon-corretto-17-x64-linux-jdk.tar.gz解压JDK17文件：在服务器上执
Amazon Kinesis Analytics 罗技123 亚马逊云科技 flink
现在让我们将注意力集中在AmazonKinesisAnalytics上。AmazonKinesisAnalytics使您能够快速编写SQL代码，以近乎实时的方式连续读取、处理和存储数据。借助AmazonKinesisAnalytics，您可以实时摄取数十亿个小数据点。然后可以聚合每个单独的数据点以提供智能的业务见解，进而可用于持续优化和改进业务流程。使用KinesisAnalytics需要您执行以
Linux 制作 OpenSSH RPM 包 dongsong1117 linux 运维服务器 OpenSSH
文章目录1.安装依赖2.建立编译目录3.下载源码包并解压4.复制编译配置5.修改编译配置6.编译制作RPM包本文适用系统：RockyLinux9、AWSAmazonLinux20231.安装依赖RockyLinux:dnf-yinstallepel-releasegccinitscriptskrb5-develmakeopensslopenssl-develpam-develperlrpm-bui
AWS认证SAA-C03每日一题 tlf985417 云计算 aws
本题库由云计算狂魔微信公众号分享。【SAA-C03助理级解决方案架构师认证】AglobalcompanyhostsitswebapplicationonAmazonEC2instancesbehindanApplicationLoadBalancer(ALB).Thewebapplicationhasstaticdataanddynamicdata.Thecompanystoresitsstati
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe