注:本文部分翻译自https://docs.vmware.com/en/VMware-Greenplum-Data-Copy-Utility/2.6/greenplum-copy/gpcopy.html
gpcopy实用程序将对象从源Greenplum数据库系统中的数据库复制到目标Greenplum数据库系统中的数据库。
语法
gpcopy
{ { -F | --full} |
{ { -d | --dbname} < database1 >[ ,< database2 > .. . ]
{ -D | --dest-dbname} < dest-db1 >[ ,< dest-db2 > .. . ] ] } |
{ -t | --include-table} < db> .< schema> .< table> [ ,< db> .< schema1 > .< table1 > .. . ]
[ --dest-table < db> .< schema> .< table> [ ,< db> .< schema1 > .< table1 > .. . ] |
{ -T | --include-table-file} < table-file1 >
[ { -T | --include-table-file} < table-file2 >] .. . ] |
--include-table-json < json-table-file1 >
[ --include-table-json < json-table-file2 >] .. . ] }
[ { -m | --metadata-only} ]
[ --no-ownership ]
[ { -e | --exclude-table} < db> .< schema> .< table> [ ,< db> .< schema1 > .< table1 > .. . ] ]
[ { -E | --exclude-table-file} < table-file1 > ]
[ { -E | --exclude-table-file} < table-file2 > ] .. . ] ]
{ --dest-host < dest_host> [ --dest-port < dest_port> ]
[ --dest-user < dest_user> ] [ --dest-mapping-file < host_ip_map_file> ] }
[ --source-host < source_host> [ --source-port < source_port> ]
[ --source-user < source_user> ] ]
[ --enable-receive-daemon = { true | false } ]
[ --jobs < int> ]
[ --snapshot < snapshot_id> ]
[ { -o | --on-segment-threshold} < int> ]
[ { -p | --parallelize-leaf-partitions} = { true | false} ]
[ --data-port-range < lower_port> -< upper_port> ]
[ --ssl-cert < cert_file> --ssl-key < key_file>
[ --ssl-ca < ca_file> ] [ --ssl-min-tls < min_version_str> ] ]
{ --skip-existing | --truncate | --drop | --append }
[ { -a | --analyze} ]
[ --no-compression ]
[ --no-distribution-check ]
[ --truncate-source-after [ --yes ] ]
[ { -v | --validate} < type> ]
[ --dry-run ]
[ --timeout < seconds> ]
[ --dumper "" ]
[ --quiet | --debug ]
gpcopy --version
gpcopy { -h | --help}
描述
gpcopy实用程序将数据库对象从源Greenplum数据库系统复制到目标系统。拷贝操作有以下几种:
在运行gpcopy时,必须指定要从源数据库复制的数据以及如何管理目标数据库中的数据。
必须使用且只能使用以下选项中的一个来指定要从源数据库复制的数据:–full、–dbname、–include-table、–include-table-file或–include-table-json。
必须使用以下选项之一来指定如何管理目标数据库中的数据:–skip-existing、–truncate、–drop或–append。
如果同时指定–append和–validate选项,则如果目标表包含数据,源表数据的验证将失败。
如果指定了–truncate-source-after选项,则还必须指定–validate选项。当指定–truncate-source-after时,在复制表数据并验证目标表数据之后,gpcopy将截断源表。
选项
gpcopy提供了一系列选项来定义要复制的数据的范围。您可以选择选项来执行完整的Greenplum系统迁移、复制特定的数据库或表,或者使用SQL查询只复制表的一部分。其他选项使您能够排除复制某些表,或者更改复制表数据的目标数据库、模式或表名。特殊的–metadata-only命令gpcopy为选定的源表创建必要的模式,但不复制表数据。
必须使用以下选项中的至少一个–full、–dbname、–include-table、–include-table-file或–include-table-json。根据需要使用其他选项从副本中排除数据,或者为复制的表数据更改目标数据库、模式或表。
-F | --full 此选项执行将Greenplum Database源系统迁移到目标系统的操作。 迁移复制所有数据库对象,包括所有用户定义数据库的表、索引、视图、物化视图定义、角色、函数、用户定义类型(UDT)、资源队列和资源组。不复制默认数据库postgres、template0和template1。 该选项不能用–dbname、–include-table、–include-table-file或–include-table-json选项指定。
{-d | --dbname} 要复制的源数据库。若要将多个数据库复制到目标系统,请指定一个以逗号分隔的数据库列表,名称之间没有空格。所有用户定义的表和表数据都被复制到目标系统。 如果源数据库不存在,gpcopy将返回一个错误并退出。如果目标数据库不存在,则创建一个数据库。 对–full、–include-table、–include-table-file或–include-table-json选项无效。 或者,您可以使用–include-table、–include-table-file或–include-table-json选项复制一组表。
{-D | --dest-dbname} 若要将数据库复制到其他目标数据库,请指定目标数据库的名称。对于多个数据库,指定一个以逗号分隔的数据库列表,名称之间没有空格。数据库名称的数量必须与–dbname选项中指定的名称数量匹配。该实用程序按照列出的顺序将源数据库复制到目标数据库。在本例中,db1被复制到destdb1, db2被复制到destdb2, db3被复制到db3。 gpcopy --dest-host mdw-2 --dbname=db1,db2,db3 --dest-dbname=destdb1,destdb2,db3 --drop 如果源数据库不存在,gpcopy将返回一个错误并退出。如果目标数据库不存在,则创建一个数据库。
{-t | --include-table} .. 从源数据库系统复制一个或多个表。必须提供完全限定的表名(..)。不能指定物化视图或系统编目表。对于依赖于其他表的表,还必须指定从属表。
若要复制多个表,请包含以逗号分隔的表名列表,不要使用空格,或使用正则表达式来描述一组表。可以选择使用–dest-table来更改数据库、模式或表名,将–include-table中的表数据复制到其中。
可以在完全限定表名的数据库、模式和表部分使用Go语言正则表达式来定义一组输入表。正则表达式模式必须用斜杠(//)括起来。例如,–include-table mytest.public.demo/. /指定公共模式下mytest数据库中所有以demo开头的表。 下面两个关于–include-table选项的示例是等效的。它们都指定了一组表,以demo开头,以0或多个数字结尾。 –include-table testdb.schema1.demo/[0-9] /
–include-table testdb.schema1./demo[0-9]*/
可以在–dest-table中引用全限定名的数据库部分中的正则表达式捕获组,以更改表数据的目标数据库、模式或表名。
注意:如果更改目标模式或表名,目标表必须存在,并且具有与源表完全相同的表结构;当目标表与源表不同时,gpcopy不会生成创建新目标模式或表所需的DDL。
如果源表不存在,gpcopy将返回一个错误并退出。
如果目标表或数据库不存在,则创建它。只复制表和表数据,不复制依赖对象。只有在指定–drop选项时才会重新创建索引。不复制依赖对象。
选项–full、–dbname、–include-table-file或–include-table-json不允许此选项。
–dest-table .. (可选)。修改复制用–include-table定义的表中的数据的数据库、模式或表。 注意:如果更改目标模式或表名,目标表必须存在,并且具有与源表完全相同的表结构;当目标表与源表不同时,gpcopy不会生成创建新目标模式或表所需的DDL。 必须提供完全限定的表名(..)。使用逗号分隔的列表(不含空格)或引用用–include-table定义的正则表达式捕获组来指定多个表。如果使用逗号分隔的表列表和–include-table,则在–dest-table列表中使用相同的数字位置来更改相应表数据的目标数据库、模式或表。例如,要只移动带有如下选项的第二个表
–include-table mytest.public.table1,mytest.public.table2
使用类似如下的选项:
–dest-table production.public.table1,production.public.table2
{-T | --include-table-file} 定义要复制的表和数据的文本文件的位置和名称。若要使用多个文件,请为每个文件指定此选项。 –include-table-file <> --include-table-file <> 在文本文件中,每行指定一个完全限定的表(database.schema.table)。不能指定视图、物化视图或系统编目表。对于依赖于其他表的表,还必须指定从属表。 可以使用Go语言正则表达式语法选择多个表。有关使用正则表达式选择表的信息,请参阅–dest-table选项。 该选项不能用–full、–dbname或–include-table选项指定。
–include-table-json json格式文件的位置和名称,该文件定义要复制的表和数据。与–include-table-file使用的文本文件不同,JSON文件可以包含一个目标表名,用于更改表数据复制到的数据库、模式或表。
-m | --metadata-only 只创建命令指定的模式。数据不传输。 如果使用–full选项指定,gpcopy将复制完整的数据库模式,包括源数据库的所有表、索引、物化视图、视图、用户定义类型(UDT)和用户定义函数(UDF)。无数据传输。 如果使用–dbname选项指定数据库,或者使用–include-table --include-table-file或–include-table-json选项指定表,gpcopy将只创建表和索引。无数据传输。 此选项不能与——truncate选项一起使用。
–no-ownership 默认情况下,如果角色存在于目标数据库中,gpcopy会将表的所有者和特权信息从源数据库中的表复制到目标数据库中的表。如果指定–no-ownership,则不会将所有者和特权信息复制到目标表。目标数据库中表的所有者设置为gpadmin。 此选项不能与–full选项一起使用。
{-e | --exclude-table} .. 表从源数据库系统中排除,不能传输。必须指定完全限定的表名(..)。
若要排除多个表,请指定以逗号分隔的表名列表。
可以使用Go语言正则表达式语法指定一组表。有关使用正则表达式的信息,请参阅–include-table选项。
只排除指定的表,不排除依赖对象。不能指定视图、物化视图或系统编目表。
该选项必须使用以下选项之一指定:–full、–dbname、–include-table、–include-table-file或–include-table-json。如果选项–exclude-table导致没有表可以复制,则不会在目标系统中创建数据库或模式。
{-E | --exclude-table-file} 包含要排除复制到目标系统的完全限定表名列表的文件的位置和名称。在文本文件中,每行指定一个完全限定的表(..
)。若要指定多个文件,请为每个文件指定此选项。
–exclude-table-file <> --exclude-table-file <>
在该文件中,可以使用Go语言正则表达式语法指定一组表。有关使用正则表达式的信息,请参阅–include-table选项。
如果源表不存在,gcopy将显示警告。
只排除指定的表。不能指定视图、物化视图或系统编目表。
该选项必须使用以下选项之一指定:–full、–dbname、–include-table、–include-table-file或–include-table-json。如果选项–exclude-table导致没有表要复制,则不会在目标系统中创建数据库或模式。
连接选项
以下选项指定目标和源Greenplum系统的连接信息。只有–dest-host是必需的。–jobs、–on-segment-threshold和–parallelize-leaf-partitions会影响用于数据传输的并发连接数。–data-port-range定义用于数据传输到目的段或目的协调器的端口。
–dest-host 必需的。目标Greenplum数据库协调器段主机名或IP地址。
–dest-mapping-file 可选的。是一个文本文件的位置和名称,该文件列出了所有目标Greenplum Database主机名及其相应的IP地址(协调器、备用协调器、主主机和镜像主机)。文件中的每一行都以这种格式列出了一个主机及其对应的IP地址:
host, IP
如果由于某种原因gcopy无法将目标主机名解析为相应的IP地址,请使用此选项。
–dest-port 目标Greenplum数据库协调器段端口号。如果没有指定–dest-port,那么默认值是5432。
–dest-user 用于连接到目标Greenplum协调器的用户ID。如果没有指定,默认为gpadmin。
–source-host 源Greenplum数据库协调器段的主机名或IP地址。如果没有指定,默认主机是运行gpcopy(127.0.0.1)的系统。
–source-port 源Greenplum数据库协调器端口号。如果不指定,默认为5432。
–source-user 用于连接到源Greenplum数据库系统的用户ID。如果没有指定,默认为gpadmin。
–ssl-cert (当目标Greenplum数据库集群配置为使用SSL/TLS时需要。)SSL/TLS证书文件的文件系统位置。该文件必须位于目标Greenplum数据库集群中所有主机(协调器、段)上的相同位置。在指定证书文件时,还必须提供SSL/TLS私钥(–ssl-key)。
–ssl-key (当目标Greenplum数据库集群配置为使用SSL/TLS时需要。)SSL/TLS私钥文件的文件系统位置。该文件必须位于目标Greenplum数据库集群中所有主机(协调器、段)上的相同位置。在指定私钥时,还必须提供SSL/TLS证书(–ssl-cert)。
–ssl-ca (可选)。SSL/TLS证书颁发机构根证书文件的文件系统位置。当指定该文件时,该文件必须位于源Greenplum数据库集群中所有主机(协调器、段)上的相同位置。Gpcopy使用根证书颁发机构验证密钥和证书。
–ssl-min-tls (可选)。在连接上请求的最小TLS版本。有效的< min_version_str >值是“1.0”,“1.1”,“1.2”、“1.3”。默认最低TLS版本为1.0。
–jobs gpcopy并行运行的最大进程数。默认值是4。取值范围是1 ~ 64512。 选项–jobs产生2*+1个数据库连接。默认值为4,表示创建9个连接。 默认情况下,此选项可能会影响分区表的复制。有关gpcopy如何处理分区表的信息,请参阅–parallelize-leaf-partitions选项。 如果增加此选项,请确保为Greenplum Database系统配置了足够的最大并发连接值,以容纳gpcopy连接和其他并发连接(如用户连接)。请参阅Greenplum数据库服务器配置参数max_connections。 如果指定了–enable-receive-daemon = false和–data-port-range,–data-port-range端口范围指定的端口数必须大于或等于用–jobs创建的并行进程数。
–snapshot 指定gpcopy在其中运行复制操作的事务快照的标识符。
{-o | --on-segment-threshold} 标识gpcopy在何处(源和目标Greenplum数据库协调器或源和目标Greenplum数据库段实例)执行数据传输。有效值为-2、-1或大于0的正整数。 默认值为-1,gpcopy通过源和目的段实例复制所有表数据。 当指定值-2时,gpcopy通过源和目标Greenplum数据库协调器复制所有表数据。 或者,您可以指定标识行号阈值的正整数值。如果一个表包含这么多或更少的行,gpcopy将使用源和目标协调器复制表数据。如果表中的行数超过阈值,gpcopy将使用源和目标段实例复制数据。 注意:当您指定一个正整数值时,gpcopy使用源表统计信息来确定表的行数。如果源表没有被分析,gpcopy会假设该表是一个小表,忽略阈值设置,只使用协调器复制表数据。如果您的数据库包含没有统计数据的大型表,请将此选项设置为-1,以强制gpcopy使用Greenplum段实例复制表数据。
-p | --parallelize-leaf-partitions 并行复制分区表的叶子分区表,或者基于根分区表复制单个表。默认值为true,并行复制叶子分区表。若要将分区表复制为单个表,请将此选项设置为false。 –jobs选项指定gpcopy并行运行的最大进程数,并且可能影响并行复制的叶子分区的数量。 如果还指定了–validate选项,则该实用程序将在复制过程中验证每个叶子分区表,然后验证整个分区表。 如果JSON文件包含查询分区表的sql:键,则不能使用–include-table-json指定此选项。
–enable-receive-daemon = {true | false} 控制目的主机从源主机接收数据时是否使用单个端口。Gpcopy允许目标主机上的守护进程在从源主机接收数据时使用单个端口。默认为true,使用单个端口。 当使用单个端口并且指定了–data-port-range时,gpcopy将在–data-port-range指定的范围内选择端口。否则,gcopy将使用可用的端口。
–data-port-range - 在Greenplum数据库目标主机上用于数据传输的一系列端口号。这适用于目标段主机,或者,如果使用协调器段传输数据,则仅适用于协调器段主机。Gpcopy使用范围(包括范围)中指定的第一个可用端口。必须大于等于1024(避免预留系统接口),必须大于1024。 如果没有指定–data-port-range,那么gcopy使用任何可用的端口。 如果指定了该选项并且–enable-receive-daemon=false,则该范围指定的端口数必须大于或等于使用–jobs创建的并行进程数。
–timeout 在源系统和目标系统都准备好进行数据传输之前等待的最大时间(以秒为单位)。缺省值是30秒。值为0使超时失效。
示例
该命令使用–full选项将源系统中所有用户创建的数据库复制到目标系统。并删除表,如果它已经存在于目标中,则重新创建它。
gpcopy --source-host mytest --source-port 1234 --source-user gpuser \
--dest-host demohost --dest-port 1234 --dest-user gpuser \
--full --drop
该命令使用–dbname选项将源系统中的指定数据库复制到目标系统。truncate选项在从源表复制表数据之前截断表数据。
gpcopy --source-host mytest --source-port 1234 --source-user gpuser \
--dest-host demohost --dest-port 1234 --dest-user gpuser \
--dbname database1,database2 --truncate
该命令使用–include-table选项将源系统中的指定表复制到目标系统。如果表已经存在于目标数据库中,那么–skip-existing选项将跳过该表。
gpcopy --source-host mytest --source-port 1234 --source-user gpuser \
--dest-host demohost --dest-port 1234 --dest-user gpuser \
--include-table database.schema.table1,database.schema.table2 --skip-existing
这个命令将表从源数据库复制到目标系统,不包括在/home/ guser /mytables中使用–exclude-table-file选项指定的表中指定的表。–truncate选项将截断目标系统中已经存在的表。使用–analyze和–validate count选项,该实用程序对复制的表执行analyze操作,并通过比较源表和目标表之间的行数来验证复制的表数据。
gpcopy --source-host mytest --source-port 1234 --source-user gpuser \
--dest-host demohost --dest-port 1234 --dest-user gpuser \
--dbname database1 --exclude-table-file /home/gpuser/mytables \
--truncate --analyze --validate count
该命令指定–full和–metadata-only选项,用于从所有源数据库复制完整的数据库模式,包括所有表、索引、视图、用户定义类型(UDT)和用户定义函数(UDF)。–drop选项指定如果表在源数据库和目标数据库中都存在,则在再次创建表之前将表删除到目标数据库中。
gpcopy --source-host mytest --source-port 1234 --source-user gpuser \
--dest-host demohost --dest-port 1234 --dest-user gpuser \
--full --metadata-only --drop
该命令使用–dbname选项将源系统中的指定数据库复制到目标系统,并使用–jobs选项指定8个并行进程。该命令指定–truncate选项,如果表已经存在于目标数据库中,则截断表并重新创建它,并使用2000-2010范围内的端口用于并行进程连接。
gpcopy --source-host mytest --source-port 1234 --source-user gpuser \
--dest-host demohost --dest-port 1234 --dest-user gpuser \
--dbname database1,database2 --truncate --jobs 8 --data-port-range 2000 -2010
该命令使用–dbname选项将源系统中的指定数据库复制到目标系统,并使用–jobs选项指定16个并行进程。–truncate选项将截断表,并在目标数据库中已经存在的情况下重新创建它。–truncate-source-after选项在源数据库中的表数据在目标数据库中验证之后,截断源数据库中的表。
gpcopy --source-host mytest --source-port 1234 --source-user gpuser \
--dest-host demohost --dest-port 1234 --dest-user gpuser \
--dbname database1 --truncate --jobs 16 --truncate-source-after --validate count
你可能感兴趣的:(Greenplum,oracle,数据库)
Google earth studio 简介
陟彼高冈yu
旅游
GoogleEarthStudio是一个基于Web的动画工具,专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库,使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具,专为创作使用G
关于提高复杂业务逻辑代码可读性的思考
编程经验分享
开发经验 java 数据库 开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑,一般都是三层架构,表示层(Controller)接收客户端请求,并对入参做检验,业务逻辑层(Service)负责处理业务逻辑,一般开发都是在这一层中写具体的业务逻辑。数据访问层(Dao)是直接和数据库交互的,用于查数据给业务逻辑层,或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说,基本上写好一
SQL Server_查询某一数据库中的所有表的内容
qq_42772833
SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表(名),可以使用以下SQL语句:USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释:SELECTTABLE_NAME:这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever:提升向量数据库检索效果的强大工具
nseejrukjhad
数据库 python
深入理解MultiQueryRetriever:提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域,高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用,但仍存在一些局限性。本文将介绍一种创新的解决方案:MultiQueryRetriever,它通过自动生成多个查询视角来增强检索效果,提高结果的相关性和多样性。MultiQueryRetriever的工
MongoDB Oplog 窗口
喝醉酒的小白
MongoDB 运维
在MongoDB中,oplog(操作日志)是一个特殊的日志系统,用于记录对数据库的所有写操作。oplog允许副本集成员(通常是从节点)应用主节点上已经执行的操作,从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中,从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定:Oplog大小:oplog的大小是有限
python os 环境变量
CV矿工
python 开发语言 numpy
环境变量:环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里,比如数据库密码,个人账户密码,如果写进自己本机的环境变量里,程序用的时候通过os.environ.get()取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量:os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置
江无羡
数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式,对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点
皆过客,揽星河
NoSQL nosql 数据库 大数据 数据分析 数据结构 非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成
weixin_39521651
insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天,他说他们项目有个需求,要实现主键自动生成,不想每次新增的时候,都手动设置主键。于是我就问他,那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成,因此为了项目稳定性,不会切换id的生成方式。朋友问我有没有什么实现思路,他们公司的orm框架是mybatis,我就建议他说,不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (> 8126) 错误的解决和理解
秋刀prince
mysql mysql 数据库
提示:啰嗦一嘴,数据库的任何操作和验证前,一定要记得先备份!!!不会有错;文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小(不推荐)2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式(可以参考使用)4.1合理设置数据
Java爬虫框架(一)--架构设计
狼图腾-狼之传说
java 框架 java 任务 html解析器 存储 电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取,分析,存储,索引。爬虫:爬虫负责爬取,解析,处理电子商务网站的网页的内容数据库:存储商品信息索引:商品的全文搜索索引Task队列:需要爬取的网页列表Visited表:已经爬取过的网页列表爬虫监控平台:web平台可以启动,停止爬虫,管理爬虫,task队列,visited表。二、爬虫1.流程1)Scheduler启动爬虫器,TaskMast
MongoDB知识概括
GeorgeLin98
持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景:传统的关系型数据库(如MySQL),在数据操作的“三高”需求以及应对Web2.0的网站需求面前,显得力不从心。解释:“三高”需求:①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net
佛一脚
error react mongodb 数据库
背景每天都能遇到奇怪的问题,做个记录,以便有缘人能得到帮助!换了一台电脑开发nextjs程序。需要连接mongodb数据,对数据进行增删改查。上一台电脑好好的程序,新电脑死活连不上mongodb数据库。同一套代码,没任何修改,搞得我怀疑人生了,打开浏览器进入mongodb官网毫无问题,也能进入线上系统查看数据,网络应该是没问题。于是我尝试了一下手机热点,这次代码能正常跑起来,连接数据库了!!!是不
入门MySQL——查询语法练习
K_un
前言:前面几篇文章为大家介绍了DML以及DDL语句的使用方法,本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询,下面我们以最常用的员工示例数据库为准,详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接:https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程
2401_85194651
java maven
首先就是技术框架:后端:Java+SpringBoot数据库:MySQL前端:Vue.js数据库连接:JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress
lissettecarlr
1安装nginx网上安装方式很多,这就就直接用apt-get了apt-getinstallnginx不用启动啥,然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源,在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化
xiaoli8748_软件开发
系统架构 系统架构 负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了,最后再来聊一下关于Nginx的性能优化,主要就简单说说收益最高的几个优化项,在这块就不再展开叙述了,毕竟影响性能都有多方面原因导致的,比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等,对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一:打开长连接配置通常Nginx作为代理服务,负责分发客户端的请求,那么建议开启H
【RabbitMQ 项目】服务端:数据管理模块之绑定管理
月夜星辉雪
rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字:交换机的路由交换算法中会用到没有是否持久化的标志,因为绑定是否持久化取决于交换机和队列是否持久化,只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子,两端连接着交换机和队列,当一方不存在,它就没有存在的必要了定义绑定持久化类构造函数:如果数据库文件不存在则创建,打开数据库,创建binding_table插入
计算机毕业设计PHP仓储综合管理系统(源码+程序+VUE+lw+部署)
java毕设程序源码王哥
php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置:phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术:原生PHP++Vue等等组成,B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境:最好是小皮phpstudy最新版,我们在这个版本上开发的。其他版本理论上也可以。2.开发
3.增删改查--连接查询
问女何所忆
关系型数据库的一个特点就是,多张表之间存在关系,以致于我们可以连接多张表进行查询操作,所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种,交叉连接、内连接和外连接,我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段,它简单表现为两张表的笛卡尔积形式,具体例子:如果你没学过数学中的笛卡尔积概念,你可以这样简单的理解这里的交叉连接:两张表的交叉连接就是一个连接合并的过程,T1表中
docker from指令的含义_多个FROM-含义
weixin_39722188
docker from指令的含义
小编典典什么是基本图片?一组文件,加上EXPOSE端口ENTRYPOINT和CMD。您可以添加文件并基于该基础图像构建新图像,Dockerfile并以FROM指令开头:后面提到的图像FROM是新图像的“基础图像”。这是否意味着如果我neo4j/neo4j在FROM指令中声明,则在运行映像时,neo数据库将自动运行并且可在端口7474的容器中使用?仅当您不覆盖CMD和时ENTRYPOINT。但是图像
Redis:缓存击穿
我的程序快快跑啊
缓存 redis java
缓存击穿(热点key):部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库,造成巨大压力1.互斥锁:可以保证强一致性线程一:未命中之后,获取互斥锁,再查询数据库重建缓存,写入缓存,释放锁线程二:查询未命中,未获得锁(已由线程一获得),等待一会,缓存命中互斥锁实现方式:redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行,以此来实现互
mysql学习教程,从入门到精通,TOP 和MySQL LIMIT 子句(15)
知识分享小能手
大数据 数据库 MySQL mysql 学习 oracle 数据库 开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中,不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中,而LIMIT子句则主要用于MySQL、PostgreSQL(通过LIMIT/OFFSET语法)、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句(SQLServer和Access)1.1
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your
†徐先森®
Oracle数据库 Web相关 错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
Redis 有哪些危险命令?如何防范?
花小疯
redis 缓存 数据库 危险命令 大数据
Redis有哪些危险命令?Redis的危险命令主要有以下几个:1.keys客户端可查询出所有存在的键。2.flushdb删除Redis中当前所在数据库中的所有记录,并且此命令从不会执行失败。3.flushall删除Redis中所有数据库中的所有记录,不止是当前所在数据库,并且此命令从不会执行失败。4.config客户端可修改Redis配置。怎么禁用和重命名危险命令?看下redis.conf默认配置
【Golang】 Golang 的 GORM 库中的 Rows 函数
不爱洗脚的小滕
golang 开发语言 后端
文章目录前言一、Rows函数解释二、代码实现三、总结前言在使用Go语言进行数据库操作时,GORM(GoObject-RelationalMapping)库是一个常用的工具。它提供了一种简洁和强大的方式来处理数据库操作。本文将介绍GORM库中的Rows函数,这是一个用于执行原生SQL查询并返回结果的函数。一、Rows函数解释在GORM库中,Rows函数用于执行原生SQL查询并返回*sql.Rows结
接口测试如何设计测试用例
李蕴Ronnie
接口测试用例设计方式针对每个必填参数,都设计一条参数为空的测试用例必填参数不存在传的参数值在数据库中不存在添加数据接口,传入已有的数据重复添加编辑数据接口,各个字段分别编辑,合并编辑参数数据类型限制,针对每个参数设计一条参数值类型不符合的逆向用例参数自身取值范围,针对所有参数,设计一条每个参数值在取值范围内最大值的正向测试用例是否满足前提条件(token、headers),几个前提条件几条用例针对
Hadoop架构
henan程序媛
hadoop 大数据 分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代,数以万计用户的互联网服务时时刻刻都在产生大量的交互,要处理的数据量实在是太大了,以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现,在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合,
非关系型数据库
天秤-white
nosql
一、为什么要用Nosql1.单机MySQL的时代。一个基本的网站访问量一般不会太大,单个数据库完全足够。那时候更多使用的静态网页html,服务器根本没有太大压力。这时候网站的瓶颈是什么?-数据量如果太大,一个机器放不下。-数据量太大需要建立数据的索引(B+Tree),一个服务器内存放不下。-访问量读写混合,一个服务器承受不了。2.memcached缓存+MySQL+垂直拆分(读写分离)。网站80%
六、全局锁和表锁:给表加个字段怎么有这么多阻碍
nieniemin
数据库锁设计的初衷是处理并发问题。作为多用户共享的资源,当出现并发访问的时候,数据库需要合理地控制资源的访问规则。而锁就是用来实现这些访问规则的重要数据结构。根据加锁的范围,MySQL里面的锁大致可以分成全局锁、表级锁和行锁三类。6.1全局锁全局锁就是对整个数据库实例加锁。MySQL提供了一个加全局读锁的方法,命令是Flushtableswithreadlock(FTWRL)。当你需要让整个库处于
集合框架
天子之骄
java 数据结构 集合框架
集合框架
集合框架可以理解为一个容器,该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。
从本质上来说,Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。
简单介绍:
Collection接口是最基本的接口,它定义了List和Set,List又定义了LinkLi
Table Driven(表驱动)方法实例
bijian1013
java enum Table Driven 表驱动
实例一:
/**
* 驾驶人年龄段
* 保险行业,会对驾驶人的年龄做年龄段的区分判断
* 驾驶人年龄段:01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞)
*/
public class AgePeriodTest {
//if...el
Jquery 总结
cuishikuan
java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如:$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值,表示某个DOM元素(第二个参数)是否为另一个DOM元素(第一个参数)的下级元素。如:$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出
麦田的设计者
java 面向对象 面向过程
面向对象中,一切都是由对象展开的,组织代码,封装数据。
在台湾面向对象被翻译为了面向物件编程,这充分说明了,这种编程强调实体。
下面就结合编程语言的发展史,聊一聊面向过程和面向对象。
c语言由贝尔实
linux网口绑定
被触发
linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4,为了提高网络的可靠性配置双网卡绑定。
一、环境描述
我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡,通过ifconfig -a命令看到eth0和eth1两张网卡。
二、双网卡绑定步骤:
2.1 修改/etc/sysconfig/network
XML基础语法
肆无忌惮_
xml
一、什么是XML?
XML全称是Extensible Markup Language,可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义,你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。
二、为什么学习XML?
用来解决程序间数据传输的格式问题
做配置文件
充当小型数据库
三、XML与HTM
为网页添加自己喜欢的字体
知了ing
字体 秒表 css
@font-face {
font-family: miaobiao;//定义字体名字
font-style: normal;
font-weight: 400;
src: url('font/DS-DIGI-e.eot');//字体文件
}
使用:
<label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市
矮蛋蛋
redis
原文地址:
http://www.tuicool.com/articles/BrURbqV
需求
根据IP找到对应的城市
原来的解决方案
oracle表(ip_country):
查询IP对应的城市:
1.把a.b.c.d这样格式的IP转为一个数字,例如为把210.21.224.34转为3524648994
2. select city from ip_
输入两个整数, 计算百分比
alleni123
java
public static String getPercent(int x, int total){
double result=(x*1.0)/(total*1.0);
System.out.println(result);
DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言
百合不是茶
java 移动开发
对于一个从没有接触过计算机语言的人来说,一上来就学面向对象,就算是心里上面接受的了,灵魂我觉得也应该是跟不上的,学不好是很正常的现象,计算机语言老师讲的再多,你在课堂上面跟着老师听的再多,我觉得你应该还是学不会的,最主要的原因是你根本没有想过该怎么来学习计算机编程语言,记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取,一个刚到大学的就能够去和
linux下tomcat开机自启动
bijian1013
tomcat
方法一:
修改Tomcat/bin/startup.sh 为:
export JAVA_HOME=/home/java1.6.0_27
export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:.
export PATH=$JAVA_HOME/bin:$PATH
export CATALINA_H
spring aop实例
bijian1013
java spring AOP
1.AdviceMethods.java
package com.bijian.study.spring.aop.schema;
public class AdviceMethods {
public void preGreeting() {
System.out.println("--how are you!--");
}
}
2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization
bit1129
serialization
enableComplexMapKeySerialization配置项的含义
Gson在序列化Map时,默认情况下,是调用Key的toString方法得到它的JSON字符串的Key,对于简单类型和字符串类型,这没有问题,但是对于复杂数据对象,如果对象没有覆写toString方法,那么默认的toString方法将得到这个对象的Hash地址。
GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题
bit1129
Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别:
1. At most once,数据最多只能接受一次,有可能接收不到
2. At least once, 数据至少接受一次,有可能重复接收
3. Exactly once 数据保证被处理并且只被处理一次,
具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本
ronin47
#!/bin/bash
cat ports |while read line
do#nc -z -w 10 $line
nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then
echo $line:ok
else
echo $line:fail
fi
done
这里的ports 既可以是文件
java-2.设计包含min函数的栈
bylijinnan
java
具体思路参见:http://zhedahht.blog.163.com/blog/static/25411174200712895228171/
import java.util.ArrayList;
import java.util.List;
public class MinStack {
//maybe we can use origin array rathe
Netty源码学习-ChannelHandler
bylijinnan
java netty
一般来说,“有状态”的ChannelHandler不应该是“共享”的,“无状态”的ChannelHandler则可“共享”
例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是
因为每一次调用decode方法时,可能数据未接收完全(incomplete),
它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据,是“有状态”的
p
java生成随机数
cngolon
java
方法一:
/**
* 生成随机数
* @author
[email protected]
* @return
*/
public synchronized static String getChargeSequenceNum(String pre){
StringBuffer sequenceNum = new StringBuffer();
Date dateTime = new D
POI读写海量数据
ctrain
海量数据
import java.io.FileOutputStream;
import java.io.OutputStream;
import org.apache.poi.xssf.streaming.SXSSFRow;
import org.apache.poi.xssf.streaming.SXSSFSheet;
import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用
daizj
mysql date_format 日期格式转换 日期格式化
日期转换函数的详细使用说明
DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验
dcj3sjt126com
程序员
在中国有很多人都认为IT行为是吃青春饭的,如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的,在下从事.NET及JAVA方面的开发的也有8年的时间了,在这里在下想凭借自己的亲身经历,与大家一起探讨一下。
明确入行的目的
很多人干IT这一行都冲着“收入高”这一点的,因为只要学会一点HTML, DIV+CSS,要做一个页面开发人员并不是一件难事,而且做一个页面开发人员更容
android欢迎界面淡入淡出效果
dcj3sjt126com
android
很多Android应用一开始都会有一个欢迎界面,淡入淡出效果也是用得非常多的,下面来实现一下。
主要代码如下:
package com.myaibang.activity;
import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令
eksliang
tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693
linux中常见压缩文件的拓展名
*.gz gzip程序压缩的文件
*.bz2 bzip程序压缩的文件
*.tar tar程序打包的数据,没有经过压缩
*.tar.gz tar程序打包后,并经过gzip程序压缩
*.tar.bz2 tar程序打包后,并经过bzip程序压缩
*.zi
Android 应用程序发送shell命令
gqdy365
android
项目中需要直接在APP中通过发送shell指令来控制lcd灯,其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP,APP调用就可以控制了,这是正规流程,但我们项目的方案商用的mtk方案,方案公司又没人会改,只调好了驱动,让应用程序自己实现灯的控制,这不蛋疼嘛!!!!
发就发吧!
一、关于shell指令:
我们知道,shell指令是Linux里面带的
java 无损读取文本文件
hw1287789687
读取文件 无损读取 读取文本文件 charset
java 如何无损读取文本文件呢?
以下是有损的
@Deprecated
public static String getFullContent(File file, String charset) {
BufferedReader reader = null;
if (!file.exists()) {
System.out.println("getFull
Firebase 相关文章索引
justjavac
firebase
Awesome Firebase
最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野,于是我做了这个 github 项目。
Firebase 是一个数据同步的云服务,不同于 Dropbox 的「文件」,Firebase 同步的是「数据」,服务对象是网站开发者,帮助他们开发具有「实时」(Real-Time)特性的应用。
开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点
lx.asymmetric
C++ 笔记
1.c++面向对象的三个特性:封装性,继承性以及多态性。
2.标识符的命名规则:由字母和下划线开头,同时由字母、数字或下划线组成;不能与系统关键字重名。
3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。
4.运算符按其功能开以分为六类:算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。
&n
java bean和xml相互转换
q821424508
java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号
做的过程中想找个java bean转xml的工具,找了几个用着不知道是配置不好还是怎么回事,都会有一些问题,
然后脑子一热谢了一个javabean和xml的转换的工具里,自己用着还行,虽然有一些约束吧 ,
还是贴出来记录一下
顺便你提一下下,这个转换工具支持属性为集合、数组和非基本属性的对象。
packag
C 语言初级 位运算
1140566087
位运算 c
第十章 位运算 1、位运算对象只能是整形或字符型数据,在VC6.0中int型数据占4个字节 2、位运算符: 运算符 作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或 他们的优先级从高到低; 3、位运算符的运算功能: a、按位取反: ~01001101 = 101
14点睛Spring4.1-脚本编程
wiselyman
spring4
14.1 Scripting脚本编程
脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行;
如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦;
如果我们的应用不允许重启,这在现实的情况中也是很常见的;
在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean;
spring支持脚本