田同学

Apache Hudi 使用文件聚类功能 (Clustering) 解决小文件过多的问题

Hudi 测试：批处理后文件据类再接流

Written By XinyaoTian

本文档详细阐述了在 “批处理后，流处理之前” 进行文件 Clustering 操作的方法。该方法可以将众多小文件合并成数量极少的大文件，从而防止过多小文件的产生。

在批处理结束后进行 Clustering 主要涉及如下几个步骤，它们主要都是通过 spark-submit 命令完成的：

制定 Clustering 计划，找到

批处理数据结束

首先用 bulk_insert 方式运行批处理任务。注意下面的操作都是在批处理任务完成后，接流之前进行。

查看表相关的 hdfs，可以发现由于使用了 bulk_insert 的方式写入数据，导致文件数量非常多，而每个文件的 Size 非常小。
我们希望将每个分区的1000多个小文件聚合成几个大文件，以免造成不必要的查询和系统维护开销。

[hadoop@p0-tklfrna-tklrna-device02 hudi_clustering]$ hdfs dfs -count /flk_hudi/chdrpf_hudi_test03/*
           7            7           32637997 /flk_hudi/chdrpf_hudi_test03/.hoodie
           1         1067          571117942 /flk_hudi/chdrpf_hudi_test03/1
           1         1071          716513820 /flk_hudi/chdrpf_hudi_test03/2
           1         1072          644997032 /flk_hudi/chdrpf_hudi_test03/3
           1         1072          507397985 /flk_hudi/chdrpf_hudi_test03/4
           1         1069          730774472 /flk_hudi/chdrpf_hudi_test03/5
           1         1067          586561261 /flk_hudi/chdrpf_hudi_test03/6
           1         1063          557377359 /flk_hudi/chdrpf_hudi_test03/7
           1         1070          483416155 /flk_hudi/chdrpf_hudi_test03/8
           1         1071          587965407 /flk_hudi/chdrpf_hudi_test03/A
           1         1071          570651877 /flk_hudi/chdrpf_hudi_test03/B
           1         1068          796163049 /flk_hudi/chdrpf_hudi_test03/C
           1         1064          732633320 /flk_hudi/chdrpf_hudi_test03/D
           1         1067          524777141 /flk_hudi/chdrpf_hudi_test03/E
           1         1070          550302848 /flk_hudi/chdrpf_hudi_test03/F
           1         1076          540059544 /flk_hudi/chdrpf_hudi_test03/G
           1         1071          590094172 /flk_hudi/chdrpf_hudi_test03/H
           1         1076          505755100 /flk_hudi/chdrpf_hudi_test03/I
           1         1068          606771875 /flk_hudi/chdrpf_hudi_test03/J
           1         1068          495261290 /flk_hudi/chdrpf_hudi_test03/K
           1         1067          516964732 /flk_hudi/chdrpf_hudi_test03/L
           1         1060          482056347 /flk_hudi/chdrpf_hudi_test03/M
           1         1054          607625266 /flk_hudi/chdrpf_hudi_test03/N
           1         1077          551989638 /flk_hudi/chdrpf_hudi_test03/O
           1         1076          590537140 /flk_hudi/chdrpf_hudi_test03/P
           1         1069          536362956 /flk_hudi/chdrpf_hudi_test03/Q
           1         1072          559723804 /flk_hudi/chdrpf_hudi_test03/R
           1         1067          546042696 /flk_hudi/chdrpf_hudi_test03/S
           1         1059          528438508 /flk_hudi/chdrpf_hudi_test03/T
           1         1063          518288413 /flk_hudi/chdrpf_hudi_test03/U
           1         1070          543146873 /flk_hudi/chdrpf_hudi_test03/V
           1         1066          532588113 /flk_hudi/chdrpf_hudi_test03/W
           1         1069          494606809 /flk_hudi/chdrpf_hudi_test03/X
           1         1079          527128056 /flk_hudi/chdrpf_hudi_test03/Y
           1         1068          477378497 /flk_hudi/chdrpf_hudi_test03/Z
           1         1075          471848267 /flk_hudi/chdrpf_hudi_test03/a

查看当前 hdfs 路径下的文件个数。可以发现由于 bulk_insert 导致小文件非常之多，这会显著影响查询的性能 (一次查询可能要做几千个 IO 操作)。

[hadoop@p0-tklfrna-tklrna-device02 hudi_clustering]$ hdfs dfs -count /flk_hudi/chdrpf_hudi_test03/
          43        37452        22269590565 /flk_hudi/chdrpf_hudi_test03

Clustering

配置清理策略

使用最简配置方法如下：

[hadoop@p0-tklfrna-tklrna-device02 hudi_clustering]$ cat /home/hadoop/hudi_clustering/clusteringjob.properties
hoodie.clustering.inline.max.commits=2
hoodie.clustering.plan.strategy.max.num.groups=40

添加高级配置项。关于如何详细配置可以参考 Hudi 官方文档

[hadoop@p0-tklfrna-tklrna-device02 ~]$ cat /home/hadoop/hudi_clustering/clusteringjob.properties
hoodie.clustering.inline=true
hoodie.clustering.inline.max.commits=2
hoodie.clustering.plan.strategy.max.num.groups=40
hoodie.clustering.plan.strategy.target.file.max.bytes=1073741824
hoodie.clustering.plan.strategy.max.bytes.per.group=2147483648
hoodie.clustering.plan.strategy.small.file.limit=629145600

Schedule

指定 Clustering 计划。计划制定完毕后 Hudi 对应 hdfs 的 Timeline 中会出现相应时间戳，以供执行计划。

spark-submit \
--master yarn \
--class org.apache.hudi.utilities.HoodieClusteringJob \
hdfs://nameservice1/utility_jars/hudi-utilities-bundle_2.12-0.10.0.jar \
--schedule \
--base-path hdfs://nameservice1/flk_hudi/chdrpf_hudi_test03 \
--table-name chdrpf_hudi_test03 \
--props file:///home/hadoop/hudi_clustering/clusteringjob.properties \
--spark-memory 16g \
> /home/hadoop/hudi_clustering/clusteringjob.log 2>&1

查看 Hdfs 中的 Hudi 的 Timeline 获取时间戳。文件后缀为 replacecommit.requested 的时间戳即为我们需要的时间戳。复制我们需要的 20220826105913373，以便下一步粘贴。

[hadoop@p0-tklfrna-tklrna-device02 ~]$ hdfs dfs -ls /flk_hudi/chdrpf_hudi_test03/.hoodie/
Found 407 items
drwxr-xr-x   - hadoop supergroup          0 2022-08-26 10:10 /flk_hudi/chdrpf_hudi_test03/.hoodie/.aux
drwxr-xr-x   - hadoop supergroup          0 2022-08-26 14:53 /flk_hudi/chdrpf_hudi_test03/.hoodie/.temp
-rw-r--r--   3 hadoop supergroup   18596070 2022-08-26 10:14 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826101036547.commit
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 10:10 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826101036547.commit.requested
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 10:10 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826101036547.inflight
-rw-r--r--   3 hadoop supergroup   14041389 2022-08-26 10:16 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826101404432.commit
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 10:14 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826101404432.commit.requested
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 10:14 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826101404432.inflight
...
-rw-r--r--   3 hadoop supergroup    5685565 2022-08-26 10:59 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826105913373.replacecommit.requested
...

Execute

Clustering 执行需要使用刚才的时间戳配置 --instant-time 20220826105913373 于命令中即可执行。

spark-submit \
--master yarn \
--class org.apache.hudi.utilities.HoodieClusteringJob \
hdfs://nameservice1/utility_jars/hudi-utilities-bundle_2.12-0.10.0.jar \
--instant-time 20220826105913373 \
--base-path hdfs://nameservice1/flk_hudi/chdrpf_hudi_test03 \
--table-name chdrpf_hudi_test03 \
--props file:///home/hadoop/hudi_clustering/clusteringjob.properties \
--spark-memory 16g \
> /home/hadoop/hudi_clustering/clusteringjob_execution.log 2>&1

文件聚类完毕后

[hadoop@p0-tklfrna-tklrna-device02 hudi_clustering]$ hdfs dfs -count /flk_hudi/chdrpf_hudi_test03/*
           7           10           39759457 /flk_hudi/chdrpf_hudi_test03/.hoodie
           1         1068          644693330 /flk_hudi/chdrpf_hudi_test03/1
           1         1072          912384991 /flk_hudi/chdrpf_hudi_test03/2
           1         1073          783040567 /flk_hudi/chdrpf_hudi_test03/3
           1         1073          535431665 /flk_hudi/chdrpf_hudi_test03/4
           1         1070          938545286 /flk_hudi/chdrpf_hudi_test03/5
           1         1068          676230669 /flk_hudi/chdrpf_hudi_test03/6
           1         1064          625387487 /flk_hudi/chdrpf_hudi_test03/7
           1         1071          494572949 /flk_hudi/chdrpf_hudi_test03/8
           1         1072          675599389 /flk_hudi/chdrpf_hudi_test03/A
           1         1072          643710911 /flk_hudi/chdrpf_hudi_test03/B
           1         1069         1056860522 /flk_hudi/chdrpf_hudi_test03/C
           1         1065          940690081 /flk_hudi/chdrpf_hudi_test03/D
           1         1068          563929957 /flk_hudi/chdrpf_hudi_test03/E
           1         1071          606406555 /flk_hudi/chdrpf_hudi_test03/F
           1         1077          589463777 /flk_hudi/chdrpf_hudi_test03/G
           1         1072          682564783 /flk_hudi/chdrpf_hudi_test03/H
           1         1077          529816271 /flk_hudi/chdrpf_hudi_test03/I
           1         1069          712917512 /flk_hudi/chdrpf_hudi_test03/J
           1         1069          514668751 /flk_hudi/chdrpf_hudi_test03/K
           1         1068          550874973 /flk_hudi/chdrpf_hudi_test03/L
           1         1061          495250431 /flk_hudi/chdrpf_hudi_test03/M
           1         1055          716887761 /flk_hudi/chdrpf_hudi_test03/N
           1         1078          612144859 /flk_hudi/chdrpf_hudi_test03/O
           1         1077          679350316 /flk_hudi/chdrpf_hudi_test03/P
           1         1070          586176818 /flk_hudi/chdrpf_hudi_test03/Q
           1         1073          625760986 /flk_hudi/chdrpf_hudi_test03/R
           1         1068          603042997 /flk_hudi/chdrpf_hudi_test03/S
           1         1060          576062292 /flk_hudi/chdrpf_hudi_test03/T
           1         1064          555764103 /flk_hudi/chdrpf_hudi_test03/U
           1         1071          598050377 /flk_hudi/chdrpf_hudi_test03/V
           1         1066          532588113 /flk_hudi/chdrpf_hudi_test03/W
           1         1069          494606809 /flk_hudi/chdrpf_hudi_test03/X
           1         1079          527128056 /flk_hudi/chdrpf_hudi_test03/Y
           1         1068          477378497 /flk_hudi/chdrpf_hudi_test03/Z
           1         1075          471848267 /flk_hudi/chdrpf_hudi_test03/a

运行清理

在进行完 Clustering 操作后，很多小文件都被合并进大文件了。由于 Hudi 不会主动删除过期和不必要的文件，因此需要利用手动清理策略来对过期文件进行清理删除。

清理策略的配置文件

[hadoop@p0-tklfrna-tklrna-device02 hudi_clustering]$ cat /home/hadoop/hudi_clustering/hudi_cleaning.properties 
# hudi_cleaning.properties

# When enabled, the cleaner table service is invoked immediately after each commit, to delete older file slices
hoodie.clean.automatic=true

# Only applies when hoodie.clean.automatic is turned on. 
# When turned on runs cleaner async with writing, which can speed up overall write performance.
hoodie.clean.async=true

# # This policy has the effect of keeping N number of file versions irrespective of time. 
# # This policy is useful when it is known how many MAX versions of the file does one want to keep at any given time.
# # hoodie.cleaner.policy=KEEP_LATEST_COMMITS
hoodie.cleaner.policy=KEEP_LATEST_COMMITS

# # Number of commits to retain, without cleaning.
# # This will be retained for num_of_commits * time_between_commits (scheduled).
# # hoodie.cleaner.commits.retained=3
# When KEEP_LATEST_FILE_VERSIONS cleaning policy is used, 
# the minimum number of file slices to retain in each file group, during cleaning.
hoodie.cleaner.commits.retained=1

# When set to true, cleaner also deletes the bootstrap base file when it's skeleton base file is cleaned.
hoodie.cleaner.delete.bootstrap.base.file=false
# Only if the log file size is greater than the threshold in bytes, the file group will be compacted.

hoodie.commits.archival.batch=60

hoodie.archive.merge.small.file.limit.bytes=104857600
# When set to true, compaction service is triggered after each write. 
# While being simpler operationally, this adds extra latency on the write path.
hoodie.compact.inline=false

hoodie.parquet.small.file.limit=124857600

hoodie.cleaner.parallelism=800

hoodie.cleaner.incremental.mode=true

# Archiving service moves older entries from timeline into an archived log after each write, 
# to keep the metadata overhead constant, even as the table size grows
hoodie.keep.max.commits=3
hoodie.keep.min.commits=2

利用命令执行清理策略：

spark-submit \
--class org.apache.hudi.utilities.HoodieCleaner \
hdfs://nameservice1/utility_jars/hudi-utilities-bundle_2.12-0.10.0.jar \
--props file:///home/hadoop/hudi_clustering/hudi_cleaning.properties \
--target-base-path hdfs://nameservice1/flk_hudi/chdrpf_hudi_test03 \
> /home/hadoop/hudi_clustering/clusteringjob_cleaning.log 2>&1

接流处理任务

此时，可以将流处理任务接至该 Hudi 表中。文件清理的效果会在 Hudi 接流后显现。

清理后文件个数

[hadoop@p0-tklfrna-tklrna-device02 hudi_clustering]$ hdfs dfs -count /flk_hudi/chdrpf_hudi_test03/*          39         2818           61047630 /flk_hudi/chdrpf_hudi_test03/.hoodie
           1            5          295730057 /flk_hudi/chdrpf_hudi_test03/1
           1            5          581449403 /flk_hudi/chdrpf_hudi_test03/2
           1            5          541564433 /flk_hudi/chdrpf_hudi_test03/3
           1            5          113526185 /flk_hudi/chdrpf_hudi_test03/4
           1            5          819123981 /flk_hudi/chdrpf_hudi_test03/5
           1            5          361258893 /flk_hudi/chdrpf_hudi_test03/6
           1            4          205559110 /flk_hudi/chdrpf_hudi_test03/7
           1            4           33721101 /flk_hudi/chdrpf_hudi_test03/8
           1            5          352884732 /flk_hudi/chdrpf_hudi_test03/A
           1            5          294248033 /flk_hudi/chdrpf_hudi_test03/B
           1            5          771533591 /flk_hudi/chdrpf_hudi_test03/C
           1            5          614827884 /flk_hudi/chdrpf_hudi_test03/D
           1            5          157676833 /flk_hudi/chdrpf_hudi_test03/E
           1            5          226004511 /flk_hudi/chdrpf_hudi_test03/F
           1            5          198656601 /flk_hudi/chdrpf_hudi_test03/G
           1            5          372307018 /flk_hudi/chdrpf_hudi_test03/H
           1            5           97041611 /flk_hudi/chdrpf_hudi_test03/I
           1            5          427390894 /flk_hudi/chdrpf_hudi_test03/J
           1            5           78296341 /flk_hudi/chdrpf_hudi_test03/K
           1            5          136428423 /flk_hudi/chdrpf_hudi_test03/L
           1            5           53218521 /flk_hudi/chdrpf_hudi_test03/M
           1            5          439899957 /flk_hudi/chdrpf_hudi_test03/N
           1            5          242278011 /flk_hudi/chdrpf_hudi_test03/O
           1            5          357549763 /flk_hudi/chdrpf_hudi_test03/P
           1            5          200702230 /flk_hudi/chdrpf_hudi_test03/Q
           1            5          265952714 /flk_hudi/chdrpf_hudi_test03/R
           1            5          229783530 /flk_hudi/chdrpf_hudi_test03/S
           1            5          191817537 /flk_hudi/chdrpf_hudi_test03/T
           1            5          151138760 /flk_hudi/chdrpf_hudi_test03/U
           1            5          221236895 /flk_hudi/chdrpf_hudi_test03/V
           1         4112         2060894265 /flk_hudi/chdrpf_hudi_test03/W
           1         4117         1910706738 /flk_hudi/chdrpf_hudi_test03/X
           1         4169         2042792364 /flk_hudi/chdrpf_hudi_test03/Y
           1         2221          995253322 /flk_hudi/chdrpf_hudi_test03/Z
           1         1075          472877437 /flk_hudi/chdrpf_hudi_test03/a

可以看到每个分区内的小文件已经被聚合成大文件，并随着流数据的进入，文件数量的增长速度也在合理范围内。

Ps: 我们把后几个分区作为对照组没有进行文件聚合。可以通过在 Clustering 的配置文件中调大 hoodie.clustering.plan.strategy.max.num.groups=30 的值来增加
SparkJob 的 parallelism 从而把所有分区涵盖进行，进行文件聚合。

[hadoop@p0-tklfrna-tklrna-device02 hudi_clustering]$ hdfs dfs -count /flk_hudi/chdrpf_hudi_test03/
          76        19050        17396389394 /flk_hudi/chdrpf_hudi_test03

Timeline 观察

20220826105913373.replacecommit 表示进行完毕聚类操作的时刻
20220826114108591.clean 表示进行完毕清理操作的时刻
20220826114317026.commit 表示进行完毕新数据写入操作的时刻

[hadoop@p0-tklfrna-tklrna-device02 hudi_clustering]$ hdfs dfs -ls /flk_hudi/chdrpf_hudi_test03/.hoodie
Found 30 items
drwxr-xr-x   - hadoop supergroup          0 2022-08-26 10:10 /flk_hudi/chdrpf_hudi_test03/.hoodie/.aux
drwxr-xr-x   - hadoop supergroup          0 2022-08-26 11:46 /flk_hudi/chdrpf_hudi_test03/.hoodie/.temp
-rw-r--r--   3 hadoop supergroup   18596070 2022-08-26 10:14 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826101036547.commit
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 10:10 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826101036547.commit.requested
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 10:10 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826101036547.inflight
-rw-r--r--   3 hadoop supergroup   14041389 2022-08-26 10:16 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826101404432.commit
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 10:14 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826101404432.commit.requested
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 10:14 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826101404432.inflight
-rw-r--r--   3 hadoop supergroup    1435895 2022-08-26 11:09 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826105913373.replacecommit
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 11:03 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826105913373.replacecommit.inflight
-rw-r--r--   3 hadoop supergroup    5685565 2022-08-26 10:59 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826105913373.replacecommit.requested
-rw-r--r--   3 hadoop supergroup    1009885 2022-08-26 11:37 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826113342082.commit
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 11:33 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826113342082.commit.requested
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 11:33 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826113342082.inflight
-rw-r--r--   3 hadoop supergroup    3811303 2022-08-26 11:40 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826113740364.commit
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 11:37 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826113740364.commit.requested
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 11:37 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826113740364.inflight
-rw-r--r--   3 hadoop supergroup    2940587 2022-08-26 11:43 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826114026452.commit
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 11:40 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826114026452.commit.requested
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 11:40 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826114026452.inflight
-rw-r--r--   3 hadoop supergroup    5005100 2022-08-26 11:41 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826114108591.clean
-rw-r--r--   3 hadoop supergroup    4260649 2022-08-26 11:41 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826114108591.clean.inflight
-rw-r--r--   3 hadoop supergroup    4260649 2022-08-26 11:41 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826114108591.clean.requested
-rw-r--r--   3 hadoop supergroup    2867542 2022-08-26 11:46 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826114317026.commit
-rw-r--r--   3 hadoop supergroup          0 2022-08-26 11:43 /flk_hudi/chdrpf_hudi_test03/.hoodie/20220826114317026.commit.requested

参考文献

Hudi Clustering Docs
Hudi RFC-19
Hudi Configuration

PDF转图片 JAVA JAVA派派 java PDF
前言以下是一个使用ApachePDFBox将PDF文件转换为图片的封装方法。这个方法将会把PDF的每一页转换为一张图片，并保存到指定的目录中。1.添加依赖首先，你需要在项目中添加PDFBox的依赖。如果你使用的是Maven，可以在pom.xml中添加以下依赖：org.apache.pdfboxpdfbox2.0.292.转换方法importorg.apache.pdfbox.pdmodel.PDD
Hadoop相关面试题努力的搬砖人. java 面试 hadoop
以下是150道Hadoop面试题及其详细回答，涵盖了Hadoop的基础知识、HDFS、MapReduce、YARN、HBase、Hive、Sqoop、Flume、ZooKeeper等多个方面，每道题目都尽量详细且简单易懂：Hadoop基础概念类1.什么是Hadoop？Hadoop是一个由Apache基金会开发的开源分布式计算框架，主要用于处理和存储大规模数据集。它提供了高容错性和高扩展性的分布式存
数据湖：Apache Iceberg在腾讯的探索和实践学而知之@ 数据库腾讯大数据 java 编程语言
摘要：今天分享的是ApacheIceberg在腾讯内部的探索和实践。本文结合腾讯大数据技术分享内容和2020全球软件开发大会分享内容进行整理，主要内容包括：1、数据湖技术概述2、ApacheIceberg的简介3、腾讯为什么选择ApacheIceberg4、腾讯看点万亿数据下的业务痛点5、ApacheIceberg在看点实践6、ApacheIceberg读写和删除ApacheIceberg新一代数
Apache Doris整合Iceberg + Flink CDC构建实时湖仓体的联邦查询分析架构 MfvShell apache flink 架构 Flink
随着大数据技术的迅猛发展，构建实时湖仓体并进行联邦查询分析成为了许多企业的迫切需求。在这篇文章中，我们将探讨如何利用ApacheDoris整合Iceberg和FlinkCDC来构建这样一个架构，并提供相应的源代码示例。简介实时湖仓体是一种灵活、可扩展的数据架构，结合了数据湖和数据仓库的优势。ApacheDoris是一款开源的分布式SQL引擎，专注于实时分析和查询。Iceberg是一种开放式表格格式
【Apache Storm】茉菇 apache storm 大数据
一、Storm简介1、概述官网地址：https://storm.apache.org/index.htmlApacheStorm是一个开源的、分布式的实时计算系统，专为处理流式数据而设计。它能够处理大量数据流并在极低的延迟下提供实时的结果。相比于传统的批处理系统，Storm具有处理无限数据流的能力，支持非常高的可扩展性和容错机制。Storm可以适用于多种编程语言，具有高度的灵活性。2、核心功能分布
深入探索 dubbo-rpc-jsonrpc：跨语言服务调用的高效桥梁郁铎舒
深入探索dubbo-rpc-jsonrpc：跨语言服务调用的高效桥梁dubbo-rpc-jsonrpcApacheDubbo-rpc-jsonrpc是一个用于ApacheDubbo的JSON-RPC协议实现项目。它提供了一个用于ApacheDubbo的JSON-RPC协议实现库和工具。适合用于在应用程序中处理分布式服务。项目地址:https://gitcode.com/gh_mirrors/dub
Apache storm 赵世炎 storm hadoop
Apachestorm是一个分布式的实时大数据处理系统。用于在容错和水平可拓展方法中处理大量数据。它是一个流数据框架，具有很高的摄取率，无状态。通过zk管理分布式环境和集群状态，并行地对实时数据执行各种操作。storm易于设置和操作，并且它保证每个消息将通过拓扑至少处理一次。基本上Hadoop和Storm框架用于分析大数据。两者互补，在某些方面有所不同。ApacheStorm执行除持久性之外的所有
Apache Storm实时流处理的核心技术 Hello.Reader 大数据 apache storm 大数据
1.引言ApacheStorm是一个开源的、分布式的实时计算系统，专为处理流式数据而设计。它能够处理大量数据流并在极低的延迟下提供实时的结果。相比于传统的批处理系统，Storm具有处理无限数据流的能力，支持非常高的可扩展性和容错机制。Storm可以适用于多种编程语言，具有高度的灵活性。1.1什么是ApacheStorm？ApacheStorm是一个流处理引擎，它可以持续处理不断到来的数据流（str
什么是Apache Avro？ maozexijr apache
什么是ApacheAvro？ApacheAvro是一个开源的数据序列化框架，主要用于高效的数据交换和存储。它由ApacheHadoop项目开发，广泛应用于大数据生态系统中（如Hadoop、Kafka等）。Avro提供了一种紧凑、快速的二进制数据格式，同时支持丰富的数据结构和模式演化。核心特性跨语言支持Avro支持多种编程语言（如Java、Python、C++、Go等），使得不同语言之间的数据交换变
Apache Storm：实时数据处理的闪电战 Aaron_945 Java apache storm 大数据
文章目录ApacheStorm原理拓扑结构数据流处理容错机制官网链接基础使用安装与配置编写拓扑提交与运行高级使用状态管理窗口操作多语言支持优点高吞吐量低延迟可扩展性容错性总结ApacheStorm是一个开源的分布式实时计算系统，它允许你以极高的吞吐量处理无界数据流。Storm被广泛用于实时分析、在线机器学习、连续计算等多种场景。本文将深入探讨ApacheStorm的原理、基础使用、高级特性及其优点
如何针对大Excel做文件读取？ F_windy excel
针对大Excel文件（如超过百万行）的读取，传统的一次性加载到内存的方式会导致内存溢出（OOM），需采用流式读取（Streaming）或分块读取（Chunk）的策略。以下是具体方案及优化建议：一、核心解决方案1.使用ApachePOI的SAX模式（事件驱动）适用场景：处理.xlsx文件（不支持.xls），逐行解析避免内存溢出。代码示例（Java）：importorg.apache.poi.open
ubuntu20.04系统安装zookeeper简单教程楼下创了电瓶车 zookeeper 分布式云原生
Ubuntu系统中安装和配置Zookeeper的完整指南ApacheZookeeper是一个开源的分布式协调服务，广泛用于分布式应用程序中管理配置、提供命名服务、分布式同步以及组服务等。在本教程中，我们将详细介绍如何在Ubuntu系统中安装Zookeeper，并进行相关配置，使其能够正常运行。环境准备在开始之前，请确保你的Ubuntu系统版本为18.04或更高版本。此外，Zookeeper依赖于J
ActiveMQ学习总结（10）——ActiveMQ采用Spring注解方式发送和监听一杯甜酒 ActiveMQ
对于ActiveMQ消息的发送，原声的api操作繁琐，而且如果不进行二次封装，打开关闭会话以及各种创建操作也是够够的了。那么，Spring提供了一个很方便的去收发消息的框架，springjms。整合Spring后，代码不仅变得非常优雅，而且易用性和扩展性更好。1.maven依赖org.apache.xbeanxbean-spring3.16org.springframeworkspring-jms
How Spark Read Sftp Files from Hadoop SFTP FileSystem IT•轩辕 Cloudy Computation spark hadoop 大数据
GradleDependenciesimplementation('org.apache.spark:spark-sql_2.13:3.5.3'){excludegroup:"org.apache.logging.log4j",module:"log4j-slf4j2-impl"}implementation('org.apache.hadoop:hadoop-common:3.3.4'){exc
爬虫基础 20岁30年经验的码农 1024程序员节
mavenpomorg.jsoupjsoup1.16.1org.apache.httpcomponentshttpcore4.4.16org.apache.httpcomponentshttpclient4.5.14commons-iocommons-io2.13.0====================================遍历网站内容爬取网站网址packagecom.xiaocao
Flink实践：通过Flink SQL进行SFTP文件的读写操作 kkk1622245 flink sql 大数据
在大数据处理领域，ApacheFlink出类拔萃，它是一个高性能、易扩展、用于处理有界和无界数据流的分布式处理引擎。FlinkSQL是ApacheFlink提供的一种声明式API，允许开发者以SQL的形式，轻松实现复杂的数据流和批处理分析。本文将重点探讨如何通过FlinkSQL来实现对SFTP文件的读写操作，这是在实际应用中经常遇到的一种场景。Flink与SFTP文件的读写在很多实际应用场景中，数
kafka详细介绍以及使用酷爱码经验分享 kafka 分布式
ApacheKafka是一个由Apache软件基金会开发的开源流式数据平台和消息系统。它被设计用于处理实时数据流，并能够支持高容错性、可伸缩性和可靠性。Kafka最初是由LinkedIn开发，并于2011年捐赠给Apache软件基金会。它现在被许多公司广泛应用于构建实时数据流架构和事件驱动型应用程序。Kafka提供了一种高性能、持久性的消息传递系统，通过将消息发布到主题（topic）和订阅这些主题
Shiro授权斗-匕 oracle 数据库
在Java安全领域，ApacheShiro以其强大的功能和灵活性备受开发者青睐。其中，授权机制是Shiro的核心功能之一，它确保了用户只能访问其被授权的资源。本文将深入探讨Shiro授权，涵盖静态和动态授权、权限、角色、隐式角色、显式角色、授权流程以及授权方式等方面。一、Shiro简介ApacheShiro是一个功能强大的Java安全框架，它提供了认证、授权、加密和会话管理等功能。Shiro的设计
Kafka 同步机制关键点 2分钟讲明白大博士.J kafka
ApacheKafka通过副本同步机制来保证数据的高可用性和可靠性。Kafka的同步机制主要涉及以下几个核心概念：副本（Replication）Kafka的每个Partition都会有多个副本（Replica），分为：Leader副本：负责处理生产者和消费者的所有请求。Follower副本：仅从Leader同步数据，不直接处理请求。副本数由replication.factor参数配置。例如：rep
第七章Solr：企业级搜索应用 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
第七章Solr：企业级搜索应用1.背景介绍1.1搜索引擎的重要性在当今信息时代,数据量呈指数级增长,海量数据中蕴含着极其宝贵的信息和知识。然而,如何快速、准确地从大数据中检索出所需的信息,一直是企业和组织面临的巨大挑战。传统的数据库查询方式已经无法满足现代搜索需求,因此高效的搜索引擎应运而生。1.2什么是SolrApacheSolr是一个高性能、可扩展、云就绪的企业级搜索平台,由Apache软件基
Debezium系列之：使用Debezium采集oceanbase数据库快乐骑行^_^ debezium Debezium系列采集oceanbase数据库
Debezium系列之：使用Debezium采集oceanbase数据库一、oceanbase数据库二、安装OceanBase三、安装oblogproxy四、基于Docker的简单采集案例五、生产实际应用案例Debezium是一个开源的分布式平台，用于监控数据库变化和捕捉数据变动事件，并以事件流的形式导出到各种消费者。Debezium基于ApacheKafka实现，并支持多种数据库系统。一、oce
Spark 解析_spark.sparkContext.getConf().getAll() 闯闯桑 spark 大数据分布式
spark.sparkContext.getConf().getAll()是ApacheSpark中的一段代码，用于获取当前Spark应用程序的所有配置项及其值。以下是逐部分解释：代码分解：spark：这是一个SparkSession对象，它是Spark应用程序的入口点，用于与Spark集群进行交互。spark.sparkContext：sparkContext是Spark的核心组件，负责与集群通
Hadoop MapReduce 词频统计（WordCount）代码解析教程我不是少爷. Java基础 hadoop mapreduce 大数据
一、概述这是一个基于HadoopMapReduce框架实现的经典词频统计程序。程序会统计输入文本中每个单词出现的次数，并将结果输出到HDFS文件系统。二、代码结构packagecom.bigdata.wc;//Hadoop核心类库导入importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.Path;//数据类型定义
基于 easyExcel 3.1.5依赖的包实现动态表头动态表格内容善我 java java 服务器前端
1.需求：需要导出的EXCEL示例：2.依赖：com.alibabaeasyexcel3.1.53.工具类：packagecom.minex.web.device.utils;importcom.minex.web.device.entity.vo.ReadRecordsVO;importlombok.extern.slf4j.Slf4j;importorg.apache.poi.ss.userm
Tomcat 新手入门指南：从零开始掌握安装与配置超级小狗 tomcat java
Tomcat新手入门指南：从零开始掌握安装与配置一、Tomcat是什么？ApacheTomcat是一个开源的轻量级Web应用服务器，专为运行JavaServlet和JSP设计。它是初学JavaWeb开发的必备工具，也是企业级应用的常见选择。核心功能：处理HTTP请求、管理Servlet生命周期、支持动态网页渲染。适用场景：开发测试环境、中小型Web应用部署、微服务架构中的容器化组件。二、快速安装T
Apache Tomcat 新手入门指南：从安装到部署的全流程解析小志开发服务 apache tomcat java
ApacheTomcat作为一款轻量级的JavaServlet容器，被广泛应用于开发和运行基于Java的Web应用程序（如Servlet和JSP）。对于刚接触Tomcat的开发者来说，快速掌握其基本操作至关重要。本文将从零开始，详细介绍Tomcat的安装、配置、部署及常见问题的解决方法，助你轻松入门。第一部分：环境准备与安装1.确认JDK环境Tomcat依赖Java运行环境，因此需提前安装JDK8
Tomcat新手入门指南：从零开始搭建Web服务器 xiaoyu❅ java tomcat 前端服务器
目录一、Tomcat是什么？二、快速安装指南1.环境准备2.下载安装3.验证安装三、目录结构解析四、第一个Web应用部署1.创建标准目录结构2.编写测试JSP3.部署方式对比五、核心配置详解1.修改端口号2.配置虚拟主机3.JVM参数优化六、常用操作命令七、常见问题排查1.端口冲突2.应用热更新失败3.内存溢出八、最佳实践建议九、学习资源推荐一、Tomcat是什么？ApacheTomcat是一个开
介绍 Apache Spark 的基本概念和在大数据分析中的应用佛渡红尘 apache
ApacheSpark是一个开源的集群计算框架，最初由加州大学伯克利分校的AMPLab开发，用于大规模数据处理和分析。相比于传统的MapReduce框架，Spark具有更快的数据处理速度和更强大的计算能力。ApacheSpark的基本概念包括：弹性分布式数据集（RDD）：是Spark中基本的数据抽象，是一个可并行操作的分区记录集合。RDD可以在集群中的节点间进行分布式计算。转换（Transform
【C++】开源：brpc远程过程调用（RPC）配置与使用 DevFrank #c++开源库和框架 c++开源 rpc
★,°:.☆(￣▽￣)/$:.°★这篇文章主要介绍brpc远程过程调用（RPC）配置与使用。无专精则不能成，无涉猎则不能通。——梁启超欢迎来到我的博客，一起学习，共同进步。喜欢的朋友可以关注一下，下次更新不迷路文章目录:smirk:1.项目介绍:blush:2.环境配置:satisfied:3.使用说明1.项目介绍项目Github地址：https://github.com/apache/brpcb
Flume详解——介绍、部署与使用克里斯蒂亚诺罗纳尔多阿维罗 flume 大数据分布式
1.Flume简介ApacheFlume是一个专门用于高效地收集、聚合、传输大量日志数据的分布式、可靠的系统。它特别擅长将数据从各种数据源（如日志文件、消息队列等）传输到HDFS、HBase、Kafka等大数据存储系统。特点：可扩展：支持大规模数据传输，灵活扩展容错性：支持数据恢复和失败重试，确保数据不丢失多种数据源：支持日志文件、网络数据、HTTP请求、消息队列等多种来源流式处理：数据边收集边传
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默