过往记忆

这个公众号到底有没有好文章？我整理了300篇，觉得不好我跪榴莲！

花了6个小时，总算整理好了，嗯，榴莲，真香！

大数据成神之路

Spark/Kafka/Flink/ElasticSearch/Hadoop/Hbase/Hive/Yarn/Kylin/Redis/.../...大数据大神。

各大厂大数据实践

阿里巴巴

阿里巴巴大数据在高德地图上的应用

阿里架构总监一次讲透中台架构，13页PPT精华详解，建议收藏！

爱奇艺

爱奇艺在日志实时数据监控的探索与实践

基于 Apache Druid 的实时分析平台在爱奇艺的实践

日均处理万亿条数据，爱奇艺实时计算平台设计

爱奇艺大数据实时分析平台的建设与实践

爱奇艺海量数据实时分析架构的演进

小米

小米 MySQL 数据实时同步到大数据数仓的架构与实践

Kylin 在小米大数据中的应用

Kylin 迁移到 HBase 实践在小米的实践

支撑小米万亿级的消息队列架构与实践

马蜂窝

Kafka 集群在马蜂窝大数据平台的优化与应用扩展

马蜂窝实时计算平台的演进

网易

网易分布式数据库多活架构的演进与实践

美团

美团点评实时数仓实践

支撑美团万亿级数据中心的计算引擎架构演进

Apache Doris在美团外卖数仓中的应用实践

美团1万台 Hadoop 集群 YARN 的调优之路

美团 MySQL 数据实时同步到 Hive 的架构与实践

每天数百亿用户行为数据，美团点评怎么实现秒级转化分析？

eBay

Apache Flink 服务化在 eBay 的实践

Apache Spark 在eBay 的优化

Kylin on Kubernetes 在 eBay 的实践

3年从200个数据用户发展到6000人，eBay的大数据平台是如何做到的？

实战 | eBay PB级日志系统的存储方案实践

快手

Flink在快手实时多维分析场景的应用

Hadoop YARN 在快手的应用实践与技术演进之路

日均处理万亿数据！Flink在快手的应用实践与技术演进之路

快手 HBase 在千亿级用户特征数据分析中的应用与实践

SQL on Hadoop在快手大数据平台的实践与优化

银行

工行“去O”数据库选型与分布式架构设计

光大银行分布式实战：国内最大缴费平台的数据库架构转型

58

58同城 Elasticsearch 应用及平台建设实践

58同城宝实时数仓建设实践

58同城 HBase 平台建设实践

58全站用户行为数据仓库建设及实践

58同城离线计算平台设计与实践

Kylin 在 58 集团的实践和应用

58同城实时计算平台架构实践

海量日志分析平台在 58 集团的实践

贝壳

分布式图数据库在贝壳的应用实践

Uber

Uber 如何使用 Apache Hudi 支撑 PB 级数据湖

面对业务增长，Uber是如何扩展HDFS文件系统的

Uber 大数据平台的演进（2014~2019）

Apache Hudi: Uber 开源的大数据增量处理框架

趣头条

趣头条基于Flink+ClickHouse的实时数据分析平台

ClickHouse 在趣头条的实践

趣头条百 PB 规模 Hadoop 实践

使用 Spark 和 Delta Lake 构建近实时数据仓库实时平台在趣头条的建设实践

京东

京东 8000+ 台 Hadoop 集群平台化之路

京东大数据平台进化之路

日均5亿查询量的京东订单中心，为什么舍MySQL用ES?

京东HBase平台进化与演进

电商

跨境电商 Shopee 的实时数仓演进之路

字节跳动

YARN 在字节跳动的优化与实践

字节跳动 EB 级 HDFS 实践

Spark-SQL 在字节跳动的应用实践

Facebook

来自 Facebook 的 Spark 大作业调优经验

60TB 数据量的作业从 Hive 迁移到 Spark 在 Facebook 的实践

Apache Cassandra 在 Facebook 的应用

腾讯

QQ音乐PB级ClickHouse实时数据平台架构演进之路

千台 ElasticSearch 集群在腾讯的优化实践

支撑腾讯直播百亿请求的 Redis 集群是如何工作的

腾讯万亿级 Elasticsearch 技术解密

携程

数万实例数百TB数据量，携程Redis治理演进之路

每天十亿级数据更新，秒出查询结果，ClickHouse在携程酒店的应用

Apache Kylin 在携程的实践

Spark SQL在携程的实践经验分享

携程机票数据仓库建设之路

100亿+数据量，每天50W+查询，携程酒店数据智能平台实践

bilibili

bilibili 实时计算平台架构与实践

滴滴

滴滴ElasticSearch平台跨版本升级以及平台重构之路

HBase 不停机升级在滴滴的实践

Apache Flink在滴滴的应用与实践

滴滴Elasticsearch多集群架构实践

SQL 开发任务超 50% ！滴滴实时计算的演进与优化

Hadoop 2.7 不停服升级到 3.2 在滴滴的实践

有赞

有赞数据仓库实践之路

蘑菇街

蘑菇街千亿级消息Kafka上云实践

360

Apache Kafka 在 360 的深度实践

实时离线一体化系统在 360 的应用

菜鸟

菜鸟供应链实时数仓的架构演进及应用场景

一点资讯

Apache Kylin 在一点资讯的实践

唯品会

唯品会 1000+ 台 Hadoop 集群优化经验

日跑几十万作业，唯品会HDFS是如何优化的

斗鱼

斗鱼在线分析平台演进之路

雅虎

雅虎日本如何用 Pulsar 构建日均千亿的消息平台

微博

万亿级日访问量下，Redis在微博的9年优化历程

甜橙金融

甜橙金融如何利用 Apache Pulsar 在日均上亿的交易中抵御金融诈骗

百分点

百分点万亿级大数据平台的建设实践

网易

网易云音乐的消息队列改造之路

Spark & Alluxio在网易严选架构演进中的实践和探索

OPPO

基于 Flink SQL 构建实数据仓库在 OPPO 的实战

OPPO 离线数仓到实时数仓库的演进

Spark系列

Apache Spark 3.0.0 正式版终于发布了，重要特性全面解析
Spark SQL 物化视图技术原理与实践
面试必知的 Spark SQL 几种 Join 实现
如何使用 Spark 3.0 中新加的 Structured Streaming UI 来进行异常分析
Spark on K8S 的最佳实践和需要注意的坑
Spark + AI Summit North America 202006 高清 PPT 全部更新完
Apache Spark 3.0 中的向量化 IO
Spark SQL 中 Broadcast Join 一定比 Shuffle Join 快？那你就错了。
Spark 3.0 中七个必须知道的 SQL 性能优化
Spark SQL 中 Broadcast Join 一定比 Shuffle Join 快？那你就错了。
你要的 Spark AI Summit 2020 PPT 我已经给你整理好了
马铁大神的 Apache Spark 十年回顾
Spark 3.0 自适应查询优化介绍，在运行时加速 Spark SQL 的执行性能
图文介绍 SQL 的三种查询计划处理模型，Spark 用了其中两个
Spark 3.0 终于支持 event logs 滚动了
实战 | 利用Delta Lake使Spark SQL支持跨表CRUD操作
Spark Executor内存管理
Apache Spark 将支持 Stage 级别的资源控制和调度
八种解决 Spark 数据倾斜的方法
Delta Lake 和 Apache Hudi 两种数据湖产品全方面对比
Delta Lake 0.5.0 正式发布，支持包括 Hive/Presto 等多种查询引擎
一文了解 Apache Spark 3.0 动态分区裁剪（Dynamic Partition Pruning）的使用
Apache Spark 3.0 预览版正式发布，多项重大功能发布
一文了解 Apache Spark 3.0 动态分区裁剪（Dynamic Partition Pruning）
使用 Spark 和 Delta Lake 构建近实时数据仓库
Spark+AI Summit Europe 2019 超清视频&PPT下载
重磅｜Spark Delta Lake 现在由Linux基金会托管，将成为数据湖的开放标准
Spark Delta Lake 0.4.0 发布，支持 Python API 和部分 SQL
Apache Spark 中编写可伸缩代码的4个技巧
云栖大会 | Apache Spark 3.0 和 Koalas 最新进展
Apache Spark Delta Lake 写数据使用及实现原理代码解析
深入理解 Apache Spark Delta Lake 的事务日志
一文理解 Apache Spark DataSource V2 诞生背景及入门实战
深入理解 Spark SQL 查询引擎
Spark & Alluxio在网易严选架构演进中的实践和探索
一条 SQL 在 Apache Spark 之旅（下）
一条 SQL 在 Apache Spark 之旅（中）
一条 SQL 在 Apache Spark 之旅（上）
深入理解 Spark Delta Lake 的诞生及其工作原理
Spark-SQL 在字节跳动的应用实践
深入理解 Spark SQL 查询引擎
通过 Spark Streaming Listener 监控程序
Airbnb 是如何通过 balanced Kafka reader 来扩展 Spark streaming 实时流处理能力的
Koalas: 让 pandas 开发者轻松过渡到 Apache Spark
.NET for Apache Spark 预览版正式发布
重磅 | Apache Spark 社区期待的 Delta Lake 开源了
Apache Spark 2.4 回顾以及 3.0 展望
SHC：使用 Spark SQL 高效地读写 HBase
Apache Spark 未来：Spark 3.0 预览
Apache Spark 3.0 将内置支持 GPU 调度
牛人用 Rust 重写了 Apache Spark，并把它开源了
是时候考虑让你的 Spark 跑在 K8s 上了
使用Spark Streaming SQL进行PV/UV统计
吐血之作 | 流系统Spark/Flink/Kafka/DataFlow端到端一致性实现对比
使用Apache Arrow助力PySpark数据处理
看完这篇文章还不懂 Spark 的 Adaptive Execution ，我去跪榴莲！
Spark on Kubernetes 的现状与挑战
Spark SQL 之 Join 实现
通过 Spark Streaming Listener 监控程序
是时候放弃 Spark Streaming, 转向 Structured Streaming 了
Airbnb 是如何通过 balanced Kafka reader 来扩展 Spark streaming 实时流处理能力的
MapReduce Shuffle 和 Spark Shuffle 区别看这篇就够了

Kafka系列

Kafka原理和实践
图文了解 Kafka 的副本复制机制
Kafka原理和实践
Kafka 是靠什么机制保持高可靠，高可用的？
大规模使用 Apache Kafka 的20个最佳实践
Kafka 基础面试知识都在这，你都知道嘛？
Kafka是靠什么机制保持高可靠，高可用的？
Apache Kafka 2.3 发布，新特性讲解
Kafka 是如何保证数据可靠性和一致性
Kafka架构原理，也就这么回事！
一文彻底搞清 Kafka 的副本复制机制
Apache Kafka 不需要管理员：删除 Apache ZooKeeper 的依赖
32 道常见的 Kafka 面试题你都会吗？附答案
Apache Kafka 2.5 稳定版发布，新特性抢先看
Kafka 是如何保证数据可靠性和一致性
从未如此简单：10分钟带你逆袭 Kafka！
如何快速全面掌握Kafka？5000字吐血整理
Apache Kafka 2.4 正式发布，重要功能详细介绍
如何为Kafka集群选择合适的Topics/Partitions数量
32 道常见的 Kafka 面试题你都会吗？附答案
两万字深入剖析Kafka，你学会了吗？
Kafka 是如何保证数据可靠性和一致性
Apache Kafka 2.3 发布，新特性讲解
Kafka创建Topic时如何将分区放置到不同的Broker中Kafka运维大全来了！优化、监控、故障处理……
不知道这些知识点，面试的时候别说你懂 Kafka
一篇文章了解 Kafka 幂等性的原理及实践
看完这篇还不会kafka，我跪榴莲！
大规模使用 Apache Kafka 的20个最佳实践

Flink系列

从 0 到 1 搭建一套 Flink 的监控系统
Apache Flink 1.11.0 重要功能全面解析
深入分析 Flink SQL 工作机制
即将发布的 Flink 1.11 新特性：流批一体的 Hive 数仓
重磅！Apache Flink 1.11 功能抢先看！
Flink Checkpoint 原理流程以及常见失败原因分析
一文了解 Apache Flink 的资源管理机制
如何实时监控 Flink 集群和作业？
Apache Flink 1.9新功能介绍及使用
Flink面试，看这篇就足够了
Flink Forward Asia 2019 总结和展望 - 附PPT下载
Flink Forward 201904 PPT资料下载
一文让你彻底了解大数据实时计算引擎 Flink
干货 | Flink Connector 深度解析
Apache Flink 是如何管理好内存的？

ElasticSearch系列

Elasticsearch 在各大互联网公司大量真实的应用案例！
完美避坑！记一次Elasticsearch集群迁移架构实战
Elasticsearch如何做到亿级数据查询毫秒级返回？
我为什么用 ElasticSearch 做 Redis 监控?
成人网站泄露 108 亿数据后，一个 Elasticsearch 爱好者的思考
Elasticsearch用得好，下班下得早
从腾讯云到自建机房？ES集群迁移架构实战
ElasticSearch 亿级数据检索案例实战
Solr vs ElasticSearch，搜索技术哪家强
看完这篇文章，再也不怕 Elasticsearch 索引设计
基于 MySQL Binlog 的 Elasticsearch 数据同步实践
Open Distro for Elasticsearch：AWS 自家版本的开源 ElasticSearch
基于 MySQL Binlog 的 Elasticsearch 数据同步实践
Elasticsearch 冷热集群架构实战
400+节点的 Elasticsearch 集群运维
全文搜索引擎 ElasticSearch 还是 Solr？
Elasticsearch解决问题之道——请亮出你的DSL！
终于有人把elasticsearch原理讲通了！
ElasticSearch 性能调优，让你的集群飞起来
Elasticsearch调优实践
让Elasticsearch飞起来！百亿级实时查询优化实战
Elasticsearch SQL用法详解
Elasticsearch如何做到亿级数据查询毫秒级返回？
Elasticsearch 7.x Nested 嵌套类型查询
看完这篇还不会 Elasticsearch，我跪搓衣板！
面试3连炮：聊聊ES写入数据的原理？查询数据的原理？倒排索引了解吗？

Hadoop系列

Apache Hadoop 3.x 最新状态以及升级指南
Hadoop 原生分布式对象存储 Ozone
Hadoop 气数已尽？
Apache Hadoop 的 HDFS federation 前世今生
{Submarine} 在 Apache Hadoop 中运行深度学习框架
百PB级Hadoop集群存储空间治理

HBase系列

为什么不建议在 HBase 中使用过多的列族
为了让你更全面的了解Apache HBase，我们做了这本专刊
HBase 中加盐之后的表如何读取：Spark 篇
HBase 中加盐之后的表如何读取：协处理器篇
HBase 协处理器入门及实战
HBase 入门之数据刷写(Memstore Flush)详细说明
HBase 客户端避坑指南
漫谈HBase Filter
HBase 四种数据迁移方案
HBase 协处理器入门及实战
MongoDB、Cassandra 和 HBase 三种 NoSQL 数据库比较
HBase Shell 十大花式玩法

Hive系列

在 Hive 中使用 OpenCSVSerde
Apache Hive JdbcStorageHandler 编程入门指南
Apache Hive 联邦查询（Query Federation）

数据湖系列

基于Apache Iceberg打造T+0实时数仓
全方位解读数砖的 Delta Engine
Apache Hudi：统一批和近实时分析的存储和服务
Apache iceberg：Netflix 数据仓库的基石
Delta Lake、Iceberg 和 Hudi 三大开源数据湖不知道如何选？那是因为你没看这篇文章
Apache Hudi应用调优指南
数据仓库、数据湖、流批一体，终于有大神讲清楚了！
恭喜，Apache Hudi 即将成为顶级项目！
Delta Lake 0.5.0 新功能介绍
还在玩数据仓库？现在已经是 LakeHouse 时代！
一篇文章掌握 delta、iceberg 和 hudi 三大开源数据湖方案

Kylin系列

5000 字带你快速入门 Apache Kylin
如何在 Kylin 中优雅地使用 Spark
Kylin 在满帮集团千亿级用户访问行为分析中的应用

Redis系列

Redis 集群原理，再也不怕面试被问倒
看完这篇再也不怕 Redis 面试了
Redis 6.0 稳定版发布，支持多线程 IO
不懂Redis Cluster原理，我被同事diss了！
Redis基础你掌握多少了？来查漏补缺？
深度好文| Redis面试全攻略
Hello Redis，我有7个问题想请教你！
深入学习 Redis 集群搭建方案及实现原理
为什么 Redis 选择单线程模型却能提供高并发请求
再有人面试问你 Redis 分布式锁的实现，把这篇文章甩给他
七问Redis，才知道我与技术大牛的差距在哪里

Zookeeper系列

一文彻底理解ZooKeeper分布式锁的实现原理
ZooKeeper 源码和实践揭秘
这可能是介绍 ZooKeeper 最好的文章了
很遗憾，没有一篇文章能讲清楚ZooKeeper
运维老鸟告诉你这个经典Zookeeper问题的根因

其他

为什么那么多 OLAP 系统选择列式存储？
Apache Doris：基于 MPP 的交互式SQL数据仓库，可用于 OLAP
Apache Arrow：跨平台的内存数据交换格式
日志采集系统都用到哪些技术？
大数据平台架构设计没思路？来看这篇就知道了！
大数据必备的十大工具
数据中台到底怎么建设，有人把他说清楚了
Apache Pulsar 发布 2.5.1 版本
从数仓到数据中台，谈技术选型最优解
实时数据架构，终于有人把他说清楚了！
分布式定时任务调度框架实践
从MongoDB迁移到ES后，我们减少了80%的服务器
身份证上的 ID 能保证唯一性么？
基于 MySQL Binlog 实现可配置的异构数据同步
浓缩精华的架构演进过程，我连看了八遍！
常见的大数据平台架构设计思路
大数据方向学习面试知识图谱
盘点2019年晋升为Apache TLP以及进去Apache孵化器的大数据相关项目
一文了解 Apache Cassandra 是什么
MongoDB 4.2 发布，支持分布式事务
分布式原理：一致性哈希算法简介
分布式原理：一文了解 Gossip 协议
一文了解一致性哈希
几种常见的数据分区方法
Docker 核心技术与实现原理
当小内存遇上大量数据，你该怎么解决这个问题？
我花了10个小时，写出了这篇K8S架构解析
如何利用Kubernetes集群提升资源利用率？
为什么大数据分析系统大都用列式存储？看了这篇文章你就知道了
从行存储到 RCFile，Facebook 为什么要设计出 RCFile？
列式存储和行式存储它们真正的区别是什么
支撑百万并发的“零拷贝”技术，你了解吗？
Sql Or NoSql，看完这一篇你就都懂了
大数据面试知识图谱
如何保证消息队列的可靠性传输？
大数据平台常见开源工具集锦(强烈推荐收藏)

榴莲系列

整理期间，竟发现有这么多篇跪榴莲的。取标题真是太难了，为了让你们点进来，我爱上榴莲了。

你可能感兴趣的:(分布式,数据库,xhtml,spark,hadoop)

Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
华为云分布式缓存服务DCS 8月新特性发布华为云PaaS服务小智华为云分布式缓存
分布式缓存服务（DistributedCacheService，简称DCS）是华为云提供的一款兼容Redis的高速内存数据处理引擎，为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力，满足用户高并发及数据快速访问的业务诉求。此次为大家带来DCS8月的特性更新内容，一起来看看吧！
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
3.增删改查--连接查询问女何所忆
关系型数据库的一个特点就是，多张表之间存在关系，以致于我们可以连接多张表进行查询操作，所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种，交叉连接、内连接和外连接，我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：如果你没学过数学中的笛卡尔积概念，你可以这样简单的理解这里的交叉连接：两张表的交叉连接就是一个连接合并的过程，T1表中
docker from指令的含义_多个FROM-含义 weixin_39722188 docker from指令的含义
小编典典什么是基本图片？一组文件，加上EXPOSE端口ENTRYPOINT和CMD。您可以添加文件并基于该基础图像构建新图像，Dockerfile并以FROM指令开头：后面提到的图像FROM是新图像的“基础图像”。这是否意味着如果我neo4j/neo4j在FROM指令中声明，则在运行映像时，neo数据库将自动运行并且可在端口7474的容器中使用？仅当您不覆盖CMD和时ENTRYPOINT。但是图像
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your †徐先森® Oracle数据库 Web相关错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo