smile-yan

《十堂课学习 Flink SQL》第一章：引言和背景

第一章是关于 Flink SQL 课程的引言和背景。这一章旨在概述有关大数据处理、流处理以及 Flink SQL 的基础知识，以便接下来能够更好地结合上下文进行学习。

1.1 大数据处理的背景

1.1.1 大数据概述

大数据是指规模巨大、高度复杂且难以用传统数据库管理工具进行捕获、存储、管理和处理的数据。它具有“3V”的特点，即体积大、速度快、种类多。这些数据源自各种渠道，包括社交媒体、传感器、日志文件等，形成海量且不断增长的数据池。传统的数据处理方法已不再适用，因为大数据的快速生成速度和多样的数据格式使得使用传统数据库技术变得困难。

1.1.2 大数据处理

大数据处理涉及对这些庞大的数据集进行分析、提取价值信息的过程。其中，流处理和批处理是两种常见的数据处理范式。批处理适用于有限的、离线的数据集，而流处理更关注实时数据的处理，能够立即对数据进行分析和响应。随着实时性要求的提升，流处理在大数据处理中变得越来越重要。Apache Flink作为一种流处理和批处理的开源框架，为处理大规模数据提供了强大的工具，特别是通过其SQL接口，使得更多的开发者能够轻松地参与到大数据处理的领域中。

1.1.3 常见的大数据工具

以下是一些常见的大数据工具以及它们主要解决的大数据问题：

工具	解决主要问题	解决方案
Hadoop	处理大规模数据的存储和批处理	提供了分布式存储（HDFS）和分布式计算（MapReduce）框架，用于存储和批量处理大量数据
Spark	高性能批处理、交互式查询、流处理和机器学习	具有内存计算和灵活的数据处理能力，适用于多种工作负载，包括批处理、交互式查询、流处理和机器学习
Flink	高性能流处理和批处理	提供了流式处理和批处理的统一框架，适用于实时数据处理，支持事件时间处理和状态管理
Hive	大规模数据仓库的查询和分析	提供类似 SQL 的查询语言，将查询转化为 MapReduce 任务，用于在 Hadoop 上进行数据仓库查询
Pig	复杂的数据流处理	提供一种脚本语言（Pig Latin），用于处理和分析大规模数据集，更抽象和简化了 MapReduce 任务
HBase	提供实时随机读/写的 NoSQL 数据库	基于 Hadoop 的分布式数据库，适用于需要高吞吐量和低延迟的实时数据访问
Kafka	大规模流数据的可靠消息传递	分布式消息队列系统，用于实时流处理，提供高吞吐量和持久性
YARN	大规模集群资源的管理和调度	Hadoop 的资源管理器，用于有效地调度和管理集群上的资源

这些工具相互配合，构建了一个完整的大数据生态系统，涵盖了数据存储、处理、分析和管理等多个方面。选择适当的工具取决于具体的业务需求和数据处理场景。

1.2 流处理简介

1.2.1 什么是流处理

流处理是一种数据处理范式，强调在数据产生时立即对其进行处理。相比之下，传统的批处理方法将数据收集到一个数据存储中，然后进行批量处理。流处理更注重实时性和对不断生成的数据流的即时响应。

在流处理中，数据被分为连续的事件流，每个事件都被即时处理。这种实时性使流处理适用于需要快速决策和对数据进行实时分析的场景，如实时监控、欺诈检测和实时报警。

1.2.2 流处理与批处理的对比

流处理和批处理是数据处理的两个主要方法，各有其优势：

名称	特点	优势	不足
批处理	针对一批静态数据进行处理，通常是离线操作	适用于对历史数据进行复杂计算和分析	处理速度相对较慢，不适用于对实时性要求较高的场景
流处理	处理实时生成的连续数据流，立即对每个事件进行处理	提供低延迟的数据处理，适用于实时监控和即时反馈的应用	部分场景可能需要更复杂的处理逻辑，因为数据在不断变化

1.2.3 Apache Flink 在流处理中的角色

Apache Flink 是一种支持流处理和批处理的开源框架，其在流处理中扮演关键角色：

事件时间处理： Flink 强调事件时间，即数据产生的实际时间，而不是到达系统的时间。这是处理乱序事件和确保精确窗口计算的重要机制。
状态管理： Flink 提供强大的状态管理，使得处理有状态的流式计算变得更容易。状态可以在事件之间保持，并在需要时进行访问，适用于实时分析和累积计算。
窗口操作： Flink 提供丰富的窗口操作，如滚动窗口、滑动窗口等，用于对流数据进行时间窗口内的计算。
容错性： Flink 具备强大的容错机制，确保在系统出现故障时，能够恢复并继续进行数据处理，保证计算结果的准确性。

通过这些特性，Flink 成为了流处理领域的重要框架，广泛应用于实时数据分析、监控和事件驱动应用等场景。

1.2.4 Flink 相对与 Spark 而言所具有的优势

Apache Flink 和 Apache Spark 是两个强大的大数据处理框架，它们各自在不同的场景和应用中都表现出色。以下是 Flink 相对于 Spark 的一些优势：

流处理的本地性： Flink 是一个原生支持流处理的框架，流处理在其设计中得到了很好的融合。Flink 的流处理性能优于 Spark Streaming，尤其在处理事件时间和窗口操作方面表现更为灵活和强大。
事件时间处理和状态管理： Flink 在事件时间处理方面非常强大，可以轻松处理乱序事件和支持基于事件时间的窗口操作。Flink 的状态管理也相对更灵活，适用于处理有状态的计算。
低延迟和高吞吐量： Flink 在流处理场景下通常具有更低的延迟，适用于对实时性要求较高的应用。它还能够保持高吞吐量，适用于处理大规模数据流。
一体化的批处理和流处理： Flink 提供了统一的流处理和批处理 API，使得用户能够无缝地在同一个应用程序中处理批量和流式数据。这种一体化的设计使得 Flink 更加灵活，能够适应不同的数据处理需求。
动态表： Flink 引入了动态表的概念，使得用户可以在运行时动态更改表的模式。这对于处理变化频繁的数据流非常有用，而 Spark 静态的 RDD 和 DataFrame 在这方面相对较为限制。
容错机制： Flink 的容错机制相对较为简单且可靠。它通过检查点机制（Checkpoints）来确保一致性，即使在系统故障时也能够恢复处理状态。
更灵活的迭代计算： Flink 在迭代计算方面更加灵活，支持显式的迭代计算模式，适用于图处理等迭代场景。

选择使用 Flink 还是 Spark 取决于具体的业务需求、数据处理场景以及团队的技术栈和偏好。两者都是优秀的框架，在不同的情境下都能够发挥其优势。

1.3 Apache Flink 简介

1.3.1 Flink 概述（划重点）

Apache Flink 是一个开源的流处理和批处理框架，旨在提供高性能、容错性强、可伸缩性好的数据处理解决方案。与其他大数据框架相比，Flink 突出的特点是其对流式数据的原生支持，使得实时数据处理变得更加灵活和强大。

1.3.2 Flink 的特点（划重点）

流批一体化： Flink 提供了统一的 API，支持流处理和批处理，使得用户能够在同一个应用程序中处理实时流数据和批量数据，简化了开发和维护的复杂性。
事件时间处理： Flink 强调事件时间处理，即按照事件发生的时间顺序进行处理，而不仅仅是数据到达系统的时间。这种特性使得 Flink 在处理乱序事件和实现准确的窗口计算方面具有优势。
状态管理： Flink 提供了强大的状态管理机制，使得处理有状态的流式计算变得更加容易。状态可以在事件之间保持，并在需要时进行访问，适用于实时分析和累积计算。
窗口操作： Flink 提供多样化的窗口操作，包括滚动窗口、滑动窗口等，用于对流数据进行时间窗口内的计算，支持更灵活的数据分析需求。
容错性： Flink 具备强大的容错机制，通过检查点（Checkpoints）机制来确保一致性。在系统出现故障时，Flink 能够快速恢复并继续进行数据处理，保证计算结果的准确性。

1.3.3 Flink 生态系统

2019 年，阿里巴巴以9000万欧元收购了Flink背后的公司 Data Artisans。

2023 年，Flink 即将发布 2.0 版本！感兴趣的小伙伴们可以参加线上会议，相关内容如下图所示（扫描下面二维码即可免费报名，并非广告）：

回到正题，Flink 生态系统不仅包括核心的流处理和批处理框架，还涵盖了一系列相关的项目和库，丰富了其功能和应用场景：

名称	内容
Flink Table API	提供了基于 SQL 的查询语言和 Table API，使得开发人员可以使用 SQL 查询语言进行流处理和批处理
Flink Gelly（图处理库）	专注于图数据的处理，支持图算法和图分析
Flink ML（机器学习库）	用于在 Flink 中进行机器学习模型的训练和推理
Flink CEP（复杂事件处理）	提供了复杂事件处理的功能，用于检测和处理事件流中的复杂事件模式
Flink SQL CLI	基于 SQL 的交互式查询工具，方便用户快速执行 Flink SQL 查询

Flink 生态系统的不断丰富使得 Flink 能够应对更广泛的应用场景，从而成为大数据处理领域的重要组成部分。

1.4 Flink SQL 的作用和优势

1.4.1 Flink SQL 概述

Flink SQL 是 Apache Flink 中的一个模块，提供了一种使用 SQL 查询语言进行流处理和批处理的方式。它使得开发人员和数据分析师能够通过熟悉的 SQL 语法来处理实时数据流，而无需深入了解底层的编程模型和复杂的流处理概念。

1.4.2 Flink SQL 的作用

简化开发： Flink SQL 提供了一种更简单、更直观的方式来表达数据处理逻辑。开发人员可以使用熟悉的 SQL 查询语言，而无需深入了解 Flink 的底层 API。
提高生产力： 使用 SQL 查询语言可以显著提高开发效率，减少代码量。这对于处理复杂的流式计算场景尤为重要，因为使用 SQL 可以更快速地实现业务逻辑。
降低学习曲线： 对于熟悉 SQL 的开发人员和数据分析师来说，使用 Flink SQL 降低了学习新技术的门槛。他们可以借助已有的 SQL 技能快速上手实时数据处理。

1.4.3 Flink SQL 的优势

统一的编程模型： Flink SQL 提供了统一的编程模型，将流处理和批处理统一在一个框架中。这种一体化的设计使得开发人员能够在同一查询中处理实时流数据和批量数据。
支持复杂事件处理： Flink SQL 不仅支持基本的 SQL 查询，还支持复杂事件处理（CEP），使得处理涉及复杂事件模式的业务场景变得更加容易。
灵活的窗口操作： Flink SQL 支持各种窗口操作，如滚动窗口、滑动窗口等，方便开发人员进行时间窗口内的计算。
事件时间处理： Flink SQL 强调事件时间，可以轻松处理乱序事件和支持基于事件时间的窗口操作，确保数据处理的准确性。
与 Flink 生态系统的集成： Flink SQL 与 Flink 生态系统无缝集成，可以与 Flink 的其他组件（如 Flink ML、Flink Gelly 等）一起使用，构建更丰富的数据处理应用。

总体而言，Flink SQL 的作用在于简化流处理和批处理的开发，提高开发效率，同时保持了足够的灵活性，使得开发人员能够通过 SQL 查询语言处理复杂的实时数据场景。

1.5 Flink SQL 与传统 SQL 的比较

1.5.1 传统 SQL 回顾

传统 SQL 是关系型数据库系统中使用的结构化查询语言。它主要用于在静态的表格中执行查询、更新和管理数据。传统 SQL 面向离线数据分析和查询，不太适用于实时流数据处理。

1.5.2 Flink SQL 的扩展

Flink SQL 在传统 SQL 的基础上进行了扩展，以满足实时流数据处理的需求。以下是 Flink SQL 相对于传统 SQL 的一些扩展和变化：

流式查询： Flink SQL 不仅支持对静态表格进行查询，还支持对实时流数据进行查询。这使得 Flink SQL 能够处理无限的、不断产生的数据流。
事件时间处理： Flink SQL 强调事件时间处理，即按照事件实际发生的时间进行处理，而不仅仅是数据到达系统的时间。这对于处理乱序事件和实现准确的窗口计算非常重要。
窗口操作： Flink SQL 提供了丰富的窗口操作，如滚动窗口、滑动窗口等，用于对实时数据流进行时间窗口内的计算。
复杂事件处理： Flink SQL 支持复杂事件处理（CEP），允许用户定义和检测复杂事件模式，使得处理复杂业务逻辑更加灵活和简便。

1.5.3 Flink SQL 的优势

实时性和即时响应： 相对于传统 SQL，Flink SQL 具有更高的实时性和即时响应性，适用于需要实时处理和分析的场景，如实时监控、欺诈检测等。
灵活性： Flink SQL 的扩展使其更加灵活，能够适应不断变化的实时数据流，支持动态的窗口操作和事件时间处理。
统一的编程模型： Flink SQL 提供了统一的编程模型，将流处理和批处理统一在一个框架中。这种一体化的设计简化了开发流处理和批处理应用的复杂性。
容错性： Flink SQL 继承了 Flink 框架的容错机制，确保在系统故障时能够恢复并继续进行数据处理，保证计算结果的准确性。

总体而言，Flink SQL 在传统 SQL 的基础上进行了有益的扩展，使得它能够更好地应对实时大数据处理的挑战，成为流处理和批处理的有力工具。

1.6 课程概览

接下来的章节安排如下表所示：

章节	内容
第一章：引言和背景	介绍大数据处理和流处理的背景；Flink SQL 的作用和优势；Flink SQL 与传统 SQL 的比较
第二章：Flink 基础	Apache Flink 框架概述；Flink 数据流处理和批处理的基本概念；Flink SQL 的角色和位置
第三章：Flink SQL 环境搭建	安装和配置 Flink 环境；使用 Flink SQL CLI 进行基本查询；连接 Flink SQL 到外部数据源
第四章：流处理基础	理解流处理概念；Flink SQL 中的时间语义；处理无界数据流
第五章：Flink SQL 基础语法	Flink SQL 查询语句的基本结构；支持的数据类型和操作符；简单的聚合和过滤操作
第六章：表和视图	创建和管理 Flink SQL 表；视图的使用和优势；Flink SQL 中的临时表和永久表
第七章：时间处理和窗口	创建和管理 Flink SQL 表；视图的使用和优势；Flink SQL 中的临时表和永久表
第八章：连接和联接操作	不同流或表之间的连接操作；支持的连接类型 Flink SQL 中的联接最佳实践
第九章：高级应用	复杂查询和模式匹配使用用户定义的函数（UDF）应对实时数据分析的挑战
第十章：性能优化和最佳实践	Flink SQL 查询性能的优化策略查询计划和执行计划的理解最佳实践和常见陷阱

进阶篇共两章：

章节	内容
进阶一：状态管理和容错机制	状态管理：深入了解 Flink 中的状态管理机制，包括算子状态和键控状态。介绍如何使用状态来跟踪和管理有状态的计算。容错机制：探讨 Flink 如何处理故障和容错。包括检查点（Checkpoints）、保存点（Savepoints）、故障恢复策略和状态后端的选择。
进阶二：机器学习与Flink SQL	Flink ML：介绍 Flink 中的机器学习库，如何使用 Flink ML 库进行模型训练和推理。 Flink SQL 和 ML 集成：深入了解如何将机器学习算法嵌入 Flink SQL 查询中，实现对实时数据的预测和分类。实践案例：提供一个综合的机器学习案例，能够将 Flink SQL 与机器学习结合起来解决实际问题。

1.7 课程前提条件

基础知识	解释
计算机基础	包括计算机体系结构基础，编程基础等，至少能懂什么是CPU，什么是内存，什么是磁盘等等
数据结构与算法	包括基本数据结构，算法基础，编程语言等
Java 基础	本部分内容主要以Java语言进行开发，因此至少能配置java环境，编写java代码等
大数据基础	前面已经介绍最最最基础的内容，事实上也差不多够了
兴趣与耐心	这个很难，这里不主动劝退，但是不感兴趣的不要勉强自己

1.8 本章小结

本章快速梳理了大数据基础，然后引入Flink以及Flink SQL，全篇套话（约等于废话）。但是希望感兴趣的小伙伴们我们能一起学习进步 ~

如果认为本章节写得还行，一定记得点击下方免费的赞 ~ 感谢！

AI赋能，让办公更智能 enter回车键人工智能
AI赋能：解锁办公智能化新图景当智能化办公成为企业创造新价值的核心引擎，AI技术正以其强大的学习能力与数据处理能力，成为这场办公变革的“隐形推手”。从流程自动化到决策智能化，从单向执行到双向协作，AI正全方位渗透办公场景的每一个环节，让办公更高效、更精准、更具创造力。AI为办公流程注入“自动化基因”，将人类从机械劳动中彻底解放。传统办公中，员工需花费30%以上的时间处理重复性任务：财务人员逐张核对
.NET CORE 分布式事务(四) CAP实现最终一致性精神小伙就是猛 .netcore 分布式架构微服务
目录引言：1.0最终一致性介绍2.0CAP2.0架构预览3.0.NETCORE结合CAP实现最终一致性分布式事务3.1准备工作(数据库，本文使用的是MySql)3.1.1数据模型3.1.2DbContext3.1.3数据库最终生成3.2Nuget引入3.3appsettings.json3.4docker启动一个RabbitMQ3.5Program.cs3.6用户1API控制器3.7用户2API控
机器学习入门（五）：线性回归—从模型函数到目标函数米饭超人
从数据反推公式假设我们获得了这样一张表格，上面列举了美国纽约若干程序员职位的年薪：enterimagedescriptionhere大家可以看到，表格中列举了职位、经验、技能、国家和城市几项特征。除了经验一项，其他都是一样的。不同的经验（工作年限），薪水不同。而且看起来，工作年头越多，工资也就越高。那么我们把Experience与Salary抽取出来，用x和y来分别指代它们。enterimaged
用SQLyog连接出现2058错误时处理方法 chilavert318 点点滴滴
win10系统更新安装Mysql8.0，连接SQLyog的时候出现下面错误1.打开cmd：mysql-uroot-p输入密码root2.进入mysql依次执行下面语句ALTERUSER'root'@'localhost'IDENTIFIEDBY'root'PASSWORDEXPIRENEVER;#修改加密规则ALTERUSER'root'@'localhost'IDENTIFIEDWITHmysq
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移人工智能正颠覆传统电路仿真方法，本文将深入解析AI在电路建模、优化与故障诊断中的前沿应用，揭示智能仿真如何提升10倍效率并突破物理限制。一、AI电路仿真的数学基础1.1图神经网络建模电路拓扑电路可抽象为图结构G=(V,E)G=(V,E)G=(V,E)：VVV：节点（电子元件）EEE：边（连接关系）图卷积网络(GCN)更新公式：H(l+1)=σ(
深化学思践悟，激发奋进动能扎实开展主题教育活动，着力提升干部干事创业真本领 62ab9e7a8a7b
在全党开展学习贯彻习近平新时代中国特色社会主义思想主题教育，是推动贯彻党的二十大战略部署的有力举措，是深入推进新时代党的建设新的伟大工程的重大部署。领导干部要牢牢把握“学思想、强党性、重实践、建新功”总要求，聚焦凝心铸魂筑牢根本、锤炼品格强化忠诚、实干担当促进发展、践行宗旨为民造福、廉洁奉公树立新风的目标，以学铸魂、以学增智、以学正风、以学促干，着力为全面建设中国式现代化隆德凝聚力量。习近平总书记
关于线上技术学习的一点学习心得 GuangHui
我是**五期学员,和你分享一下我的学习心得,希望能够帮助到你.这是自己对于学习的思考和想法,因为我还在不断的学习和调整中,所以并不能说自己的所想都是正确的.我想即使我实现了成功的转行,也并不代表我说的我所选择的方式都是适合所有人的.每个人还需结合自己的实际情况,找到适合自己的最佳方法.我们一起努力.一.目标篇因为大数据需要学习的内容很多,所以学习过程中,一定要对进行定位,要做到有所取舍.针对自己的
有个人沉淀的石头
从前有个小孩儿，打小就跟父母务工在外。去过上海，待过浙江，更是在河北生活十几年。于老家的记忆，只是一些泥泞的路，破瓦的房，还有印象模糊的几个老人。他在河北，因为口音上的差异，不愿意与当地人说话，不愿意上学，直到9岁才上了一年级，这也导致了要比同年级同学大上两岁。他后来学习很好，小学到初中，一直都是班级前三名。老师们喜欢，同学们喜欢，也一直是父母的骄傲。一路顺风顺雨，过多的溢美之词形成了强烈自尊心与
活在回忆中的人‖第一章 “别人家的孩子”啊胜啊胜lwj
第一章“别人家的孩子”啊胜都说孩子是父母的骄傲，听话懂事的孩子总会成为别人夸赞的对象，也总会成为别的父母教育他们孩子的榜样，所以孩子经常会听到这样一句话:“你看看别人家的谁谁谁，人家学习好，会干活，又懂事，有礼貌，再看看你……”，但是榜样其实也很难做，最可怕的就是父母也认可自己孩子是榜样了这个标准，那孩子就不能犯一点点的错误，俗话说，老天为你关了一扇门，就会为你打开一扇窗，这大概就是有得必有失吧，
Python爬取网易云音乐歌手歌曲和歌单！推荐好听的歌吗？爬遍天下无敌手 Python http https python ssl servlet
仅供学习参考Python爬取网易云音乐网易云音乐歌手歌曲和歌单，并下载到本地①找到要下载歌手歌曲的链接，这里用的是：https://music.163.com/#/artist?id=10559然后更改你要保存的目录，目录要先建立好文件夹，例如我的是保存在D盘-360下载-网易云热歌榜文件夹内，就可以完成下载。如果文件夹没有提前建好，会报错[Errno2]Nosuchfileordirectory
java中字符串的创建_Java学习之字符串的创建 weixin_39849127 java中字符串的创建
Java字符串类(java.lang.String)是Java中使用最多的类，也是最为特殊的一个类，很多时候，我们对它既熟悉又陌生。一、从根本上认识java.lang.String类和String池首先，我建议先看看String类的源码实现，这是从本质上认识String类的根本出发点。从中可以看到：1、String类是final的，不可被继承。publicfinalclassString。2、St
你的博客为什么不更新了？
博客为什么不更新了很久没有写过博客了，为什么呢？因为工作了，成为了一名社畜因为没时间因为没有学习新的东西，所以无法分享因为不思进取…笔者写博客的初衷只是为了总结知识，让我学到的知识能从我这里输出出去，并且别人能看懂。如果结果能帮助更多人了解某个东西，那自然是最好的。三年前写了人生第一篇博客：SQL语句中，MySQL不支持的几种情况。反响平平，两千阅读。之后又陆续发表了几篇博客，数量不多，9篇文章。
2021年第20周计划媛涵妈妈_自我成长
五月第三周计划:1、闺蜜团学习5个早起2、健身1小时3、亲子阅读1小时4、培养娃的睡前程序5、减轻体重上周计划完成情况1、闺蜜团学习5小时第一周内容比较少完成4小时2、亲子阅读1小时基本完成，效率不高。争取提高兴趣。3、健身1小时。基本完成4、培养娃的吃饭喝水睡觉的好习惯。晚上睡得太晚，慢慢调整吧。5、除了学习等必须的，不刷手机减少了刷手机时长，偶尔看看还是有的。6、减轻体重。减掉0.95公斤，也
aws rds mysql 连接_使用 Amazon RDS 代理连接到 Amazon RDS MySQL 数据库实例或 Aurora MySQL 数据库集群... 仁安同学 aws rds mysql 连接
如何使用AmazonRDS代理连接到我的AmazonRDSMySQL数据库实例或AuroraMySQL数据库集群？上次更新时间：2020年9月21日如何使用AmazonRDS代理连接到运行MySQL的AmazonRelationalDatabaseService(AmazonRDS)数据库实例或AmazonAurora数据库集群？简短描述您可以使用AmazonRDS代理来管理与应用程序之间的连接。
3、 AWS基础设施入门：托管、部署与全球布局 jie sherry 云计算入门：从零开始掌握AWS AWS 云计算 IT基础设施
AWS基础设施入门：托管、部署与全球布局1.在AWS上托管IT基础设施将IT基础设施迁移到AWS云平台是现代企业数字化转型的重要一步。在AWS云平台上托管IT基础设施需要学习一些新概念和术语，以确保迁移过程顺利进行。AWS云平台提供的虚拟化和资源管理工具，使得企业能够灵活地构建和管理IT基础设施，同时节省时间和成本。1.1新概念和术语在AWS上托管IT基础设施涉及以下新概念和术语：虚拟化：通过软件
2018-11-19 金八力杜老师
日精进68天亲爱的王总及何校，亲爱的家人们大家好!我是来自山峰教外教育的杜胜利，今天是我第68天的日精进，给大家分享我今天的进步，我们互相勉励，携手前行。每天进步一点点，距离成功便不远。1、比学习:一年级离不开王老师，我还要不断学习，还要不断磨练。2、比改变：孩子们都会自己记作业条了，虽然个别不全，这是不小的进步！3、比付出:不流血不撒汗收获不了一片天。4、比谦卑：向优秀的家人，智慧的领导学习。5
AWS RDS MySQL是否能实现登录限制类需求 shiran小坚果 RDS aws 云计算 database mysql
问题描述：此类问题一般来说在等保中会频繁遇到：对于AWSRDSMySQL5.7和8.0的实例，能否做到如下限制和需求：1.一个连接到数据库的session，超过一段时间以后被RDSMySQL结束的功能：RDSMySQL5.7和8.0中，均可以通过更改参数组中wait_timeout和interactive_timeout参数来设置。当连接空闲并超过参数设置的时长，那么会导致RDSMySQL自动断掉
读《关于在全党大兴调查研究的工作方案》有感王家遥3
本周我们晨读阅读了中共中央办公厅印发的《关于在全党大兴调查研究的工作方案》我深有感触，调查研究能力本质上是发现问题、分析问题、解决问题的能力，是体现出干部是否善于思考、主动作为，是否坚持群众路线，善于向群众学习、向实践学习的表现，组工干部要怎样开展调查呢，我认为可以从一下几个方面入手。第一是选题要精准，选择什么问题开展调研。是调研开展的首要问题，调查研究要求要做到“顶天立地”，所谓“顶天”就是要符
2023-08-27 每天都微笑
20230827《会痛的不是爱》273笔记及摘抄笔记及摘抄1我们来到世间，就是为了做自己。经历体验，合作创造属于自己独特的生活与功课。尽管信任笃定，安心欢喜的做自己吧。因为这是我们来此，你我他终究要做的。不必比较评判，无需预设强求，我们都尽管做好自己。2一个人，不能控制另外一个人，也因此不能推动另外一个人。每个人都只能自己推动自己，所以应当给别人一些空间。3学习真实、自由、负责任地做自己，并通过同
GENERALIST REWARD MODELS: FOUND INSIDE LARGELANGUAGE MODELS 樱花的浪漫大模型与智能体对抗生成网络与动作识别强化学习语言模型人工智能自然语言处理深度学习机器学习计算机视觉
GeneralistRewardModels:FoundInsideLargeLanguageModelshttps://arxiv.org/pdf/2506.232351.概述将大型语言模型（LLMs）与复杂的人类价值观（如乐于助人和诚实）对齐，仍然是人工智能发展中的一个核心挑战。这项任务的主要范式是来自人类反馈的强化学习（RLHF）[Christianoetal.,2017;Baietal.,
这个冬天格外的冷，格外的长（第十一章）麦芒律师
看似平静地回到家，她躲到房间里，还是往外瞄了瞄，其实黑漆漆的，啥也看不到。小心翼翼地从包里慢慢抽出那个笔记本，凑近煤油灯，用手反复摩挲着光滑的封面，晃一晃，反射出晶莹剔透的光，太阳下肯定更漂亮。她谨慎地翻开封面，第一页有一行蓝色钢笔字，字体刚劲有力：好好学习，好好生活！她双手轻轻地抚摸着这几个字，眼泪不受控制地往外涌，她赶紧用袖口抹去，不然会落到本子上，可是为什么越抹越多呢？婆婆催着睡觉，她吹灭了
深入理解Mysql索引底层数据结构与算法桑翔
一.索引的本质索引是帮助MySQL高效获取数据的排好序的数据结构二.索引数据结构1.二叉树2.红黑树3.Hash表4.B-Tree1.叶节点具有相同的深度,叶节点的指针为空2.所有索引元素不重复3.节点中的数据索引从左到右递增排序B-Tree5.B+Tree1.非叶子节点不存储data,可以放更多的索引2.叶子节点包含所有索引字段3.叶子节点用指针连接,提高区间访问的性能(体现在做范围查询的时候)
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
三个步骤，解决焦虑，告别低效率勤奋蚂蚁说成长
焦虑，是现代社会除了拖延以外，大部分人都会面临的问题。因为每天都有很多事情需要自己去操心，不管是工作上的，学习上的，还是生活上的，都有很多事情需要去做。面对这么多事情，只能勤奋一些，花更多的时间来应对，努力去加班，努力去学习。原本想努力一些，事情会少一些，焦虑也能少一点，现实却是越勤奋，越焦虑，花了很多时间，事情最终却都没完成。这样的情况也就是低效率的勤奋，如何解决，可以按以下这三个步骤来进行。安
感赏36 小宇宙的记忆庄园
感觉学习了越久的课程自己反而比刚学的时候更懒惰，有多久没写了，虽然每天坚持学习，可越来越觉得写不出来，也没有做过晨读和晨享，孩子的状态是一直在放任，感觉我身上的担子卸下很多，很轻松。孩子却好像由于我的放任胆是越来越大了，我和他爸说一句，他有两句等着，手机也不让我设学生模式了，说不想被我控制，放假三天，现在还没写完作业。今天到他屋里看到写的作业没有单位，没有答，说话还骗人，今天早上上班的时候打电话问
C语言基础学习_数组 LiuKai~ c语言
数组的概念数组是相同类型的变量的有序集合inta[10];/**该数组包含10个int类型的数据*a代表数组第一个元素的地址，即数组的首地址*a还是此段内存空间的名字，a[0],a[1]都是数组种的元素，而不是这些元素的名字，数组中的元素没有名字*每个元素类型相同都为int*/数组在一片连续的内存空间中存储元素数组元素的个数可以显示或隐式指定inta[10]={1,2};/*1.显式指定,初始化的
AWS-rds 表主从不一致如何解决与数据交流的路上 AWS mysql mysql sql 数据库
一、背景因为某些修改造成了表的主从不一致，所以需要备份表恢复数据，物理机大家都有很多种做法，但是因为awsrds限制了账户的权限，所以这里用不到普通的办法，想了一阵想到一种可行性的方法，暂时没有发现隐患，或者更好的办法，如果有大佬知道的话，欢迎随时指教二、步骤1.查看主库二进制状态（主库执行）#记录当前的二进制和pos点,mysql-bin.123,111showmasterstatus2.等待一
学习的动力陆惠芳
图片发自App如今学习的资源十分丰富，走进哪个资源库？鲜明的指示，贵人的引导，好奇心的驱驶，迈开前进的脚步，跨入学习区域，选择合适的内容，静心地潜入，品尝学习的乐趣，学以致用的成功体验，找到了正确的路径，跟随一个有品味的导师，与一群志趣相投的伙伴，互相鼓励和支持，携手共进！发自内心的喜爱，钻进去研究，不断地在做事中锻炼，提高自己解决问题的能力！学习是为了成为更好的自己，成为自己喜欢的模样！2018
一个例子带你入门机器学习
目录1.为建模选择数据2.选择预测目标3.选择“特征”4.构建您的模型（这篇文章将使用经典墨尔本房价数据集作为例子，引导机器学习的流程，数据集为melb_data.csv，请在csdn的下载区自行下载，运行代码时需要将数据集下载在同个目录下）1.为建模选择数据数据集有太多的变量，多到难以理解，甚至无法很好地打印出来。如何将这海量的数据削减为能够理解的内容？我们将首先凭借直觉选择几个变量。后续将介绍
初探机器学习与力学研究的交叉领域 faderbic 机器学习人工智能深度学习
目录关于如何踏入机器学习领域机器学习与力学研究的交叉方向1.使用机器学习加速有限元求解2.结合有限元计算和机器学习预测复杂材料结构与力学性能的关系3.结构健康检测4.疲劳寿命预测总结关于如何踏入机器学习领域因为我本科的专业是力学，所以当我开始关注机器学习领域时，首先考虑的是机器学习和力学的交叉领域。对于很多对人工智能感兴趣的朋友，想加入人工智能的潮流却不知道从何学起，我提供一个思路，我认为将自己学
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc