数之何

SQL-o1：一种用于Text-to-SQL的自奖励启发式动态搜索方法

1 引言

文本到SQL (Text2SQL) 任务旨在将自然语言查询转换为可执行的SQL查询。得益于大规模语言模型 (LLMs) 的应用，该领域取得了显著进展。然而，模型的可扩展性、生成空间的限制以及SQL生成过程中的连贯性问题仍然存在。为了解决这些问题，我们提出了SQL-o1，一种基于自奖励的启发式搜索方法，旨在增强LLMs在SQL查询生成中的推理能力。SQL-o1结合了蒙特卡洛树搜索 (MCTS) 进行过程级搜索，并构建了一个Schema-Aware数据集，以帮助模型更好地理解数据库模式。广泛的实验表明，SQL-o1在复杂的Bird数据集上的执行准确率比最新的基线方法提高了10.8%，甚至超过了基于GPT-4的方法。此外，SQL-o1在少量样本学习场景中表现出色，并且具有强大的跨模型迁移能力。我们的代码已公开可用1。

1.1 介绍

Text2SQL是指将自然语言问题转换为结构化查询语言 (SQL) 的过程，作为非专业用户使用自然语言与数据库交互的有效方法。该领域的发展可以分为三个阶段：首先，使用预训练模型或抽象语法树对输入序列进行编码和解码 (Wang et al., 2020)；其次，采用序列到序列方法 (Xie et al., 2022)；最近，大规模语言模型 (LLMs) (Zhang et al., 2025) 被证明是Text2SQL的有效解决方案。然而，准确地将自然语言查询与数据库中的数据对齐仍然是一个重大挑战。

最近关于基于LLMs的Text2SQL的研究主要集中在通过上下文学习提示策略和特定领域的监督微调来提高模型性能。该领域的关键方法包括Schema Linking、Self-correction和Chain-of-Thought (CoT) (Tai et al., 2023)，旨在增强模型对模式的理解、提高其推理能力，并帮助生成更准确的SQL查询。

然而，仍存在三个主要挑战：1. 这些方法通常受到模型规模的限制。较小的LLMs在理解复杂指令方面的能力有限，导致在处理复杂任务时泛化能力较差。2. 端到端生成方法受到生成空间的限制。由于缺乏逐步验证和灵活调整的机会，模型在生成过程中难以探索更多潜在路径，限制了输出的多样性和准确性。3. 在SQL生成过程中存在推理过程的连贯性问题。如果在任何步骤中出现错误，通常会影响后续步骤的正确性，导致最终生成的SQL查询无法正确执行。

受Process-supervised Reward Model (Luo et al., 2023) 的启发，我们提出了SQL-o1，一种基于自奖励的启发式搜索方法，如图 1 所示。首先，我们广泛挖掘数据库模式，收集表列字段、代表性实体等信息，构建一个Schema-Aware数据集，用于微调大规模语言模型 (LLMs)。此外，我们引入蒙特卡洛树搜索 (MCTS) (Swiechowski et al. ´ , 2023) 作为推理媒介，利用过程级推理和自奖励减少LLMs生成过程中的逻辑错误。通过扩展生成空间并克服SQL生成的一致性挑战，我们显著增强了LLMs的推理能力。

我们在Bird和Spider数据集及其三个变体上进行了实验。实验结果表明，SQL-o1结合常见的开源模型（如Llama 3 (Touvron et al., 2023) 和Qwen 2.5 (Yang et al., 2024a)）显著优于大多数现有方法，甚至超过了其他基于GPT-4的方法。此外，我们在少量样本微调场景中应用SQL-o1，结果表明当样本量达到2000时，几乎所有性能指标都超过了在完整数据集上微调的模型。最后，我们还讨论了SQL-o1的迁移能力和其组件的贡献。我们的贡献可以总结如下：

1. 我们从多个角度提取数据库信息，构建了一个Schema-Aware数据集，以促进LLMs的渐进式SQL生成 (PSG)。
1. 我们提出了SQL-o1，一种基于自奖励的启发式搜索方法，显著减少了SQL生成过程中的连贯性问题，同时扩展了SQL生成空间。
1. 我们进行了全面的评估和广泛的实验，充分验证了SQL-o1的有效性和迁移能力。

2 相关工作

Text2SQL任务近年来取得了显著进展，主要集中在大规模语言模型 (LLMs) 上，其出色的推理能力为Text2SQL任务提供了新的方向和机会。目前，基于LLMs的方法可以大致分为两类：提示工程和基于代理的LLMs交互。

2.1 提示工程

在LLMs的早期阶段，一种直接有效的方法是精心设计有效的提示，以更好地利用LLMs的潜力，这同样适用于Text2SQL任务。通过Chain of Thought (Zhang et al., 2023) 增强LLMs的推理能力是一个有前景的尝试。一些方法 (Wang et al., 2024; Pourreza and Rafiei, 2023; Li et al., 2024a) 利用模式链接将自然语言问题与数据库模式元素结合，取得了令人满意的结果。其中，DAIL-SQL (Gao et al., 2024) 系统地研究了提示工程在基于LLMs的文本到SQL方法中的应用，包括问题表示、提示组件、示例选择和示例组织。

最近，一些研究将注意力从提示工程（例如GPT-4和其他封闭源模型）转向了LLMs的微调。SENSE (Yang et al., 2024b) 合成强数据，并对弱LLM生成的弱数据进行直接偏好优化 (DPO)，而ROUTE (Qin et al., 2024) 提出了一种多任务协同微调方法，减少了SQL生成中的潜在错误，取得了更好的结果。

2.2 基于代理的LLMs交互

基于代理的交互方法 (Chen et al., 2024b) 通过设计反馈信号引导LLMs生成准确的SQL查询。早期的工作 (Shi et al., 2022) 专注于基于执行结果改进SQL，通过执行SQL查询并根据执行风险选择最准确的翻译。其他工作 (Chen et al., 2024a; Guo et al., 2023) 利用LLMs检查结果并纠正生成的SQL与真实SQL查询之间的差异。MAC-SQL (Wang et al., 2024) 引入了多代理框架和其他新颖的交互方法 (Xiong et al., 2024)。然而，这些方法大多依赖高质量的外部反馈，这在实际应用中往往不可用，并且主要依赖封闭源LLMs，忽视了开源LLMs在推理方面的潜力。

3 基础知识

3.1 问题定义

给定一个Text2SQL数据集 D = {(Di , Qi , Si)} N i=1，其中每个样本包含一个SQL数据库 Di 、一个自然语言问题 Qi 和相应的 ground-truth SQL 查询 Si ，Text2SQL任务的目标是使用大规模语言模型生成一个SQL查询 Qi ′，并确保其执行结果与 Si 匹配。

3.2 定义：自奖励启发式动态搜索

自奖励启发式动态搜索主要由一系列状态 O = {o0, o1, o2, …, ot−1} 和基于这些状态生成的动作序列 A = {a1, a2, …, at} 组成。每次执行动作 at 时，模型将收到相应的奖励 Rt ∈ R。奖励和动作均由模型 π 生成。

4 方法

在本节中，我们将介绍SQL-o1的三个组成部分：Schema-Aware数据构建、渐进式SQL生成和自奖励启发式动态搜索。

4.1 Schema-Aware数据构建

SQL-o1需要在进行启发式动态搜索之前准确理解数据库结构和查询条件。因此，我们设计了提取表字段类型和样本数据条目的策略，以帮助模型更好地掌握数据库模式，从而优化启发式搜索过程。

4.1.1 表列字段类型

列的数据类型决定了字段中可以存储的值以及这些值的处理方式。在构建Text2SQL提示时，指定列的数据类型至关重要，因为不同的数据类型需要不同的处理。例如，数值 (NUMBER) 数据支持加法和平均等数学运算，而文本 (TEXT) 数据通常用于过滤和匹配。这些类型指示符有助于模型正确生成SQL查询。

4.1.2 每个表的示例条目

示例数据库条目是指数据库表中的小部分数据，帮助模型理解数据的内容和结构。在Text2SQL任务中，提示中的示例数据帮助模型将自然语言查询映射到特定的数据库条目。例如，生成查询 “orders.order_date BETWEEN ‘2022-01-01’ AND ‘2022-12-31’” 时，模型需要理解 “order_date” 列的日期格式。同样，对于 “products.category” 字段，模型应识别 “category” 列中的特定值，如 “Electronics” 或 “Clothing”。通过提供代表性示例数据，模型可以更好地理解列的内容和格式，从而更准确地生成SQL查询。

4.1.3 关键约束

主键和外键定义了数据库表之间的关系。例如，表A中的 “ID” 和 “Type” 列作为主键，而表B中的 “ID” 连接到表A中的 “ID”，形成关系 A.ID = B.ID。这种关系有助于模型理解如何连接表并正确检索数据，是识别表之间的依赖关系和连接条件的关键。

4.2 渐进式SQL生成

渐进式SQL生成 (PSG) 是监督微调 (SFT) 的一种变体，核心思想是在训练过程中在特定关键字处截断完整的SQL查询，模型的任务是根据提示重建完整的查询。我们主要关注预训练的大规模语言模型中预测错误或复杂语法结构的SQL查询。例如，在查询 ‘SELECT name, age FROM employees WHERE Department = ‘HR’ AND salary > 50000’ 中，截断发生在关键字 ‘WHERE’ 或 ‘AND’ 处，而不是任意位置。如果截断发生在 ‘SELECT name, age FROM employees WHERE’，模型需要从这个片段生成完整的查询。

这种增量生成方法利用了LLMs的连续生成能力，帮助模型更好地理解查询结构和语法，减少生成错误，特别是在处理多个连接或复杂过滤条件时。

基于上述内容，我们为LLMs开发了一个基本的微调数据集，主要包括第 4.1 和 4.2 节的内容。我们表示构建的数据集为：

$D_s = \{ \sigma_p(\mathcal{D}_i, \mathcal{Q}_i), \mathcal{S}_i \}_{i=1}^{N_s},$

其中 σp 表示我们定义的提示构建函数，Ns 表示数据集中的样本总数。

4.3 自奖励启发式动态搜索

本节提出的方法结合了强化学习框架、蒙特卡洛树搜索 (MCTS) 和自奖励评估，以指导模型在SQL查询生成过程中的决策。根据算法的组成部分，该方法主要分为：SQL生成规划、自奖励评估和启发式动态搜索。

4.3.1 SQL生成规划

我们将SQL查询生成任务定义为一个顺序决策任务，模型的目标是根据当前上下文选择下一个SQL片段（如表名、列名或SQL关键字）。这被视为一个策略生成问题，目标是教会模型一种策略，以最大化生成正确SQL查询的可能性：

$a_t = \underset{a_t'}{\text{argmax}} \,\pi(a_t' \mid o_{t-1}).\tag{1}$

方程 (1) 描述了策略模型 π 如何根据前一个状态 ot−1（即前一个步骤生成的SQL片段）选择最优动作 at（即第 t 步生成的SQL片段）。具体来说，模型选择一个可能的SQL片段 a ′ t，以最大化概率 π(a ′ t | ot−1)。

4.3.2 自奖励评估

该任务的目标是根据当前状态评估生成的SQL查询片段的质量和有效性，提供奖励和反馈信号以指导决策过程。具体来说，我们提出了一种评分函数 Rπ，利用 π 的对数概率值评估给定输入 x 生成输出 y 的可能性：

$R_{\pi}(y \mid x) = \beta + \alpha \log \pi(y \mid x), \qquad (2)$

其中 β 是定义的满分，设为100，α 是一个正温度值，用于控制分数的差异。

4.3.3 启发式动态搜索

蒙特卡洛树搜索 (MCTS) 是一种强大的决策算法，广泛应用于博弈论（如AlphaGo）和规划问题。如图 2 所示，我们使用MCTS作为启发式搜索方法，以指导SQL查询生成。它逐步探索和生成SQL查询序列，模拟结果，并根据自奖励指导优化搜索路径。

选择。MCTS的选择阶段从根节点开始，遍历子节点直到到达叶节点。每个节点代表SQL查询生成过程中的一个决策点，模型根据方程 (1) 选择下一个有效的SQL标记，逐步生成查询。在关键的语法和语义决策点，模型使用启发式截断扩展部分查询。然后应用UCT算法指导节点选择，平衡未访问查询结构的探索和高奖励路径的利用：

$n_t = \underset{n \in \mathcal{N}(o_{t-1})}{\text{argmax}} \left[ Q(o_{t-1} + n) + w \cdot \frac{\sqrt{\ln N(o_{t-1})}}{N(o_{t-1} + n)} \right] \tag{3}$

其中 N (.) 表示给定状态 ot−1 的候选扩展路径，Q(.) 表示当前状态的Q值，反映执行动作的预期回报。N(.) 表示代理状态的访问次数。

扩展。选择过程选择最相关的SQL查询作为候选扩展。当最大查询深度 L 未达到时，模型继续通过探索下一个可能的SQL操作或子句来扩展查询：

$\left\{ n_t^{(b)} \right\}_{b=1}^{B} \sim \pi \left( n_t | o_{t-1} \right)_{Beam},\qquad(4)$

其中，π(.)Beam 表示束搜索算法，B 是束宽度。然后，模型根据与前一个查询片段的语义相似性选择最相关的SQL操作进行扩展：

$\begin{aligned} \mathcal{N}(o_{t-1}) &= \left\{ n_t^{(i)} \right\}_{i=1}^d \leftarrow \operatorname*{argmax}_d \\ R_\pi \left( \left\{ n_t^{(b)} \right\}_{b=1}^B \mid o_{t-1} \right), \quad (5) \end{aligned}$

其中 Rπ 表示评估每个候选扩展质量的奖励函数，d < B。例如，如果当前状态是 “user” 表的部分查询，模型可能会生成 “SELECT user.id” 或 “SELECT user.name” 并根据其与输入问题的语义相关性选择候选。

模拟和回溯。扩展节点后，模型为所有新添加的子节点分配分数，如方程 (2) 和 (6) 所示。根据方程 (7)，选择得分最高的节点进行进一步模拟，直到达到最终状态，从而生成完整的SQL查询生成轨迹。

$Q(o_l^{(n)}) = \delta R_\pi(n_l \mid o_{l-1}^{(n)}) + (1 - \delta)R_\pi(\mathcal{S} \mid \mathcal{Q}),\tag{6}$

其中 δ 是一个介于 (0, 1) 之间的参数，用于平衡过程得分和总得分，通常设为0.5。算法通过更新从叶节点到根节点的所有节点的Q值进行回溯。

$$Q(o_t^{(n)}) = \max_{j=1}^n \left( \frac{\sum_{i=l}^t Q(o_i^{(j)})}{l - t### 4.3 自奖励启发式动态搜索

4.3.1 SQL生成规划

$a_t = \underset{a_t'}{\text{argmax}} \,\pi(a_t' \mid o_{t-1}).\tag{1}$

方程 (1) 描述了策略模型 π 如何根据前一个状态 ( o_{t-1} )（即前一个步骤生成的SQL片段）选择最优动作 ( a_t )（即第 t 步生成的SQL片段）。具体来说，模型选择一个可能的SQL片段 ( a_t’ )，以最大化概率 ( \pi(a_t’ \mid o_{t-1}) )。

4.3.2 自奖励评估

该任务的目标是根据当前状态评估生成的SQL查询片段的质量和有效性，提供奖励和反馈信号以指导决策过程。具体来说，我们提出了一种评分函数 ( R_\pi )，利用 π 的对数概率值评估给定输入 ( x ) 生成输出 ( y ) 的可能性：

$R_{\pi}(y \mid x) = \beta + \alpha \log \pi(y \mid x), \qquad (2)$

其中 ( \beta ) 是定义的满分，设为100，( \alpha ) 是一个正温度值，用于控制分数的差异。

4.3.3 启发式动态搜索

$n_t = \underset{n \in \mathcal{N}(o_{t-1})}{\text{argmax}} \left[ Q(o_{t-1} + n) + w \cdot \frac{\sqrt{\ln N(o_{t-1})}}{N(o_{t-1} + n)} \right] \tag{3}$

其中 ( N(\cdot) ) 表示给定状态 ( o_{t-1} ) 的候选扩展路径，( Q(\cdot) ) 表示当前状态的Q值，反映执行动作的预期回报。( N(\cdot) ) 表示代理状态的访问次数。

扩展。选择过程选择最相关的SQL查询作为候选扩展。当最大查询深度 ( L ) 未达到时，模型继续通过探索下一个可能的SQL操作或子句来扩展查询：

$\left\{ n_t^{(b)} \right\}_{b=1}^{B} \sim \pi \left( n_t | o_{t-1} \right)_{\text{Beam}},\qquad(4)$

其中，( \pi(\cdot)_{\text{Beam}} ) 表示束搜索算法，( B ) 是束宽度。然后，模型根据与前一个查询片段的语义相似性选择最相关的SQL操作进行扩展：

其中 ( R_\pi ) 表示评估每个候选扩展质量的奖励函数，( d < B )。例如，如果当前状态是 “user” 表的部分查询，模型可能会生成 “SELECT user.id” 或 “SELECT user.name” 并根据其与输入问题的语义相关性选择候选。

$Q(o_l^{(n)}) = \delta R_\pi(n_l \mid o_{l-1}^{(n)}) + (1 - \delta)R_\pi(\mathcal{S} \mid \mathcal{Q}),\tag{6}$

其中 ( \delta ) 是一个介于 (0, 1) 之间的参数，用于平衡过程得分和总得分，通常设为0.5。算法通过更新从叶节点到根节点的所有节点的Q值进行回溯。

$Q(o_t^{(n)}) = \max_{j=1}^n \left( \frac{\sum_{i=l}^t Q(o_i^{(j)})}{l - t} \right) \tag{7}$

参考文献

Ziru Chen, Michael White, Raymond J. Mooney, Ali Payani, Yu Su, and Huan Sun. 2024b. When is tree search useful for LLM planning? it depends on the discriminator. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), ACL 2024, Bangkok, Thailand, August 11-16, 2024, pages 13659–13678. Association for Computational Linguistics.
Dawei Gao, Haibin Wang, Yaliang Li, Xiuyu Sun, Yichen Qian, Bolin Ding, and Jingren Zhou. 2023a. Text-to-sql empowered by large language models: A benchmark evaluation. CoRR, abs/2308.15363.
Dawei Gao, Haibin Wang, Yaliang Li, Xiuyu Sun, Yichen Qian, Bolin Ding, and Jingren Zhou. 2023b. Text-to-sql empowered by large language models: A benchmark evaluation. arXiv preprint arXiv:2308.15363.
Dawei Gao, Haibin Wang, Yaliang Li, Xiuyu Sun, Yichen Qian, Bolin Ding, and Jingren Zhou. 2024. Text-to-sql empowered by large language models: A benchmark evaluation. Proc. VLDB Endow., 17(5):1132–1145.
Chunxi Guo, Zhiliang Tian, Jintao Tang, Pancheng Wang, Zhihua Wen, Kang Yang, and Ting Wang. 2023. Prompting GPT-3.5 for text-to-sql with de-semanticization and skeleton retrieval. In PRICAI 2023: Trends in Artificial Intelligence - 20th Pacific Rim International Conference on Artificial Intelligence, PRICAI 2023, Jakarta, Indonesia, November 15-19, 2023, Proceedings, Part II, volume 14326 of Lecture Notes in Computer Science, pages 262–274. Springer.
Albert Q Jiang, Alexandre Sablayrolles, Arthur Mensch, Chris Bamford, Devendra Singh Chaplot, Diego de las Casas, Florian Bressand, Gianna Lengyel, Guillaume Lample, Lucile Saulnier, et al. 2023. Mistral 7b. arXiv preprint arXiv:2310.06825.
Dongjun Lee, Choongwon Park, Jaehyuk Kim, and Heesoo Park. 2025. MCS-SQL: Leveraging multiple prompts and multiple-choice selection for text-to-SQL generation. In Proceedings of the 31st International Conference on Computational Linguistics, pages 337–353, Abu Dhabi, UAE. Association for Computational Linguistics.
Haoyang Li, Jing Zhang, Hanbing Liu, Ju Fan, Xiaokang Zhang, Jun Zhu, Renjie Wei, Hongyan Pan, Cuiping Li, and Hong Chen. 2024a. Codes: Towards building open-source language models for text-to-sql. Proc. ACM Manag. Data, 2(3):127.
Haoyang Li, Jing Zhang, Hanbing Liu, Ju Fan, Xiaokang Zhang, Jun Zhu, Renjie Wei, Hongyan Pan, Cuiping Li, and Hong Chen. 2024b. Codes: Towards building open-source language models for text-to-sql. Proc. ACM Manag. Data, 2(3).
Jinyang Li, Binyuan Hui, Ge Qu, Jiaxi Yang, Binhua Li, Bowen Li, Bailin Wang, Bowen Qin, Ruiying Geng, Nan Huo, Xuanhe Zhou, Chenhao Ma, Guoliang Li, Kevin C.C. Chang, Fei Huang, Reynold Cheng, and Yongbin Li. 2023. Can llm already serve as a database interface?- 周景仁. 2023a. 大型语言模型赋能的文本到SQL：基准评估. CoRR, abs/2308.15363.
高大伟, 王海斌, 李亚亮, 孙秀宇, 钱一辰, 丁博林, 周景仁. 2023b. 大型语言模型赋能的文本到SQL：基准评估. arXiv preprint arXiv:2308.15363.
高大伟, 王海斌, 李亚亮, 孙秀宇, 钱一辰, 丁博林, 周景仁. 2024. 大型语言模型赋能的文本到SQL：基准评估. Proc. VLDB Endow., 17(5):1132–1145.
郭春曦, 田志良, 唐金涛, 王盼成, 温志华, 杨康, 王婷. 2023. 通过去语义化和骨架检索提示GPT-3.5进行文本到SQL转换. In PRICAI 2023: 人工智能趋势 - 第20届太平洋地区国际人工智能会议, PRICAI 2023, 印度尼西亚雅加达, 2023年11月15-19日, 会议录, 第二部分, 卷14326的 Lecture Notes in Computer Science, 页262–274. Springer.
江阿尔伯特·Q, 萨布罗尔尔斯·亚历山大, 门施·亚瑟, 巴姆福德·克里斯, 查普洛特·德文德拉·辛格, 德拉斯卡萨斯·迭戈, 布雷桑德·弗洛里安, 伦格耶尔·吉安娜, 拉姆普尔·纪尧姆, 萨尔尼尔·露西尔, 等. 2023. Mistral 7B. arXiv preprint arXiv:2310.06825.
李东俊, 朴忠元, 金在旭, 朴熙秀. 2025. MCS-SQL: 利用多个提示和多选选择进行文本到SQL生成. In 第31届国际计算语言学会议论文集, 页337–353, 阿联酋阿布扎比. 计算语言学协会.
李浩洋, 张静, 刘汉冰, 范菊, 张晓康, 朱军, 魏任杰, 潘红燕, 李翠萍, 陈红. 2024a. Codes: 朝着构建开源文本到SQL语言模型. Proc. ACM Manag. Data, 2(3):127.
李浩洋, 张静, 刘汉冰, 范菊, 张晓康, 朱军, 魏任杰, 潘红燕, 李翠萍, 陈红. 2024b. Codes: 朝着构建开源文本到SQL语言模型. Proc. ACM Manag. Data, 2(3).
李金阳, 惠斌元, 屈戈, 杨佳曦, 李斌华, 李博文, 王柏霖, 秦博文, 耿瑞英, 火楠, 周轩和, 马晨浩, 李国良, Chang Kevin C.C., 黄飞, 程彦, 李永斌. 2023. 大型语言模型能否作为数据库接口？

一个大规模数据库支持的文本到SQL基准. In 第37届神经信息处理系统国际会议论文集, NIPS '23, 纽约州红钩, 美国. Curran Associates Inc.

罗海鹏, 孙庆丰, 徐灿, 赵普, 刘建国, 陶朝阳, 耿西波, 林庆伟, 陈世锋, 张东梅. 2023. WizardMath: 通过强化进化指令增强大型语言模型的数学推理能力. arXiv preprint arXiv:2308.09583.
普尔雷扎·穆罕默德雷扎, 拉菲伊·达伍德. 2023. DIN-SQL: 带自校正的分解上下文学习文本到SQL. In 神经信息处理系统第36届会议进展, 2023年12月10-16日, 美国路易斯安那州新奥尔良.
普尔雷扎·穆罕默德雷扎, 拉菲伊·达伍德. 2024. DTS-SQL: 利用小型大型语言模型的分解文本到SQL. In 计算语言学协会发现: EMNLP 2024, 美国佛罗里达州迈阿密, 2024年11月12-16日, 页8212–8220. 计算语言学协会.
秦阳, 陈超, 付志航, 陈泽, 彭德忠, 胡鹏, 叶杰平. 2024. Route: 文本到SQL的鲁棒多任务调优与协作. arXiv preprint arXiv:2412.10138.
施弗达, 弗里德·丹尼尔, 加兹维尼贾德·马詹, 泽特勒莫伊尔·卢克, 王思达. 2022. 自然语言到代码翻译与执行. In 第2022届计算语言学经验方法会议论文集, EMNLP 2022, 阿联酋阿布扎比, 2022年12月7-11日, 页3533–3546. 计算语言学协会.
斯维切沃斯基·马切伊, 戈德列夫斯基·康拉德, 萨维克·巴托什, 曼德祖克·雅切克. 2023. 蒙特卡洛树搜索: 最近的修改与应用综述. Artificial Intelligence Review, 56(3):2497–2562.
泰昌宇, 陈子儒, 张天舒, 邓翔, 孙焕. 2023. 探索链式思考风格提示的文本到SQL. In 第2023届计算语言学经验方法会议论文集, EMNLP 2023, 新加坡, 2023年12月6-10日, 页5376–5393. 计算语言学协会.
图弗罗·雨果, 拉维尔·蒂博, 伊扎卡德·高特耶, 马丁内特·泽维尔, 拉肖·玛丽-安娜, 拉克罗伊·蒂莫西, 罗齐耶·巴普蒂斯特, 戈亚尔·纳曼, 哈姆布罗·埃里克, 阿扎尔·法伊萨尔, 罗德里格斯·奥雷利安, 乔利安·阿曼德, 格拉夫·埃杜瓦尔, 拉姆普尔·纪尧姆. 2023. Llama: 开放和高效的基语言模型. CoRR, abs/2302.13971.
王柏霖, 辛理查德, 刘晓东, 波洛佐夫·奥列克桑德, 理查森·马修. 2020. RAT-SQL: 文本到SQL解析器的关系感知模式编码与链接. In 第58届计算语言学协会年会论文集, ACL 2020, 线上, 2020年7月5-10日, 页7567–7578. 计算语言学协会.
王兵, 任昌宇, 杨健, 梁新年, 白嘉琪, 柴林正, 闫钊, 张倩雯, 尹迪, 孙星, 李周军. 2024. Mac-SQL: 文本到SQL的多代理协作框架. 预印本, arXiv:2312.11242.
谢天宝, 吴陈亨利, 施鹏, 钟睿琦, 舒尔克·托尔斯滕, 亚苏纳加·米奇, 吴千山, 钟明, 尹鹏程, 王思达, 钟维克, 王柏霖, 李成祖, 波伊尔·康纳, 倪安松, 韶子宇, 拉德夫·德拉戈米尔, 熊彩明, 孔凌鹏, 张睿, 史密斯·诺亚·A., 泽特勒莫伊尔·卢克, 于涛. 2022. UnifiedSKG: 利用文本到文本语言模型统一和多任务结构化知识. In 第2022届计算语言学经验方法会议论文集, EMNLP 2022,

阿联酋阿布扎比, 2022年12月7-11日, 页602–631. 计算语言学协会.

熊冠明, 包俊伟, 江红飞, 宋阳, 赵文. 2024. Interactive-T2S: 利用大型语言模型的多轮交互文本到SQL. arXiv preprint arXiv:2408.11062.
杨安, 杨宝松, 张贝辰, 惠斌元, 郑波, 于博文, 李成远, 刘大一恒, 黄飞, 魏浩然, 等. 2024a. Qwen2.5技术报告. arXiv preprint arXiv:2412.15115.
杨佳曦, 惠斌元, 杨敏, 杨健, 林俊阳, 周昌. 2024b. 从弱和强LLM合成文本到SQL数据. In 第62届计算语言学协会年会论文集(第一卷: 长论文), 页7864–7875, 泰国曼谷. 计算语言学协会.
于涛, 张睿, 杨凯, 亚苏纳加·米奇, 王东旭, 李子凡, 马杰, 丽·艾琳, 姚庆宁, 罗曼·沙内尔, 张子林, 拉德夫·德拉戈米尔. 2018. Spider: 一个大规模人工标注的复杂和跨域语义解析和文本到SQL任务数据集. In 第2018届计算语言学经验方法会议论文集, 页3911–3921, 比利时布鲁塞尔. 计算语言学协会.
张汉聪, 曹瑞升, 陈璐, 徐洪申, 余凯. 2023. ACT-SQL: 带自动生成链式思考的上下文学习文本到SQL. In 计算语言学协会发现: EMNLP 2023, 新加坡, 2023年12月6-10日, 页3501–3532. 计算语言学协会.
张宣亮, 王丁子瑞, 杜龙旭, 朱庆福, 车万祥. 2025. 大型语言模型表格推理综述. Frontiers Comput. Sci., 19(9):199348.

参考 Paper:https://arxiv.org/pdf/2502.11741

你可能感兴趣的:(人工智能,ai,语言模型,sql)

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
基于开源AI智能名片链动2+1模式与S2B2C商城小程序的渠道选择策略研究说私域人工智能小程序
摘要：在数字化商业环境下，品牌与产品的渠道选择对其市场推广和运营成功至关重要。本文聚焦于如何依据自身品牌和产品特性，结合开源AI智能名片链动2+1模式与S2B2C商城小程序，运用科学的渠道选择方法，慎重挑选1-2个适宜平台，集中资源发力并取得成绩后再拓展其他渠道。通过理论分析与案例研究，探讨该策略的有效性和可行性，为企业渠道布局提供参考。关键词：渠道选择；开源AI智能名片；链动2+1模式；S2B2
深入解析 TCP 连接状态与进程挂起、恢复与关闭誰能久伴不乏 tcp/ip 网络服务器
文章目录深入解析TCP连接状态与进程挂起、恢复与关闭一、TCP连接的各种状态1.**`LISTEN`**（监听）2.**`SYN_SENT`**（SYN已发送）3.**`SYN_RECEIVED`**（SYN已接收）4.**`ESTABLISHED`**（已建立）5.**`FIN_WAIT_1`**（关闭等待1）6.**`FIN_WAIT_2`**（关闭等待2）7.**`CLOSE_WAIT`**
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
配音助手：自媒体神器，内置海量音色的语音，支持多主播配音阿幸软件杂货间媒体
软件介绍内置文字转语音，提供多个主播音色，男声、女声、小孩、方言。支持的场景也是比较多，比如：广告促销、有声读物、广播配音、影视配音、Ai配音等。这个软件是免费的，只不过需要通过手机号码登录就可以使用全部功能了。软件下载夸克下载
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
kube-scheduler 抢占机制分享放大价值 kubernetes源码分析 kubernetes kube-scheduler 抢占
当pod调度失败后，会在PostFilter扩展点执行抢占流程，下面分析相关的代码实现抢占接口//PodNominatorabstractsoperationstomaintainnominatedPods.typePodNominatorinterface{//将pod加入抢占成功的node中AddNominatedPod(pod*PodInfo,nodeNamestring)//将pod从no
Linux/Centos7离线安装并配置MySQL 5.7 有事开摆无事百杜同学 LInux/CentOS7 linux mysql 运维
Linux/Centos7离线安装并配置MySQL5.7超详细教程一、环境准备1.下载MySQL5.7离线包2.使用rpm工具卸载MariaDB（避免冲突）3.创建系统级别的MySQL专用用户二、安装与配置1.解压并重命名MySQL目录2.创建数据目录和配置文件3.设置目录权限4.初始化MySQL5.配置启动脚本6.配置环境变量三、启动与验证1.启动MySQL服务2.获取初始密码3.登录并修改密码
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
ThinkSound V2版 - 一键给无声视频配音，为AI视频生成匹配音效支持50系显卡一键整合包下载昨日之日2006 ai语音音视频人工智能
ThinkSound是阿里通义实验室开源的首个音频生成模型，它能够让AI像专业“音效师”一样，根据视频内容生成高度逼真、与视觉内容完美契合的音频。ThinkSound可直接应用于影视后期制作，为AI生成的视频自动匹配精准的环境噪音与爆炸声效；服务于游戏开发领域，实时生成雨势变化等动态场景的自适应音效；同时可以无障碍视频生产，为视障用户同步生成画面描述与环境音效。今天分享的ThinkSoundV2版
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
“Datawhale AI夏令营”基于带货视频评论的用户洞察挑战赛 fzyz123 Datawhale AI夏令营人工智能 Datawhale 大模型技术 NLP 深度学习 AI夏令营
前言：本次是DatawhaleAI夏令营2025年第一期的内容，赛事是：基于带货视频评论的用户洞察挑战赛（科大讯飞AI大赛）一、赛事背景在直播电商爆发式增长浪潮中，短视频平台积累的海量带货视频及用户评论数据蕴含巨大商业价值。这些数据不仅是消费者体验的直接反馈，更是驱动品牌决策的关键资产。用户洞察的核心在于视频内容与评论数据的联合挖掘：通过智能识别推广商品分析评论中的情感表达与观点聚合精准捕捉消费者
无面试无offer? 你需要AI 求职co-pilot的帮助!
大家好啊，我写的开源免费求职AIco-pilot工具发布了v3.0.0，欢迎大家参与、使用!https://github.com/weicanie/prisma-ai一、项目介绍开源免费的求职co-pilot，自动化简历准备至offer到手的整个流程。优化您的项目、定制您的简历、为您匹配工作，并帮助您做好面试准备。二、核心价值prisma-ai旨在解决求职者在准备简历和寻找工作时最头疼的3个问题:
[特殊字符] 实时数据洪流突围战：Flink+Paimon实现毫秒级分析的架构革命（附压测报告）——日均百亿级数据处理成本降低60%的工业级方案 Lucas55555555 flink 大数据
引言：流批一体的时代拐点据阿里云2025白皮书显示，实时数据处理需求年增速达240%，但传统Lambda架构资源消耗占比超运维成本的70%。某电商平台借助Flink+Paimon重构实时数仓后，端到端延迟从分钟级压缩至800ms，计算资源节省5.6万核/月。技术红利窗口期：2025年ApachePaimon1.0正式发布，支持秒级快照与湖仓一体，成为替代Iceberg的新范式一、痛点深挖：实时数仓
AIGC工具与软件开发流程的深度集成方案 Irene-HQ 软件开发测试 AIGC 测试工具 github AIGC 程序人生面试
一、代码开发环节集成路径‌环境配置标准化‌安装AIGC工具包并配置环境变量（如设置AIGC_TOOL_PATH），确保团队开发环境一致‌。在IDE插件市场安装Copilot等工具，实现编码时实时建议调用‌。‌人机协作新模式‌‌需求解析‌：上传PRD文档，AI自动提取业务规则生成类结构（如支付模块的PaymentService雏形）‌。‌代码补全‌：输入注释//JWT验证中间件，生成OAuth2.0
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）基于历史对话重新生成Query？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain RAG
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Q
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。