原创小白变怪兽

组合优化开题报告分享：基于强化学习的旅行商问题研究

基于强化学习的旅行商问题研究

课题的来源、意义
课题的国内外研究概况及发展趋势
课题的研究内容和技术方案
理论与实践方面预计的预期成果
主要参考文献

课题的来源、意义

课题来源：微软亚洲研究院联合研究基金和某公司横向项目
优化问题涉及在不同的可能性中找到最佳配置或“值”，它们属于具有连续变量和离散变量配置中的一个。例如，找到凸规划问题的解是一个连续优化问题，而找到图中所有路径中的最短路径是一个离散优化问题。有时两者之间的界限不可能那么容易画出来。传统上离散空间被称为组合优化（CO）问题，通常有不同类型的解与连续空间中的那些相比。可以将CO问题公式化如下：设V是一组元素，f:V->R是一个成本函数。组合优化问题目的是找到函数f的最优值和实现该最优值的任何相应的最优元素域V上的组合。
组合优化的求解方法广泛应用于交通运输、管理、电力、航天、通信等领域，其快速求解具有重要的理论意义和实用价值。例如，车辆的调度、金融资产的配置、仓库货物存储和运输路线的设计等实际问题都属于组合优化问题，随着这些优化问题实例规模的不断增大和实例中动态及随机因素的增加，传统方法的求解将耗费巨大的时间，问题结构一旦发生变化，传统方法需要重新搜索求解，计算成本也会随之提高，快速求解这些优化问题变得十分困难。
旅行商问题（TSP）是组合优化中的一个经典子问题，它的定义是：给定一个无向完全图，其中每个节点代表一个城市，已知任意两个城市之间的距离，旨在找到最短的哈密顿回路。
在图中，从一个城市开始，访问其他城市正好一次，最终回到起点。TSP是一个经典的NP难组合优化问题它在现实世界中有着广泛的应用[1]。TSP的定义虽然简单，但是随着规模的增加对TSP实例的精确求解急剧增长。20世纪中期问题被提出以来至今，众多学者蜂拥而至，为提高问题求解的质量和速度贡献自己的一份力量。当面许多现实世界中对算法效率要求高问题的时候，启发式是最流行和最实用的方法。
强化学习（RL）被定义为智能体与环境不断交互，获取相应的奖励，不断学习以完成特定的目标任务，可以理解为智能体在与环境进行交互的过程中，通过不断的尝试，从错误中学习经验，并根据经验调整其策略，来最大化最终所有奖励的累积值。RL的奖励很重要，具有奖励导向性，这种奖励导向性类似于 SL中正确的标签，从一开始没有数据和标签，不断尝试在环境中获取这些数据和标签，然后再学习哪些数据对应哪些标签，通过学习这样的规律，不断更新智能体的状态，使之尽可能选择高分行为。RL不是简单学习运算一个结果，而是学习问题的一种求解策略[2]。
随着人工智能、大数据时代的到来，组合优化问题实例的规模不断增大，随之会出现“组合爆炸”的现象，相关问题计算的时间和空间复杂度会呈指数增长，传统方法很难快速求解大规模性的实际问题，即使解决了这类问题，求解时间和花费也是人们无法接受的。在权衡时间和精度的条件下，目前传统算法仍然是求解 NP 问题的有效方法，但高效求解大规模 COP 问题实例及其变体问题成为一个很大的挑战。在P ≠ NP的假设下，放眼国内外专家团队对 COP 算法的研究，传统方法在短时间内不会取得重大突破，未来的发展是基于线下训练、线上求解的高性能计算设计上[3]。强化学习算法和传统组合问题的结合有机会擦出不一样的知识火花，为学术与工业界的进步贡献力量。

课题的国内外研究概况及发展趋势

启发式方法主要包括局部启发式方法和全局搜索算法。JF Cordeau等人针对静态的多车辆呼叫路线排班，对问题进行实例化的体现和数学分析并使用禁忌搜索进行求解[4]。C Rego, D Gamboa, F Glover, C Osterman在论文中进行了LK和S&C杰出启发式的总结和实验，在同等情况下，总结来说S&C更好更优秀[5]。F Glover介绍的根茎循环结构与弹射链的TSP算法，能够探寻LK启发式不能搜索到的状态空间[6]。C Yanai, A Solomon, G Katz, B Shapira等人对篮球比赛的决策运用drl进行完整的建模与求解–Q ball，该方法是建立在深度强化学习之上的有效建模[7]。Y Nagata, S Kobayashi提出了TSP中的经典全局搜索算法EAX，该算法能将两个亲本的优良性质传递到子代中，有机会生成更好的子代，并为局部最优的搜索提供良好的开始解[8]。Shen Lin提出了经典的λ-optimal(λ-opt)理论。文章详细介绍了3-pot运行时的实验现象并进行了分析。还有开头基础介绍了一些线性规划和小规模的线性规划算法和分支定界方法等，在文章的写作中都值得借鉴[9]。郑迥之等人的[10]将传统Sarsa，Q-Learning和蒙特卡洛方法与LKH算法进行了成功的结合，取得了卓越的效果。文章[11]提出了1-tree的相关理论，该理论用于计算LKH算法中的α值，它在算法中至关重要。文章[12]将原本在Sat问题中的骨干信息迁移到旅行商问题中来，进行了详细的分析和解释。HK Tsai, JM Yang, CY Kao的工作是，在EAX中选择的个体差异性最大的个体进行杂交产生子代，以充分发挥全局搜索部分的效益[13]。文章在VRP问题中，提出新版本的EAX并在其他组合优化问题中提供泛化[14]。郑迥之等人将EAX和VSR-LKH结合起来，局部搜索和全局搜索结合，效果极好[15]。林剑，叶璟轩，刘雯雯，邵晓雯的求解带容量约束车辆路径问题的多模态差分进化算法，介绍了小生境和差分进化算法在CVRP问题中的应用[16]。ÉD Taillard, K Helsgaun 的[17]将tour分为多个subtour，在subtour内进行路径寻优，然后将这些子路径再连接起来，考虑到subtour的局限性，还有不同大小子旅行优化的阶段。JF Cordeau, M Gendreau, G Laporte使用禁忌搜索在周期性和多车厂问题上进行探索，属于开创性的工作，他很多同期的文章都在进行这些类似的工作[18]。H Su, YD Zhong, B Dey, A Chakraborty的文章探索了路由问题中的EMV子问题，提出一种强化学习框架和baseline，多只能协同优化路线，使紧急路线和非紧急路线的交通都得到最大的优化，属于自成一个新的体系的创新的工作。但是还有没有考虑到的地方，比如多个紧急时间发生且路线重合的情况[19]。W Chu等人从之前的LinUCB引申出基于baseLinUCB的SupLinUCB，并且给出了遗憾界的证明，后续可以关注一下他在最新的研究中的拓展和使用[20]。[21]阐述了多智能体的多样性在RL算法中收敛和提升算法的重要性，并给出了评价指标和证明，并且进行了实验验证。F Liu, G Zeng 提出RMGA算法，即异构EAX加上构建单个解时候的RM算法，中小型算例上部分有超过LKH的baseline[22]。Y Abbasi-Yadkori, D Pál, C Szepesvári的线性经验赌博机中，根据新的不等式证明了新的置信界，给出了证明和简化了寻优过程中的计算[23]。[24]是混合基因搜索算法在VRP问题中的发明。Vidal在他的2012的工作中继续开发出Swap*的领域结构，在CVRP进行了运用，且方法结构清新简单[25]。基于k交换邻域的局部搜索(k-opt)是求解旅行商问题(TSP)中应用最广泛的启发式方法。本文提出了在LKH-2中k-opt的有效实现，LKH-2是Lin-Kernighan TSP启发式的一种变体。在10000到1000万个城市的欧几里得实例上进行了实验，证明了该方法的有效性。介绍了原始LK的k-opt和接下来的LKH1和LKH2，是LKH算法分支很好的总结和创新点的突出论文[26]。W Zhang分析，MaxSat和Sat中的骨干的应用和分析，同时也有一个值得借鉴的地方，因为不同质量的解提取骨干信息的质量也有不同，因此引入折扣因子[27]。HP Wang等人提出了监督学习的组合优化问题理论，将x的取值的{0,1}条件，松弛为[0,1]区间，而不是使用贝叶斯的梯度计算和大量采样[28]。[29]是UCB bandits的经典论文。L Xin, W Song, Z Cao, J Zhang的文章在基于深度学习的LKH在小于500的规模下的算例中取得了很好的效果，接近VSR-LKH等已知最好的LKH的变种算法。其中学习distance用的是监督学习，而惩罚pi用的无监督学习[30]。
强化和组合结合的方向可以总结为以下几个：无模型的RL方法，传统方法难以解决多维度的问题方面和求解动态和受随机因素影响的问题。许多组合优化问题问题都是NP难解的，设计算法的过程本身难度就很大，且不容易被刻画，无模型的RL方法可以通过智能体与环境的不断交互，学习到相应策略，模型训练完成后，短时间内给出一个高质量解，甚至比传统算法求解的质量要高。如 Alipour 等人[31]提出一种遗传算法和多主体 RL算法结合的混合算法来求解TSP问题，文献[31]采用GA-MARL + NICH-LS算法使得求解的精度高于几个传统算法；Fairee 等人[32]提出一种采用RL算法更新解的模型和基于人工蚁群的组合变体算法，在6个测试集上测试，在收敛速度上，RL更新的解快于人工蚁群算法。针对传统方法难以解决多维度的问题方面，RL 可以采用值函数近似和直接策略搜索等算法，使问题的描述更加全面，从而得到更高质量的解。如 Hu 等人[33]提出一种多智能体 RL框架求解多重旅行商问题（multiple traveling salesman problem，MTSP）。网络架构由 GNNs 和分布式策略网络组成，利用 RL算法训练模型参数，采用 S-样本（批次训练）的方法减少梯度方差，提高模型的整体性能。针对大规模问题求解，该框架学习的策略优于整数线性规划和启发式算法。针对求解动态和受随机因素影响的问题上，RL可在智能体与环境之间的交互以及状态转移过程中加入随机因素，增强模型的鲁棒性，且模型一旦训练完成，对同一问题的变体，也可以很好地适应新数据的变化。如Yao等人[34]提出一种端到端的 RL 框架求解组合优化问题，核心思想是把状态空间作为问题的解，解的扰动信息作为智能体的动作空间。模型利用 GNNs 抽取潜在的表征信息，对状态行为进行编码。推理阶段采用深度 Q-学习改善解（转换或交换向量标签）的质量，得到问题的最优策略。在 Max-cut 和 TSP问题上，此模型相比学习算法和启发式算法有更优的表现和泛化能力，更好地适应动态和随机因素。

课题的研究内容和技术方案

课题研究内容：
背景介绍：旅行商问题（TSP）是一个经典的组合优化问题，它要求在给定一组城市和它们之间的距离时，找到一条最短的路径，使得每个城市都恰好访问一次后返回起点城市。TSP在实际中有广泛的应用，例如物流、电子电路设计等领域。
问题陈述：本研究旨在探索如何使用强化学习方法（或是深度强化学习），来解决TSP问题。我们的目标是开发一种有效的算法，学习算法的完备理论和优良性质，使得算法能够自动学习并优化旅行商的路径，以最小化总旅行距离。
研究假设或研究问题：本研究的核心问题是，能否开发一种基于强化学习的组合算法，使其能够有效地解决TSP问题，并在大规模实例上提供具有竞争力的性能。
技术方案：
研究方法：我们计划采用强化学习（或者深度强化学习）方法，具体来说，我们将探索如何使用RL来建模和求解TSP问题。
问题建模：我们可以定义TSP问题的状态、动作和奖励函数，并将其转化为一个强化学习任务。其中，状态将表示旅行商的当前位置和已访问城市，动作将是选择下一步要访问的城市，而奖励函数基于路径长度。
实验设置：我们将使用公开可用的TSP数据集进行实验，模拟不同规模和复杂性的TSP实例，并进行超参数调整以优化性能。
数据分析计划：我们将评估我们的算法在不同TSP实例上的性能，比较其与传统方法的表现，并分析结果以验证研究假设。
预期结果：我们预期本研究将产生一种能够有效解决TSP问题的强化学习算法，并为组合优化问题的解决提供一种新的方法。

理论与实践方面预计的预期成果

理论研究深度提升：本论文将通过深入的文献研究和理论分析，为相关领域的研究提供新的理论视角和洞见。预计将从现有文献中识别并填补知识的空白，为相关领域的理论研究做出贡献。
方法学创新：论文将提出一种新的方法或改进现有方法，以解决相关问题。这个方法将在实践中进行测试和验证，以证明其有效性和可行性。
实践案例研究：论文将对一个或多个实际案例进行详尽的研究，以验证理论和方法的实际应用。通过深入的实践调查和分析，将提供有关解决实际问题的有效策略和建议。
数据分析和结果呈现：预计将使用定量和定性数据进行详细的分析，以支持理论和方法的实际效果。相关的图表、表格和可视化工具将用于清晰地呈现研究结果。
贡献和结论：论文将总结研究的主要发现，并讨论其对相关领域的重要性。还将提供未来研究方向的建议，以推动领域的进一步发展。
这些预期成果将有助于丰富学术知识，提高相关领域的实践效益，并为未来的研究和决策提供有价值的参考。

主要参考文献

[1]zig, G. B.; and Ramser, J. H. 1959. The truck dispatching problem. Management science, 6(1): 80–91.
[2] SUTTON R, BARTO A. Reinforcement learning: an introduction[M]. Cambridge: MIT Press, 1998.
[3] BENGIO Y, LODI A, PROUVOST A. Machine learning for combinatorial optimization: a methodological tour d’horizon [J]. European Journal of Operational Research, 2021, 290 (2): 405-421.
[4]Cordeau J F, Laporte G. A tabu search heuristic for the static multi-vehicle dial-a-ride problem[J]. Transportation Research Part B: Methodological, 2003, 37(6): 579-594.
[5]Rego C, Gamboa D, Glover F, et al. Traveling salesman problem heuristics: Leading methods, implementations and latest advances[J]. European Journal of Operational Research, 2011, 211(3): 427-441.
[6]Glover F. New ejection chain and alternating path methods for traveling salesman problems[M]//Computer science and operations research. Pergamon, 1992: 491-509.
[7]Yanai C, Solomon A, Katz G, et al. Q-Ball: Modeling Basketball Games Using Deep Reinforcement Learning[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2022, 36(8): 8806-8813.
[8]Nagata Y, Kobayashi S. A powerful genetic algorithm using edge assembly crossover for the traveling salesman problem[J]. INFORMS Journal on Computing, 2013, 25(2): 346-363.
[9]Lin S. Computer solutions of the traveling salesman problem[J]. Bell System Technical Journal, 1965, 44(10): 2245-2269.
[10]Zheng J, He K, Zhou J, et al. Combining reinforcement learning with Lin-Kernighan-Helsgaun algorithm for the traveling salesman problem[C]//Proceedings of the AAAI conference on artificial intelligence. 2021, 35(14): 12445-12452.
[11]Held M, Karp R M. The traveling-salesman problem and minimum spanning trees[J]. Operations Research, 1970, 18(6): 1138-1162.
[12]Zhang W, Looks M. A novel local search algorithm for the traveling salesman problem that exploits backbones[C]//IJCAI. 2005, 5: 343-384.
[13]Tsai H K, Yang J M, Kao C Y. Solving traveling salesman problems by combining global and local search mechanisms[C]//Proceedings of the 2002 Congress on Evolutionary Computation. CEC’02 (Cat. No. 02TH8600). IEEE, 2002, 2: 1290-1295.
[14]He P, Hao J K. General edge assembly crossover-driven memetic search for split delivery vehicle routing[J]. Transportation Science, 2023, 57(2): 482-511.
[15]Zheng J, Zhong J, Chen M, et al. A reinforced hybrid genetic algorithm for the traveling salesman problem[J]. Computers & Operations Research, 2023, 157: 106249.
[16]林剑, 叶璟轩, 刘雯雯, 等. 求解带容量约束车辆路径问题的多模态差分进化算法[J]. 计算机应用, 2023, 43(7): 2248.
[17]Taillard É D, Helsgaun K. POPMUSIC for the travelling salesman problem[J]. European Journal of Operational Research, 2019, 272(2): 420-429.
[18]Cordeau J F, Gendreau M, Laporte G. A tabu search heuristic for periodic and multi‐depot vehicle routing problems[J]. Networks: An International Journal, 1997, 30(2): 105-119.
[19]Su H, Zhong Y D, Dey B, et al. A Decentralized Reinforcement Learning Framework for Efficient Passage of Emergency Vehicles[J]. arXiv preprint arXiv:2111.00278, 2021.
[20]Chu W, Li L, Reyzin L, et al. Contextual bandits with linear payoff functions[C]//Proceedings of the Fourteenth International Conference on Artificial Intelligence and Statistics. JMLR Workshop and Conference Proceedings, 2011: 208-214.
[21]Hu S, Xie C, Liang X, et al. Policy diagnosis via measuring role diversity in cooperative multi-agent rl[C]//International Conference on Machine Learning. PMLR, 2022: 9041-9071.
[22]Liu F, Zeng G. Study of genetic algorithm with reinforcement learning to solve the TSP[J]. Expert Systems with Applications, 2009, 36(3): 6995-7001.
[23]Abbasi-Yadkori Y, Pál D, Szepesvári C. Improved algorithms for linear stochastic bandits[J]. Advances in neural information processing systems, 2011, 24.
[24]Vidal T, Crainic T G, Gendreau M, et al. A hybrid genetic algorithm for multidepot and periodic vehicle routing problems[J]. Operations Research, 2012, 60(3): 611-624.
[25]Vidal T. Hybrid genetic search for the CVRP: Open-source implementation and SWAP* neighborhood[J]. Computers & Operations Research, 2022, 140: 105643.
[26]Helsgaun K. General k-opt submoves for the Lin–Kernighan TSP heuristic[J]. Mathematical Programming Computation, 2009, 1: 119-163.
[27]Zhang W. Configuration landscape analysis and backbone guided local search.: Part i: Satisfiability and maximum satisfiability[J]. Artificial Intelligence, 2004, 158(1): 1-26.
[28]Wang H P, Wu N, Yang H, et al. Unsupervised learning for combinatorial optimization with principled objective relaxation[J]. Advances in Neural Information Processing Systems, 2022, 35: 31444-31458.
[29]Auer P, Cesa-Bianchi N, Fischer P. Finite-time analysis of the multiarmed bandit problem[J]. Machine learning, 2002, 47: 235-256.
[30]Xin L, Song W, Cao Z, et al. NeuroLKH: Combining deep learning model with Lin-Kernighan-Helsgaun heuristic for solving the traveling salesman problem[J]. Advances in Neural Information Processing Systems, 2021, 34: 7472-7483.
[31] ALIPOUR M M, RAZAVI S N, DERAKHSHI M F, et al. A hybrid algorithm using a genetic algorithm and multiagent reinforcement learning heuristic to solve the traveling salesman problem[J]. Neural Computing and Applications, 2018, 30(9): 2935-2951.
[32] FAIREE S, KHOMPATRAPORN C, PROM- ON S, et al. Combinatorial artificial bee colony optimization with reinforcement learning updating for travelling salesman problem [C]//Proceedings of the 2019 16th International Conference on Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology, Pattaya, Jul 10- 13, 2019. Piscataway: IEEE, 2019: 93-96.
[33] HU Y J, YAO Y, LEE W S. A reinforcement learning approach for optimizing multiple traveling salesman problems over graphs[J]. Knowledge-Based Systems, 2020, 204: 106244.
[34] YAO F, CAI R Q, WANG H N. Reversible action design for combinatorial optimization with reinforcement learning[J]. arXiv:2102.07210, 2021

Coze智能体开发：如何批量生成和处理图片王国平 Coze AI Agent智能体开发语言模型人工智能开发语言智能体 Agent
在绘本制作、图片后期制作等场景中，往往需要使用模型来批量生成和处理图片。扣子提供了多个图像处理类节点，支持图像生成、添加水印、画质优化等多种常见的图片处理方式，你可以在批处理节点中嵌套图像生成等图像处理节点，实现图片的批量操作。本文档以绘本制作工作流为例，演示如何通过批处理节点和图像节点实现图像的批量生成和批量处理。效果演示通过绘本制作工作流，你可以批量生成类似以下风格的图片。搭建过程中你也可以根
深入理解数据库领域的 SQL 索引失效问题数据库管理艺术数据库 sql ai
深入理解数据库领域的SQL索引失效问题关键词：SQL索引、索引失效、查询优化、执行计划、数据库性能、B+树、索引选择性摘要：本文深入探讨SQL索引失效的核心问题，分析导致索引失效的8种典型场景及其背后的原理机制。通过B+树索引结构解析、执行计划解读和实际案例演示，帮助开发者全面理解索引失效的本质原因。文章提供详细的优化方案和最佳实践，包括索引设计原则、SQL编写规范以及性能调优技巧，并附有MySQ
搜索领域SEO进阶：内容优化与用户体验提升搜索引擎技术 ux ai
搜索领域SEO进阶：从关键词堆砌到用户价值——内容优化与体验升级的实战指南关键词SEO进阶、内容质量、用户体验、E-E-A-T、用户行为信号、结构化数据、页面速度优化摘要当“SEO=关键词堆砌”的时代成为历史，当搜索引擎算法从“识别文字”进化到“理解意图”，SEO从业者正面临一场从“技术投机”到“用户价值”的范式转移。本文将深度拆解搜索领域的进阶策略：从内容优化的核心逻辑（E-E-A-T框架、主题
2023年搜索领域的技术认证与职业发展指南搜索引擎技术搜索引擎 ai
2023年搜索领域的技术认证与职业发展指南关键词搜索领域、技术认证、职业发展、搜索引擎技术、人工智能搜索摘要本指南旨在为搜索领域的从业者和有志于进入该领域的人士提供全面的技术认证与职业发展参考。首先介绍搜索领域的概念基础，包括其历史发展和关键问题。接着阐述相关理论框架，分析不同认证背后的原理。架构设计部分展示搜索系统的组成与交互。实现机制探讨算法复杂度和代码优化。实际应用部分给出实施和部署策略。高
LRU缓存算法在搜索引擎中的应用数据结构与算法学习缓存算法搜索引擎 ai
LRU缓存算法在搜索引擎中的应用关键词：LRU算法、缓存淘汰、搜索引擎、哈希表、双向链表、性能优化、访问频率摘要：本文深入探讨了LRU(最近最少使用)缓存算法在搜索引擎中的关键应用。我们将从基本概念出发，通过生活化的比喻解释LRU的工作原理，分析其在搜索引擎架构中的具体实现方式，并通过Python代码示例展示如何构建一个高效的LRU缓存系统。文章还将讨论LRU算法的数学建模、实际应用场景以及未来发
React.js在前端移动端开发中的应用大厂前端小白菜前端 react.js 前端框架 ai
React.js在前端移动端开发中的应用关键词：React.js、移动端开发、跨平台、组件化、性能优化、ReactNative、PWA摘要：本文将深入探讨React.js在移动端开发中的应用场景和技术实现。从React的核心特性出发，分析其在移动端的优势，详细介绍ReactNative的工作原理，并通过实际案例展示如何构建高性能的移动应用。文章还将对比不同移动端开发方案，提供性能优化建议，并展望R
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
python系列之：使用md5和sha256完成签名认证，调用接口快乐骑行^_^ 前端和后端开发 python系列使用md5和sha256 完成签名认证调用接口
python系列之：使用md5和sha256完成签名认证，调用接口MD5签名和sha256签名认证md5认证代码sha256认证代码拼接签名生成签名拼接url调用接口MD5签名和sha256签名认证MD5签名认证算法特性：生成128位(16字节)的哈希值计算速度快已被证明存在碰撞漏洞(不同输入可能产生相同输出)签名认证流程：发送方对原始数据计算MD5哈希值将哈希值附加到数据中发送接收方重新计算接收
AI智能体原理及实践：从概念到落地的全链路解析 you的日常人工智能大语言模型人工智能机器学习深度学习神经网络自然语言处理
AI智能体正从实验室走向现实世界，成为连接人类与数字世界的桥梁。它代表了人工智能技术从"知"到"行"的质变，是能自主感知环境、制定决策、执行任务并持续学习的软件系统。在2025年，AI智能体已渗透到智能家居、企业服务、医疗健康、教育和内容创作等领域，展现出强大的生产力与创造力。然而，其发展也伴随着技术挑战、伦理困境和安全风险，需要从架构设计到落地应用的全链条思考与平衡。一、AI智能体的核心定义与技
spring中@Transactional注解和事务的实战理解附代码 GJCTYU spring oracle 数据库 spring boot mybatis 后端
文章目录前言一、事务是什么？二、事务的特性2.1隔离性2.2事务的隔离级别三、@Transactional注解@Transactional注解简介基本用法常用属性配置事务传播行为事务隔离级别异常处理与回滚性能优化建议四、事务不生效的可能原因方法访问权限非public自调用问题异常被捕获未抛出数据库引擎不支持事务未启用事务管理特殊场景：final/static方法五、分布式事务考虑总结前言在开发过程
MySQL 使用order by limit 分页重复问题我爱双面奶 SQL sql 分页重复
一、问题描述执行以下sql，在数据没有插入删除的情况下，返回的数据可能不一致，导致线上出现重复数据selectxxxfromtablewherexxxorderbyxxxlimitoffset二、产生原因在mysql5.6版本，mysql对orderbylimit做了一个优化，使用了priorityqueue，priorityqueue使用的是堆排序策略，在排序过程中虽然还要对n个数据进行排序，但
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
零基础数据结构与算法—— 第三章：高级数据结构-总结 qqxhb 零基础数据结构与算法小学生编程算法数据结构算法树堆哈希表图
3.1树（上）3.1树（下）3.2堆（Heap）3.3哈希表（HashTable）3.4图（Graph）3.5高级树结构3.6本章小结在本章中，我们深入学习了几种重要的高级数据结构，这些数据结构在解决复杂问题时具有强大的能力。让我们回顾一下本章的主要内容：1.堆（Heap）堆是一种特殊的完全二叉树，具有堆序性质。我们学习了：最大堆和最小堆的概念和性质堆的基本操作（插入、删除堆顶、获取堆顶、构建堆）
无法删除或者修改注册表权限不够，如何修改注册表的权限番知了注册表 Windows 权限更改设置 Windows权限
目录1如何找到注册表项（详细步骤）方法步骤（图文步骤）此方法适用于你遇到的以下问题：2为什么这里不是文件位置？3执行修改时务必谨慎如何找到注册表项（详细步骤）方法步骤（图文步骤）打开注册表编辑器按键盘组合键Win+R输入命令：regedit点击确定，打开注册表编辑器。定位你需要修改的注册表项，如：注册表左侧面板树状结构中定位到路径：HKEY_LOCAL_MACHINE\SOFTWARE\Micro
推客系统全栈开发指南：从架构设计到商业化落地 ywyy6798 系统小程序分销系统短剧系统海外短剧系统推客系统推客小程序
一、推客系统概述推客系统（TuiKeSystem）是一种结合社交网络与内容分发的创新型平台，旨在通过用户间的相互推荐机制实现内容的高效传播。这类系统通常包含用户关系管理、内容发布、智能推荐、数据分析等核心模块，广泛应用于电商导购、知识分享、新闻资讯等领域。推客系统的核心价值在于：利用社交关系链实现内容病毒式传播通过激励机制提升用户参与度基于用户行为数据优化推荐算法构建内容生产者与消费者的良性互动生
推客系统开发：从0到1构建高效社交化推荐引擎 wx_ywyy6798 推客系统分销系统海外短剧系统推客小程序推客系统开发推客小程序开发推客分销系统
在信息爆炸的时代，如何让用户快速获取感兴趣的内容？推客系统（推荐引擎）成为解决这一问题的核心方案。无论是电商、内容平台还是社交应用，精准的推荐算法都能显著提升用户粘性和转化率。本文将带您了解推客系统的核心模块与开发要点，助您快速构建高效的推荐体系。一、推客系统的核心价值个性化体验：基于用户行为数据（浏览、点赞、收藏等）生成定制化推荐。流量高效分发：解决“信息过载”问题，提升内容/商品的曝光率。商业
《推客系统开发全景指南：从架构设计到运营落地的完整解决方案》 wx_ywyy6798 数据库大数据短剧 java 推客系统推客小程序推客分销
一、推客系统概述与市场背景1.1什么是推客系统？推客系统（ReferralSystem）是一种基于社交关系网络的数字化推荐营销平台，通过系统化的机制设计激励用户自发进行产品或服务的推广传播。这种系统将传统的口碑营销模式与现代互联网技术相结合，形成了可追踪、可量化、可优化的新型营销生态系统。1.2行业发展现状随着流量红利逐渐消退，企业获客成本不断攀升，推客系统凭借其高效低成本的特性受到广泛关注。据统
《支持向量机（SVM）在医疗领域的变革性应用》 CodeJourney. 支持向量机算法机器学习
在医疗科技日新月异的今天，先进的数据分析与机器学习技术正逐渐成为提升诊疗水平、助力医学研究的关键力量。支持向量机（SVM），凭借其独特的优势，在医疗这片复杂且对精准度要求极高的领域崭露头角，带来诸多令人瞩目的应用成果。一、疾病诊断：癌症早期筛查的“火眼金睛”癌症，作为全球健康的“头号杀手”，早期诊断对提升患者生存率意义非凡。在乳腺癌筛查领域，SVM发挥着重要作用。医疗科研人员收集大量乳腺组织的影像
202505架构师论文《论静态负载均衡策略设计和应用》文琪小站系统架构师软考论文负载均衡运维软考论文
软件架构师论文范文系列摘要在当今高度依赖信息技术的时代，构建高性能、高可用的分布式系统已成为必然趋势。负载均衡作为分布式系统中的关键技术，旨在将请求或数据有效地分发到多个处理单元，以优化资源利用率、提升系统吞吐量并确保服务的稳定运行。本文深入探讨了静态负载均衡策略的设计原理、技术特点及其在实际项目中的应用。首先，概述了负载均衡的整体概念及静态策略的分类，重点介绍了基于哈希、轮询和权重等静态算法的实
机器学习20-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习20-线性网络思考针对线性网络的基础问题，使用基础示例进行解释1-核心知识点1-线性模型家族的线性回归和逻辑回归分别是什么，线性模型家族还有没有其他的模型线性模型家族是一系列基于线性假设的统计模型，它们假设因变量和自变量之间存在线性关系。线性模型家族中的两个最常见模型是线性回归和逻辑回归。线性回归（LinearRegression）:线性回归是一种用于预测连续因变量的模型。它假设因变量yy
机器学习18-强化学习RLHF 坐吃山猪机器学习机器学习人工智能
机器学习18-强化学习RLHF1-什么是RLHFRLHF（ReinforcementLearningfromHumanFeedback）即基于人类反馈的强化学习算法，以下是详细介绍：基本原理RLHF是一种结合了强化学习和人类反馈的机器学习方法。传统的强化学习通常依赖于预定义的奖励函数来指导智能体的学习，而RLHF则通过引入人类的反馈来替代或补充传统的奖励函数。在训练过程中，人类会对智能体的行为或输
机器学习19-Transformer和AlexNet思考坐吃山猪机器学习机器学习 transformer 人工智能
Transformer和AlexNet思考关于Transformer和AlexNet发展的一些思考1-核心知识点Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？AlexNet的主要核心思路是什么，为什么表现那么好？现在有什么比AlexNet更优秀的算法2-思路整理1-Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？Word2Vec的作用Word2
机器学习21-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习21-线性网络思考针对线性网络的发展问题，进行补充学习1-核心知识点1-传统机器学习针对线性分类算法求解的方式有哪些？请详细列举不同的算法对应的损失函数和计算思路在传统机器学习中，线性分类算法是一种非常重要的方法，用于将数据划分为不同的类别。以下是几种常见的线性分类算法，包括它们的损失函数和计算思路：1.感知机（Perceptron）损失函数感知机的损失函数是基于误分类点的，其目标是最小化
Vue计算属性(computed)全面解析：原理、用法与最佳实践雪碧聊技术 uniapp vue.js 前端 javascript computed
目录前言一、计算属性基础概念1.什么是计算属性2.基本语法3.简单示例二、计算属性的核心特性1.响应式依赖追踪2.缓存机制3.不可直接赋值三、计算属性vs方法1.基本区别2.性能对比3.何时使用方法四、计算属性的高级用法1.设置setter2.依赖多个数据源3.结合过滤器使用五、常见使用场景1.数据过滤与转换2.表单验证3.复杂条件判断4.动态样式计算六、计算属性的性能优化1.避免复杂计算2.减少
Spring IO 与企业级应用开发_构建标准化项目的最佳实践
1.前言1.1SpringIO的诞生背景与定位随着Spring生态的不断扩展，Java开发者在使用SpringBoot、SpringData、SpringSecurity等模块时，常常面临一个痛点：不同模块之间版本不一致、依赖冲突频发、升级困难。为了解决这一问题，Spring推出了SpringIOPlatform，它是一个统一版本管理平台，提供了一套经过验证的模块版本组合（BOM），帮助开发者快速
巧用云平台API实现开源模型免费调用的实战教程 herosunly AIGC 人工智能大模型 API 实战教程
大家好，我是herosunly。985院校硕士毕业，现担任算法工程师一职，获得CSDN博客之星第一名，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得多项AI顶级比赛的Top名次，其中包括阿里云、科大讯飞比赛第一名，CCF、开放原子比赛二等奖。在技术创新领域拥有多项授权发明。曾辅导多位非科班出身的同学成功进入算法行业就业
C++中noexcept的具体特性及其代码示例码事漫谈 c++c++开发语言
文章目录1.**作为异常说明符**2.**作为运算符**3.**性能优化**4.**异常安全性**总结1.作为异常说明符noexcept可以放在函数声明或定义的后面，表示该函数不会抛出任何异常。如果函数在运行时抛出异常，程序会立即终止，并调用std::terminate()函数。特性：编译时检查：编译器会检查函数是否可能抛出异常。如果函数内部调用了可能抛出异常的代码，编译器会报错。运行时终止：如果
搜索之BFS Luther coder 宽度优先 c++
目录一.BFS简介二.BFS主要应用和实现三.典型例题（1）P1443马的遍历-洛谷（2）P8693[蓝桥杯2019国AC]大胖子走迷宫-洛谷四.总结一.BFS简介BFS(图论)：广度优先搜索,是一种用于遍历或搜索树或图的算法。所谓广度优先，就是说按照圈层搜索。二.BFS主要应用和实现在搜索算法中，该BFS常常指利用队列实现广度优先搜索，从而寻找最短距离。与图论中的BFS算法有一定相似之处，但并不
数据结构与算法：贪心（二）
前言要加快速度啊！！一、最短无序连续子数组classSolution{public:intfindUnsortedSubarray(vector&nums){intn=nums.size();intMax=-1e9;intright=-1;//最右不符合的位置for(inti=0;inums[i])//遇到不符合递增规律的数{right=i;}Max=max(Max,nums[i]);}intMi
Golang路由性能优化：提升Web应用响应速度 Golang编程笔记 Golang编程笔记 Golang开发实战 golang 性能优化前端 ai
Golang路由性能优化：提升Web应用响应速度关键词：Golang路由、性能优化、RadixTree、Web应用响应、路由匹配算法摘要：在Web应用开发中，路由是处理请求的"第一站"。路由性能直接影响用户体验——慢0.1秒可能流失10%的用户！本文以Golang为背景，从路由匹配的底层原理出发，结合生活案例、代码实战和性能测试，带你一步一步掌握路由优化的核心技巧。无论是刚接触Go的新手，还是想突
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST