CSDN资讯

让 GPT-4 修改文件，真的太难了！

【CSDN 编者按】“无所不能”的 GPT-4 也有犯错的时候，不信请看本文。

作者 | Kevin Lu

译者 | 弯月

出品 | CSDN（ID：CSDNnews）

自 GPT-4 发布以来，我们一直在尝试让其修改长篇的代码文件。尽管它在解决复杂问题或从零开始创建复杂系统方面表现出色，但在向一个 200 行代码的 Flask 服务器中插入日志时，它却举步维艰。然而，显然后者更为实用。

我们经常听到的一种抱怨是：“ChatGPT 可以完成这项任务，但你们的 Sweep.AI 却不能”。这是因为 GPT-4 并不能一致地编辑长篇文件，它往往会在中途写入“＃Rest of the code”，或错误地复制一段代码，而使用ChatGPT的人类可以轻松解决这个算法无法解决的问题。因此，我们不能简单地通过从头开始重写文件的方式来修改文件。

以下是我们做过的所有让 GPT-4 修改文件的尝试，以及由于 GPT-4 未能正确格式化或计数而导致的成功和失败。

版本 0：简单地重写整个文件

如前所述，完全重写文件存在两个主要问题：

1、对于超过 50 行的文件，GPT-4 最终会生成类似“＃Rest of the code”的内容。

2、文件太长。拥有 k 个令牌的文件将需要 k 个输入令牌和 k 个输出令牌。

3、GPT-4 会错误地复制代码。它有时会删除或添加额外的注释或空白，或更改缩进。

我们来看一个如何解决第一个问题的示例。

在本文中，我将使用以下简短的 Flask 服务器实现作为我们正在编辑的文件的示例。出于简洁考虑，我选择了一个简短的示例，因此对于这个特定示例，GPT-4 也许不会出现这些错误，但在较大的文件中经常会出现类似的错误。

要求 GPT-4 添加日志，我们可能会得到以下内容：

显然，我们不能仅凭这段代码创建拉取请求（PR）！我们必须撤销所有“＃Rest of the code”的修改。

版本 1：使用 difflib 修复“rest of the code”

救命稻草 difflib

最简单的解决方案似乎是检查两个文件的差异，并回滚所有带有“Rest of the code”、“Remaining of the code”的部分。

上面示例的差异如下所示：

现在，我们只需撤销每个删除后面带一个形如 + # Rest of test 注释的部分。具体来说，我们使用以下方法检查这些注释：

在这个示例中，它解决了问题：我们最终得到了我们所期望的结果，即在每个函数的开头有一个打印语句。

限制

不幸的是，这个差异回滚系统的能力仍然相当有限。首先，有时 GPT-4 会写下诸如“More unti tests here”，“Complete the implementation”，“...”等注释，有无限多可能。其次，有些情况下，差异算法无法找到具体应当被替换的行。

例如，让我们要求 GPT-4 添加一个删除端点，它的回应是：

但差异算法返回的内容如下：

回滚该差异只会产生：

显然，这完全不是我们所期望的。在 Sweep.AI 的最初几周中，由于这个问题，Sweep 会随机删除大段的代码。

也许我们可以编写一个更智能的差异算法来捕捉这些讨厌的“Rest of code”注释。但即使如此，从算法角度来看，也不可能确定GPT-4的意图是要删除一切并添加新的 delete_task 端点，还是要将 update_task 端点替换为 delete_task 端点。

根本的问题在于，我们无法确定# Rest of code的意思是替换直到 update_task 的所有代码，还是仅仅是替换 create_task 端点。我们需要不同的输入。我们需要让 GPT-4 指出每个替换和修改标签的覆盖范围。

版本 2：以行为单位修改或复制

思路

如果可以让 GPT-4 编写一组具体的替换说明，我们就可以用新代码进行替换。最初，我们采用了以下格式：

这段指令的意思是使用新的代码替换从 i（包含）到 j（不包含）的行。

通常，我们更喜欢从 GPT-4 获得基于 XML 的响应，因为它们：

可以使用正则表达式轻松解析。我们的模式通常类似于：(?P.*?)。

 
    在训练数据（从网上获取的数据）中很常见，因此大型语言模型非常了解它们。 
    可以处理引号和换行符，这些符号在代码中很常见。XML 不像 JSON 那样需要对符号进行转义。此外，XML 的结束标记通常很少出现。 
    大型语言模型很难破坏 XML 格式。

 
   例如，向上面的 Flask API 端点添加更多示例数据，GPT-4 会给出： 
    
   而插入新的代码，比如删除端点，GPT-4 会给出： 
    
   GPT-4 无法复制行号 
   当然，我们在提示中添加了代码的行号，以帮助模型正确计数。然而，即便如此，GPT-4 也会复制不正确的行号。这可能导致代码缺失一行或多出一行，如下所示，缺少 return 语句： 
    
   或者产生重复的代码行，如下所示： 
    
   我们尝试了一些办法，但都无法很好地解决这个问题： 
   1、删除重复行：如果出现重复较小的行，我们将尝试去除重复行。不幸的是，这并不完全可的，有时会错误删除有意重复的代码。而且它无法处理缺失行的情况。 
   2、通过另一个模型运行以修复代码：我们将代码输入到 GPT-3.5-16k 中，以验证更改并修复应该修复的内容。不幸的是，这会导致复制中的随机错误，并偶尔出现随机的“＃Rest of code”。所以这条路也行不通。 
   我们还尝试了其他方法，但感觉不太自然，即从文件中复制旧的代码行，然后自然地编写剩下的部分，如下所示： 
    
   但同样会受到错误行号的影响。 
    
   版本 3：aider diff 
   这个时候，我们碰巧看到了 aider 创建者的博客文章，aider 是类似于 Sweep 的工具，但是它在本地运行。Aider 要求 GPT-4 生成以下格式的搜索和替换对： 
    
   然后只需在代码中搜索原始代码块，并用新代码块替换。例如，为了生成更多的测试数据，它可能生成如下内容： 
    
   这种新方法在我们以前的尝试中效果明显更好，我认为主要原因是： 
   1、对于 LLM 来说，复制代码比选择正确的行号要容易得多。 
   2、一旦代码被复制到ORIGINAL代码块中，Sweep 就可以非常容易地修改代码，因为 ORIGINAL 原始代码更接近 GPT-4 编写的代码的地方，并且可以用作参考。很有可能，位置嵌入减少了 LLM 在修改代码块过程中的噪声。 
   这种格式与 git 合并冲突的格式相似，这可能是 GPT-4 的训练数据的一部分。 
   然而，我们仍然有一些问题： 
    
    可能无法正确地复制 ORIGINAL 代码。 
    
   ○最初，我们考虑构建一个模糊匹配算法。然后，我们构建了 V4 来进一步解决这个问题。 
    
    ORIGINAL 代码块可能会多次出现在代码中。 
    
   ○默认情况下，我们会匹配第一个项。 
   ○我们还提示 Sweep 在 ORIGINAL 代码块前后多复制几行以消除歧义。 
   ○此外，通常不建议在多个地方重复使用中等大小的代码块，而是应该使用辅助函数。 
    
    在重新编写较长的部分时，它仍然偶尔会写入“＃Rest of code”。 
    
   ○我们提示 GPT-4 进行多个小的更改，而不是较大的更改。 
    
    代码仍然太长。 
    
   ○对于超过 600 行的文件，我们会要求 GPT-4 一次处理 400 行代码。由此产生了一些与上下文相关的问题，但这解决了目前的问题。有关此问题的更多信息，请参见下文。 
    
   版本 4：搜索并替换 
   我们目前的算法是在 Aider diff 的基础上进行了一些扩展。主要问题是，对于中等大小的文件，Sweep 经常会复制错误的行。 
   Aider diff 存在的问题 
   例如，如果要求 Sweep 向端点添加日志： 
    
   此处，ORIGINAL 代码块中的 create_task 被无意间更改为 start_task。本质上是 GPT-4 错误地复制了行，然后在错误复制的行上应用了转换。 
   更准确地说，GPT-4 本来想把子字符串 S 替换成 R(S)，其中 R: str → str 是需要进行的变换。但是，它生成了 S'，然后替换成了 R(S')。这就导致 S 被替换成了 R(S')，这经常会导致代码无法编译，或者导致不可预见的错误。 
   aider diff 的改进 
   一个解决方案是更早地开始流式传输，即使用 200 行的块而不是 400 行的块，但这会导致更多的问题，如算法缺少上下文、性能较差和成本较高。 
   最终我们的解决方案是分别生成 S 和 R(S)。首先让 GPT-4 生成 S'，然后通过模糊匹配，在代码中用 S' 搜索 S。然后要求 GPT-4 在 S 上执行相应的变换，这样就生成了 R(S)。 
   具体而言，新算法执行以下操作： 
   1、生成一系列的小段代码：S'1, S'2, ..., S'n，供GPT-4编辑，然后使用模糊匹配算法，找到正确的行：S1, S2, ..., Sn。 
   a.如果模糊匹配对于某个 S'i 产生的相似度分数过低（< 50%），则抛弃。未来也可以向 GPT-4 重新提示该问题。 
   2、然后将真正的代码片段发给 GPT-4 进行编辑。 
   因此，我们会要求 GPT-4 生成类似于以下内容：  
    
   此时生成省略号(...)是允许的，因为我们的匹配算法通常可以正确匹配代码片段。然后，我们会在代码库中找到真正的代码片段，并呈现给 GPT-4 进行编辑，如下所示： 
    
   然后，我们会回复以下内容，要求 GPT-4 进行编辑： 
    
   这样可以确保不会出现意外编辑，比如将变量从 create_task 重命名为 start_task。 
    
   其他障碍 
   以下是我们遇到的其他不太重要的障碍： 
    
    格式错误：我们设置了一个退避系统，可以再次提示 GPT-4 以更高的准确度以正确的格式提供响应。 
    缩进：GPT-4 往往会取消缩进代码，这会使 Python 代码无法解析。我们通过匹配原始缩进来修复这个问题，根据 ORIGINAL 代码块和原始文件的匹配部分之间的缩进差异来进行匹配。 
    
   尽管我们解决了大部分问题，但仍然存在一些文件太长的问题。我们自己的代码库中就有多个超过 1000 行的文件。 
    
    每次流式传输 400 行只是一个权宜之计，但并不能完全解决问题，因为它会分割代码的语义。此外，模型有时不会修改代码的任何部分，有时会修改代码的多个部分。在没有文件其余部分的上下文的情况下，修改文件的一部分非常困难。 
    对于 Python，我们建立了基于实体的编辑。最近，我们建立了一个用于更好地理解 Python 代码的库级别的调用图系统。我们在规划阶段使用它，让 LLM 决定要编辑文件的哪个类或函数。 
    
    
   结论 
   让 GPT-4 正确修改代码是一场艰苦的战斗，很容易出现各种错误。自发布以来，我们一直在与这些错误作斗争，但只能缓解常见的错误。 
   原文链接：https://docs.sweep.dev/blogs/gpt-4-modification 
   推荐阅读： 
   ▶ 雷军：小米汽车进展非常顺利，明年上半年正式上市；程序员篡改ETC余额，一年私吞260余万元；SiFive裁员20%|极客头条 
   ▶自研代码超 14 万行、沉淀 11 年，deepin-IDE：正在改写“为什么没有好的国产 IDE”答案！ 
   ▶大模型时代，得开发者生态得天下！


    
        你可能感兴趣的:(人工智能)
        
            
                
                    AIGC视觉生成革命：文生图、图生图与视频生成垂直模型发展全景报告（2025）
                        Liudef06小白
AIGC人工智能AI作画语言模型
                        一、引言：从实验工具到产业引擎的跃迁人工智能生成内容（AIGC）技术正经历从文本向多模态的范式转移。2023-2025年间，文生图、图生图与视频生成垂直模型逐步跨越技术奇点，从实验室玩具进化为工业化生产力工具。这一进程的核心驱动力在于架构创新、数据优化与场景深耕的三重突破：扩散模型与Transformer的融合催生了更高保真度的图像生成；十亿级多模态数据训练解决了复杂语义理解难题；而面向影视、电商
                    
                    [论文阅读] 人工智能 | 读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法
                        张较瘦_
前沿技术论文阅读人工智能
                        读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法论文标题：Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsarXiv:2507.02533Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsMiguelRomero-Arjona,JoséA.Parejo,Jua
                    
                    深度 |AI高质量数据集交易爆发式增长
                        数智前沿
数字化转型人工智能数据集
                        AI产业从通用模型向行业垂直应用快速融合下沉的阶段演进，人工智能三大基本要素之一数据，面临的高质量数据不足问题却凸显。财联社记者最新从业内获悉，目前各大模型企业迫切希望获得更多更好的高质量数据集，需求集中于头部企业行业知识底座构建，人工智能高质量数据集的需求量、交易量激增，已成为数据流通最活跃的领域。不过，高质量数据集的建设、流通环节均面临诸多问题，目前数据交易所并非模型语料最主要的采购途径。需求
                    
                    轻量化分布式AGI架构：基于区块链构建终端神经元节点的互联网智脑
                        探客木木夕
分布式agi人工智能架构区块链
                        在2025年的技术发展背景下，轻量化分布式AGI架构正成为人工智能领域的重要突破方向。通过将终端设备转化为神经元节点，结合区块链技术构建去中心化的互联网智脑，不仅能够突破传统AGI开发的算力瓶颈，还能实现数据安全共享与价值分配。**这一架构将重塑人工智能的发展范式，使AGI能力从中心化实验室扩散至全球终端设备网络，最终形成一个去中心化、自演进、高可用的互联网级智能系统**。研究显示，通过知识密度提
                    
                    写测试太烦？Copilot + Jest 让你 3 分钟搞定单元测试
                        

                        网罗开发（小红书、快手、视频号同名）  大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
                    
                    Python编程电子书：从基础到实践
                        王奥雷

                        本文还有配套的精品资源，点击获取简介：Python电子书汇集了基础语法、面向对象编程、标准及第三方库使用、文件操作、网络编程、并发编程、单元测试与调试、Python2与Python3的区别等核心知识点。通过实例和项目案例，帮助读者在Web开发、数据分析、人工智能等应用领域提升编程技能，跟上Python的技术进步。1.Python基础语法介绍Python作为一种高级编程语言，其易读性和简洁的语法使其
                    
                    开源模型应用落地-OpenAI Agents SDK-集成MCP与Qwen3-8B模型的创新应用探索（七）
                        开源技术探险家
开源模型-实际应用落地开源pythonai人工智能
                        一、前言在人工智能技术飞速发展的今天，如何将先进的模型和技术无缝结合，成为推动行业变革的关键。OpenAIAgents通过集成模型上下文协议（MCP）和阿里巴巴推出的Qwen3-8B模型，正开启一场智能应用的革命。这种创新的结合不仅提升了AI代理与外部工具之间的通信能力，还在多模态任务处理、个性化服务等领域展现出巨大潜力。本文将深入探讨这一技术组合的实际应用场景，揭示其在改善客户体验和提升运营效率
                    
                    开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用（六）
                        开源技术探险家
开源模型-实际应用落地开源pythonai人工智能
                        一、前言随着人工智能技术的迅猛发展，大语言模型（LLM）在各行各业的应用日益广泛。然而，模型生成的内容是否安全、合规、符合用户预期，成为开发者和企业不可忽视的问题。为此，OutputGuardrail应运而生，作为一种关键的安全机制，它在模型生成结果之后进行内容审核与过滤，确保输出不偏离道德、法律和业务规范。通过检测不当的内容，不仅提升了AI系统的可信度，也为构建更加稳健和负责任的人工智能应用提供
                    
                    开源模型应用落地-让AI更懂你的每一次交互-Mem0集成Qdrant、Neo4j与Streamlit的创新实践（四）
                        开源技术探险家
开源模型-实际应用落地neo4j开源人工智能语言模型
                        一、前言在人工智能迅速发展的今天，如何让AI系统更懂“你”？答案或许藏在个性化的记忆管理之中。Mem0作为一个开源的记忆管理系统，正致力于为AI赋予长期记忆与个性化服务能力。通过结合高性能向量数据库Qdrant、图数据库Neo4j的强大关系分析能力以及Streamlit的高效可视化交互，我们可以打造出一个既能存储用户历史行为、又能实时推理并展示结果的智能记忆助手。本文将带您一步步探索这一技术组合的
                    
                    【优秀文章】7月优秀文章推荐
                        

                        优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
                    
                    【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析
                        智算菩萨
人工智能深度学习
                        引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
                    
                    MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式
                        csdn_tom_168
NoSQL数据库mongodb人工智能AI
                        MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
                    
                    HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现
                        H老师带你学鸿蒙
系统架构HarmonyOS5.0鸿蒙华为仓颉教育
                        人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
                    
                    阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！
                        
数据库观点资讯人工智能
                        背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
                    
                    【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
                        

                        博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
                    
                    使用 C++ 实现 MFCC 特征提取与说话人识别系统
                        whoarethenext
c++开发语言mfcc语音识别
                        使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
                    
                    ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4
                        爱编程的喵喵
Python基础课程pythonImportErrortorchnvJitLink解决方案
                          大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。  本文主要介绍了ImportError:/home/
                    
                    网络安全相关专业总结（非常详细）零基础入门到精通，收藏这一篇就够了
                        网络安全工程师教学
兼职副业黑客技术网络安全web安全安全人工智能网络运维
                        一、网络工程专业专业内涵网络工程是指按计划进行的以工程化的思想、方式、方法，设计、研发和解决网络系统问题的工程，一般指计算机网络系统的开发与构建。该专业培养具备计算机科学与技术学科理论基础，掌握网络技术领域专业知识和基本技能，在计算机、网络及人工智能领域的工程实践和应用方面受到良好训练，具有深厚通信背景、可持续发展、能力较强的高水平工程技术人才。学生可在计算机软硬件系统、互联网、移动互联网及新一代
                    
                    《北京市加快推动“人工智能+医药健康“创新发展行动计划（2025-2027年）》深度解读
                        

                        引言随着新一轮科技革命和产业变革的深入推进，人工智能技术与医药健康的深度融合已成为全球科技创新的重要方向。北京市于2025年7月正式发布《北京市加快推动"人工智能+医药健康"创新发展行动计划（2025-2027年）》，旨在充分发挥北京在人工智能技术策源、头部医疗资源汇聚、健康数据高度富集等方面的突出优势，构建形成"人工智能+医药健康"创新和应用并举的产业生态体系，打造具有国际影响力的创新策源地、应
                    
                    「源力觉醒 创作者计划」_文心大模型开源：开启 AI 新时代的大门
                        小黄编程快乐屋
人工智能
                        在人工智能的浩瀚星空中，大模型技术宛如一颗璀璨的巨星，照亮了无数行业前行的道路。自诞生以来，大模型凭借其强大的语言理解与生成能力，引发了全球范围内的技术变革与创新浪潮。百度宣布于6月30日开源文心大模型4.5系列，这一消息如同一颗重磅炸弹，在AI领域掀起了惊涛骇浪，其影响之深远，意义之重大，足以改写行业的发展轨迹。百度这次放大招，直接把文心大模型4.5开源了，这操作就像往国内AI圈子里空投了一个超
                    
                    四种微调技术详解：SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
                        

                        当谈到人工智能大语言模型的微调技术时，我们进入了一个令人兴奋的领域。这些大型预训练模型，如GPT-3、BERT和T5，拥有卓越的自然语言处理能力，但要使它们在特定任务上表现出色，就需要进行微调，以使其适应特定的数据和任务需求。在这篇文章中，我们将深入探讨四种不同的人工智能大语言模型微调技术：SFT监督微调、LoRA微调方法、P-tuningv2微调方法和Freeze监督微调方法。第一部分：SFT监
                    
                    2023年搜索领域的技术认证与职业发展指南
                        搜索引擎技术
搜索引擎ai
                        2023年搜索领域的技术认证与职业发展指南关键词搜索领域、技术认证、职业发展、搜索引擎技术、人工智能搜索摘要本指南旨在为搜索领域的从业者和有志于进入该领域的人士提供全面的技术认证与职业发展参考。首先介绍搜索领域的概念基础，包括其历史发展和关键问题。接着阐述相关理论框架，分析不同认证背后的原理。架构设计部分展示搜索系统的组成与交互。实现机制探讨算法复杂度和代码优化。实际应用部分给出实施和部署策略。高
                    
                    探索AI人工智能医疗NLP实体识别系统的架构设计
                        AI学长带你学AI
人工智能自然语言处理easyuiai
                        探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
                    
                    AI智能体原理及实践：从概念到落地的全链路解析
                        you的日常
人工智能大语言模型人工智能机器学习深度学习神经网络自然语言处理
                        AI智能体正从实验室走向现实世界，成为连接人类与数字世界的桥梁。它代表了人工智能技术从"知"到"行"的质变，是能自主感知环境、制定决策、执行任务并持续学习的软件系统。在2025年，AI智能体已渗透到智能家居、企业服务、医疗健康、教育和内容创作等领域，展现出强大的生产力与创造力。然而，其发展也伴随着技术挑战、伦理困境和安全风险，需要从架构设计到落地应用的全链条思考与平衡。一、AI智能体的核心定义与技
                    
                    人工智能动画展示人类的特征
                        AGI大模型与大数据研究院
AI大模型应用开发实战javapythonjavascriptkotlingolang架构人工智能
                        人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
                    
                    Spring AI 第二讲 之 Chat Model API 第八节ZhiPu AI Chat
                        疼死老夫了
人工智能
                        SpringAI支持知普人工智能的各种人工智能语言模型。您可以与知普人工智能语言模型互动，并基于知普人工智能模型创建多语言对话助手。先决条件您需要与ZhiPuAI创建一个API，以访问ZhiPuAI语言模型。在ZhiPuAI注册页面创建账户，并在APIKeys页面生成令牌。SpringAI项目定义了一个名为spring.ai.zhipuai.api-key的配置属性，你应将其设置为从APIKeys
                    
                    Chat Model API
                        虾条_花吹雪
SpringAIjava
                        聊天模型API为开发人员提供了将人工智能聊天完成功能集成到应用程序中的能力。它利用预训练的语言模型，如GPT（生成预训练转换器），以自然语言对用户输入生成类似人类的响应。API通常通过向人工智能模型发送提示或部分对话来工作，然后人工智能模型根据其训练数据和对自然语言模式的理解生成对话的完成或继续。然后将完成的响应返回给应用程序，应用程序可以将其呈现给用户或用于进一步处理。Spring人工智能聊天模
                    
                    巅峰对决，超三十万奖金等你挑战！第十届信也科技杯全球AI算法大赛火热开赛！
                        中杯可乐多加冰
前沿资讯分享科技人工智能算法计算机视觉机器学习深度学习
                        信也科技今年跟IJCAI和CIKM这两大全球顶级AI会议合作，这场比赛被全球人工智能顶会CIKM收录为官方赛事单元，获奖选手有机会全球人工智能顶会创造更大的影响力。一、赛事概况随着深度伪造技术的高度发展，人工智能产业走深向实，生成合成技术开始呈现工具化和普及化趋势。在生成合成内容质量显著提升的当下，基于换脸攻击的身份冒用和欺诈事件在全球范围内激增，严重威胁个人隐私和公共数据安全。第十届信也科技杯全
                    
                    OPENAI中Assistants API的实现原理及示例代码python实现
                        dzend
aigcpythonai
                        OPENAI中AssistantsAPI的实现原理及示例代码前言OPENAI是一家人工智能公司，致力于研究和开发人工智能技术。其中，AssistantsAPI是OPENAI推出的一项人工智能服务，可以帮助开发者快速构建智能助手。本文将介绍AssistantsAPI的实现原理，并提供使用Python实现的示例代码。AssistantsAPI实现原理AssistantsAPI的实现原理主要包括以下几个
                    
                    使用大模型预测胃穿孔的全流程系统技术方案大纲
                        

                        目录一、项目概述二、项目背景三、建设目标四、建设内容（一）建设架构（二）核心功能（三）核心技术（四）预期成效（五）方案总结五、系统架构方案流程图六、实验验证证据七、健康教育与指导一、项目概述本项目旨在构建一套基于大模型的胃穿孔预测及全流程管理系统，通过整合术前、术中、术后各环节数据，利用先进的人工智能技术，实现对胃穿孔疾病的精准预测、手术方案优化、并发症风险预警以及术后护理指导等功能，为医疗决策提
                    
                                Algorithm
                                    香水浓
javaAlgorithm
                                    冒泡排序 
 

	public static void sort(Integer[] param) {
		for (int i = param.length - 1; i > 0; i--) {
			for (int j = 0; j < i; j++) {
				int current = param[j];
				int next = param[j + 1];
                                
                                mongoDB 复杂查询表达式
                                    开窍的石头
mongodb
                                    1:count 
   Pg: db.user.find().count(); 
   统计多少条数据 
2:不等于$ne 
   Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 
   查询id不等于3的数据。 
3：大于$gt $gte(大于等于) 
&n
                                
                                Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space
                                    0624chenhong
jvmjboss
                                    转自 
http://blog.csdn.net/zou274/article/details/5552630 
 
解决办法： 
 
window->preferences->java->installed jres->edit jre 
把default vm arguments 的参数设为-Xms64m -Xmx512m 
 
 
 
----------------
                                
                                文件上传 下载 解析 相对路径
                                    不懂事的小屁孩
文件上传
                                    有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。 
下面总结一下遇到的问题： 
 
文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。 
在上传图片，或者文件时，使用form表单来操作。 
前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: 
 

<form action=&
                                
                                怎么实现qq空间批量点赞
                                    换个号韩国红果果
qq
                                    纯粹为了好玩！！ 
逻辑很简单 
1 打开浏览器console；输入以下代码。 
先上添加赞的代码 
 

var tools={};
		//添加所有赞
		function  init(){
			document.body.scrollTop=10000;
				setTimeout(function(){document.body.scrollTop=0;},2000);//加
                                
                                判断是否为中文
                                    灵静志远
中文
                                    方法一： 
public class Zhidao { 
 public static void main(String args[]) { 
 String s = "sdf灭礌 kjl d{';\fdsjlk是"; 
 int n=0; 
 for(int i=0; i<s.length(); i++) { 
 n = (int)s.charAt(i); 
 if((
                                
                                一个电话面试后总结
                                    a-john
面试
                                    今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。 
面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结： 
  
在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。 
  
然后对list和map分别举几个类型： 
  
list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
                                
                                MSSQL中Escape转义的使用
                                    aijuans
MSSQL
                                    IF OBJECT_ID('tempdb..#ABC') is not null
drop table tempdb..#ABC


create table #ABC
(
PATHNAME NVARCHAR(50)
)


insert into #ABC
SELECT N'/ABCDEFGHI' 
UNION ALL SELECT N'/ABCDGAFGASASSDFA' 
UNION ALL
                                
                                一个简单的存储过程
                                    asialee
mysql存储过程构造数据批量插入
                                               今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： 
  
         
DELIMITER $$  
DROP PROCEDURE IF EXISTS inse
                                
                                annot convert from HomeFragment_1 to Fragment
                                    百合不是茶
android导包错误
                                    创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 
    创建类时引入包是:import android.app.Fragment; 
  
   创建队列和对象时使用的包是:import android.support.v4.ap
                                
                                Weblogic10两种修改端口的方法
                                    bijian1013
weblogic端口号配置管理config.xml
                                    一.进入控制台进行修改    1.进入控制台:  http://127.0.0.1:7001/console     2.展开左边树菜单         域结构->环境->服务器-->点击AdminServer(管理) &
                                
                                mysql 操作指令
                                    征客丶
mysql
                                    一、连接mysql 
进入 mysql 的安装目录； 
$ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 
输入密码，回车，接连； 
 
二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 
1、赋权 
mys
                                
                                【Hive一】Hive入门
                                    bit1129
hive
                                    Hive安装与配置 
Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 
  Hive安装和配置的步骤 
  
1. 从如下地址下载Hive0.14.0 
  
http://mirror.bit.edu.cn/apache/hive/ 
  
 2.解压hive，在系统变
                                
                                ajax 三种提交请求的方法
                                    BlueSkator
Ajaxjqery
                                    1、ajax 提交请求 
$.ajax({
			type:"post",
			url : "${ctx}/front/Hotel/getAllHotelByAjax.do",
			dataType : "json",
			success : function(result) {
				try {
					for(v
                                
                                mongodb开发环境下的搭建入门
                                    braveCS
运维
                                      
linux下安装mongodb 
1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 
2）linux 解压   
gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; 
mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
                                
                                编程之美-最短摘要的生成
                                    bylijinnan
java数据结构算法编程之美
                                    

import java.util.HashMap;
import java.util.Map;
import java.util.Map.Entry;

public class ShortestAbstract {

	/**
	 * 编程之美 最短摘要的生成
	 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
                                
                                json数据解析及typeof
                                    chengxuyuancsdn
jstypeofjson解析
                                       
       // json格式
	var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},'
		                    +' {"firstName": "CCC&
                                
                                流程系统设计的层次和目标
                                    comsci
设计模式数据结构sql框架脚本
                                     
                              流程系统设计的层次和目标 
 
 
 
                                
                                RMAN List和report 命令
                                    daizj
oraclelistreportrman
                                    LIST 命令 
使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的 
信息。使用此命令可列出： 
• RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 
• 可用的且可以用于还原操作的数据文件备份和副本 
• 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 
• 包含指定名称或范围的所有归档日志备份的备份集和副本 
• 由标记、完成时间、可
                                
                                二叉树:红黑树
                                    dieslrae
二叉树
                                        红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 
    红黑树必须遵循红黑规则,规则如下 
    
1、每个节点不是红就是黑。     2、根总是黑的  &
                                
                                C语言homework3，7个小题目的代码
                                    dcj3sjt126com
c
                                    1、打印100以内的所有奇数。 
# include <stdio.h>

int main(void)
{
	int i;

	for (i=1; i<=100; i++)
	{
		if (i%2 != 0)
			printf("%d ", i);
	}

	return 0;
}
 
 2、从键盘上输入10个整数，
                                
                                自定义按钮, 图片在上, 文字在下, 居中显示
                                    dcj3sjt126com
自定义
                                    #import <UIKit/UIKit.h>

@interface MyButton : UIButton

-(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
                                
                                MySQL查询语句练习题，测试足够用了
                                    flyvszhb
sqlmysql
                                    http://blog.sina.com.cn/s/blog_767d65530101861c.html 
1.创建student和score表 
CREATE  TABLE  student ( 
id  INT(10)  NOT NULL  UNIQUE  PRIMARY KEY  , 
name  VARCHAR
                                
                                转：MyBatis Generator 详解
                                    happyqing
mybatis
                                      
MyBatis Generator 详解 
http://blog.csdn.net/isea533/article/details/42102297 
  
MyBatis Generator详解 
http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
                                
                                让程序员少走弯路的14个忠告
                                    jingjing0907
工作计划学习
                                      
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 
  
1.不要害怕在工作中学习。  
只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
                                
                                nginx和NetScaler区别
                                    流浪鱼
nginx
                                    NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 
2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 
3.策略灵活度方
                                
                                第11章 动画效果（下）
                                    onestopweb
动画
                                    index.html 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/
                                
                                FAQ - SAP BW BO roadmap
                                    blueoxygen
BOBW
                                    http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq 
  
Besides, I care that how to integrate tightly. 
  
By the way, for BW consultants, please just focus on Query Designer which i
                                
                                关于java堆内存溢出的几种情况
                                    tomcat_oracle
javajvmjdkthread
                                    【情况一】：   　　 
java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；   　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：   　　<jvm-arg>-Xms3062m</jvm-arg>   　　<jvm-arg>-Xmx
                                
                                Manifest.permission_group权限组
                                    阿尔萨斯
Permission
                                    结构 
继承关系 
public static final class Manifest.permission_group extends Object 
java.lang.Object 
android. Manifest.permission_group 常量 
ACCOUNTS 直接通过统计管理器访问管理的统计 
COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 
D
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.