我们已经进入了广泛采用和民主化获取生成 AI 产品的时代。用例无处不在——从生成图像到编写代码——而且采用速度超过了过去十年的每一种消费技术趋势。在 Image Generation 中,MidJourney 的 Discord 成员已增长到约 1300 万,而据报道,ChatGPT 的用户已超过 1 亿。软件开发人员的用例也在爆炸式增长——截至 9 月,超过 120 万开发人员使用了 GitHub Copilot 的技术预览版。ChatGPT 还出人意料地擅长编写应用程序——从根据文本提示生成完整代码(尽管通常有很多错误)到错误修复代码。
随着模型和训练集越来越适合编程任务,我们预计大型语言模型的编码能力会随着采用率的提高而提高。有迹象表明 OpenAI 正在关注这一潜力,有报道称他们已经聘请了约 400 名开发人员作为承包商来帮助标记代码以训练他们的下一代模型。虽然我们不希望这些产品很快取代软件开发人员,但我们确实希望它们能显著提高生产力并让开发人员专注于更困难的问题。
迄今为止的进展表明,生成式 AI 模型可能会成为开发人员编写、调试和优化代码能力的必备工具。他们已经开始改变编写、审查和改进代码的方式。借助高级算法,这些模型可以分析现有代码中的模式并生成针对可读性、效率和无错误执行进行了优化的新代码行。这可以节省开发人员的时间,还可以提高所生成代码的质量。生成式人工智能还可以通过自动识别潜在问题和改进、安全漏洞、提高代码性能的替代方法以及帮助团队维护高质量的代码库来协助代码审查。通过自动执行一些繁琐和重复的编码任务,这些工具有可能提高生产力。
在目前的状态下,基于人工智能的编程工具并非完美无缺,而是在迅速改进。虽然生产率的提高对大企业和小企业都是一样的,但它改变了游戏规则,特别是对小企业、独立开发者和专业人士而言。这些工具在降低进入新创业企业的障碍和成本方面可能特别有影响力和益处。
软件开发的未来可以看到人类与 AI 之间的协作,其中 AI 充当导师,指导开发人员完成代码编写过程并确保他们走在正确的轨道上。凭借学习和适应能力,生成式 AI 在编码方面的潜力令人兴奋且无限。
本文深入回顾了当前为代码完成、生成、调试和性能改进而设计的人工智能编程工具。这些工具分为流行的、即将推出的或新的,使用户能够根据他们的需求、预算和项目复杂性选择最适合的工具。
ChatGPT 是 OpenAI 的一种高级自然语言处理模型,风靡全球。ChatGPT 是从 GPT-3.5 系列中的一个模型微调而来的。这是一个具有 175B 个参数的 Transformer 神经网络。它通过提供简单的文本提示来帮助开发人员进行编码,这些提示利用上下文、代码模板和编程知识来帮助完成代码、生成、优化、文档、性能、更正和解释。利用其高级功能,ChatGPT 可以分析源代码并提供对编码语言的见解、解决编码问题以及软件开发建议。
ChatGPT 可以通过分析代码并在理解代码的行为和功能的基础上建议测试用例来帮助开发人员编写单元测试。这可以显著减少编写单元测试所需的时间和精力,并提高其准确性。此外,ChatGPT 可以提供反馈和建议以提高代码质量并帮助开发人员更好地理解错误或改进。
虽然 ChatGPT 是用于各种编程任务的有用工具,但它不能取代开发人员。它不能用于学习如何编码,也不能替代良好的编码习惯。相反,它是提高生产力和产量的补充。ChatGPT 是一个可以帮助开发人员的强大工具。
优点:
ChatGPT 充当代码完成、优化、性能、纠正和解释的导师。
它可以提供对代码设计和结构的见解。
它可以帮助识别可能需要重构、简化、审查或改进的领域。
它可以通过分析代码并提供解释和注释来生成源代码文档。
缺点:
ChatGPT 缺乏对代码的内在理解,但可以识别正确的代码结构。
改写提示可能会导致不同的结果。
培训数据仅限于 2021 年,限制了其范围。
该工具可能不是生成需要大量上下文的代码的理想选择。
类别:代码生成、代码完成、代码优化
价格:免费或 20 美元/月
Copilot是一个12B参数的Transformer模型。
GitHub Copilot 是一个人工智能驱动的结对编程编辑器,旨在帮助开发人员更快、更高效地工作。它使用 OpenAI Codex 在开发人员编写注释或代码行时将自然语言转换为编码提示。当开发人员编写描述他们所需逻辑的评论时,GitHub Copilot 可以自动为他们的解决方案生成代码建议。此外,它可以通过调整他们的编辑来适应开发人员的编码风格。从本质上讲,它是开发人员的智能自动完成工具。
此代码完成解决方案与大量编程语言和框架兼容,包括 Python、Java、JavaScript、TypeScript、Ruby 和 Go。它可以用作流行代码编辑器的扩展,例如 Visual Studio Code、Neovim 和 JetBrains。该扩展可在桌面上使用,也可用于基于云的解决方案,例如 GitHub Codespaces。
GitHub Copilot 的即时工程管道非常复杂。它会根据你编写代码的上下文建议填写哪个变量。
GitHub Copilot 有其优点和缺点。虽然它提供了更智能的代码完成和上下文解决方案等功能,可以减少搜索解决方案所花费的时间,但建议的代码只是一个建议。由开发人员评估这些建议并决定是接受、跳过还是忽略它们。
优点:
Copilot兼容多种编程语言
它可以访问 GitHub 上大量的公共代码存储库数据集
它利用上下文化的解决方案来编写代码
它非常擅长编写样板代码。
缺点:
在代码可维护性、配置、兼容性和版本控制方面存在问题。
当前版本的 CoPilot 无法删除、简化或重构代码。
该工具不适合新手开发人员。
CoPilot 仅在出现提示时提供安全建议。
类别:代码生成、代码完成
价格:免费或 44 美元/用户/月(团队计划)
Replit Ghostwriter 是一种基于 ML 的工具,可提供代码完成、生成、转换和编辑器内搜索功能。
Ghostwriter由四个主要部分组成:完整代码,分析你的代码并提供后续建议;生成代码,根据你的建议生成新代码;转换代码,帮助你重构或现代化代码以满足标准;解释代码,它分析现有代码并使用自然语言解释其功能,以及语义搜索。Ghostwriter 旨在补充你现有的编程知识,并减少你在 Stack Overflow 等网站上搜索帮助或研究代码示例所花费的时间。
优点:
Ghostwriter 通过使用代码和注释上下文帮助减少摩擦。
它可以重构您的代码以更快地运行并将其翻译成另一种语言。
它是一个网络浏览器应用程序;用户不需要下载任何东西。
它自动将生成的代码保存到云端,不需要部署过程。
缺点:
它提供有限的存储空间、CPU 和 RAM。
类别:代码生成、代码完成、代码重构、代码解释、测试生成器
价格:免费或 7 美元/月
TabNine 是一款人工智能代码补全工具,利用深度学习算法实现Java、Python、C++等语言的智能代码补全。
TabNine会自动为你的代码编制索引并根据你的写作模式创建定制的建议。其高级 AI 功能提供了自动代码完成、自动生成的测试、语法突出显示以及与流行的 IDE 集成等功能。TabNine 支持 20 多种语言和 15 种编辑器,包括 VS Code、IntelliJ、Android Studio 和 Vim。虽然它不是端到端的代码生成器,但它增强了 IDE 的自动完成功能。TabNine 还提供基于云的版本,使开发人员可以从任何设备访问他们的编码工具。
优点:
TabNine 通过实时代码完成加快开发速度。
它保护代码隐私。
它提供个性化的语言模型,这些模型在对各种规模的模型进行全面评估后进行协作。
它提供了一个根据你的代码训练的私有模型。
它的预测既是本地的,也是基于云的。
缺点:
它的免费版本只能真正为小项目提供建议。
该模型使用大量内存用于你正在使用的文本编辑器之上的文本编辑器功能。
该工具的用户体验可能会忙于处理不相关的建议。
类别:代码生成、代码完成、云、本地、微调
价格:免费或 12 美元/月
Codex 是一种基于 OpenAI GPT-3 的自然语言处理模型,可以生成十多种编程语言的工作代码,包括 Python、JavaScript、Go、Perl、PHP、Ruby、Swift 和 TypeScript,甚至 Shell。
用于训练 Codex 的数据包括来自公开来源的数十亿行源代码,以及自然语言,包括来自公共 GitHub 存储库的代码。它有 14KB 的内存用于 Python 代码。Codex 是一个功能强大的转换器驱动系统。它了解你的任务并最有效地完成任务。
优点:
Codex 可以访问各种 API 并操作数据。
它可以描述现有代码。
它会自动为公司或开源项目的现有代码库生成文档。
该模型可以自我引用,将先前的命令存储在同一会话的内存中,并相应地使用它们。
用户可以从给定的提示中查看该工具生成的代码,使他们能够了解该工具解释了什么。
Codex 提供扩展响应,其中包括与初始请求相关的附加信息。
缺点:
它可能会创建重复的函数。
很难微调生成的代码。
它的设置受限,因此很难包含功能和扩展。
类别:代码生成、代码完成、代码重构、代码解释、测试生成器
价格:免费(限量测试版)
CodeWP 是 Isotropic 构建的 AI WordPress 代码生成器。它专门针对 WordPress 网站创建者进行了训练和优化。
CodeWP支持 JS 和 PHP,以及特定于流行插件(如 WooCommerce 和主要页面构建器)的模式。CodeWP 包括实时协作、实时代码反馈和适用于不同编程语言的各种插件等功能。此外,它还与 GitHub 集成,可以轻松进行版本控制和项目协作。对于寻求易于使用和协作的代码编辑器的团队来说,CodeWP 是一个有价值的工具。
优点:
CodeWP 支持 11 种以上的编程语言。
它的 AI 模型是专门为 WordPress 训练的。
它是一个多语言工具。
缺点:
它有时可能会有轻微的错误和缓慢。
它不适合复杂的项目或大型应用程序。
类别:代码生成、代码解释、领域特定
价格:免费或 12 美元/月
MutableAI 是一款由 AI 驱动的编码助手,可帮助自动执行重复的编码任务,并通过自然语言输入加快生产速度。
MutableAI最令人兴奋的功能之一是开放式查询对话,允许用户提出复杂的问题。MutableAI 提供特定于领域的转换,可以无缝理解你的代码,从而更轻松、高效地完成任务。其他功能包括自动完成、开放式转换、生产代码的能力和类型注释。总的来说,MutableAI 是一个强大的工具,可以帮助开发人员节省时间并提高生产力。
优点:
MutableAI 提供特定领域的转换,可以无缝理解你的代码。
它是在一组更精心策划的高质量代码上进行训练的。
它提供实时配对和共享编码会话的能力。
缺点:
稳定性和可靠性存在一些小问题。
该工具的学习曲线更陡峭,尤其是其高级功能。
类别:代码生成、代码完成、代码重构、代码解释
价格:免费或 10 美元/月
CodeSquire 是一款人工智能驱动的代码编写助手,专为数据科学家、工程师和分析师设计。
CodeSquire提供智能代码建议,协助数据探索,并自动执行重复性任务。它允许开发人员将注释翻译成代码,创建完整的函数而无需搜索库方法和参数,编写带有文本提示的 SQL 查询,以及为其他人的代码生成代码解释。目前,CodeSquire 在 Google Colab、BigQuery 和 JupyterLab 上用作浏览器扩展。
优点:
CodeSquire 专为满足数据科学家的需求而设计。
它提供适当的笔记本支持、数据感知和单元格输出。
缺点:
它对于复杂的编程任务不是那么有效。
它在有限的平台上可用。
类别:代码生成、代码完成、代码重构、代码解释、特定领域
价格:不可用(免费/付费)
Salesforce CodeGen 是一种开源模型,可促进程序合成,支持对话式 AI 编程。它使用 160 亿参数的自回归语言模型,在大量自然语言和编程语言的语料库上进行训练。
CodeGen 超越了代码自动完成,并寻求了解用户的最终目标,使他们能够更快地开发应用程序并减少编码。这为受益于人情味的复杂任务开辟了更多时间。
优点:
Salesforce CodeGen 的功能通过生成可执行代码消除了限制。
它的应用比编写提示更简单——它只是在说话。
缺点:
它可能只有有限的社区支持和可用资源。
类别:代码生成,开源
价格:免费
Figstack 是一个基于 Web 的平台,可帮助开发人员理解任何语言的任何代码、翻译编程语言以及自动化功能文档。
Figstack与 VS Code 等流行的代码编辑器集成,使开发人员能够在处理项目时访问其功能。Figstack 提供了自动完成、代码片段和实时调试等功能,使开发人员能够更高效地编写代码并减少错误。此外,Figstack 提供了一个强大的回答平台,使开发人员能够搜索代码示例和常见编程问题的解决方案,从而减少寻找答案所花费的时间。
优点:
Figstack 有助于衡量大 O 表示法中代码的效率。
它的无代码 UI 使所有技能水平的开发人员都可以使用该工具。
缺点:
它可能不适合需要高级自定义选项的更复杂的项目。
它是一种基于云的工具,因此可能存在数据隐私和安全问题。
类别:代码解释、代码翻译、自动化文档
价格:联系供应商了解定价
Datamaker Coder Tool 通过使用自然语言处理为 HTML、CSS 和 JavaScript 生成可在项目中使用的自定义代码片段,从而简化了 Webflow 的编码过程。
DataMaker还提供了操作集合、在特定断点上应用函数以及向代码添加附加功能的能力。此外,DataMaker 支持多种编程语言,包括 Python、Java、JavaScript、C、C++、C#、Go、Rust、Ruby、Swift 和 HTML/CSS。但是,需要注意的是,虽然 Datamaker 可以为开发人员提供许多好处,但在使用它之前评估它是否适合特定用例也很重要。
优点:
DataMaker 旨在从错误中吸取教训并随着时间的推移不断改进。
对于新手开发人员来说,它简单直观。
缺点:
某些用户可能难以导航或配置该工具。
实现特定结果可能需要实验。
用户不拥有生成的代码的所有权。
类别:代码生成,特定领域
价格:9.99 美元/月
AirOps 是一个基于云的平台,可为开发人员简化应用程序部署和管理。它可以通过 Chrome 扩展程序、网络应用程序或 API 访问,从而可以轻松集成到任何工作流程中。
AirOps的突出特点是 SQL 助手,它为开发人员提供了编写、优化、更新、修复和解释查询的工具。AirOps 使开发人员能够轻松分析他们的数据库,识别和修复性能瓶颈,并自动执行重复性任务。虽然 AirOps 提供了许多好处,但一些开发人员可能更喜欢使用替代工具来管理他们的应用程序或编写 SQL 查询。
优点:
AirOps 为 SQL 编写、修复和解释提供了 AI 支持的方法。
它可以自动记录表模式。
它允许用户生成 Python 脚本和 dbt YAML 文件。
缺点:
由于其复杂性和成本,它可能不太适合较小的开发团队。
作为一个基于云的平台,平台稳定性或停机的任何问题都可能对开发过程产生重大影响。
该平台的可定制性可能不足以满足某些开发项目的独特需求。
类别:代码生成、代码重构、代码解释、云、领域特定
价格:159 美元/月
What-the-Diff 是一款由 AI 驱动的应用程序,它可以审查拉取请求中的差异,并用简单的英语编写有关更改的描述性评论。
What-the-Diff使用 GitHub API 获取拉取请求差异,然后使用 AI 模型在不存储代码的情况下生成更改描述。What-the-Diff 了解更改的上下文,并深入了解更改的内容和原因。一个独特的功能是除了通常的逐行代码比较之外,它还能够突出显示语义差异,从而使开发人员能够快速准确地识别问题。另一个有用的功能是能够识别和忽略与代码更改无关的某些差异,例如空格或格式的差异。但是,作为一种相对较新的工具,What-the-Diff 可能还不具备更成熟的比较工具所提供的所有功能和集成。
优点:
Diff 支持几乎所有的编程语言。
它具有干净的用户界面。
它可以完全控制何时以及如何分析您的拉取请求。
缺点:
它需要完全访问你的代码才能读取差异。
它可能不适合较大的代码库或复杂的更改。
虽然该工具可以识别代码更改之间的差异,但它可能不会为已识别的差异提供解决方案或修复。
类别:代码解释,代码重构
价格:免费或 19 美元/月
AI Query 是一种功能强大的自然语言处理工具,使开发人员能够使用简单的英语句子与他们的数据库进行交互,然后将其翻译成 SQL 查询。
AI Query提供了一个独特的功能,能够理解复杂的查询并生成可在底层数据库上执行的 SQL 查询。它用途广泛,能够处理多个数据库和不同的数据库模式,并支持广泛的数据类型。借助 AI Query,开发人员可以轻松快速地生成 SQL 查询,它提供了一系列功能,包括 SQL 查询生成、SQL 解释和数据库架构。
优点:
AI Query 允许用户保存和共享 SQL 查询。
它支持 PostgreSQL、MySQL、MariaDB 和 SQL Server。
该工具存储 SQL 查询历史记录。
它是用户友好的,可供没有编码背景的个人使用。
缺点:
它可能并不总是理解查询意图,从而导致不正确的翻译或数据检索。
它可能不支持所有 SQL 语法,限制了可以执行的查询。
它需要针对复杂查询和底层数据结构进行手动查询调整。
人工智能算法的内部运作可能缺乏透明度。
类别:代码生成、代码解释、领域特定
价格:10 美元/月
Adrenaline 是一种软件调试助手,它使用机器学习来帮助开发人员更有效地识别和修复代码中的错误。
Adrenaline可以自动生成关于可能导致错误的假设的过程。它还提供有关开发人员操作的实时反馈,以帮助他们测试和完善这些假设。Adrenaline 结合使用程序分析、统计推理和概率推理来确定问题最可能的原因。
优点:
Adrenaline可以更快、更准确地识别错误,并减少手动调试所需的时间和资源。
它像 diff 一样在线显示修复
它使用 GPT-3 以简单的英语解释错误
缺点:
它需要用户的 OpenAI API 密钥。
如果输入数据没有经过适当的预处理,就有可能出现错误的诊断。
类别:调试助手,开源
价格:免费或 5 美元/月
Adept 的 ACT-1 是一款人工智能代码补全工具,它使用深度学习算法实时提供智能代码建议和完整代码块。
ADEPT的大型 Transformer 模型 ACT-1 已经过训练,可以使用包括网络浏览器在内的数字工具。目前,它与 Chrome 扩展程序集成在一起,允许它观察浏览器活动并执行各种操作,例如键入、单击和滚动。此外,该模型可以处理涉及组合多个工具的任务,因为大多数计算机任务需要使用多个程序。未来,ACT-1 有望要求澄清用户的需求,使其更有帮助。虽然它可能不知道所有事情,但 ACT-1 具有很强的可指导性,可以通过单次人类反馈纠正错误,在每次互动中变得更有用。
类别:过程自动化
价格:尚未发布。
AlphaCode是基于 Transformer 的语言模型。414亿个参数。
由 DeepMind 和谷歌开发的 AlphaCode 是生成有竞争力的编程解决方案的强大工具。它是高度专业化的,专门接受过关于人们如何回答软件写作比赛问题的培训。AlphaCode 展示了一套独特的技能集,结合了自然语言理解、解决问题的能力和大型语言模型的统计能力特征。
AlphaCode已经成功解决了退格问题,并且比以前依赖显式指令的 AI 编码系统有了显著改进。AlphaCode 模型在 700GB 的 GitHub 开源代码上进行了预训练,以学习代码表示和解决显式编码任务。
类别:代码生成,竞争性编码
价格:尚未发布。
结束语
生成式 AI 正在改变代码的生成方式,在很大程度上实现了编码自动化。它自动化任务的能力提高了编程的生产力和效率。虽然 AI 驱动的编码是迈向未来的重大飞跃,但当前的工具仍在不断发展。这些工具是编码实践的重要补充,但并不完美。关键要素是人工智能与人类之间的监督和伙伴关系。由于这些模型致力于提高质量和准确性,因此必须了解人类专业知识和监督的重要性,以使这些工具成为高效的编码合作伙伴。
本文为新手开发人员、高级项目以及介于两者之间的一切提供了各种工具列表。如果无法引导 AI 朝着正确的方向发展,或者无法交叉检查 AI 的成果,这些工具可能会适得其反。这些工具可能会生成完美的代码或不相关的输出——这使得开发人员必须区分好代码和坏代码才能有效地使用这些工具。
END
文字转载自:BimAnt翻译整理
原文链接:Top 17 Generative AI-based Programming Tools
活动推荐