新缸中之脑

20个主流的代码生成LLM大模型及9种常见应用场景

基于生成式AI的代码生成（Code Generation）是一个重要的新领域，用于根据不完整的数据源、用另一种编程语言编写的程序、自然语言描述或执行日志来预测代码或程序结构。

多年来，开发人员经常从博客、帖子、文章和其他网站获取代码，并根据自己的上下文进行调整。如今，现在可以要求机器使用一些提示来为你生成它，并且性能如此之高，以至于不再需要从这些站点获取此源代码。现在的问题是是否有可能不真正考虑使用此类技术来加快开发阶段。

在正常使用中，我们使用大型语言模型（LLM）的能力来生成句子的下一个标记。 LLM 估计下一个单元（文本、句子、标记、符号）的概率，系统按照所选策略（温度、前 K 个最有可能的标记或概率的前 p% 等）获取一个标记。）在代码生成的情况下，我们不仅将这种功能用于文本，而且还用于代码。值得注意的是，在代码生成方面，为了获得更具确定性的结果（0.2 到 0.8），低温优于高温。如果要生成多个样品，则优选较高的温度。

如果想详细了解文本生成的工作原理，请参阅我关于生成式AI的文章。

推荐：用 NSDT设计器快速搭建可编程3D场景。

1、代码生成器模型简介

自动完成或代码生成功能已在开发工具中存在多年。早在 1996 年，微软就在 Visual Studio 中为 Visual Basic 引入了这一功能（IntelliSense）。熟悉 Eclipse 的人可能使用过 Java getter 和 setter 生成函数，以及变量名的字符串导出函数（著名的“public String toString()”函数）。提供下一行代码仍然是这些 IDE 工具的一个重要功能，通常通过同时按下 Control 和空格键来激活。在可见性范围内，这种语法导向的编辑仍然可以帮助你完成类、方法、字段、注释和关键字的名称，只需按一下键盘，有时只需单击一下。

不得不说，源代码生成功能并不是LLM的主要目的，因为他们接受的培训主要是从所摄取的大量网页和书籍中生成文本。结果，GPT-1和GPT-2都没有直接接收到任何与代码相关的数据。当这一功能在LLM中使用并提供给尽可能广泛的受众时，革命就开始了。从那时起，我们看到专门针对此特定用例训练的模型数量呈爆炸式增长，并且多代码模型可能提供更好的泛化性，因为不同的编程语言共享相似的关键字和属性。

2021 年 6 月 29 日，GitHub 宣布 GitHub Copilot（“你的 AI 配对程序员”）可在由 OpenAI Codex（GPT-3 的修改版本）支持的 Visual Studio Code 开发环境中进行技术预览。 Copilot 使用的 OpenAI Codex 经过精选的英语数据集、公共 GitHub 存储库和其他可公开访问的源代码的训练。

以下是代码生成器模型的非详尽列表：

2020 年，微软发布了 CodeBERT，这是一种针对编程语言的预训练模型 (124M)，这是一种在 NL-PL 对上以六种编程语言（Python、Java、JavaScript、PHP、Ruby 和去）。
CuBERT，345M（2020 年 8 月）是一个开源代码理解 BERT 模型。他们通过在源代码上训练 BERT 模型来获得上下文嵌入。他们称之为 CuBERT，是代码理解 BERT 的缩写。该模型主要用于使用代码嵌入来查找代码缺陷和重复块。
PLBART 406M 是一种类似 BART 的模型，可用于执行代码汇总、代码生成和代码翻译任务。
CodeParrot 是仅在 180GB Python 代码上训练的 GPT-2 模型，有两种大小：110M 和 1.5B。
CodeT5，220M（2021 年 9 月）来自 Salesforce。该模型具有编码器-解码器架构，可以灵活地在不同模式下运行（即仅编码器、仅解码器和编码器-解码器）。支持四种生成任务：代码摘要、代码生成、翻译、细化；以及两个理解任务：代码缺陷和克隆检测。训练数据包含来自CodeSearchNet数据的六种编程语言：Python、Java、JavaScript、PHP、Ruby、Go；以及来自 Google BigQuery 数据的另外两种编程语言：C 和 C#。
GPT-Neo 由 EleutherAI 于 2021 年生产，提供三种尺寸：125M、1.3B 和 2.7B。它是一个类似GPT-3的模型和LLM模型，用于生成文本，但它们也可以生成源代码。 GPT-J-6B 经过自然语言和多种编程语言 (12) 代码的混合训练，并且仅提供一种大小：6B。 GPT-NeoX-20B 与 GPT-J-6B 几乎相同。
PolyCoder（2021 年 8 月 10 日）来自 CMU，是基于 GPT-2 架构的LLM。它使用 GPT NeoX 工具包对 12 种编程语言（C、C++、Java、JavaScript、C#、Python 等）的 249GB 代码进行了训练，并提供三种大小：160M、0.4B 和 2.7B。
2022 年 3 月，Salesforce 发布了另一个名为 CodeGen（350M、2.7B、6.1B 和 16.1B）的代码 LLM，这是一种多步程序合成方法，其中通过多轮规范和代码生成来实现程序合成。
2023 年 5 月，Salesforce 发布了 CodeT5 的增强版本，称为 CodeT5+（220M、770M、2B、6B 和 16B），具有有趣的检索增强代码生成功能。通过利用编码器最初获取相关代码片段，模型随后可以将这些片段作为输入的一部分合并到解码器中，从而提高模型生成的代码的质量。
Facebook 的 InCoder 1.3B 和 6B 模型（2023 年 4 月）经过训练，可以在双向上下文中生成代码。这些生成模型能够直接执行无缝代码完成，例如类型推断、注释生成和变量重命名。
Codex 是 OpenAI 仅通过 API 提供的模型，是 GPT-3 的后代。有300M、2.5B、12B三种尺寸可供选择。 GitHub Copilot 背后的驱动力是 Codex，这是一个以其性能而闻名的强大模型。虽然 OpenAI Codex 在 Python 方面表现出色，但它也表现出对其他各种语言的熟练程度，包括 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript 甚至 Shell。与其他模型不同，该模型不可公开下载，因此无法进行研究。所有者成功地将其用于转译、代码解释和代码重构。
2022 年 2 月，DeepMind 宣布推出 AlphaCode，与 Codex 一样，它也采用基于 Transformer 的模型。它接受了超过 715 GB 的 GitHub 数据以及 Codeforce 问题和解决方案的训练，包括 C++、C#、Go、Java、JavaScript、Lua、PHP、Python、Ruby、Rust、Scala 和 TypeScript 程序。
Amazon CodeWhisperer（2022 年 6 月）是一个用于代码生成、参考跟踪和安全扫描的内部模型。除了 Python、Java 和 JavaScript 之外，它还支持 TypeScript 和 C# 编程语言，并且可以为基于 Lambda、Amazon S3 和弹性计算 (EC2) 服务的编程应用程序提供建议。
Replit 3B 由 Replit 提供，是一个专注于代码完成的 2.7B 因果语言模型。训练混合物包括 20 种不同的语言：Markdown、Java、JavaScript、Python、TypeScript、PHP、SQL、JSX、reStructuredText、Rust、C、CSS、Go、C++、HTML、Vue、Ruby、Jupyter Notebook、R 和 Shell。
Google 的 Codey 基于 Google PaLM 2 大语言模型构建，经过专门训练，可以处理与 Google Cloud 相关的编码相关提示和查询。 PaLM 2 的基础源于对可公开访问的源代码的广泛数据集的预训练。 Codey 对 Python 和 JavaScript 等广泛使用的编程语言表现出卓越的熟练程度。此外，它还能够用 Prolog、Fortran 和 Verilog 等语言生成专用代码。
StarCoder 由 HuggingFace 和 ServiceNow 合作发布，来自 BigCode 项目（开放科学合作），是一个经过训练可编写 80 多种编程语言的 15.5B 模型。 StarCoder 的 LLM 使用多查询注意力技术来理解代码内容并生成准确的建议。该技术包括同时分析多个请求以提供相关答案。
GPT4是OpenAI最后一个模型，至少有700B左右的参数（作者猜测）。 OpenAI 的 Code-davinci-02（和 code-cushman-02）现已被 GPT4 取代，但微软仍在其认知服务中使用它。
THUDM 的 CodeGeeX 是一种高容量的多语言代码生成模型，拥有令人印象深刻的 13B 参数。它已经在包含 20 多种编程语言的庞大代码库上进行了预训练。它处理多种主流编程语言，包括Python、C++、Java、JavaScript、Go等。
IBM Watson Code Assistant（2023 年 5 月）目前仅生成带有 AI 生成建议的 Red Hat® Ansible® 脚本。它基于Wisdom模型及其350M参数。

2、代码生成的用例和应用

代码完成是一种上下文相关的代码生成功能，可通过减少拼写错误和其他常见错误来加快应用程序编码过程。

使用 replit-code-v1–3b 的代码完成示例可以在此处复制。使用 ChatGPT 的其他代码示例可以在此处复制。

2.1 代码完成

代码完成（Code completion）是第一个主要用例，允许你完成代码的开头或在中间注入代码。代码完成似乎是最明显的用例，但代码LLM可以在增强软件“工艺”的背景下涵盖更多用例。

# >>> Model: replit/replit-code-v1-3b - Temperature = 0.2
# >>> Prompt:
def find_best_rsquared(list_of_fits):
  """Return the best fit, based on rsquared"""

# >>> Result:
  return min(list_of_fits, key=lambda x: x.rsquared)

2.2 文本生成代码

文本生成代码（Text to code）是据自然语言描述生成代码。

# >>> Model: replit/replit-code-v1-3b - Temperature = 0.2
# >>> Prompt:
"""
double_sum_to_value takes a list of integers as an input.
It returns True if there are two distinct elements in the list that \\
sum to a value given in input, and False otherwise.
Check if the list has at least two elements.
Find all possible combinations of two distinct elements in the list.
Check if any of the combinations sum up to the given value.
"""

# >>> Result:
def double_sum_to_value(list_of_ints, value):
    """
    :param list_of_ints: a list of integers
    :param value: a value to check if the list has two distinct elements that sum to
    :return: True if there are two distinct elements in the list that sum to a value given in input, and False otherwise
    """
    # if the list has less than two elements, return False
    if len(list_of_ints) < 2:
        return False

    # if the list has more than two elements, return True
    else:
        # iterate over the list
        for i in range(len(list_of_ints) - 1):
            # iterate over the remaining elements
            for j in range(i + 1, len(list_of_ints)):
                # if the sum of the two elements is equal to the value, return True
                if list_of_ints[i] + list_of_ints[j] == value:
                    return True

        # if the list does not have two distinct elements that sum to the value, return False
        return False


def main():
    # print the return value of double_sum_to_value
    print(double_sum_to_value([1, 2, 3, 4, 5], 8))


if __name__ == '__main__':
    main()

2.3 测试生成

手动创建单元测试可能是一项乏味的工作。因此，一些开发人员根本不想编写测试。使用提示中要测试的功能自动生成测试用例是解决这种缺乏良好实践的一个很好的替代方案。

# >>> Model: replit/replit-code-v1-3b - Temperature = 0.2
# >>> Prompt:
import unittest

def double_sum_to_value(list_of_ints, value):
    """
    :param list_of_ints: a list of integers
    :param value: a value to check if the list has two distinct elements that sum to
    :return: True if there are two distinct elements in the list that sum to a value given in input, and False otherwise
    """
    # if the list has less than two elements, return False
    if len(list_of_ints) < 2:
        return False

    # if the list has more than two elements, return True
    else:
        # iterate over the list
        for i in range(len(list_of_ints) - 1):
            # iterate over the remaining elements
            for j in range(i + 1, len(list_of_ints)):
                # if the sum of the two elements is equal to the value, return True
                if list_of_ints[i] + list_of_ints[j] == value:
                    return True

        # if the list does not have two distinct elements that sum to the value, return False
        return False

class MyTest(unittest.TestCase):

# >>> Result:
    def test_example(self):
        self.assertTrue(double_sum_to_value([1, 2, 3, 4, 5], 7))

    def test_example_2(self):
        self.assertFalse(double_sum_to_value([1, 2, 3, 4, 5], 6))

    def test_example_3(self):
        self.assertTrue(double_sum_to_value([1, 2, 3, 4, 5, 6], 7))

2.4 重构代码

重构代码（Refactoring code）包括在不改变其功能的情况下更改源代码的结构，通常是为了使其更加高效、可读且易于维护。此功能仅适用于已按指导方式训练的模型。

# >>> Model: ChatGPT
# >>> Prompt:
You are an expert in development. 
Rewrite this code to reduce its complexity.
"""
def double_sum_to_value(list_of_ints, value):
    if len(list_of_ints) < 2:
        return False
    else:
        for i in range(len(list_of_ints) - 1):
            for j in range(i + 1, len(list_of_ints)):
                if list_of_ints[i] + list_of_ints[j] == value:
                    return True

        return False
"""

# >>> Result:
def double_sum_to_value(list_of_ints, value):
    if len(list_of_ints) < 2:
        return False

    seen_values = set()
    for num in list_of_ints:
        complement = value - num
        if complement in seen_values:
            return True
        seen_values.add(complement)

    return False

"""
Explanation:

The initial check for the length of list_of_ints is retained to handle 
the case where there are fewer than two integers, as the logic wouldn't 
work in that scenario. We use a set, seen_values, to keep track of 
the complements needed to reach the target value.
Instead of iterating through all combinations of numbers, we iterate 
through each number in list_of_ints only once. For each number, we 
calculate the complement needed to reach the target value. If the 
complement is in seen_values, we have found a pair that sums up to 
the target value, and we return True. If we finish iterating through 
the list without finding a pair, we return False.
This approach reduces the complexity from O(n^2) to O(n), as we only need 
to iterate through the list once to check for the sum condition. 
Additionally, it avoids unnecessary duplicate calculations by storing the 
complements in a set.
"""

2.5 代码文档和代码摘要

以自然语言描述生成源代码摘要。此功能仅适用于已按指导方式训练的模型。

# >>> Model: ChatGPT
# >>> Prompt:
You are an expert in development. Adds an explanation of the code between quotations at the end.
"""
def double_sum_to_value(list_of_ints, value):
    if len(list_of_ints) < 2:
        return False
    else:
        for i in range(len(list_of_ints) - 1):
            for j in range(i + 1, len(list_of_ints)):
                if list_of_ints[i] + list_of_ints[j] == value:
                    return True

        return False
"""

# >>> Result:
"""
The given code defines a function named double_sum_to_value that takes 
in two parameters: list_of_ints, which is a list of integers, and value, 
which is an integer. The function checks if there are any two distinct 
integers in the list whose sum is equal to the given value.
Here's a breakdown of how the code works:
The function begins with an initial check to see if the length of the 
list_of_ints is less than 2. If it is, it means there are not enough 
integers in the list to form a pair, so the function returns False.
If the length of the list is 2 or greater, the function proceeds to 
iterate through the list using two nested loops. The outer loop iterates 
over each element in the list except the last one, denoted by the variable i.
The inner loop iterates over the elements following the current element 
of the outer loop, denoted by the variable j. This ensures that every 
possible pair of distinct integers is considered.
Within the nested loops, the function checks if the sum of the current 
pair of integers, list_of_ints[i] and list_of_ints[j], is equal to the 
given value. If it is, the function immediately returns True to indicate 
that a pair with the desired sum has been found.
If no such pair is found after exhausting all possible combinations, the 
function exits the nested loops and returns False to indicate that there 
are no distinct integers in the list that sum up to the given value.
The code utilizes a brute-force approach by checking all possible pairs 
of integers. While it works correctly, it has a time complexity of O(n^2) 
due to the nested loops, where n is the length of the input list. This 
means the execution time grows quadratically with the size of the input 
list, which can be inefficient for large lists.
"""

2.6 代码重写

开发人员必须定期编写相同的功能，但仅更改某些名称。生成函数使这些修改变得非常容易。此功能仅适用于已按指导方式训练的模型。

# >>> Model: ChatGPT
# >>> Prompt:
In the following function, change the input variable 'list_of_ints' to 'list_of_revenues' and 'value'' to 'revenue'.
def double_sum_to_value(list_of_ints, value):
    if len(list_of_ints) < 2:
        return False
    else:
        for i in range(len(list_of_ints) - 1):
            for j in range(i + 1, len(list_of_ints)):
                if list_of_ints[i] + list_of_ints[j] == value:
                    return True

        return False

# >>> Result:
def double_sum_to_value(list_of_revenues, revenue):
    if len(list_of_revenues) < 2:
        return False
    else:
        for i in range(len(list_of_revenues) - 1):
            for j in range(i + 1, len(list_of_revenues)):
                if list_of_revenues[i] + list_of_revenues[j] == revenue:
                    return True

        return False

2.7 代码翻译

代码到代码的翻译（Code-to-code）是将一种编程语言编写的代码转换为另一种同功能编程语言的过程。此过程也称为代码转换、转译、代码迁移或源到源翻译。此功能仅适用于已按指导方式训练的模型。

# >>> Model: ChatGPT
# >>> Prompt:
Convert this function in 'C' language.
"""
def double_sum_to_value(list_of_ints, value):
    if len(list_of_ints) < 2:
        return False
    else:
        for i in range(len(list_of_ints) - 1):
            for j in range(i + 1, len(list_of_ints)):
                if list_of_ints[i] + list_of_ints[j] == value:
                    return True

        return False
"""

# >>> Result:
#include 

bool double_sum_to_value(int list_of_ints[], int length, int value) {
    if (length < 2) {
        return false;
    } else {
        for (int i = 0; i < length - 1; i++) {
            for (int j = i + 1; j < length; j++) {
                if (list_of_ints[i] + list_of_ints[j] == value) {
                    return true;
                }
            }
        }
        return false;
    }
}
"""
Explanation:

The function is defined with the return type bool, which represents the 
boolean value of True or False in C.
The list_of_ints is passed as an integer array along with its length 
length and the target value value.
The condition if (length < 2) is used to check if the length of the 
array is less than 2, similar to the Python code.
The nested loops are implemented using for loops in C. The loop 
variables i and j iterate over the indices of the array elements.
The condition list_of_ints[i] + list_of_ints[j] == value is checked 
to determine if a pair of elements sums up to the target value, 
similar to the Python code.
If a pair is found, true is returned, and if no pair is found, false 
is returned at the end of the function.
Note: In C, it is important to include the necessary headers, such 
as stdbool.h, for using the bool data type.
"""

2.8 代码缺陷检查

这是一个要求LLM检测提示中提供的源代码中的缺陷的过程。此功能仅适用于已按指导方式训练的模型。

# >>> Model: ChatGPT
# >>> Prompt:
Find defects in this code.
"""
def double_sum_to_value(list_of_ints, value):

 for i in range(len(list_of_ints)):
  for j in range(i + 1, len(list_of_ints)):
   if list_of_ints[i] + list_of_ints[j] == value:
    return True

 return False
"""

# >>> Result:
"""
There are a few potential defects in the provided code:

Inadequate Input Validation:
The code does not perform sufficient input validation. It assumes that 
list_of_ints will always be a list and value will be a valid integer. 
If these assumptions are not met, the code may raise exceptions or produce 
incorrect results. It's good practice to validate the input types and 
handle any potential errors or edge cases.

Lack of Bounds Checking:
The code uses nested loops to iterate over the indices of list_of_ints. 
However, it does not perform any bounds checking to ensure that the 
indices are within the valid range of the list. This can lead to 
out-of-range errors if the input list is empty or has insufficient 
elements. It's important to validate the length of list_of_ints before 
iterating over its indices.

No Early Termination:
Once a pair of integers is found that satisfies the sum condition, the 
code immediately returns True. However, it continues iterating through 
the remaining pairs unnecessarily. This can result in unnecessary 
computation and reduced performance. Adding a break statement after 
the return True statement would optimize the code by terminating the 
loops early.

Inefficient Nested Loop:
The code uses a nested loop to compare each pair of integers in list_of_ints. 
This approach has a complexity of O(n^2), where n is the length of 
list_of_ints. Depending on the size of the list, this can lead to poor 
performance for larger inputs. Consider using alternative approaches, 
such as utilizing a set to store seen values or sorting the list and 
applying binary search, which can potentially reduce the complexity 
to O(n) or O(n log n) respectively.

To address these potential defects, here's an improved version of the code:
"""
def double_sum_to_value(list_of_ints, value):
    if not isinstance(list_of_ints, list) or not isinstance(value, int):
        raise ValueError("Invalid input")

    if len(list_of_ints) < 2:
        return False

    seen_values = set()
    for num in list_of_ints:
        complement = value - num
        if complement in seen_values:
            return True
        seen_values.add(num)

    return False
"""
In the updated code:

Input validation is performed to check the type of list_of_ints and value.
The length of list_of_ints is checked to ensure it has at least two elements 
before proceeding with the main logic.
A set, seen_values, is used to store previously seen values for efficient 
lookup.
If a pair is found that satisfies the sum condition, True is immediately 
returned.
The code raises a ValueError if the input types are invalid, providing 
clearer error handling.
The code overall has a reduced complexity of O(n), improving performance 
compared to the original nested loop implementation.
"""

2.9 模板化和头脑风暴

对于最后一个用例，我们仅使用这些模型的文本生成功能。这无疑是最具创意的案例，也是让我们能够快速转向软件框架定义的案例。它需要最多的架构知识才能对建议进行批判性的审视。

# >>> Model: ChatGPT
# >>> Prompt:
You are a software architect.
Generates the skeleton of a mobile application used to display a map \\
and allow users to write comments at a point on the map.

# >>> Result:
Certainly! Here's a high-level skeleton of a mobile application that 
displays a map and allows users to write comments at specific points on 
the map:

1. User Interface:
 . Map View: This is the primary view that displays the map.
 . Annotation View: When the user taps on a specific point on the map,
   an annotation view is displayed to allow writing comments.
 . Comment List: A list view to display the comments associated with 
   each point on the map.
 . User Authentication: Provide a login/signup feature to authenticate 
   users and associate comments with their accounts.

2. Components and Modules:
 . Map SDK Integration: Integrate a map SDK (e.g., Google Maps, Mapbox) 
   to display the map and handle user interactions like panning and zooming.
 . Annotation Management: Implement functionality to add annotations to 
   the map when the user taps on a specific point. Each annotation can 
   have associated comments.
 . Comment Management: Implement functionality to allow users to write 
   and post comments. Comments should be associated with the selected 
   point on the map.
 . User Authentication: Implement user authentication and session 
   management to associate comments with user accounts and provide a 
   personalized experience.
 . Data Persistence: Use a database or storage system to store and 
   retrieve annotations and comments. This can be done using a server-side 
   backend or a local database.

3. Workflow:
 . User opens the mobile app and is presented with a login/signup screen.
 . After successful authentication, the user is directed to the Map View.
 . The user can interact with the map, zoom in/out, and pan to navigate 
   to desired locations.
 . When the user taps on a specific point on the map, an annotation view is 
   displayed.
 . The user can write and post comments in the annotation view.
 . The comments are saved and associated with the selected point on the map.
 . The user can view the comments by tapping on existing annotations or 
    accessing a comment list view.
 . The user can log out or switch to a different user account if needed.

4. Considerations:
 . UI/UX Design: Design a user-friendly interface with intuitive map 
   interactions and clear annotation/comment presentation.
 . Data Security: Implement secure authentication and ensure data privacy 
   for user accounts and comments.
 . Performance Optimization: Consider implementing efficient data 
   retrieval and rendering mechanisms to ensure smooth map interactions
   and quick comment loading.
 . Offline Support: Implement offline capabilities, allowing users to 
   view previously loaded map data and comments when there is no internet 
   connection.
 . Error Handling: Implement proper error handling and feedback 
   mechanisms to inform users of any issues, such as failed comment 
   submission or map loading errors.

Please note that this is a high-level overview, and the actual 
implementation details and choice of technologies may vary depending 
on the specific requirements and platform (iOS, Android, etc.) you 
are targeting.

# Complementary prompt:
What would you recommend in terms of technology for this application?

# Result:
In terms of technology recommendations for developing a mobile application 
with map functionality and comment features, here are some popular choices:

1. Mobile App Development Frameworks:
   - React Native: A popular cross-platform framework that allows building 
     mobile apps using JavaScript and React. It offers good performance 
     and code reusability across iOS and Android platforms.
   - Flutter: A cross-platform framework developed by Google that uses 
     the Dart programming language. It provides a rich set of UI components 
     and offers fast app development with excellent performance.
   - Native Development: If you prefer native development for iOS and 
     Android separately, you can use Swift/Objective-C for iOS and 
     Java/Kotlin for Android.

2. Map SDKs:
   - Google Maps SDK: Provides comprehensive mapping functionality, 
     including interactive maps, markers, annotations, and user interaction 
     support.
   - Mapbox SDK: Offers powerful mapping tools with customizable styles, 
     markers, annotations, and support for user interactions.

3. Backend and Database:
   - Backend as a Service (BaaS): Services like Firebase or AWS Amplify 
     provide ready-to-use backend infrastructure, authentication, and 
     database support, simplifying backend development.
   - Custom Backend: You can build your own backend using technologies 
     like Node.js, Python, Ruby, or Java, along with databases like MySQL, 
     PostgreSQL, or MongoDB.

4. User Authentication:
   - Firebase Authentication: Provides easy integration for user 
     authentication with various login methods like email/password, 
     social media logins, etc.
   - OAuth Providers: Utilize OAuth providers like Google, Facebook, or 
     Twitter for seamless authentication and account creation.

5. Additional Considerations:
   - Data Storage: Depending on the scale and requirements of your 
     application, you can choose a database solution such as Firebase 
     Realtime Database, Cloud Firestore, or a SQL/NoSQL database for 
     storing comments and other data.
   - API Development: If you plan to develop a custom backend, consider 
     using frameworks like Express.js (Node.js) or Flask (Python) to build 
     RESTful APIs for communication between the mobile app and the backend.

It's essential to evaluate the specific requirements, scalability needs, 
and development expertise of your team when choosing the technology stack. 
Additionally, consider factors like community support, documentation, and 
ease of integration with your chosen frameworks.

3、提示最佳实践

重要的是要遵循一些实用的技巧和指南，以利用大型语言模型的代码生成来获得最佳结果：

LLM对上下文非常敏感，用最多信息的纯文本表明你愿意做什么，而且要精确。请记住，它们经过训练可以预测前一个标记的下一个标记。
对于指令调教过的LLM，要求其扮演与其职责密切相关的角色，例如开发人员或测试人员。
指明目标语言。许多模型都是用多种语言训练的，它们有一些相似之处，比如如何注释。
请毫不犹豫地指出包名称和版本号。
对于文本补全，添加示例可以提高输出的准确性。
温度必须很低，因为我们确实希望模型生成危险代码。

4、代码生成评估简介

代码生成模型主要通过将输出与参考解决方案进行比较来评估，如翻译的 BLEU 分数，对应关系可以是精确的，也可以是模糊的。该方法的局限性在于它无法捕获代码的重要句法和语义特征，并且由于完美精度过于严格，它低估了相同语义逻辑下的不同结果。该指标将有利于已根据测试数据进行训练的模型或已使用评估数据来匹配输出的模型。

2021 年 7 月，OpenAI 引入了 Codex 和一种名为 HumanEval 的新评估技术，用于衡量从文档字符串合成程序的功能正确性。 OpenAI 发布的 HumanEval 数据集包含 164 个编程问题，其中包括函数签名、文档字符串、正文和多个单元测试。它们是手写的，以确保不包含在代码生成模型的训练集中。 HumanEval 使用 pass@k 指标。该指标由 Kulal 等人于 2019 年定义，用于评估功能正确性。 k 是每个问题生成并评估的代码样本的数量。如果任何样本通过单元测试，则认为问题已解决，然后报告已解决问题的总分数。

GPT家族在选秀分数方面是最好的。就每个分数的参数数量而言，StarCoder、CodeT5+ 和 CodeGen 模型目前最有趣。

HumanEval 并不是唯一可用的基准测试，你还可以考虑以下基准测试：

Salesforce 的 WikiSQL 于 2017 年推出，专门针对 SQL 语言，由 87,726 个手工注释的 SQL 查询和自然语言问题对组成。
CodeBLEU 于 2020 年开发，利用 BLEU 的强大功能来测量 n 元语法匹配，同时通过抽象语法树 (AST) 合并代码语法，并通过数据流合并代码语义。
2021 年，微软推出了 CodeXGLUE（CODE 通用语言理解评估基准）。它是代码智能任务的集合和模型评估和比较的平台。它包括 10 个多样化代码智能任务的 14 个数据集，涵盖以下场景：代码到代码（克隆检测、缺陷检测、完形填空测试、代码完成、代码修复和代码到代码翻译）；文本代码（自然语言代码搜索、文本到代码生成）；代码文本（代码摘要）；和文本到文本（文档翻译）。
自动编程进度标准（APPS）总共包含 10,000 个编码问题，131,836 个用于检查解决方案的测试用例和 232,444 个由人类编写的真实解决方案。
MBPP（Mostly Basic Python Problems）是社区提供的约 1000 个 Python 编程问题的基准测试，旨在供新手程序员解决，涵盖编程基础知识、标准库功能……每个问题由任务描述、解决方案代码和三个自动化问题组成。测试用例。

5、开发人员的生产力是否更高？

2022 年 9 月，Github 进行的一项关于 Github Copilot 应用程序对开发人员生产力和幸福感影响的研究显示了许多有趣的结果：

大约 60% 到 75% 的用户表示工作满意度更高，编码挫折感减少，专注于完成任务的能力增强。
据开发人员称，事实证明，GitHub Copilot 在维持工作流程 (73%) 和处理重复性任务时节省精力 (87%) 方面发挥了重要作用。
Github 招募了 95 名专业开发人员，将他们随机分为两组，并对他们用 JavaScript 编写 HTTP 服务器所需的时间进行计时。一组使用 GitHub Copilot 来完成任务，另一组则没有。使用 GitHub Copilot 的开发人员的任务效率显着提高，与未使用 GitHub Copilot 的开发人员相比，完成任务的速度提高了 55%。

这是 Github 对 Github 提供的产品进行的一项研究。需要进行更多的学术研究才能对观察到的成果得出任何结论。尽管如此，结果还是很有趣，可以公平地说，这些类型的工具在编写源代码中经常遇到的函数方面提供了明确的好处。

6、道德与考量

代码生成带来了许多新的道德问题，并引发了有关开发人员角色的问题。这些系统并非没有缺点，重要的是要记住与它们相关的一些需要考虑的问题：

公平使用：使用开源代码作为底层机器学习模型的训练数据这一有争议的问题仍然需要解决。通常建议开发人员在源代码中标明他们已重用的代码。这通常也会在许可证中注明。生成方法与此背道而驰。
自动化偏差：开发人员可能倾向于过于依赖模型生成的结果。这些系统可能会生成表面上看起来正确的代码，但无法提供预期的服务，要么是因为请求不精确或制定得不好，要么是因为生成的代码由于模型不正确，要么是因为训练代码不正确（垃圾中的垃圾）。，垃圾出）。如果开发人员太快接受这些不正确的代码建议，他们就会面临花费更多时间调试甚至遇到重大安全问题的风险。
安全威胁：训练数据可能包含注入或泄露代码（恶意软件）。控制生成并从功能和安全角度彻底检查代码势在必行。
数据、代码和信息泄露：切勿在提示中放入任何机密内容，因为这会构成安全风险。业务规则、项目代码、数据示例，这些都不应该进入与模型的交互中。请记住，输入也可用于训练模型，因此部分代码可能最终会出现在输出中。输入也可能被恶意方分析并未经同意使用。
数据集偏差：训练数据集通常是来自开源、可公开访问的 Github 存储库的源代码，还包含用户撰写的评论。因此，这些数据集可能包含某些刻板印象，例如来自文本注释或源代码（例如变量、函数和类名）的种族和性别。因此，社会偏见可能本质上被内置到根据这些数据训练的模型中。上游过滤或输出控制仍然是一项复杂的活动，可以帮助减轻这些偏差，但要完全消除仍然很复杂。
计算成本：生成一段代码需要对通常较重的模型进行多次推理。数十亿参数模型的每次推理都需要大量的电力，然后根据底层系统生成二氧化碳。简单的复制粘贴肯定会减少能源消耗。
知识产权：该模型不能保证代码抄袭和产权保存。另外，请用户阅读这些模型的精确许可证，这些模型可能是开源的，但禁止用于商业用途。 OpenAI 在他们的论文中“研究发现 Codex 模型很少生成与训练数据内容相同的代码。在一项检查与训练数据中的代码片段匹配的代码生成频率的研究中，此类发生率 < 0.1%。” 他们发现类似的代码对应于经典的代码元素，这在一定程度上消除了在输出中找到其他人的代码部分的风险。 OpenAI 研究人员认为，这与学习不良（过度拟合）有关。

生成式人工智能系统可能会生成侵犯现有版权作品的输出媒体。我们认为，这不太可能是结构良好的生成式人工智能系统的意外结果，尽管由于过度拟合或开发人员的意图，这种情况仍然有可能发生。关于人工智能创新知识产权保护征求意见的意见 — 2020 年 3 月 3 日

教育工作者和学生的考虑因素：在《编程很难——或者至少曾经是：人工智能代码生成的教育机会和挑战》论文中，大学假设这些工具将继续可供学生使用，他们的能力将继续提高。改进，因此采用率将会增加。他们的结论是，将人工智能生成的代码集成到编程教育中正变得越来越普遍，这既带来了挑战，也带来了好处。随着软件开发的未来更多地倾向于自动生成代码，因此需要调整实践并专注于代码读取和评估而不是代码生成。

人工智能生成的代码为入门编程和相关课程的学生和教育工作者带来了机遇和挑战。这些工具突然变得可行且易于访问，这表明教育工作者可能没有意识到或没有准备好应对人工智能生成的代码对教育实践产生的重大影响。因此，我们迫切需要根据这些新技术来审查我们的教育实践。

7、结束语

代码生成方面的这一新进展彻底改变了人类和机器在一个由人类向机器发出指令的领域中协同工作的方式。这些技术有望显着提高时间和性能，但我们不应该简单地说它们是针对所有开发人员，尤其是初学者。

诚然，代码解释可以用来更快地输入源代码，但代码生成需要高级的开发知识，以避免将错误引入程序或忘记软件设计不仅仅是编写功能。

这些模型变得越来越高效，但它们仍然对请求的制定方式很敏感，并且取决于多个因素：模型性能、支持技能和应用程序设计技能。这些因素意味着必须谨慎对待这些技术，并且不要低估事先培训的需要。

一种新方法正在迅速出现，涉及自协作代码生成的使用。它包括通过生成本身链接从定义到测试用例的多个生成级别。这个序列显着改善了最终结果并开辟了新的视角。我们还没有看到这一领域最后的重大进展。

原文链接：Top 20代码生成LLM — BimAnt

你可能感兴趣的:(LLM)

【提示词优化技巧】利用大模型进行提示词自优化 weixin_37763484 大模型人工智能
看到一篇帖子，里面记录了如下的提示词优化技术，我使用ai进行了解读。整体来看，这个方法非常合理，能减少人工干预，值得试一试。原始方法如下：1.主题：构建高效Prompt的系统化流程：一种元提示工程方法在与大型语言模型（LLM）的交互中，提示词（Prompt）的质量直接决定了输出的上限。传统的Prompt撰写高度依赖工程师的经验和直觉，缺乏一套系统化的构建与优化流程，导致效率瓶颈和质量波动。本文提出
LLM初识
从零到一：用Python和LLM构建你的专属本地知识库问答机器人摘要：随着大型语言模型（LLM）的兴起，构建智能问答系统变得前所未有的简单。本文将详细介绍如何使用Python，结合开源的LLM和向量数据库技术，一步步搭建一个基于你本地文档的知识库问答机器人。你将学习到从环境准备、文档加载、文本切分、向量化、索引构建到最终实现问答交互的完整流程。本文包含详细的流程图描述、代码片段思路和关键注意事项，
大语言模型：人像摄影的“达芬奇转世”？——从算法解析到光影重塑的智能摄影革命黑巧克力可减脂 AIGC 语言模型人工智能自然语言处理
导言在摄影术诞生之初，达芬奇或许无法想象，他对于光影、比例和解剖的严谨研究，会在数百年后以另一种形式重生。今天，当摄影师面对复杂的光线环境或苦苦寻找最佳构图时，一位由代码构筑的“光影军师”正悄然降临——大语言模型（LLM）正以前所未有的方式，重塑人像摄影的创作边界。解构经典：大语言模型如何“消化”百年摄影智慧大语言模型并非凭空创造建议，其根基在于对海量摄影知识体系的深度理解与结构化重组。理论内化：
Spring Boot + LLM 智能文档生成全流程技术方案，包含从代码注解规范、OpenAPI增强、Prompt工程到企业级落地夜雨hiyeyu.com java spring boot spring java 系统架构后端 spring cloud 人工智能
SpringBoot+LLM智能文档生成全流程技术方案，包含从代码注解规范、OpenAPI增强、Prompt工程到企业级落地一、深度集成架构设计二、代码层深度规范（含20+注解模板）2.1精细化参数描述2.2错误码智能生成三、OpenAPI规范增强策略3.1扩展字段注入3.2多语言支持四、企业级Prompt工程库4.1基础Prompt模板4.2智能问答Prompt五、智能文档生成全流程5.1动态示
【RAG专题】如何选择合适的RAG架构？星际棋手人工智能
选择适合的RAG架构需结合自身业务需求、数据特点、性能要求等因素综合判断，以下是关键考量维度及对应架构选择建议：1.按数据规模与类型选择•小规模、单一类型数据（如纯文本文档库）：适合基础单阶段检索架构（检索模块+生成模块）。◦检索：用轻量级嵌入模型（如BGE-base、all-MiniLM）+简单向量数据库（如FAISS）。◦生成：搭配中小型LLM（如Llama2-7B、Mistral），无需复杂
迈向大型推理模型：基于大型语言模型的强化推理综述（附教程） LLM大模型人工智能自然语言处理知识库本地化部署吴恩达大模型 RAG
语言长期以来被认为是人类推理的基本工具。大型语言模型（LLM）的突破激发了大量研究兴趣，推动了利用这些模型解决复杂推理任务的探索。研究人员通过引入“思维”这一概念——即一系列代表推理过程中的中间步骤的标记——超越了简单的自回归标记生成。这一创新范式使LLMs能够模仿复杂的人类推理过程，如树搜索和反思性思维。近年来，学习推理的趋势逐渐兴起，强化学习（RL）被应用于训练LLMs掌握推理过程。这种方法通
LLM应用开发中的敏捷文档管理 AI天才研究院计算 Agentic AI 实战 AI人工智能与大数据 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
文章标题：LLM应用开发中的敏捷文档管理关键词：LLM应用开发敏捷文档管理敏捷开发方法文档生命周期管理敏捷文档工具摘要：本文旨在探讨在LLM（大型语言模型）应用开发过程中，敏捷文档管理的重要性及其具体实践方法。文章首先介绍了LLM应用开发的背景和敏捷文档管理的必要性，接着深入讲解了敏捷文档管理的核心概念和原理。随后，文章探讨了敏捷文档管理工具的选择与应用，以及如何在LLM应用开发中实施敏捷文档管理
Kimi-Audio：最佳音LLM, 如何免费使用 Kimi-Audio AI 模型？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 kimi
简介继DeepSeek之后，字节跳动（现名MoonShotAI，又名Kimi）也在生成式人工智能领域加速发展，并发布了自己的音频模型Kimi-Audio，据说是迄今为止最好的音频模型。推荐文章《NvidiaGPU入门教程之02ubuntu安装A100显卡驱动(含8步快速浓缩教程)》权重2，安装A100显卡驱动《本地大模型知识库OpenWebUI系列之如何解决知识库上传文件故障Extractedco
LLM OCR vs 传统 OCR：解锁文档处理的未来
光学字符识别（OCR）技术早已是数字化文档的得力助手，但你有没有想过，传统OCR和新兴的LLMOCR究竟有何不同？传统OCR就像一台老式打印机，虽然能干活，但在复杂场景下常常“卡壳”。而LLMOCR则像一个聪明的助手，不仅能识别文字，还能读懂文档的“灵魂”。今天，我们就来聊聊这两者的区别，并看看LLMOCR如何为文档处理带来新可能。传统OCR：可靠但有限的老将传统OCR就像一位勤劳的抄写员，擅长把
从功能到落地：AI Agent 平台选型的 6 大维度全解析
一、背景：AIAgent爆发式普及，企业如何科学选型？近两年，随着大语言模型（LLM）技术的快速迭代，“AIAgent”正在从实验室走向企业实际生产线。从内容生成、客户服务，到销售助手、流程调度，越来越多企业开始探索将Agent作为“智能化助手”纳入业务流程。然而市场上平台众多、能力差异巨大，企业常常面临如下难题：不知道该选国内还是国外平台？哪个平台支持私有化部署？是否能接入已有CRM/CDP系统
大模型聊天模板
文章目录何为聊天模板聊天模板具体长什么样为什么会出现聊天模板何为聊天模板相信大多数本地离线使用过(特别是训练或微调过)LLM、VLM的人知道“Chattemplate/聊天模板”这个概念，但可能并没有对其有较多的了解。本文主要整合网络收集的知识，结合少数使用“聊天模板”的经验对其进行简要说明，希望可以帮助到大家。如果了解Alpaca、ShareGPT等数据集会知道，数据集都是结构化形式，其中会有各
基于 Qwen-Agent 与 MCP 实现阿里云 ECS 实例查询（含完整代码与实操）
✅关键词：Qwen-Agent、MCP、阿里云、运维、LLM、FunctionCalling在现代云运维场景中，我们不仅希望大语言模型（LLM）能回答文本问题，更希望它能直接调用云端API、查询资源，实现「智能运维」。本文将分享如何基于Qwen-Agent和MCP，快速实现一个“云资源助手”，能帮你查询阿里云ECS实例信息。什么是MCP？MCP(Model-ComputingPlatform)是阿
Spring AI从入门到精通：构建智能Spring应用的全面指南 java干货仓库 Spring 八股文汇总大模型 spring 人工智能 java
随着人工智能技术的快速发展，将大语言模型（LLM）与企业应用集成已成为趋势。SpringAI作为Spring官方推出的AI集成框架，为开发者提供了便捷、标准化的方式来构建智能应用。本文将从基础概念到高级应用，全面介绍SpringAI的核心功能与实践技巧。一、SpringAI概述1.1什么是SpringAI？SpringAI是VMware于2023年推出的开源框架，旨在简化大语言模型（LLM）与Sp
【Agent的革命之路——LangGraph】人机交互中的四种决策设计模式乔巴先生24 人机交互设计模式人工智能 python
在现在强大的LLM应用程序中，最有用的无外乎就是人机交互工作流，它将人工输入集成到自动化流程中，允许在关键阶段做出决策、验证或更正，因为底层模型可能会偶尔产生不准确之处，在合规性、决策或内容生成等低容错场景中，人工参与可通过审查、更正或覆盖模型输出来确保可靠性。我么的应用程序在什么时候会使用人机交互工作流程呢？审查工具调用：人类可以在工具执行之前审查、编辑或批准LLM请求的工具调用。验证LLM输出
LangGraph 教程：初学者综合指南（1）背太阳的牧羊人 langgraph langchain langgraph
关键概念图结构LangGraph设计的核心是基于图形的应用程序工作流程表示。该图包含两个主要元素：节点-工作的构建块：LangGraph中的每个节点代表应用程序中的一个不同的工作或操作单元。这些节点本质上是封装特定任务的Python函数。此任务可能涉及多种操作，例如：与LLM直接沟通，进行文本生成、摘要或其他基于语言的任务。与外部工具和API交互以获取数据或在现实世界中执行操作。通过格式化、过滤或
LangGraph教程6：LangGraph工作流人机交互 Cachel wood LLM和AIGC 人机交互 java 前端 langchain langgraph 开发语言数据库
文章目录Human-in-the-loop(人机交互)interruptWarningHuman-in-the-loop(人机交互)人机交互（或称“在循环中”）工作流将人类输入整合到自动化过程中，在关键阶段允许决策、验证或修正。这在基于LLM的应用中尤其有用，因为基础模型可能会产生偶尔的不准确性。在合规、决策或内容生成等低误差容忍场景中，人类的参与通过允许审查、修正或覆盖模型输出来确保可靠性。使用
大型语言模型在自动化AI科学研究与论文撰写中的应用与展望这是Jamon AI4SR 人工智能
1.引言：LLM驱动科学研究与论文撰写的范式转变大型语言模型（LLM）的快速发展正在科学发现领域引发一场深刻的范式转变。这些模型正从最初的任务特定自动化工具，逐步演变为能够自主执行复杂任务的智能代理，从根本上重新定义了研究过程以及人机协作的模式。LLM所展现出的新兴能力，例如高级规划、复杂推理和精确指令遵循，显著加速了科学发现的步伐。传统科学研究通常是一个由人类主导的、高度线性且劳动密集型的过程，
LLM4SR: A Survey on Large Language Models for Scientific Research UnknownBody LLM Daily Survey Paper 语言模型人工智能自然语言处理
文章主要内容文章围绕大语言模型（LLMs）在科学研究中的应用展开，系统探讨了其在科研各关键阶段的作用、方法、挑战及未来方向。科学假设发现：LLMs生成科学假设的研究源于“基于文献的发现”和“归纳推理”。现有方法通过灵感检索策略、反馈模块等组件提升假设生成质量，相关基准测试分为基于文献和数据驱动两类，评估指标涵盖新颖性、有效性等。虽取得一定成果，但面临实验验证困难、依赖现有LLMs能力等挑战。实验规
通过 Ollama 获取并运行本地大型语言模型（LLM）
Ollama是一个开源工具，专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计。它支持多种操作系统（Windows、macOS、Linux），并提供简单的命令行接口和API，适合开发者、研究人员以及对数据隐私有较高要求的用户。本文档将详细指导您如何通过Ollama在本地获取和运行LLM。1.准备工作在开始之前，请确保您的系统满足以下要求：操作系统：Windows、macOS或Linux（支
LLM词频规律：Zipf定律 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 pytorch 语言模型 python
LLM词频规律：Zipf定律Zipf定律（Zipf’sLaw）是语言学和信息论中描述文本中词语出现频率分布的规律，由美国语言学家乔治·金斯利·齐夫（GeorgeKingsleyZipf）提出。其核心结论是：在自然语言的大型文本语料中，若将所有词语按出现频率从高到低排序，第n个词语的频率与n的倒数大致成正比。Zipf定律的数学表达若用f(n)f(n)f(n)表示排序后第n个词语的出现频率，CC
Prompt：开启与AI高效对话的钥匙
解密Prompt：开启与AI高效对话的钥匙一、什么是Prompt？——AI的“使用说明书”想象一下，你正在指挥一位无所不知但毫无主动性的“实习生”——人工智能（AI）。你不能指望它“心领神会”，你必须给出清晰、具体的指令，它才能准确地完成你想要的任务。这个指令，就是Prompt（提示或提示词）。简单来说，Prompt是你向AI（如大型语言模型LLM）发出的文本或问题，用以引导它生成特定的、高质量的
LLM模型贪婪、温度、Top-k、核采样方式的区别---附代码与示例繁星意未平 AI python 开发语言
LLM模型贪婪、温度、Top-k、核采样方式的区别—附代码与示例在自然语言生成任务中，不同的采样技术用于从语言模型的输出中选择下一个生成的单词或词语。这些技术包括贪婪采样、温度采样、Top-k采样和核（Nucleus）采样。它们在选择生成单词的过程中有不同的策略，本文将介绍这四种采样方式的区别。1.贪婪采样(GreedySampling)贪婪采样是一种直接选择最可能的下一个词的策略。具体步骤为：从
LLM 的Top-P参数是在LLM中的每一层发挥作用，还是最后一层？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 人工智能算法机器学习 transformer 自然语言处理
LLM的Top-P参数是在LLM中的每一层发挥作用，还是最后一层？Top-P（核采样）是在大语言模型（LLM）生成文本的最后一步发挥作用，具体来说是在模型输出**原始分数（Logits）**之后、应用Softmax函数生成概率分布之前进行筛选。它的作用机制与Temperature（温度）类似，但逻辑不同，以下从技术原理、代码实现和应用场景三个维度展开说明：一、技术原理：仅作用于生成阶段的最后一步1
KAIST：LLM混合递归推理大模型任我行大模型-推理优化人工智能自然语言处理语言模型论文笔记
标题：Mixture-of-Recursions:LearningDynamicRecursiveDepthsforAdaptiveToken-LevelComputation来源：arXiv,2507.10524摘要缩放语言模型解锁了令人印象深刻的能力，但伴随的计算和内存需求使训练和部署都很昂贵。现有的效率工作通常针对参数共享或自适应计算，留下了如何同时实现两者的问题。我们引入了混合递归(MoR
NUS：LLM表格数据建模综述
标题：LanguageModelingonTabularData:ASurveyofFoundations,TechniquesandEvolution来源：arXiv,2408.10548摘要表格数据是一种跨领域的流行数据类型，由于其异构性和复杂的结构关系，带来了独特的挑战。在表格数据分析中实现高预测性能和鲁棒性对许多应用程序具有重大前景。受自然语言处理，特别是转换器架构的最新进展的影响，出现了
大模型本地部署-dify私有化部署-教程
一、简介dify是一个开源的LLM应用开发平台。其直观的界面结合了AI工作流、RAG管道、Agent、模型管理、可观测性功能等，可以让您快速从原型到生产。二、核心功能列表1、工作流：在画布上构建和测试功能强大的AI工作流程。2、全面的模型支持：与数百种专有/开源LLMs以及数十种推理提供商和自托管解决方案无缝集成，涵盖GPT、Mistral、Llama3以及任何与OpenAIAPI兼容的模型。完整
AIGC革命：基于魔搭社区的LLM应用开发实战——从模型微调到系统部署 Liudef06小白 AIGC 人工智能特殊专栏人工智能魔搭 AIGC LLM
AIGC革命：基于魔搭社区的LLM应用开发实战——从模型微调到系统部署1.AIGC技术演进与魔搭社区生态解析人工智能生成内容（AIGC）正在重塑内容创作、软件开发和人机交互的边界。从OpenAI的GPT系列到StabilityAI的StableDiffusion，生成式AI技术正以惊人的速度发展。在这场技术革命中，魔搭社区（ModelScope）作为中国领先的AI模型开源平台，正成为开发者探索AI
人工智能界的“黑话“大揭秘：AI新词汇速成指南
人工智能界的"黑话"大揭秘：AI新词汇速成指南你是否曾在科技大佬们讨论AI时一头雾水？听到RAG、Agent、PromptEngineering时以为他们在说天书？别担心，今天我们就来一场AI术语的"通俗化运动"，让你轻松混入AI圈子，秒变内行人！LLM（大型语言模型）：AI界的"大胃王"LLM是吞噬了互联网大部分文字的"数据饕餮"。特点：训练数据以TB（万亿字节）计算参数动辄上千亿计算能力堪比小
解密Claude系列：从原理到实践的全方位解析软考和人工智能学堂强化学习人工智能 Claude快速入门 Claude
引言：Claude系列模型的崛起在人工智能领域，大型语言模型(LLM)的发展日新月异。OpenAI的GPT系列和Anthropic的Claude系列无疑是这一领域的双子星。Claude系列模型以其独特的"ConstitutionalAI"理念和强大的对话能力，正在重塑人机交互的未来。本文将深入探讨Claude系列的技术原理、架构特点，并通过实践代码展示其强大能力。Claude系列的技术演进1.Cl
智能体架构设计的五大核心原则：构建下一代AI系统的工程基石一休哥助手人工智能
引言：智能体架构的范式演进人工智能领域正经历从孤立模型向自主智能体的范式转变。2025年，全球AI智能体市场规模突破200亿美元，在金融、医疗、制造等领域的渗透率超40%。然而，智能体开发仍面临协作效率低（多智能体任务重叠率达30%）、安全风险高（工具调用错误率18%）和系统僵化（需求变更迭代周期超2周）三大痛点。本文基于产业实践提炼五大核心设计原则，为构建下一代智能体系统提供架构指南。传统LLM
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息