UFO上的可乐

Camel-AI项目模块详解

前提内容

快捷键

在Pycharm中使用ctrl+F12查看类中所有方法
查看某一个类中的方法的实现类：鼠标点到方法名字上右键→go to→Implementations

camel项目目录如下：

camel/
├── agents/                 # 智能体相关代码
├── models/                 # 模型集成与管理
├── tools/                  # 工具集成与使用
├── conversations/          # 对话管理与处理
├── data/                   # 数据处理与管理
├── examples/               # 示例代码
├── docs/                   # 文档
├── tests/                  # 测试代码
├── .env                    # 环境配置文件
├── .gitignore              # Git忽略文件配置
├── .pre-commit-config.yaml # 预提交钩子配置
├── .style.yapf             # 代码风格配置
├── CONTRIBUTING.md         # 贡献指南
├── LICENSE                 # 许可证
├── Makefile                # 构建脚本
├── README.md               # 项目简介
├── poetry.lock             # 依赖锁定文件
└── pyproject.toml          # 项目配置文件

Agent两个重要函数

在一个典型的 Agent 系统（如 AI 助手或交互式代理）中，两个重要函数通常是与 消息处理 和 任务执行 相关的功能。以下是通用的两类核心函数及其作用：

1. 消息处理函数

常见实现：`step()` 或类似函数

作用：
- 用于接收用户的输入（例如对话消息、图像、问题等），处理这些输入，并生成适当的响应或操作建议。
- 是 Agent 和外部交互的主要入口。
典型流程：
1. 接收消息：用户的输入被封装为消息对象（如 BaseMessage）。
2. 处理消息：Agent 调用模型、执行逻辑，生成响应。
3. 返回结果：将响应返回给调用者。
示例：

def step(self, message):
    # 接收用户消息
    processed_input = self.preprocess_message(message)
    
    # 调用模型生成响应
    response = self.model.generate_response(processed_input)
    
    # 返回响应消息
    return self.format_response(response)

应用场景：
- 用于处理用户输入的自然语言问题，例如回答问题、生成推荐等。
- 在对话系统中，step() 函数驱动整个对话流程。

2. 任务执行函数

常见实现：`run()` 或类似函数

作用：
- 用于执行一项或一组任务，通常是较复杂的、需要多个步骤的逻辑操作。
- 一般会依赖其他子模块（如模型预测、数据库查询、API 调用等）来完成任务。
典型流程：
1. 接收任务指令：包括任务目标、上下文等信息。
2. 执行步骤：调用子任务或模块完成任务。
3. 返回结果：返回任务的完成状态或结果数据。
示例：

def run(self, task):
    # 检查任务参数
    if not self.validate_task(task):
        raise ValueError("Invalid task parameters")
    
    # 执行任务逻辑
    result = self.execute_subtasks(task)
    
    # 处理结果并返回
    return self.postprocess_result(result)

应用场景：
- 用于完成复杂的操作，例如信息检索、任务规划、数据分析等。
- 在多步对话或任务代理中，run() 是核心调度函数。

总结

消息处理函数 (step())：
- 用于处理用户输入和生成即时响应。
- 适合对话代理场景，是 Agent 和用户交互的核心函数。
任务执行函数 (run())：
- 用于执行复杂的任务，通常涉及多步骤操作。
- 适合多任务场景，是 Agent 内部逻辑的执行引擎。

这两个函数是 Agent 的核心，因为它们分别负责 对外交互 和 内部任务管理，共同构成了 Agent 的工作机制。run 函数是 step 函数的高层封装，内部可能多次调用 step 来完成任务

run()
├── step()  # 第一次交互
├── step()  # 第二次交互
└── step()  # 最后一次交互

Give `BaseMessage` to `ChatAgent`

将baseMessage信息输入给agent

from io import BytesIO

import requests
from PIL import Image

from camel.agents import ChatAgent
from camel.messages import BaseMessage
# 图片信息的输入
url = "https://raw.githubusercontent.com/camel-ai/camel/master/misc/logo_light.png"
response = requests.get(url)
img = Image.open(BytesIO(response.content))

# 创建系统消息，定义聊天代理的角色和行为，为了初始化聊天代理
sys_msg = BaseMessage.make_assistant_message(
    role_name="Assistant", # 消息角色
    content="You are a helpful assistant.", # 行为是什么
)

# 创建一个聊天代理对象
camel_agent = ChatAgent(system_message=sys_msg)

# 定义用户消息，等会儿传递给聊天代理
user_msg = BaseMessage.make_user_message(
    role_name="User", content="""what's in the image?""", image_list=[img] # 包含一个文字问题和图片信息
)

# 发送用户消息并获取响应
response = camel_agent.step(user_msg)
print(response.msgs[0].content)
>>> The image features a logo for "CAMEL-AI." It includes a stylized purple camel graphic alongside the text "CAMEL-AI," which is also in purple. The design appears modern and is likely related to artificial intelligence.

Camel项目重要模块讲解

models模块

该模块包含奖惩评分机制和用到的各种模型

奖惩评分机制工作流程

BaseRewardModel (base_reward_model.py)：
- 定义了一个抽象基类，规定奖励模型需要实现的两个方法：
  - evaluate(messages: List[Dict[str, str]]) -> Dict[str, float]：评估消息并返回分数。
  - get_scores_types() -> List[str]：获取奖励模型返回的分数类型列表。
- 具体的奖励模型（如 NemotronRewardModel 和 SkyworkRewardModel）继承并实现此基类。
具体奖励模型：
- NemotronRewardModel (nemotron_model.py)：
  - 使用 OpenAI 的 API 实现，返回五种评分指标（helpfulness, correctness, coherence, complexity, verbosity）。
- SkyworkRewardModel (skywork_model.py)：
  - 使用 HuggingFace 模型和 PyTorch 实现，返回单一分数（Score）。
评估器 (evaluator.py)：
- 提供了基于奖励模型的通用评估和过滤功能：
  - 调用奖励模型的 evaluate 方法获取分数。
  - filter_data 方法基于给定的阈值对消息进行过滤。
初始化 (__init__.py)：
- 将 BaseRewardModel, NemotronRewardModel, SkyworkRewardModel, 和 Evaluator 导出为模块公共接口。

整体工作流程

选择奖励模型：
- 根据需求选择 NemotronRewardModel 或 SkyworkRewardModel。
- 使用 HuggingFace 的模型时选择 SkyworkRewardModel，否则选择 NemotronRewardModel。
初始化奖励模型：
- 通过模型类型、API Key 或 URL 初始化奖励模型。
调用评估器：
- 通过 Evaluator 调用奖励模型的 evaluate 方法，获取评分。
- 使用 filter_data 方法对消息进行过滤。

详细实现流程

1. 基础奖励模型：**BaseRewardModel**

抽象类，定义奖励模型的基本结构：
- evaluate(messages)：处理消息并返回评分。
- get_scores_types()：返回模型支持的评分类型列表。
子类必须实现这两个方法。

2. Nemotron 奖励模型：**NemotronRewardModel**

继承自 BaseRewardModel。
使用 OpenAI 的 API 实现：
- API 客户端初始化：通过 OpenAI 客户端与服务端通信。
- evaluate** 方法**：
  - 调用 OpenAI 的 chat.completions.create 接口。
  - 对返回的 ChatCompletion 对象解析评分。
- 评分类型：
  - helpfulness、correctness、coherence、complexity、verbosity。
评分解析逻辑：
- 从 ChatCompletion 对象中提取 logprobs 信息，映射到评分。

3. Skywork 奖励模型：**SkyworkRewardModel**

同样继承自 BaseRewardModel。
基于 HuggingFace Transformers 和 PyTorch：
- 加载 HuggingFace 模型和分词器。
- 使用 AutoModelForSequenceClassification 和 AutoTokenizer 处理输入。
evaluate** 方法**：
- 将消息通过 tokenizer 编码后输入模型。
- 提取模型的输出 logits，作为单一评分（Score）。
评分类型只有一个：Score。

4. 评估器：**Evaluator**

核心功能：
1. 评估：调用奖励模型的 evaluate 方法，获取消息评分。
2. 过滤：
  - 给定阈值（thresholds），对消息进行过滤。
  - 如果任意评分低于阈值，则消息不通过。

代码调用示例

初始化并评估消息

from evaluator import Evaluator
from nemotron_model import NemotronRewardModel

# 初始化奖励模型
nemotron_model = NemotronRewardModel(model_type="gpt-4", api_key="sk-xxx")

# 初始化评估器
evaluator = Evaluator(reward_model=nemotron_model)

# 待评估的消息
messages = [{"role": "user", "content": "How can I learn Python?"}]

# 获取评分
scores = evaluator.evaluate(messages)
print("Scores:", scores)

过滤消息

# 阈值设定
thresholds = {"helpfulness": 0.8, "correctness": 0.9}

# 过滤消息
is_valid = evaluator.filter_data(messages, thresholds)
print("Message valid:", is_valid)

模型模块

核心作用是对多个大型语言模型（LLM）的统一接口封装。实现了不同模型的后端支持和配置管理，主要包括 OpenAI、Anthropic、Azure OpenAI、Cohere 和 DeepSeek 等服务。

作用分析

1. 核心抽象：**BaseModelBackend**

文件位置：base_model.py。
作用：
- 提供一个抽象基类，定义了所有模型后端的共同功能，包括：
  - run(messages): 执行推理任务，返回推理结果。
  - token_counter: 计数器，用于统计消息的 token 数。
  - check_model_config: 校验模型配置是否合法。
- 各具体模型后端都继承此类，实现其特定的推理逻辑。

模型后端实现逻辑

每个模型后端继承 BaseModelBackend，并实现其特定逻辑：

a. Anthropic 模型：`AnthropicModel`

文件位置：anthropic_model.py。
作用：
- 支持 Anthropic API（Claude 系列模型）的统一接口。
- 提供 token 计数器、消息转化、以及从 Anthropic 格式到 OpenAI 格式的响应转换。
主要功能：
- 通过 AnthropicTokenCounter 实现 token 统计。
- _convert_response_from_anthropic_to_openai: 转换响应为 OpenAI 格式。

b. Azure OpenAI 模型：`AzureOpenAIModel`

文件位置：azure_openai_model.py。
作用：
- 支持 Azure 提供的 OpenAI 模型（例如 GPT 系列）的统一接口。
- 兼容 Azure 的特定配置参数（如 api_version 和 azure_deployment_name）。
主要功能：
- 自定义 api_version 和 azure_deployment_name 检查。
- 通过 Azure OpenAI 客户端执行推理。

c. DeepSeek 模型：`DeepSeekModel`

文件位置：deepseek_model.py。
作用：
- 支持 DeepSeek 服务的统一接口。
- 提供流式推理的能力，通过 Stream[ChatCompletionChunk] 支持分块输出。
主要功能：
- 支持自定义 URL 和 API Key。
- 校验模型配置中是否包含无效参数。

d. Cohere 模型：`CohereModel`

文件位置：cohere_model.py。
作用：
- 支持 Cohere API 的统一接口。
- 提供 Cohere 专属的消息格式转换和响应格式转换。
主要功能：
- _to_openai_response: 将 Cohere 的响应转换为 OpenAI 格式。
- _to_cohere_chatmessage: 将 OpenAI 格式的消息转为 Cohere 格式。

配置管理

作用：
- 每个模型后端都有其特定的配置管理逻辑。
- 使用环境变量或配置文件加载必要的 API Keys 和模型参数。
关键点：
- 通过 os.environ.get 加载 API Key 和其他配置。
- 提供校验功能（例如 check_model_config）以确保配置合法。

文件 `init.py`

文件位置：__init__.py。
作用：
- 将所有模型后端类统一导出，便于模块化使用。
- 包括所有支持的模型（如 OpenAIModel、AzureOpenAIModel 等）。

messages模块

该模块主要负责处理信息交互，尤其是工具或者函数调用相关的功能

Hermes数据格式

是一种配合Json的数据格式，通过下面两种标记，嵌入对话信息和结果，使得对话系统能够识别和处理这些交互。

发起工具调用

Let me check the weather.
<tool_call>
{"name": "get_weather", "arguments": {"city": "London"}}
</tool_call>

返回问答结果

<tool_response>
{"name": "get_weather", "content": {"temperature": 15, "condition": "sunny"}}
</tool_response>

human、gpt、system 或tool四种角色的不同

在ShareGPTMessage中，human、gpt、system 和 tool 表示消息发送方的角色，它们的定义和用途如下：

角色介绍

human

含义：由人类用户发送的消息。
场景：通常作为对话的输入内容，表示用户的需求、提问或指令。
特性：
- 必须出现在对话的开始位置（ShareGPTConversation 的第一条消息）。
- 是 GPT 或工具响应的触发点。
示例：

{
    "from": "human",
    "value": "What's the weather like in London?"
}

gpt

含义：由 AI 助手（GPT 模型）生成的消息。
场景：对 human 消息进行回应，或者作为工具调用的触发者。
特性：
- 可以是对 human 消息的直接回答，也可以包含工具调用请求（例如标签）。
- 必须跟随 human 或 tool 消息。
示例：
- 直接回复：

{
    "from": "gpt",
    "value": "The weather in London is sunny with a high of 15°C."
}

- **工具调用**：

{
    "from": "gpt",
    "value": "Let me check the weather for you. {\"name\": \"get_weather\", \"arguments\": {\"city\": \"London\"}}"
}

system

含义：系统生成的消息，用于设置上下文或对话规则。
场景：初始化对话环境，为 GPT 或工具提供指令或背景信息。
特性：
- 一般在对话的开头设置，用于影响后续对话的生成逻辑。
- 不用于直接交互，但可能隐含对话的全局约束。
示例：

{
    "from": "system",
    "value": "You are a helpful assistant providing weather information."
}

tool

含义：工具或外部系统返回的消息。
场景：作为工具调用的响应，返回结果供 GPT 使用或直接返回给用户。
特性：
- 必须紧接包含的 gpt 消息。
- 表示工具调用结果，例如 API 返回的数据。
示例：

{
    "from": "tool",
    "value": "{\"name\": \"get_weather\", \"content\": {\"temperature\": 15, \"condition\": \"sunny\"}}"
}

角色关系与消息流动

对话初始化：
- 由 system 或 human 开始。
- 示例：

[
    {"from": "system", "value": "You are a helpful assistant."},
    {"from": "human", "value": "What's the weather today?"}
]

GPT 回应：
- gpt 消息直接响应 human 或调用工具。
- 示例：

{"from": "gpt", "value": "Let me check that for you. {\"name\": \"get_weather\", \"arguments\": {\"city\": \"New York\"}}"}

工具调用与响应：
- tool 消息提供工具调用的结果。
- 示例：

{"from": "tool", "value": "{\"name\": \"get_weather\", \"content\": {\"temperature\": 22, \"condition\": \"cloudy\"}}"}

GPT 解析工具响应：
- gpt 消息处理工具结果并返回给用户。
- 示例：

{"from": "gpt", "value": "The weather in New York is 22°C and cloudy."}

总结

human：人类用户输入，用于启动对话或请求信息。
gpt：AI 助手生成的消息，负责回复或发起工具调用。
system：系统消息，用于设定对话背景或规则。
tool：工具的响应消息，返回外部系统处理的结果。一般被包含在gpt中

模块核心组成与作用

基础类与模型
- BaseMessage（base.py** 中）：**
  - 这是一个核心基类，用于表示通用消息结构，定义了消息的基本属性（如角色、内容、元数据等）和方法（如消息的创建、格式转换）。
- ShareGPTMessage** 和 ShareGPTConversation（conversation_models.py 中）：**
  - ShareGPTMessage 表示单条消息，ShareGPTConversation 表示完整对话。这两者包含了严格的验证逻辑（如消息发送顺序）以保证对话的逻辑性。
功能性类
- FunctionCallFormatter（function_call_formatter.py** 中）：**
  - 一个抽象基类，定义了处理函数调用和响应的接口方法（如提取、格式化）。
- HermesFunctionFormatter（hermes_function_formatter.py** 中）：**
  - 实现了 FunctionCallFormatter 接口，为 Hermes 格式提供了函数调用和响应的解析与格式化功能。
- FunctionCallingMessage（func_message.py** 中）：**
  - 继承自 BaseMessage，专用于处理函数调用相关的消息，支持 OpenAI、ShareGPT 等多种格式的转换。
数据模型
- ToolCall** 和 ToolResponse（conversation_models.py 中）：**
  - 用于定义工具/函数调用与响应的结构。这些模型确保传递的参数和响应内容是 JSON 可序列化的。
- AlpacaItem（alpaca.py** 中）：**
  - 表示指令-响应数据格式，支持从结构化字符串解析为对象，主要用于特定任务或训练数据。

模块之间的关系与流程

BaseMessage** 是核心**
- 所有消息类型（如函数调用消息、ShareGPT 消息）都以 BaseMessage 为基础。
- 提供了多种格式的转换方法（如 from_sharegpt 和 to_openai_message），使消息在不同系统间无缝流转。
HermesFunctionFormatter** 的格式化功能**
- 提供专门的工具调用和响应的解析与格式化方法。
- 主要与 FunctionCallingMessage 配合使用，用于提取消息中的工具调用（extract_tool_calls）或工具响应（extract_tool_response）。
ShareGPT 与 Hermes 的集成
- FunctionCallFormatter 提供了统一的接口，而 HermesFunctionFormatter 作为其具体实现，支持 Hermes 格式的函数调用处理。
- ShareGPTMessage 和 ShareGPTConversation 借助这些工具，保证对话流转逻辑和数据的有效性。
AlpacaItem** 的独立性**
- AlpacaItem 主要服务于指令-响应任务，虽然与其余模块的耦合度较低，但验证逻辑与整体模块一致。
验证与格式化
- 模块通过多层验证（如 Pydantic 模型、正则表达式等）确保数据格式的完整性。
- 格式化工具支持不同格式的消息（如 OpenAI、ShareGPT），实现高可扩展性。

核心应用场景

工具调用与响应处理
- 用于处理对话中涉及的外部工具调用与响应。
- 由 HermesFunctionFormatter 提供解析与格式化支持。
多格式消息兼容
- 支持在 ShareGPT、OpenAI 等多种格式之间转换。
- 确保系统在不同平台上的一致性和兼容性。
对话流转逻辑的保障
- 通过 ShareGPTConversation 的验证功能，确保对话消息的顺序和逻辑性。

Memory模块

该模块用于Agent的存储、检索和管理信息。它使代理能够在对话中保持上下文，并从过去的交互中检索相关信息，从而增强了AI响应的一致性和相关性。

storage：负责存储数据
retrieve：根据关键字获取相似记录

下面是embedding向量化的核心方法：

    def encode(
        self,
        sentences: str | list[str],
        prompt_name: str | None = None,
        prompt: str | None = None,
        batch_size: int = 32,
        show_progress_bar: bool | None = None,
        output_value: Literal["sentence_embedding", "token_embeddings"] | None = "sentence_embedding",
        precision: Literal["float32", "int8", "uint8", "binary", "ubinary"] = "float32",
        convert_to_numpy: bool = True,
        convert_to_tensor: bool = False,
        device: str = None,
        normalize_embeddings: bool = False,
        **kwargs,
    ) -> list[Tensor] | np.ndarray | Tensor:
        """
        Computes sentence embeddings.

        Args:
            sentences (Union[str, List[str]]): The sentences to embed.
            prompt_name (Optional[str], optional): The name of the prompt to use for encoding. Must be a key in the `prompts` dictionary,
                which is either set in the constructor or loaded from the model configuration. For example if
                ``prompt_name`` is "query" and the ``prompts`` is {"query": "query: ", ...}, then the sentence "What
                is the capital of France?" will be encoded as "query: What is the capital of France?" because the sentence
                is appended to the prompt. If ``prompt`` is also set, this argument is ignored. Defaults to None.
            prompt (Optional[str], optional): The prompt to use for encoding. For example, if the prompt is "query: ", then the
                sentence "What is the capital of France?" will be encoded as "query: What is the capital of France?"
                because the sentence is appended to the prompt. If ``prompt`` is set, ``prompt_name`` is ignored. Defaults to None.
            batch_size (int, optional): The batch size used for the computation. Defaults to 32.
            show_progress_bar (bool, optional): Whether to output a progress bar when encode sentences. Defaults to None.
            output_value (Optional[Literal["sentence_embedding", "token_embeddings"]], optional): The type of embeddings to return:
                "sentence_embedding" to get sentence embeddings, "token_embeddings" to get wordpiece token embeddings, and `None`,
                to get all output values. Defaults to "sentence_embedding".
            precision (Literal["float32", "int8", "uint8", "binary", "ubinary"], optional): The precision to use for the embeddings.
                Can be "float32", "int8", "uint8", "binary", or "ubinary". All non-float32 precisions are quantized embeddings.
                Quantized embeddings are smaller in size and faster to compute, but may have a lower accuracy. They are useful for
                reducing the size of the embeddings of a corpus for semantic search, among other tasks. Defaults to "float32".
            convert_to_numpy (bool, optional): Whether the output should be a list of numpy vectors. If False, it is a list of PyTorch tensors.
                Defaults to True.
            convert_to_tensor (bool, optional): Whether the output should be one large tensor. Overwrites `convert_to_numpy`.
                Defaults to False.
            device (str, optional): Which :class:`torch.device` to use for the computation. Defaults to None.
            normalize_embeddings (bool, optional): Whether to normalize returned vectors to have length 1. In that case,
                the faster dot-product (util.dot_score) instead of cosine similarity can be used. Defaults to False.

        Returns:
            Union[List[Tensor], ndarray, Tensor]: By default, a 2d numpy array with shape [num_inputs, output_dimension] is returned.
            If only one string input is provided, then the output is a 1d array with shape [output_dimension]. If ``convert_to_tensor``,
            a torch Tensor is returned instead. If ``self.truncate_dim <= output_dimension`` then output_dimension is ``self.truncate_dim``.

        Example:
            ::

                from sentence_transformers import SentenceTransformer

                # Load a pre-trained SentenceTransformer model
                model = SentenceTransformer('all-mpnet-base-v2')

                # Encode some texts
                sentences = [
                    "The weather is lovely today.",
                    "It's so sunny outside!",
                    "He drove to the stadium.",
                ]
                embeddings = model.encode(sentences)
                print(embeddings.shape)
                # (3, 768)
        """
        if self.device.type == "hpu" and not self.is_hpu_graph_enabled:
            import habana_frameworks.torch as ht

            ht.hpu.wrap_in_hpu_graph(self, disable_tensor_cache=True)
            self.is_hpu_graph_enabled = True

        self.eval()
        if show_progress_bar is None:
            show_progress_bar = logger.getEffectiveLevel() in (logging.INFO, logging.DEBUG)

        if convert_to_tensor:
            convert_to_numpy = False

        if output_value != "sentence_embedding":
            convert_to_tensor = False
            convert_to_numpy = False

        input_was_string = False
        if isinstance(sentences, str) or not hasattr(
            sentences, "__len__"
        ):  # Cast an individual sentence to a list with length 1
            sentences = [sentences]
            input_was_string = True

        if prompt is None:
            if prompt_name is not None:
                try:
                    prompt = self.prompts[prompt_name]
                except KeyError:
                    raise ValueError(
                        f"Prompt name '{prompt_name}' not found in the configured prompts dictionary with keys {list(self.prompts.keys())!r}."
                    )
            elif self.default_prompt_name is not None:
                prompt = self.prompts.get(self.default_prompt_name, None)
        else:
            if prompt_name is not None:
                logger.warning(
                    "Encode with either a `prompt`, a `prompt_name`, or neither, but not both. "
                    "Ignoring the `prompt_name` in favor of `prompt`."
                )

        extra_features = {}
        if prompt is not None:
            sentences = [prompt + sentence for sentence in sentences]

            # Some models (e.g. INSTRUCTOR, GRIT) require removing the prompt before pooling
            # Tracking the prompt length allow us to remove the prompt during pooling
            tokenized_prompt = self.tokenize([prompt])
            if "input_ids" in tokenized_prompt:
                extra_features["prompt_length"] = tokenized_prompt["input_ids"].shape[-1] - 1

        if device is None:
            device = self.device

        self.to(device)

        all_embeddings = []
        length_sorted_idx = np.argsort([-self._text_length(sen) for sen in sentences])
        sentences_sorted = [sentences[idx] for idx in length_sorted_idx]

        for start_index in trange(0, len(sentences), batch_size, desc="Batches", disable=not show_progress_bar):
            sentences_batch = sentences_sorted[start_index : start_index + batch_size]
            features = self.tokenize(sentences_batch)
            if self.device.type == "hpu":
                if "input_ids" in features:
                    curr_tokenize_len = features["input_ids"].shape
                    additional_pad_len = 2 ** math.ceil(math.log2(curr_tokenize_len[1])) - curr_tokenize_len[1]
                    features["input_ids"] = torch.cat(
                        (
                            features["input_ids"],
                            torch.ones((curr_tokenize_len[0], additional_pad_len), dtype=torch.int8),
                        ),
                        -1,
                    )
                    features["attention_mask"] = torch.cat(
                        (
                            features["attention_mask"],
                            torch.zeros((curr_tokenize_len[0], additional_pad_len), dtype=torch.int8),
                        ),
                        -1,
                    )
                    if "token_type_ids" in features:
                        features["token_type_ids"] = torch.cat(
                            (
                                features["token_type_ids"],
                                torch.zeros((curr_tokenize_len[0], additional_pad_len), dtype=torch.int8),
                            ),
                            -1,
                        )

            features = batch_to_device(features, device)
            features.update(extra_features)

            with torch.no_grad():
                out_features = self.forward(features, **kwargs)
                if self.device.type == "hpu":
                    out_features = copy.deepcopy(out_features)

                out_features["sentence_embedding"] = truncate_embeddings(
                    out_features["sentence_embedding"], self.truncate_dim
                )

                if output_value == "token_embeddings":
                    embeddings = []
                    for token_emb, attention in zip(out_features[output_value], out_features["attention_mask"]):
                        last_mask_id = len(attention) - 1
                        while last_mask_id > 0 and attention[last_mask_id].item() == 0:
                            last_mask_id -= 1

                        embeddings.append(token_emb[0 : last_mask_id + 1])
                elif output_value is None:  # Return all outputs
                    embeddings = []
                    for sent_idx in range(len(out_features["sentence_embedding"])):
                        row = {name: out_features[name][sent_idx] for name in out_features}
                        embeddings.append(row)
                else:  # Sentence embeddings
                    embeddings = out_features[output_value]
                    embeddings = embeddings.detach()
                    if normalize_embeddings:
                        embeddings = torch.nn.functional.normalize(embeddings, p=2, dim=1)

                    # fixes for #522 and #487 to avoid oom problems on gpu with large datasets
                    if convert_to_numpy:
                        embeddings = embeddings.cpu()

                all_embeddings.extend(embeddings)

        all_embeddings = [all_embeddings[idx] for idx in np.argsort(length_sorted_idx)]

        if precision and precision != "float32":
            all_embeddings = quantize_embeddings(all_embeddings, precision=precision)

        if convert_to_tensor:
            if len(all_embeddings):
                if isinstance(all_embeddings, np.ndarray):
                    all_embeddings = torch.from_numpy(all_embeddings)
                else:
                    all_embeddings = torch.stack(all_embeddings)
            else:
                all_embeddings = torch.Tensor()
        elif convert_to_numpy:
            if not isinstance(all_embeddings, np.ndarray):
                if all_embeddings and all_embeddings[0].dtype == torch.bfloat16:
                    all_embeddings = np.asarray([emb.float().numpy() for emb in all_embeddings])
                else:
                    all_embeddings = np.asarray([emb.numpy() for emb in all_embeddings])
        elif isinstance(all_embeddings, np.ndarray):
            all_embeddings = [torch.from_numpy(embedding) for embedding in all_embeddings]

        if input_was_string:
            all_embeddings = all_embeddings[0]

        return all_embeddings

Tools模块

可以用来自定义函数，并且传入camel将函数识别为camel的内置函数工具

支持定义自己的工具
可以利用工具包
也可以将工具传递给chatAgent

camel的内置工具包

工具箱	描述
Arxiv工具包	一个用于与 arXiv API 交互以搜索和下载学术论文的工具包。
AskNewsToolkit	一个工具包，用于使用 AskNews API 根据用户查询获取新闻、故事和其他内容。
CodeExecutionToolkit	一个用于代码执行的工具包，可以在各种沙箱中运行代码，包括内部 Python、Jupyter、Docker、子进程或 e2b。
DalleToolkit 工具包	使用 OpenAI 的 DALL-E 模型生成图像的工具包。
DappierToolkit	一个工具包，用于使用 Dappier API 在新闻、财经、股票市场、体育、天气等关键垂直领域搜索实时数据和获取 AI 推荐。
DataCommonsToolkit 工具包	用于从 Data Commons 知识图谱中查询和检索数据的工具包，包括 SPARQL 查询、统计时间序列数据和属性分析。
功能工具	一个基本工具包，用于创建 OpenAI 聊天模型可以调用的基于函数的工具，并支持架构解析和合成。
GitHub工具包	用于与 GitHub 存储库交互的工具包，包括检索问题和创建拉取请求。
GoogleMaps工具包	用于访问 Google Maps 服务的工具包，包括地址验证、海拔数据和时区信息。
GoogleScholar工具包	用于从 Google 学术搜索中检索作者及其出版物相关信息的工具包。
人类工具包	一个用于在 AI 系统中促进人机交互和反馈的工具包。
LinkedInToolkit 工具包	用于 LinkedIn 操作的工具包，包括创建帖子、删除帖子和检索用户个人资料信息。
MathToolkit	用于执行基本数学运算（如加法、减法和乘法）的工具包。
Meshy工具包	用于处理 3D 网格数据和操作的工具包。
概念工具包	一个工具包，用于使用 Notion API 从 Notion 页面和工作区中检索信息。
OpenAPIToolkit	用于处理 OpenAPI 规范和 REST API 的工具包。
OpenBBToolkit	用于通过 OpenBB 平台访问和分析金融市场数据的工具包，包括股票、ETF、加密货币和经济指标。
Reddit工具包	用于 Reddit 操作的工具包，包括收集热门帖子、对评论执行情绪分析以及跟踪关键字讨论。
RetrievalToolkit 工具包	一个工具包，用于根据指定的查询从本地向量存储系统中检索信息。
搜索工具包	一个用于使用各种搜索引擎（如 Google、DuckDuckGo、Wikipedia 和 Wolfram Alpha）执行 Web 搜索的工具包。
Slack工具包	用于 Slack 操作的工具包，包括创建频道、加入频道和管理频道成员资格。
StripeToolkit	通过 Stripe 处理付款和管理金融交易的工具包。
推特工具包	用于 Twitter 操作的工具包，包括创建推文、删除推文和检索用户个人资料信息。
视频工具包	一个用于下载视频并选择性地将其拆分为块的工具包，支持各种视频服务。
WeatherToolkit	一个使用 OpenWeatherMap API 获取城市天气数据的工具包。
WhatsApp工具包	用于与 WhatsApp Business API 交互的工具包，包括发送消息、管理消息模板和访问企业简介信息。

Prompt模块

使用prompt模版可以创建AI专家，聚合这些专家来创建特定的任务代理

from camel.agents import TaskSpecifyAgent
from camel.configs import ChatGPTConfig
from camel.models import ModelFactory
from camel.types import ModelPlatformType, ModelType, TaskType

model = ModelFactory.create(
    model_platform=ModelPlatformType.OPENAI,
    model_type=ModelType.GPT_4O_MINI,
)
task_specify_agent = TaskSpecifyAgent(
    model=model, task_type=TaskType.AI_SOCIETY
)
specified_task_prompt = task_specify_agent.run(
    task_prompt="Improving stage presence and performance skills",
    meta_dict=dict(
        assistant_role="Musician", user_role="Student", word_limit=100
    ),
)

print(f"Specified task prompt:\n{specified_task_prompt}\n")

创建任务时设置指定代理task_type=TaskType.AI_SOCIETY，它会自动唤起带有模板的提示：AISocietyPromptTemplateDict.TASK_SPECIFY_PROMPT，可以设置希望助手扮演的角色。输出将如下所示：

>> Response:
Musician will help Student enhance stage presence by practicing engaging eye contact, dynamic movement, and expressive gestures during a mock concert, followed by a review session with video playback to identify strengths and areas for improvement.

也可以自己传入模版

from camel.agents import TaskSpecifyAgent
from camel.configs import ChatGPTConfig
from camel.models import ModelFactory
from camel.prompts import TextPrompt
from camel.types import ModelPlatformType, ModelType

model = ModelFactory.create(
    model_platform=ModelPlatformType.OPENAI,
    model_type=ModelType.GPT_4O_MINI,
)

my_prompt_template = TextPrompt(
    'Here is a task: I\'m a {occupation} and I want to {task}. Help me to make this task more specific.'
)  # Write anything you would like to use as prompt template
task_specify_agent = TaskSpecifyAgent(
    model=model, task_specify_prompt=my_prompt_template
)
response = task_specify_agent.run(
    task_prompt="get promotion",
    meta_dict=dict(occupation="Software Engineer"),
)
print(response)

Task模块

定义任务

from camel.tasks import Task

task = Task(
    content="Weng earns $12 an hour for babysitting. Yesterday, she just did 51 minutes of babysitting. How much did she earn?",
    id="0",
)

多任务定义的结构

# Creating the root task
root_task = Task(content="Prepare a meal", id="0")

# Creating subtasks for the root task
sub_task_1 = Task(content="Shop for ingredients", id="1")
sub_task_2 = Task(content="Cook the meal", id="2")
sub_task_3 = Task(content="Set the table", id="3")

# Creating subtasks under "Cook the meal"
sub_task_2_1 = Task(content="Chop vegetables", id="2.1")
sub_task_2_2 = Task(content="Cook rice", id="2.2")

# Adding subtasks to their respective parent tasks
root_task.add_subtask(sub_task_1)
root_task.add_subtask(sub_task_2)
root_task.add_subtask(sub_task_3)

sub_task_2.add_subtask(sub_task_2_1)
sub_task_2.add_subtask(sub_task_2_2)

# Printing the hierarchical task structure
print(root_task.to_string())

>>>
Task 0: Prepare a meal
Task 1: Shop for ingredients
Task 2: Cook the meal
Task 2.1: Chop vegetables
Task 2.2: Cook rice
Task 3: Set the table

分解或编写任务涉及定义其负责的Agent、提示模板和代理响应解析器

from camel.agents import ChatAgent
from camel.tasks import Task
from camel.tasks.task_prompt import (
TASK_COMPOSE_PROMPT,
TASK_DECOMPOSE_PROMPT,
)
from camel.messages import BaseMessage

sys_msg = BaseMessage.make_assistant_message(
    role_name="Assistant", content="You're a helpful assistant"
)
# Set up an agent
agent = ChatAgent(system_message=sys_msg)

task = Task(
    content="Weng earns $12 an hour for babysitting. Yesterday, she just did 51 minutes of babysitting. How much did she earn?",
    id="0",
)


new_tasks = task.decompose(agent=agent, template=TASK_DECOMPOSE_PROMPT)
for t in new_tasks:
    print(t.to_string())

>>>
Task 0.0: Convert 51 minutes into hours.

Task 0.1: Calculate Weng's earnings for the converted hours at the rate of $12 per hour.

Task 0.2: Provide the final earnings amount based on the calculation.

# compose task result by the sub-tasks.
task.compose(agent=agent, template=TASK_COMPOSE_PROMPT)
print(task.result)

任务管理器

from camel.tasks import (
Task,
TaskManager,
)

sys_msg = "You're a helpful assistant"

# Set up an agent
agent = ChatAgent(system_message=sys_msg)


task = Task(
    content="Weng earns $12 an hour for babysitting. Yesterday, she just did 51 minutes of babysitting. How much did she earn?",
    id="0",
)
print(task.to_string())

>>>Task 0: Weng earns $12 an hour for babysitting. Yesterday, she just did 51 minutes of babysitting. How much did she earn?

task_manager = TaskManager(task)
evolved_task = task_manager.evolve(task, agent=agent)
print(evolved_task.to_string())

>>>Task 0.0: Weng earns $12 an hour for babysitting. Yesterday, she babysat for 1 hour and 45 minutes. If she also received a $5 bonus for exceptional service, how much did she earn in total for that day?

Loader模块

CAMEL 引入了两个 IO 模块Base IO和Unstructured IO，它们专为处理各种文件类型和非结构化数据处理而设计。此外，还添加了四个新的数据读取器，即Apify Reader，Chunkr Reader，Firecrawl Reader和Jina_url Reader，它们支持检索外部数据以改进数据集成和分析。

Storage模块

Storage 模块是一个全面的框架，旨在处理各种类型的数据存储机制。它由抽象基类和具体实现组成，同时满足键值存储和向量存储系统的需求。

Society模块

社会模块是 Camel 的核心模块之一。通过模拟信息交换过程，该模块研究代理之间的社会行为。

目前，社会模块旨在使代理能够自主协作完成任务，同时与人类意图保持一致，并且需要最少的人工干预。它包括两个框架：RolePlaying和BabyAGI ，用于运行代理的交互行为以实现目标。

用RolePlaying举例，该框架是以遵循指令的方式设计的。这些角色分别独立承担执行和规划任务的职责。对话通过轮流机制不断推进，从而协作完成任务。主要概念包括：

任务：任务可以像想法一样简单，由启动提示初始化。
AI User：需要提供说明的代理。
AI 助手：预期使用满足指令的解决方案进行响应的代理。

RolePlaying是 CAMEL 独有的合作代理框架。通过这个框架，可以实现例如角色翻转、助手重复指令、片状回复、消息无限循环和对话终止条件。

在 CAMEL 中使用RolePlaying框架时，预定义的提示用于为不同的Agent创建唯一的初始设置。例如，如果用户想要初始化一个助理 Agent，则会使用以下提示初始化 Agent。

永远不要忘记你是，我是。

这会将所选角色分配给助理代理，并为其提供有关用户角色的信息。

永远不要互换角色！永远不要指示我！

这可以防止代理翻转角色。在某些情况下，我们观察到 Assistant 和用户切换角色，其中 Assistant 突然接管控制权并指示用户，而用户则遵循这些指示。

如果您因身体、道德、法律原因或您的能力而无法执行我的指示，您必须诚实地拒绝我的指示，并解释原因。

这禁止代理制作有害、虚假、非法和误导性信息。

除非我说任务已完成，否则您应该始终从以下位置开始：解决方案：。应该是具体的，并为任务解决提供更可取的实现和示例。

这鼓励助理始终以一致的格式进行回应，避免与对话结构有任何偏差，并防止模糊或不完整的回应，我们称之为片状回应，例如“我会做某事”。

始终以以下方式结束您的解决方案：Next request。

这可确保助手通过请求新的指令来解决来保持对话的进行。

`RolePlaying`属性

属性	类型	描述
assistant_role_name	str	助理所扮演的角色的名称。
user_role_name	str	用户所扮演的角色的名称。
critic_role_name	str	评论家所扮演的角色的名称。
task_prompt	str	要执行的任务的提示。
with_task_specify	布尔	是否使用任务指定 agent。
with_task_planner	布尔	是否使用 Task Planner 代理。
with_critic_in_the_loop	布尔	是否在循环中包含评论家。
critic_criteria	str	Critic agent 的 critic 标准。
型	BaseModel后端	用于生成响应的模型后端。
task_type	TaskType	要执行的任务类型。
assistant_agent_kwargs	字典	要传递给助理代理的其他参数。
user_agent_kwargs	字典	要传递给用户代理的其他参数。
task_specify_agent_kwargs	字典	要传递给任务的其他参数指定 agent。
task_planner_agent_kwargs	字典	要传递给 Task Planner 代理的其他参数。
critic_kwargs	字典	要传递给批评家的其他论点。
sys_msg_generator_kwargs	字典	要传递给系统消息生成器的其他参数。
extend_sys_msg_meta_dicts	列表[Dict]	用于扩展系统消息元 dicts 的 dict 列表。
extend_task_specify_meta_dict	字典	用于扩展任务的 dict specify meta dict with。
output_language	str	代理程序要输出的语言。

使用`RolePlaying`

from colorama import Fore

from camel.societies import RolePlaying
from camel.utils import print_text_animated

# 主函数
def main(model=None, chat_turn_limit=50) -> None:
    # 初始化任务提示，描述要开发一个股票市场的交易机器人
    task_prompt = "Develop a trading bot for the stock market"
    
    # 创建一个角色扮演会话，模拟用户与 AI 之间的互动
    role_play_session = RolePlaying(
        assistant_role_name="Python Programmer",  # AI助手角色为Python程序员
        assistant_agent_kwargs=dict(model=model),  # 使用传入的模型作为助手代理
        user_role_name="Stock Trader",  # 用户角色为股票交易员
        user_agent_kwargs=dict(model=model),  # 使用传入的模型作为用户代理
        task_prompt=task_prompt,  # 任务提示
        with_task_specify=True,  # 启用任务说明
        task_specify_agent_kwargs=dict(model=model),  # 任务指定代理的模型参数
    )

    # 输出 AI 助手的系统消息
    print(
        Fore.GREEN
        + f"AI Assistant sys message:\n{role_play_session.assistant_sys_msg}\n"
    )
    
    # 输出 AI 用户的系统消息
    print(
        Fore.BLUE + f"AI User sys message:\n{role_play_session.user_sys_msg}\n"
    )

    # 输出原始的任务提示（黄色）
    print(Fore.YELLOW + f"Original task prompt:\n{task_prompt}\n")
    
    # 输出经过任务指定代理处理后的任务提示（青色）
    print(
        Fore.CYAN
        + "Specified task prompt:"
        + f"\n{role_play_session.specified_task_prompt}\n"
    )
    
    # 输出最终的任务提示（红色）
    print(Fore.RED + f"Final task prompt:\n{role_play_session.task_prompt}\n")

    # 初始化对话
    n = 0
    input_msg = role_play_session.init_chat()

    # 开始对话，直到达到回合限制或检测到终止条件
    while n < chat_turn_limit:
        n += 1
        
        # 进行一步对话，获取助手和用户的回应
        assistant_response, user_response = role_play_session.step(input_msg)

        # 检测到AI助手终止对话时，输出终止原因并结束
        if assistant_response.terminated:
            print(
                Fore.GREEN
                + (
                    "AI Assistant terminated. Reason: "
                    f"{assistant_response.info['termination_reasons']}."
                )
            )
            break
        
        # 检测到用户终止对话时，输出终止原因并结束
        if user_response.terminated:
            print(
                Fore.GREEN
                + (
                    "AI User terminated. "
                    f"Reason: {user_response.info['termination_reasons']}."
                )
            )
            break

        # 动画化输出用户的响应
        print_text_animated(
            Fore.BLUE + f"AI User:\n\n{user_response.msg.content}\n"
        )
        
        # 动画化输出助手的响应
        print_text_animated(
            Fore.GREEN + "AI Assistant:\n\n"
            f"{assistant_response.msg.content}\n"
        )

        # 如果用户响应中包含"CAMEL_TASK_DONE"，说明任务完成，跳出循环
        if "CAMEL_TASK_DONE" in user_response.msg.content:
            break

        # 更新输入消息为助手的响应，进行下一回合对话
        input_msg = assistant_response.msg

# 程序入口，运行主函数
if __name__ == "__main__":
    main()

Embedding模块

为不同类型的数据（文本、图像、视频）创建embedding来将这些输入转换为机器可以理解和有效处理的数字形式。每种类型的embedding都侧重于捕获其各自数据类型的基本特征。

数据类型

文本嵌入

文本嵌入将文本数据转换为数字向量。每个向量都代表文本的语义含义，使我们能够根据文本的含义而不仅仅是原始形式来处理和比较文本。OpenAI Embedding 等技术使用大规模语言模型来理解语言中的上下文和细微差别。另一方面，SentenceTransformerEncoder 是专门为创建句子嵌入而设计的，通常使用类似 BERT 的模型。

请看两句话：

“一个小男孩在公园里踢足球。”
“一个孩子在操场上踢足球。”

文本嵌入模型会将这些句子转换为两个高维向量（例如， text-embedding-3-small为1536 维）。尽管措辞不同，但向量将是相似的，捕捉了孩子在户外玩球类游戏的共同概念。这种转换为向量使机器能够理解和比较上下文之间的语义相似性。

图像嵌入

图像嵌入将图像转换为数字向量，从而捕获形状、颜色、纹理和空间层次结构等基本特征。这种转换通常由卷积神经网络（CNN）或其他专为图像处理而设计的高级神经网络架构执行。生成的嵌入可用于图像分类、相似性比较和检索等任务。

假设我们有一个猫的图像。图像嵌入模型将分析视觉内容（例如，耳朵的形状、毛皮的图案）并将其转换为矢量。此向量封装了图像的本质，使模型能够将其识别为猫并将其与其他图像区分开来。

Embedding类型

使用`OpenAIEmbedding`

利用 OpenAI 的模型生成文本嵌入。需要 OpenAI API 密钥。

from camel.embeddings import OpenAIEmbedding
from camel.types import EmbeddingModelType

# Initialize the OpenAI embedding with a specific model
openai_embedding = OpenAIEmbedding(model_type=EmbeddingModelType.TEXT_EMBEDDING_3_SMALL)

# Generate embeddings for a list of texts
embeddings = openai_embedding.embed_list(["Hello, world!", "Another example"])

使用`MistralEmbedding`

利用 Mistral 的模型生成文本嵌入。需要 Mistral API 密钥。

from camel.embeddings import MistralEmbedding
from camel.types import EmbeddingModelType

# Initialize the OpenAI embedding with a specific model
mistral_embedding = MistralEmbedding(model_type=EmbeddingModelType.MISTRAL_EMBED)

# Generate embeddings for a list of texts
embeddings = mistral_embedding.embed_list(["Hello, world!", "Another example"])

使用`SentenceTransformerEncoder`

利用 Sentence Transformers 库中的开源模型生成文本嵌入。

from camel.embeddings import SentenceTransformerEncoder

# Initialize the Sentence Transformer Encoder with a specific model
sentence_encoder = SentenceTransformerEncoder(model_name='intfloat/e5-large-v2')

# Generate embeddings for a list of texts
embeddings = sentence_encoder.embed_list(["Hello, world!", "Another example"])

使用`VisionLanguageEmbedding`

利用 OpenAI 的模型生成图像嵌入。需要 OpenAI API 密钥。

from camel.embeddings import VisionLanguageEmbedding

vlm_embedding = VisionLanguageEmbedding()

url = "http://images.cocodataset.org/val2017/000000039769.jpg"
image = Image.open(requests.get(url, stream=True).raw)
test_images = [image, image]

embeddings = vlm_embedding.embed_list(test_images)

Retrievers模块

Retrievers 模块本质上是一个搜索引擎。旨在帮助通过搜索大量文本来查找特定信息。比如有一个巨大的图书馆，想找到提到某些主题或关键词的地方，这个模块就像一个图书管理员，可以帮助做到这一点。

检索器类型

向量检索器

Vector Retriever 通常是指用于信息检索和机器学习的方法或系统，它利用数据的向量表示。这种方法基于将数据（如文本、图像或其他形式的信息）转换为高维空间中的数值向量。

以下是其工作原理的简要概述：

Embedding Model：首先，它使用 embedding 模型。此模型将文本转换为数学形式（向量）。
存储信息：该模块获取大型文档，将它们分解成更小的块，然后使用嵌入模型将这些块转换为向量。这些向量存储在向量存储中。
检索信息：当我们提出问题或进行查询时，嵌入模型将我们的问题转换为向量，然后在此向量存储中搜索最匹配的向量。最接近的匹配项可能是我们正在寻找的最相关的信息。

关键字检索器

Keyword Retriever 旨在根据关键字匹配检索相关信息。与使用数据的矢量表示的 Vector Retriever 不同，Keyword Retriever 通过识别文档和查询中的关键字或特定术语来查找匹配项。

以下是其工作原理的简要概述：

文档预处理：在使用检索器之前，会对文档进行预处理，以对其中的关键字进行标记和索引。分词化是将文本拆分为单个单词或短语的过程，从而更容易识别关键字。
查询解析：当我们输入问题或查询时，检索器会解析查询以提取相关关键字。这涉及将查询分解为其组成术语。
关键字匹配：确定查询中的关键字后，检索器会在预处理的文档中搜索这些关键字的出现次数。它会检查文档中关键字的完全匹配项。
排名和检索：找到包含查询关键字的文档后，检索器会根据各种因素对这些文档进行排名，例如关键字匹配的频率、文档相关性或其他评分方法。然后，排名靠前的文档将作为最相关的结果进行检索。

快速入门

使用 Vector Retriever

初始化 VectorRetrieve：首先，我们需要使用可选的嵌入模型VectorRetriever进行初始化。如果我们不提供嵌入模型，它将使用默认的OpenAIEmbedding ：

from camel.embeddings import OpenAIEmbedding
from camel.retrievers import VectorRetriever

# Initialize the VectorRetriever with an embedding model
vr = VectorRetriever(embedding_model=OpenAIEmbedding())

嵌入和存储数据：在我们检索信息之前，我们需要准备数据并将其存储在 vector storage 中。该方法为我们解决了这个问题。它处理来自文件或 URL 的内容，将其划分为块，并将其嵌入存储在指定的矢量存储中。

# Provide the path to our content input (can be a file or URL)
content_input_path = "https://www.camel-ai.org/"

# Create or initialize a vector storage (e.g., QdrantStorage)
from camel.storages.vectordb_storages import QdrantStorage

vector_storage = QdrantStorage(
    vector_dim=OpenAIEmbedding().get_output_dim(),
    collection_name="my first collection",
    path="storage_customized_run",
)

# Embed and store chunks of data in the vector storage
vr.process(content_input_path, vector_storage)

执行查询：现在我们的数据已存储，我们可以执行查询以根据搜索字符串检索信息。该方法执行查询并将检索到的结果编译为字符串。query

# Specify our query string
query = "What is CAMEL"

# Execute the query and retrieve results
results = vr.query(query, vector_storage)
print(results)

>>>  [{'similarity score': '0.812884257383057', 'content path': 'https://www.camel-ai.org/', 'metadata': {'filetype': 'text/html', 'languages': ['eng'], 'page_number': 1, 'url': 'https://www.camel-ai.org/', 'link_urls': ['/home', '/home', '/research/agent-trust', '/agent', '/data_explorer', '/chat', 'https://www.google.com/url?q=https%3A%2F%2Fcamel-ai.github.io%2Fcamel&sa=D&sntz=1&usg=AOvVaw1ifGIva9n-a-0KpTrIG8Cv', 'https://www.google.com/url?q=https%3A%2F%2Fgithub.com%2Fcamel-ai%2Fcamel&sa=D&sntz=1&usg=AOvVaw03Z2OD0-plx_zugZZgBb8w', '/team', '/sponsors', '/home', '/home', '/research/agent-trust', '/agent', '/data_explorer', '/chat', 'https://www.google.com/url?q=https%3A%2F%2Fcamel-ai.github.io%2Fcamel&sa=D&sntz=1&usg=AOvVaw1ifGIva9n-a-0KpTrIG8Cv', 'https://www.google.com/url?q=https%3A%2F%2Fgithub.com%2Fcamel-ai%2Fcamel&sa=D&sntz=1&usg=AOvVaw03Z2OD0-plx_zugZZgBb8w', '/team', '/sponsors', '/home', '/research/agent-trust', '/agent', '/data_explorer', '/chat', 'https://www.google.com/url?q=https%3A%2F%2Fcamel-ai.github.io%2Fcamel&sa=D&sntz=1&usg=AOvVaw1ifGIva9n-a-0KpTrIG8Cv', 'https://www.google.com/url?q=https%3A%2F%2Fgithub.com%2Fcamel-ai%2Fcamel&sa=D&sntz=1&usg=AOvVaw03Z2OD0-plx_zugZZgBb8w', '/team', '/sponsors', 'https://github.com/camel-ai/camel'], 'link_texts': [None, 'Home', 'AgentTrust', 'Agent App', 'Data Explorer App', 'ChatBot', 'Docs', 'Github Repo', 'Team', 'Sponsors', None, 'Home', 'AgentTrust', 'Agent App', 'Data Explorer App', 'ChatBot', 'Docs', 'Github Repo', 'Team', 'Sponsors', 'Home', 'AgentTrust', 'Agent App', 'Data Explorer App', 'ChatBot', 'Docs', 'Github Repo', 'Team', 'Sponsors', None], 'emphasized_text_contents': ['Skip to main content', 'Skip to navigation', 'CAMEL-AI', 'CAMEL-AI', 'CAMEL:\xa0 Communicative Agents for "Mind" Exploration of Large Language Model Society', 'https://github.com/camel-ai/camel'], 'emphasized_text_tags': ['span', 'span', 'span', 'span', 'span', 'span']}, 'text': 'Search this site\n\nSkip to main content\n\nSkip to navigation\n\nCAMEL-AI\n\nHome\n\nResearchAgentTrust\n\nAgent App\n\nData Explorer App\n\nChatBot\n\nDocs\n\nGithub Repo\n\nTeam\n\nSponsors\n\nCAMEL-AI\n\nHome\n\nResearchAgentTrust\n\nAgent App\n\nData Explorer App\n\nChatBot\n\nDocs\n\nGithub Repo\n\nTeam\n\nSponsors\n\nMoreHomeResearchAgentTrustAgent AppData Explorer AppChatBotDocsGithub RepoTeamSponsors\n\nCAMEL:\xa0 Communicative Agents for "Mind" Exploration of Large Language Model Society\n\nhttps://github.com/camel-ai/camel'}]

使用 Auto Retriever

为了进一步简化检索过程，我们可以使用AutoRetriever方法。此方法处理嵌入和存储数据以及执行查询。在处理多个内容输入路径时特别有用。

from camel.retrievers import AutoRetriever
from camel.types import StorageType

# Set the vector storage local path and the storage type
ar = AutoRetriever(vector_storage_local_path="camel/retrievers",storage_type=StorageType.QDRANT)

# Run the auto vector retriever
retrieved_info = ar.run_vector_retriever(
    contents=[
        "https://www.camel-ai.org/",  # Example remote url
    ],
    query="What is CAMEL-AI",
    return_detailed_info=True, # Set this as true is we want to get detailed info including metadata
)

print(retrieved_info)

>>>  Original Query:
    >>>  {What is CAMEL-AI}
>>>  Retrieved Context:
    >>>  {'similarity score': '0.8380731206379989', 'content path': 'https://www.camel-ai.org/', 'metadata': {'empha

Workorce模块

Workforce 是一个系统，multiple agents协同工作以解决任务。通过使用 Workforce，用户可以快速设置multi-agent task solving system。

System Design

Architecture

Workforce 遵循分层架构。workforce可以包括多个 Worker 节点，并且每个 Worker 节点都将包含一个或多个Agent作为工作程序。Worker 节点由员工内部的coordinator Agent，coordinator Agent将分配 tasks以及他们的工具集给 worker 节点。

除了 coordinator 代理之外，还有一个 task planner Agent。任务规划器代理将负责分解以及编写任务，以便workforce可以逐步解决任务。

Communication Mechanism

员工内部的通信基于任务通道。这 Workforce 的初始化将创建一个通道，该通道将由所有节点。任务稍后将发布到此频道中，每个 worker 节点将监听通道，接受分配的任务到它从这个通道解决。

当任务解决时，worker 节点会将结果发布回 channel，结果将作为其他任务，这些任务将由所有 Worker 节点共享。

借助此机制，员工可以在协作和高效的方式。

Failure Handling

在workforce中，我们有一个处理失败的机制。当任务失败时，协调代理将采取措施来修复它。操作可以是将任务分解为较小的任务并再次分配它们，或者创建一个能够执行该任务的 new worker。

目前，协调器将根据任务已分解。如果任务已经分解了更多超过一定次数，协调器将接收新的 worker 创建操作;如果没有，协调器将简单地进行分解行动。

在某些情况下，任务根本无法通过代理。在这种情况下，为了防止workforce陷入困境在无限代理创建循环中，如果执行一项任务已失败一定次数（默认为 3 次）。

A Simple Example of the Workflow

下面是一个通过简单示例说明工作流的图表。

开始使用

本节展示如何创建 Workforce 实例，添加worker节点到workforce中，最后，如何启动workforce解决任务。

创建 Workforce 实例

要开始使用 Workforce，需要首先创建一个 Workforce 实例，然后将 worker 节点添加到 Workforce。以下是示例：

from camel.societies.workforce import Workforce

# Create a workforce instance
workforce = Workforce("A Simple Workforce")

现在，我们获得一个描述为 “A Simple Workforce” 的workforce实例。但是，workforce中还没有worker节点。

注意：如何进一步自定义Workforce

您可以使用默认配置快速创建Workforce实例，只需提供workforce的描述。但是，也可以使用更多详细信息配置人力，例如提供 Worker 节点，而不是逐个添加，或者配置通过传递配置来获取 Coordinator Agent 和 Task Planner Agent 添加到 Workforce 实例。

添加 Worker 节点

创建 workforce 实例后，您可以将 worker 节点添加到 workforce。要添加 worker 节点，您需要先创建 worker agent 他们实际上可以完成工作。

假设我们已经创建了一个可以进行 Web 搜索的ChatAgent叫search_agent。现在，我们可以将此 worker agent 添加到人力中。

# Add the worker agent to the workforce
workforce.add_single_agent_worker(
    "An agent that can do web searches",
    worker=search_agent,
)

adding 函数遵循 Fluent 接口设计模式，因此您可以在一行中将多个工作人员代理添加到人力中，如下所示：

workforce.add_single_agent_worker(
    "An agent that can do web searches",
    worker=search_agent,
).add_single_agent_worker(
    "Another agent",
    worker=another_agent,
).add_single_agent_worker(
    "Yet another agent",
    worker=yet_another_agent,
)

现在，我们的员工中有一些worker agents。需要创建一个任务并让worker来解决它。

注意：描述并非不重要

将代理（Agent）作为 worker 节点添加到workforce时，第一个参数是 Worker 节点的描述。虽然这看起来很没有必要，但其实非常重要。该描述将由 coordinator 使用 agent 作为将任务分配给worker节点的基础。因此，建议提供 worker 节点的清晰简洁的描述。

启动 Workforce

将 worker 节点添加到workforce后，启动 workforce以解决任务。首先，我们可以定义一个任务：

from camel.tasks import Task

# the id of the task can be any string to mark the task
task = Task(
    content="Make a travel plan for a 3-day trip to Paris.",
    id="0",
)

然后，我们可以启动具有任务的workforce：

task = workforce.process_task(task)

任务的最终结果将存储在 task 对象。您可以通过以下方式检查结果：

print(task.result)

你可能感兴趣的:(人工智能,深度学习,pycharm,python,ipython,pip,conda)

关于Python3绕过指纹识别解决ja3指纹的案例水兵没月 python
注意！！！！某XX网站实例仅作为学习案例，禁止其他个人以及团体做谋利用途！！！场景Python采集某网址页面内容aHR0cHM6Ly9jcmVkaXRiai5qeGouYmVpamluZy5nb3YuY24vY3JlZGl0LXBvcnRhbC9jcmVkaXRfc2VydmljZS9wdWJsaWNpdHkvcmVjb3JkL2JsYWNr报错信息requests.exceptions.SSLE
网页返回title“Just a moment...“，python 绕过tls指纹的几种方式记录一下
第一种：使用tls_client第三方库进行绕过importtls_clientsession=tls_client.Session(ja3_string="771,4865-4866-4867-49195-49199-49196-49200-52393-52392-49171-49172-156-157-47-53,0-23-65281-10-11-35-16-5-13-18-51-45-43-
python如何抓取网页里面的文字_如何利用python抓取网页文字、图片内容？ weixin_39917437
想必新老python学习者，对爬虫这一概念并不陌生，在如今大数据时代，很多场景都需要利用爬虫去爬取数据，而这刚好时python领域，如何实现？怎么做？一起来看下吧~获取图片：1、当我们浏览这个网站时，会发现，每一个页面的URL都是以网站的域名+page+页数组成，这样我们就可以逐一的访问该网站的网页了。2、当我们看图片列表时中，把鼠标放到图片，右击检查，我们发现，图片的内容由ul包裹的li组成，箭
人工智能学习指南：从菜鸟到大神的进击之路橡晟人工智能深度学习计算机视觉算法学习 python
人工智能学习指南：从菜鸟到大神的进击之路前言：别慌，AI没那么可怕嘿！想学人工智能？恭喜你，你已经比90%的人更有眼光了！很多人一听到"人工智能"就开始头疼，仿佛这是什么高深莫测的巫术。其实不然，AI就像学做饭一样——刚开始可能会糊锅，但掌握了方法，你也能做出一桌好菜！目录第一章：认清现实，别被忽悠第二章：建立知识地图第三章：实战为王第四章：自检清单——你真的学会了吗？第五章：进阶之路结语：成为A
如何用 Python 绕过 cloudflare（5秒盾）抓取数据：也不是很难嘛！炒青椒不放辣 Web爬虫进阶实战 python cloudflare 爬虫 5秒盾逆向
大家好！我是爱摸鱼的小鸿，关注我，收看每期的编程干货。逆向是爬虫工程师进阶必备技能，当我们遇到一个问题时可能会有多种解决途径，而如何做出最高效的抉择又需要经验的积累。本期文章将以实战的方式，带你全面了解cloudflare（5秒盾）以及如何绕过使用cloudflare服务的网站从而抓取数据特别声明：本篇文章仅供学习与研究使用，不用做任何非法用途，相关URL和API等均已做脱敏处理，若有侵权请联系作
python请求有关ja3指纹问题王太歌 python 爬虫开发语言
遇见一个网站采集，无论怎样都返回空数据(实际上是有数据的)，但是抓包下来又确实是那样的，请教了一些人推测是指纹验证，拜读了网上其他大佬的博客文章后实验了一下，发现确实是这个问题！第一次知道tcp还有这个东西，让我大受震撼，值此搬运一下。参考链接及来源：Python爬虫进阶必备|JA3指纹在爬虫中的应用与定向突破python爬虫requests、httpx、aiohttp、scrapy突破ja3指纹
【干货】pythonJA3指纹绕过 kisloy 爬虫逆向 python 爬虫
requests/scrapyJA3指纹绕过requests绕过importrequestsimportrandomfromrequests.adaptersimportHTTPAdapterfromrequests.packages.urllib3.util.ssl_importcreate_urllib3_contextORIGIN_CIPHERS=("ECDH+AESGCM:DH+AESGC
阴谋爆仓！社科院课堂朱民ST-balance节能风电被骗揭秘！受害者亲述不能出金真相！正义青天
随着互联网的普及，数字经济蓬勃发展，各种线上平台如雨后春笋般涌现。然而，在这些看似繁荣的平台中，不乏一些黑平台，它们以欺诈手段骗取用户的财产，给人们的财产安全带来严重威胁。因此，我们有必要提高警惕，防范黑平台诈骗。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈善投票网站买数字的等等都是骗局若你也不幸被骗遇到此类平台一定不要打草惊蛇，早期不
豆瓣电影信息爬虫【2024年6月】教程，赋完整代码桃宝护卫队爬虫 python
豆瓣电影信息爬虫【2024年6月】教程，赋完整代码在本教程中，我们将使用以下技术栈来构建一个爬虫，用于爬取豆瓣电影列表页面的信息：完整代码放到最后；完整代码放到最后；完整代码放到最后；重要的事情说三遍。1.技术栈介绍在本教程中，我们将使用以下技术栈来构建一个爬虫，用于爬取豆瓣电影列表页面的信息：Python:一种广泛使用的高级编程语言，因其简洁的语法和强大的库支持而受到开发者的喜爱。Request
智能喷洒机器人目标识别系统：基于NanoDet的目标检测与UI界面实现 YOLO实战营机器人目标检测 ui NanoDet 计算机视觉目标跟踪深度学习
在现代农业生产中，自动化喷洒系统是实现精准农业的重要组成部分。智能喷洒机器人通过图像识别和自动控制技术，能够高效识别并精确喷洒农药、肥料等，提高农业生产效率，降低化学品使用量，减少环境污染。目标识别是智能喷洒机器人中至关重要的部分，它涉及到精准的作物和病虫害识别，确保喷洒操作的准确性。在本篇博客中，我们将构建一个基于NanoDet深度学习目标检测模型的智能喷洒机器人目标识别系统。我们将介绍如何使用
爬虫技术Requests实现模拟登录 incidite 爬虫
一、模拟登录的目的访问受限内容：获取需要登录才能查看的页面数据个性化数据采集：获取用户账户相关的定制化信息自动化操作：实现自动签到、自动任务等流程数据完整性：采集完整的用户视角数据（如社交网络信息）状态保持：维持会话状态以进行连续操作测试验证：用于网站功能测试和验证二、对Requests模拟登录的认识技术本质：通过PythonRequests库模拟浏览器登录行为实现原理：处理登录表单提交维护会话c
从 C# 到 Python：项目实战第五天的飞跃 AI、少年郎数据库 c#开发语言
在前面三天的学习中，我们已经掌握了Python的基础语法、数据结构以及一些核心库的使用。今天，我们将通过三个实战项目，深入对比C#和Python在命令行工具开发、Web应用开发以及数据处理方面的差异，感受Python在实际项目中的强大魅力。一、命令行工具开发：文件批量处理命令行工具是开发者日常工作中经常用到的工具，无论是文件处理、数据转换还是系统管理，都离不开命令行工具的身影。下面我们就来对比一下
对标ChatGPT，「文心一言」今日亮相！AI人机时代来临，未来在何方？ AI医学
本文由「AI医学er」提供医海无涯，AI同舟。关注我们，助力高效科研。3月15日，OpenAI公布了其大型语言模型的最新版本——GPT-4。3月16日，百度文心一言人工智能聊天机器人正式上线。一个时代开始了。OpenAI在官网表示，GPT-4是一个能接受图像和文本输入，并输出文本的多模态模型，是OpenAI在扩展深度学习方面的最新成果。此前的ChatGPT，只能通过向其输入文字提问才能生成文字回答
python docker 阿狸的家 SDN docker
我们的开发人员和布署人员经常因环境问题，而使得安装过程困难重重，相比于虚拟机较少硬件资源的虚拟化，同时不需要加载虚拟机操作系统的耗时，因为docker共享宿主机的操作系统Centos和Ubunta共用内核kernel即bootfs相同，但是加载内核的rootfs不同，即文件的结构目录不同docker三要素docker可以看作为一个小型的linux系统，部署时秒级启动镜像：模板（应用程序代码），一个
【深度学习新浪潮】什么是system 1和system 2？小米玄戒Andrew 深度学习新浪潮深度学习人工智能大模型推理模型 COT 模型蒸馏动态推理
在大模型研究中，System1和System2的概念源于心理学家DanielKahneman的双系统理论，用于描述人类思维的两种模式。System1代表快速、直觉、自动化的思维（如模式识别），而System2代表慢速、有意识、需要努力的逻辑推理（如复杂数学计算）。这一理论被引入AI领域后，成为理解大模型能力边界和优化方向的重要框架。一、大模型中的System1与System2的定义System1（
飞算科技：以原创技术为翼，赋能产业数字化转型
在数字经济浪潮席卷全球的当下，一批专注于技术创新的中国企业正加速崛起，飞算数智科技（深圳）有限公司（简称“飞算科技”）便是其中的佼佼者。作为一家国家级高新技术企业，飞算科技以自主创新为核心驱动力，凭借互联网科技、大数据、人工智能等前沿技术，为各行业客户插上数字化转型的翅膀。飞算科技的定位清晰而坚定——自主创新型数字科技公司。这一定位不仅体现在其技术研发的方向上，更融入到为客户服务的每一个环节。无论
python实现自动化sql布尔盲注(二分查找) 海星船长丶 python 自动化 sql 网络安全 web安全
为了优化自动化布尔盲注的代码，我们可以使用二分查找来减少猜测次数，从而提高效率。以靶场sqli为例：importrequests#目标URLurl="http://127.0.0.1/sqli/Less-8/index.php"#要推断的数据库信息（例如：数据库名）database_name=""#字符集（可以根据需要扩展）charset="abcdefghijklmnopqrstuvwxyzAB
警惕!北恒私募高级班周一丰，马建军不正规。不让出金,不能提现,大家远离骗局! 昌龙律法
随着互联网的普及，数字经济蓬勃发展，各种线上平台如雨后春笋般涌现。然而，在这些看似繁荣的平台中，不乏一些黑平台，它们以欺诈手段骗取用户的财产，给人们的财产安全带来严重威胁。因此，我们有必要提高警惕，防范黑平台诈骗。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈善投票网站买数字的等等都是骗局，广大市民对此要提高警惕，若你也不幸被骗遇到此类平
学习人工智能开发的详细指南 Ws＿学习人工智能 python
一、引言人工智能（AI）开发是一个充满挑战与机遇的领域，它融合了数学、计算机科学、统计学、认知科学等多个学科的知识。随着大数据、云计算和深度学习技术的快速发展，AI已经成为推动社会进步和产业升级的关键力量。本文将为初学者提供一份详细的学习指南，帮助大家逐步掌握AI开发的核心技能。二、基础知识准备数学基础：线性代数：理解向量、矩阵、线性变换等基本概念，掌握矩阵运算和特征值分解等技巧。概率论与统计学：
rpg_trajectory_evaluation工具评估SLAM/VIO系统
rpg_trajectory_evaluation工具评估SLAM/VIO系统1、安装系统环境：ubuntu18.04+ROSmelodic代码：https://github.com/uzh-rpg/rpg_trajectory_evaluationtutorial:http://rpg.ifi.uzh.ch/docs/IROS18_Zhang.pdf1.1首先安装依赖的python库pipins
计算机发展史：人工智能时代的智能变革与无限可能 jdlxx_dongfangxing 计算机发展史计算机发展史
在计算机发展的漫长进程中，人工智能时代的到来无疑是最具革命性的篇章之一。它使计算机从单纯的数据处理工具，进化为能够模拟、延伸和拓展人类智能的强大系统，对科学研究、经济发展、社会生活乃至人类文明的走向，都产生了深远且不可逆转的影响。从早期对智能机器的设想，到如今人工智能技术在全球范围内的广泛应用，这一领域经历了无数次理论突破、技术迭代与实践探索，正以前所未有的速度重塑着我们的世界。人工智能的起源与早
做人脸识别遇到的问题 princesshu python pycharm
最开始安装的时候直接用pipinstalldlib却一直显示错误提示“Failedbuildingwheelfordlib”之后去网上搜来了各种下载链接依然错误我发现问题是！！python版本问题，我下载所有的包都与我的python版本不匹配于是我先安装了cmakeboost之后最后直接在终端安好了dlib～
【Hugging Face全面拥抱LangChain：全新官方合作包】
文末有福利！❝最近HuggingFace官宣发布langchain_huggingface，这是一个由HuggingFace和LangChain共同维护的LangChain合作伙伴包。这个新的Python包旨在将HuggingFace最新功能引入LangChain并保持同步。通过HuggingFace官方包的加持，开发小伙伴们通过简单的api调用就能在langchain中轻松使用HuggingFa
【技术工具】python人员照片简介批量对照（千人级） Allen_Lyb 医疗高效编程研发 python 开发语言自然语言处理健康医疗语言模型
要实现根据照片上的工号批量添加人员姓名和工号到照片上，可以按照以下步骤操作（使用Python+PIL/Pillow+OpenCV+pytesseract）：解决方案步骤准备数据创建人员信息表（CSV格式）：姓名,工号确保所有照片文件名包含工号（如工号.jpg），或照片中有清晰可见的工号文本安装依赖库pipinstallpillowopencv-pythonpandaspytesseract#额外安
Linux机器上Selenium+Python3+Chrome使用driver.get()只能获取到标签而没有内容的解决方法
代码：#!/usr/bin/python3#coding=utf8fromseleniumimportwebdriverfromselenium.webdriver.chrome.optionsimportOptionschrome_options=Options()chrome_options.add_argument('--headless')chrome_options.add_argume
6、LangChain —— 使用 Huggingface 中的开源模型 Miyazaki_Hayao LangChain 实战 langchain
文章目录一、概述二、大语言模型发展史三、预训练+微调的模式四、用HuggingFace跑开源模型五、申请使用Meta的Llama2模型六、通过HuggingFace调用Llama七、LangChain和HuggingFace的接口1、通过HuggingFaceHub2、通过HuggingFacePipeline八、用LangChain调用自定义语言模型一、概述大语言模型，不止ChatGPT一种。
解决 python 中的 huggingface_hub code_welike python 前端数据库
解决python中的huggingface_hub.utils._validators.HFValidationErrorRepoidmustbeintheformrepo_nameorname问题在使用python的huggingface_hub库时，有时候会遇到类似于“huggingface_hub.utils._validators.HFValidationErrorRepoidmustbe
Hugging Face x LangChain: 全新 LangChain 合作伙伴包
langchain-huggingface与LangChain无缝集成，为在LangChain生态系统中使用HuggingFace模型提供了一种可用且高效的方法。这种伙伴关系不仅仅涉及到技术贡献，还展示了双方对维护和不断改进这一集成的共同承诺。起步langchain-huggingface的起步非常简单。以下是安装该软件包的方法:pipinstalllangchain-huggingface现在，
使用Python调用Hugging Face Question Answering (问答)模型墨如夜色 python easyui 开发语言 Python
使用Python调用HuggingFaceQuestionAnswering(问答)模型在自然语言处理领域，问答系统是一种能够回答用户提出的问题的智能系统。HuggingFace是一个知名的开源软件库，提供了许多强大的自然语言处理工具和模型。其中，HuggingFace的QuestionAnswering模型可以帮助我们构建问答系统，使得我们能够从给定的文本中提取答案。本文将介绍如何使用Pytho
深入解析与实战应用：利用Python和Amazon Product Advertising API实战分析不进则退i python 开发语言
在电商平台的运营中，关键词搜索接口是不可或缺的一部分，特别是在亚马逊这样的全球电商平台。通过关键词搜索接口，商家可以高效地获取商品信息，优化选品策略，提升销售业绩。本文将详细介绍如何接入亚马逊的关键字搜索接口，并提供一个Python代码示例。点击获取key和secret1.注册开发者账号并获取API权限首先，你需要访问亚马逊开发者中心，注册一个开发者账号，并获取相应的API权限。在注册过程中，你将
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo