Reeeeeeyh

专家系统TBE算子调优

详情指路视频专栏：https://www.bilibili.com/video/BV1j34y1J7Cd

MindStudio介绍

MindStudio提供在AI开发所需的一站式开发环境，支持模型开发、算子开发以及应用开发三个主流程中的开发任务，依靠模型可视化、算力测试、IDE本地仿真调试等功能，MindStudio能够帮助您在一个工具上就能高效便捷地完成AI应用开发，MindStudio采用了插件化扩展机制，开发者可以通过开发插件来扩展已有功能。本实验使用的MindStudio版本为5.0.RC1，安装请参考MindStudio安装教程（https://www.hiascend.com/document/detail/zh/mindstudio/50RC1/instg/ instg_000002.html）。

交付件介绍

实现流程

在使用MindStudio中专家系统的算子优化分析功能进行自定义算子调优的时候，因为专家系统的算子优化分析功能只关注于算子实现部分的优化分析，所以对于自定义算子的开发只需要完成一部分步骤即可，算子分析、算子代码实现、算子信息库定义、算子UT测试，然后通过专家系统中的算子优化分析功能进行算子问题的分析和优化，下面展示了本实验的流程图。

环境搭建与配置：本实验的环境由华为提供，MindStudio安装教程请参考（[https://www.hiascend.com/document/detail/zh/mindstudio/50RC1/inst /instg_000002.html](https://www.hiascend.com/document/detail/zh/mindstudio/50RC1/inst /instg_000002.html)）。安装完MindStudio后开始在MindStudio中配置CANN，CANN配置参考（[https://gitee.com/ascend/docs-openmind/blob/ master/guide/common/tutorials/%E6%98%87%E8%85%BE%E7%94%9F%E6%80%81%E4%BC%97%E6%99%BA%E5%AE%9E%E9%AA%8C%E5%AE%A4%E7%BD%91%E7%BB%9C%E8%BF%9E%E6%8E%A5%E6%8C%87%E5%AF%BC.md](https://gitee.com/ascend/docs-openmind/blob/ master/guide/common/tutorials/昇腾生态众智实验室网络连接指导.md)）
算子工程创建：通过MindStudio工具创建算子工程，创建完之后工具会自动生成算子工程目录及相应的文件模板，开发者可以基于这些模板进行算子开发。
算子分析：在开发算子代码之前需要分析算子的数学表达式，输入、输出以及计算逻辑的实现，明确需要调用的TBE DSL接口。若是使用的第三方开源网络，网络中有昇腾AI处理器不支持的算子，可以根据第三方开源网站中的算子实现进行分析，推理出算子的数学表达式
算子代码实现：算子使用的TBE框架的实现过程。
算子信息库定义：算子信息配置文件用于将算子的相关信息注册到算子信息库中，包括算子的输入输出dtype、format以及输入shape信息。网络运行时，FE会根据算子信息库中的算子信息做基本校验，判断是否需要为算子插入合适的转换节点，并根据算子信息库中信息找到对应的算子实现文件进行编译，生成算子二进制文件进行执行。
算子的UT测试：即单元测试（Unit Test），仿真环境下验证算子实现的功能正确性，包括算子逻辑实现代码及算子原型定义实现代码。
算子问题分析：根据专家系统显现的问题进行分析。
算子调优：根据专家系统提出来的建议进行调优。

代码工程

本实验基于MindStudio的代码工程结构如下所示。

.
|-- CMakeLists.txt
|-- MyOperator26.iml
|-- build			//编译生成的中间文件
|-- cmake			//编译相关公共文件存放目录
|-- cmake-build		//编译相关生成文件存放目录
|-- framework		//算子插件实现文件目录
|-- op_proto			//算子IR定义文件目录
|   |-- CMakeLists.txt
|   |-- sort.cc		//算子IR定义的.c文件
|   `-- sort.h			//算子IR定义的.h头文件
|-- tbe			//TBE算子文件目录
|   |-- CMakeLists.txt		//编译规则文件，会被算子工程根目录中的CMakeLists.txt文件调用
|   |-- impl
|   |   `-- sort.py
`-- testcases			//工程ut测试和st测试相关代码目录
    |-- CMakeLists.txt
    `-- ut			//算子UT测试目录
        `-- ops_test				
            |-- CMakeLists.txt
            |-- sort
            |   |-- CMakeLists.txt			//用于编译可执行文件
            |   |-- test_sort_impl.py			//算子实现代码的测试用例文件
            `-- test_main.cc			//测试用例调用总入口

文章介绍

文章详细记录了如何使用MindStudio中的算子优化分析功能去优化TBE算子，包括算子工程创建、算子分析、算子代码实现、算子信息库定义、算子UT测试、专家系统算子问题分析和专家系统算子调优。第三节介绍了MindStudio算子工程的创建。第四节介绍了TBE自定义算子开发算子基本概念、算子的分析，包括算子的输入输出，属性等。第五节介绍了专家系统算子优化分析。第六节介绍了整个流程中遇到的问题和解决方案。第七节介绍MindStudio的更多的内容。

算子工程创建

打开MindStudio进入算子工程创建界面

首次登录MindStudio：在MindStudio欢迎界面中单击“New Project”，进入创建工程界面。

非首次登录MindStudio：在顶部菜单栏中选择“File > New > Project…”，进入创建工程界面。

创建算子工程

左侧导航栏选择“Ascend Operator”，如图所示，在右侧配置算子工程信息，配置示例如下表。

 | 参数             | 参数说明                                                     | 示例                 |
 | ---------------- | ------------------------------------------------------------ | -------------------- |
 | Name             | 工程名称，用户自行配置。名称必须以字母开头，数字或字母结尾，只能包含字母、数字、中划线和下划线，且长度不能超过64个字符。 | MyOperator26         |
 | Description      | 工程描述信息，自行配置。                                     | 可选配置             |
 | CANN Version     | 当前CANN的版本号                                             | 选择当前CANN的版本号 |
 | Project Location | 工程的存储路径。                                             | 保持默认             |

单击“Next”，在弹出的页面中配置算子相关信息，选择Empty Template，如下表算子信息配置。

 | 参数             | 参数说明                                                     |
 | ---------------- | ------------------------------------------------------------ |
 | Empty Template   | 表示创建空的算子工程。选择此选项，下方会显示“Operator Type”配置项，请在此处输入需要创建的算子的类型，请根据算子分析进行配置。 |
 | Operator Type    | 算子名称                                                     |
 | Plugin Framework | 算子所在模型文件的框架类型。如果选择“Sample Template”创建算子工程时不显示此配置项。
MindSpore
PyTorch
TensorFlow
Caffe
ONNX |
 | Compute Unit     | 有以下两种选项，选择“Sample Template”创建算子工程时不显示此配置项。
AI Core / Vector Core：算子如果运行在AI Core或者Vector Core上，则代表是TBE算子。
AICPU：算子如果运行在AICPU上，则代表是AICPU算子。
如果“Plugin Framework”选择“MindSpore”， 则仅支持选择“AI Core / Vector Core” |

单击“Finish”，完成算子工程的创建。

若工作窗口已打开其他工程，会出现如图所示提示。

选择“This Window”，则直接在当前工作窗口打开新创建的工程。

选择“New Window”，则新建一个工作窗口打开新创建的工程。

TBE自定义算子开发

TBE算子基本概念介绍

要认识TBE就要先了解TVM。TVM（Tensor Virtual Machine）是为了解决不同平台的神经网络模型难以在其他硬件平台便捷的运行，无法充分利用新平台的运算性能的问题而诞生出来的开源深度学习编译栈，它通过统一的中间表达（Intermediate Representation）堆栈连接深度学习模型和后端硬件平台，通过统一的结构优化Schedule，可以支持CPU、GPU和特定的加速器平台和语言。TVM的架构详细介绍请参考https://tvm.apache.org/。

TBE（Tensor Boost Engine）提供了基于TVM框架的自定义算子开发能力，通过TBE提供的API可以完成相应神经网络算子的开发。TBE工具给用户提供了多层灵活的算子开发方式，用户可以根据对硬件的理解程度自由选择，利用工具的优化和代码生成能力，生成昇腾AI处理器的高性能可执行算子。

算子分析

sort算子的功能：将输入张量的元素按照给定的维度按值升序或者降序排序。返回一个命名元组(值，索引)，其中值是排序后的值，索引是原始输入张量中元素的索引。
属性：

sort算子有两个属性，分别为axis和descending，代表排序的维度和是升序还是降序。

axis类型为int32，descending类型为bool

axis和descending属性都是可选的，默认是-1和false，即默认排序最后一个轴、降序排序。
输入和输出：

sort算子有一个输入：x，输出为y1，y2。

本样例中算子的输入支持的数据类型为float16，算子输出y1的数据类型为float16，y2的数据类型为int32。

算子输入支持所有shape，输出shape与输入shape相同。

算子输入和输出支持的format为：ND。
确定算子开发方式及使用的计算接口：本次sort算子的开发使用的是MindStudio工具，通过调用TIK提供的API接口来实现sort算子的功能。
明确算子实现文件名称、算子实现函数名称以及算子的类型（OpType）：算子类型定义为Sort。算子的实现文件名称及实现函数名称将首字母转换小写字符，定义为sort。
通过以上分析，得到Sort算子的设计规格如下：

算子类型（OpType）: Sort

算子属性: name: axis; shape: (,1); data type: int32; default: -1;

name: descending; shape: (,1); data type: bool; default: -1;

算子输入: name: x; shape: all; data type: float16; format: ND;

算子输出: name: y1; shape: all; data type: float16; format: ND;

name: y2; shape: all; data type: float16; format: ND;

算子实现使用的主要TIK接口: tik_instance = tik.Tik(); tik_instance.Tensor();

算子实现文件/实现函数名称: sort;

算子代码实现

用户调用TIK API编写算子对应的Python程序后，TIK会将其转化为TIK DSL(TIK DSL是一种DSL语言，它可以在比CCE更高的抽象层次上定义CCEC程序的行为)，经过编译器编译后生成CCEC文件（CCEC代码目前对于TIK编程人员无法感知），再经过CCE编译器编译后生成可运行在昇腾AI处理器上的应用程序。TBE TIK的算子实现流程如下图所示：

通过调用TBE TIK接口，在算子工程下的“tbe/impl/sort.py”文件中进行Sort算子的实现，包括算子函数定义、算子入参校验、compute过程实现及调度与编译。其关键代码如下所示：

算子信息库定义

需要通过配置算子信息文件，将算子的相关信息注册到算子信息库中。算子信息库主要体现算子在昇腾AI处理器上物理实现的限制，包括算子的输入输出dtype、format以及输入shape信息。网络运行时，FE会根据算子信息库中的算子信息做基本校验，判断是否需要为算子插入合适的转换节点，并根据算子信息库中信息找到对应的算子实现文件进行编译，生成算子二进制文件进行执行。

进入“tbe/op_info_cfg.ai_core.soc_version”目录，配置算子信息库文件“sort.ini”。soc_version为当前昇腾AI处理器的版本，例如ascend310、ascend910等。开发者需要基于MindStudio自动生成的sort.ini文件进行修改，修改后的Sort算子的算子信息定义如下所示。

信息	Sort算子配置	说明
[OpType]	[Sort]	算子类型，以英文半角方括号，标识一个算子信息开始，根据算子分析，算子类型为Sort。
input0.name	x	Sort算子的第一个输入tensor的名称，根据算子分析，输入名称为x，所以此处配置为x，且需要跟算子原型定义中的名称保持一致。
input0.dtype	input0.dtype=float16	定义输入tensor支持的数据类型与数据排布格式。根据算子分析，Sort算子的输入数据类型支持float16；
input0.format	input0.format= ND	支持的数据排布格式有ND。说明：若算子输入支持多种规格，算子输入的dtype与format需要一一对应、按对应顺序进行配置，列出算子支持的所有dtype与format的组合，中间以“,”分隔。
input0.shape	all	定义输入tensor支持的形状。
input0.paramType	required	定义输入tensor的类型。dynamic：表示该输入是动态个数，可能是1个，也可能是多个。optional：表示该输入为可选，可以有1个，也可以不存在。required：表示该输入有且仅有1个。Sort算子的input0为固定输入1个，此处配置为required。
output1.name	y1	此配置项代表Sort算子的第一个输出tensor的名称，根据算子分析，第一个输出名称为y1，所以此处配置为y1，且需要跟算子原型定义中的名称保持一致。
output1.dtype	output1.dtype=float16	定义输入tensor支持的数据类型与数据排布格式。根据算子分析，Sort算子的输入数据类型支持float16；
output1.format	output1.format= ND	支持的数据排布格式有ND。
output1.shape	all	定义输入tensor支持的形状。
output1.paramType	required	定义输入tensor的类型。Sort算子的output1为固定1个输出，此处配置为required。
output2.name	y2	Sort算子的输出tensor的名称，根据算子分析，算子的输出名称为y2，所以此处配置为y2，且需要跟算子原型定义中的名称保持一致。
output2.dtype	output2.dtype=int32	定义输出tensor支持的数据类型与数据排布格式。根据算子分析，Sort算子的输出数据类型支持float16；支持的数据排布格式有ND。
output2.format	output2.format=ND	支持的数据排布格式有ND。
output2.shape	all	定义输出tensor支持的形状。
output2.paramType	required	定义输出tensor的类型。Sort算子的output1为固定输出1个，此处配置为required。

算子UT测试

UT（Unit Test：单元测试）是开发人员进行单算子运行验证的手段之一，主要目的是：1)、测试算子代码的正确性，验证输入输出结果与设计的一致性。2)、UT侧重于保证算子程序能够跑通，选取的场景组合应能覆盖算子代码的所有分支（一般来说覆盖率要达到100%），从而降低不同场景下算子代码的编译失败率。下面展示UT测试步骤：

创建UT测试用例。创建UT测试用例，有以下两种方式：

右键单击算子工程根目录，选择“New Cases > TBE UT Case”。

若已经存在了算子的UT测试用例，可以右键单击“testcases”目录，或者“testcases > ut”目录，选择“New Cases > TBE UT Case”，创建UT测试用例。

在弹出的算子选择界面，选择需要创建UT测试用例的算子，单击OK，如下图所示。

创建完成后，会在算子工程根目录下生成testcases文件夹，目录结构如下所示：

├── MyOperator26            //工程根目录  
│   ├──  testcases                            
│   │   ├── libs                  // gtest框架，为第三方依赖，用户无需关注
│   │   ├──  ut                              
│   │   │   ├── ops_test
│   │   │   │   ├── sort   
│   │   │   │   │   ├── CMakeLists.txt        //用于编译可执行文件
│   │   │   │   │   ├── test_sort_impl.py      //算子实现代码的测试用例文件
│   │   │   │   │   ├── test_sort_proto.cc    //算子原型定义代码的测试用例文件
│   │   │   │   ├── CMakeLists.txt             //用于编译可执行文件
│   │   │   │   ├── test_main.cc              //测试用例调用总入口
│   │   │   ├ CMakeLists.txt

编写算子实现代码的UT Python测试用例。在“testcases/ut/ops_test/ sort/test_sort_impl.py”文件中，编写算子实现代码的UT Python测试用例，计算出算子执行结果，并取回结果和预期结果进行比较，来测试算子逻辑的正确性。

注：

测试用例params中字段和字段取值范围需根据算子实现文件入口参数确定。输入tensor中的"ori_shape"和"ori_format"字段为可选字段，但若使用参数校验修饰器检验参数"ori_shape"和"ori_format"字段必选。

可参见UT测试接口参考查看每个测试类接口的使用方法。若要与期望数据进行结果的比对，请使用add_precision_case接口。
运行算子实现文件的UT测试用例。

开发人员可以执行当前工程中所有算子的UT测试用例，也可以执行单个算子的UT测试用例。

右键单击“testcases/ut/aicpu_test”文件夹，选择Run AI CPU Operator‘All’UT Impl with coverage，运行整个文件夹下算子实现代码的测试用例。

右键单击“testcases/ut/aicpu_test/算子名称”文件夹，选择Run AI CPU Operator ‘算子名称’ UT Impl with coverage，运行单个算子实现代码的测试用例。

第一次运行时会弹出运行配置页面，请参考配置，然后单击Run。后续如需修改运行配置，请参考修改运行配置。

 | 参数          | 说明                                                         |
 | ------------- | ------------------------------------------------------------ |
 | Name          | 运行配置名称，用户可以自定义。                               |
 | Test Type     | 选择ut_impl。                                                |
 | Compute Unit  | 选择计算单元：l AI Core/Vector Core；l AI CPU。选择不同的计算单元可以实现AI Core/Vector Core和AICPU_UT测试配置界面的切换。 |
 | Operator Name | 选择运行的测试用例。all表示运行所有用例。其他表示运行某个算子下的测试用例。 |
 | Case Names    | 勾选需要运行的测试用例，即算子实现代码的UT C++测试用例。支持全选和全不选所有测试用例。 |

查看运行结果，运行完成后，通过界面下方的日志打印窗口，查看运行结果。结果中展示此次一共运行几个用例，如下图。

专家系统优化分析

背景介绍

在算子开发结束和整网运行出现算子性能不达标两种场景下，需要对算子进行调优。算子调优对开发者的要求比较高，需要开发者对底层和框架有一定的了解，同时具备一定的算子调优经验。算子优化分析可以协助开发者迅速找到算子性能瓶颈，并给出相应的优化手段，能够有效提升开发者算子调优的效率。本节以TBE中的Sort算子为例，介绍通过专家系统算子优化分析功能，自动识别算子中存在的问题，给出优化建议，根据优化建议进行优化，提升模型整体性能。

专家系统操作

单击算子工程界面“Run > Edit Configurations…”或单击如下图所示菜单，进入运行UT测试配置界面。
配置算子参数时勾选“Enable Advisor”。如下图所示

只有当Test Type参数选择ut_impl，Target参数选择Simulator_TMModel，且Case Names参数仅勾选一项Case时，才允许勾选“Enable Advisor”开启算子专家系统功能；当Target选择其他选项或Case Names参数勾选多个case时，“Enable Advisor”选项不显示。
单击“OK”完成算子工程信息的配置。
单击算子工程界面“Run >Run”或单击下图所示菜单，运行算子UT测试。
在这里我们使用了两类UT测试case来测试Sort算子的性能，一类是排序轴数小于2048的场景，另一类是排序轴数大于2048的场景。

在使用排序轴数目小于2048场景的UT测试案例的时候，得到如下结果输出。

在使用排序排序轴数目大于2048场景下，得到的输出结果如下。

问题分析

针对占比最大的流水进行分析，主要从三个维度进行：

其它流水导致的流水不连续。
指令入队列导致的流水不连续。
pipe_barrier(PIPE_ALL)导致的流水打断。

根据分析的结果，对上述三个维度造成影响的周期数进行排序，结果展示如下：

MTE2：表示将数据从Global Memory搬运到Unified Buffer，Vector完成计算后将结果写回Unified Buffer。
MTE3：表示将计算结果搬回Global Memory。
MTE2和MTE3的功能如下图所示。

对于专家系统展示的分析结果，其字段解释如下表格所示。

字段	说明
Pipeline Interruption	分析流水打断。
Interruption Factor	流水打断因素。
Affected Pipeline	受影响的流水。
Interruption Cycles	流水打断的周期数。
Percentage to Total	打断周期数占总周期数的百分比。

Reduce strong data dependencies between pipelines.

优化不合理的流水依赖。
Eliminate improper instruction syschronization between pipelines.

消除流水间不合理的指令同步。

故根据上述关于专家系统算子优化分析功能的结果展示分析，Sort算子的实现部分针对于排序轴数小于2048的场景存在不合理的流水线依赖问题和流水间不合理指令同步问题。

问题解决

根据优化建议，需要重点需要优化轴数小于2048的场景下Sort算子的代码实现部分，在这部分中存在着不合理的流水依赖和同步指令，对于这部分的分析根据开发经验,可能会有数据内存地址踩踏问题出现，即可能存在冗余的重复指令问题,再参考专家系统的分析建议，如下图

即显示MTE2和MTE3影响了指令流水的打断,对此首先想到data_move指令，即数据的内存和外存之间的搬运指令，是否存在着不合理的可以优化的部分。通过寻找使用data_move的代码模块并测试发现下图中的tik循环可以省略，由于这个不必要的tik循环，导致了出现冗余重复的指令，里面的repeat_times也可以提出到外面进行统一计算，减少了对BLOCK和num_16的数据依赖，也优化了不合理的指令。

进行优化后重新测试的结果如下图所示，可以看到对于排序轴数小于2048的情况下，已经没有流水打断提示了，即优化是有效的。

使用专家系统总结

通过专家系统工具的分析，可以快速找出算子实现的效率和性能问题。并根据向量流水等不同维度的分析（三个维度分析请参考https://www.hiascend.com/document/detail/zh/mindstudio/50RC1/msug/msug_000349.html），给出对应的优化建议。根据优化意见和开发经验分析，可以有针对性的进行性能分析，改进实现代码，提升了算子调优效率。

经验总结

UT测试的时候出现如下问题，case不能识别，显示缺少absl-py模块。

解决方法：本地默认的Python环境中安装absl-py模块，而不是在配置的Python编译器中安装absl-py模块，它识别的时候是根据本地的默认的Python环境识别的。

使用专家系统时，在tmmodel模式下出现算子case识别不出来。

解决方法：打开UT的代码，没有精度测试case，使用add_precision_case()添加精度测试case，如果使用add_case方式是无法识别的。

有时候使用专家系统的时候出现如下问题。测试案例显示测试成功，但是不能拉起专家系统。

解决方法：方法一：检查UT测试代码是否有问题，方法二：尝试关闭MindStudio，并重新打开项目运行测试，暂时不明什么原因导致，但确实是有效的解决方法。

关于MindStudio更多的内容

如果需要了解关于MindStudio更多的信息，请查阅昇腾社区中MindStudio的用户手册(https://www.hiascend.com/document/detail/zh/mindstudio /50RC1/msug/msug_000433.html)，里面有算子开发、模型开发等各种使用操作的详细介绍。

如果在使用MindStudio过程中遇到任何问题，也可以在昇腾社区中的昇腾论坛(https://www.huaweicloud.com/s/JU1pbmRTdHVkaW_mkK3lu7ol/t_60_p_1)里进行提问，会有华为内部技术人员对其进行解答，如下图。

你可能感兴趣的:(AI,人工智能,深度学习,ai)

宝塔下载pgsql适配spring ai 一入JAVA毁终身技术精讲 spring 数据库 java
1.宝塔安装pgvector1.先去github下载pgvectorpgvector/pgvector:Open-sourcevectorsimilaritysearchforPostgres2.把压缩包上传到系统文件的/temp下解压，重命名文件名为pgvector，之后命令操作cd/tmpcdpgvectorexportPG_CONFIG=/www/server/pgsql/bin/pg_co
Python编程电子书：从基础到实践王奥雷
本文还有配套的精品资源，点击获取简介：Python电子书汇集了基础语法、面向对象编程、标准及第三方库使用、文件操作、网络编程、并发编程、单元测试与调试、Python2与Python3的区别等核心知识点。通过实例和项目案例，帮助读者在Web开发、数据分析、人工智能等应用领域提升编程技能，跟上Python的技术进步。1.Python基础语法介绍Python作为一种高级编程语言，其易读性和简洁的语法使其
九、K8s污点和容忍退役小学生呀 K8s企业级深度研修 kubernetes docker 容器云原生 k8s linux 运维
九、K8s污点和容忍文章目录九、K8s污点和容忍1、污点（Taint）和容忍（Toleration）1.1什么是污点（Taint）？1.2什么是容忍（Toleration）？1.3污点的影响效果（Effect）1.4污点配置解析1.5常见内置污点2、污点的增删改查2.1添加污点2.2修改污点2.3查询污点2.4删除污点3、污点和容忍使用场景实战3.1K8s主节点禁止调度3.2K8s新节点禁止调度3
宽带有哪几种接入方式 weixin_30252709
转：https://zhidao.baidu.com/question/1025089.html目前的家庭接入方式主要有三种：一是普通电话线的非对称数字用户环路技术（ADSL）方式、二是基于光纤IP网的FTTB+LAN技术方式（小区宽带），三是有线电视的CableModem技术方式（有线通）。ADSL使用一种调制解调传输技术，在普通电话线上将现有电话线路的频宽经由调制解调技术处理后扩大，其中较高容
Neo4j 的向量搜索（Neo4jVector）和常见的向量数据库（比如 Milvus、Qdrant）之间的区别与联系
先说联系（共同点）点内容✅都支持向量检索都可以基于embedding（向量）做相似度搜索，比如给一段文本、找出最相似的若干条记录。✅都用于语义检索你可以把它们用在RAG（检索增强生成）、ChatwithDocs、智能问答、推荐系统等应用里。✅都支持批量插入、查询都可以批量向数据库中插入文本+向量，然后用向量做top-k检索（如search(k=8)）。✅都和LangChain集成它们都可以通过la
03每日简报20250705 Alvin_YD 每日简报人工智能娱乐社交电子媒体传媒
每日简报新闻简报：AI行业信任危机浮现标题：知名科技作者AlbertoRomero发文《我对AI行业正在失去所有信任》来源：TheAlgorithmicBridge（算法之桥）核心内容：作者立场：长期支持AI技术的作者AlbertoRomero公开表达对行业信任的崩塌，称"作为一个支持者，我本不愿有这种感受"。行业痛点：未具体说明的行业乱象导致公众信任度下降暗示AI发展过程中存在伦理或透明度问题传
flex布局原理以及各属性详解卷尾猫 css css css3 flexbox flex
1布局原理1.1flex是flexibleBox的缩写，意为“弹性布局”，用来为盒状模型提供最大的灵活性，任何一个容器都可以指定为flex布局*当我们为父盒子设为flex布局以后，子元素的float、clear和vertical-align属性将失效*伸缩布局=弹性布局=伸缩盒布局=弹性盒布局=flex布局1.2采用flex布局的元素，称为flex容器（flexcontainer），简称“容器”。
大前端日志分析的AI应用：从海量日志中提取有价值的运维信息欧阳天羲大前端与 AI 的深度融合 #AI 在大前端安全与运维篇前端人工智能运维
在大前端技术快速发展的今天，前端应用的复杂度呈指数级增长，涵盖Web、移动端H5、小程序、快应用等多端形态。随之而来的是海量日志数据的爆发式增长——从浏览器控制台输出到移动端性能埋点，从用户行为轨迹到API调用异常，这些日志分散在不同终端、格式异构，传统的人工分析或规则引擎已难以应对。本文将系统阐述AI技术如何赋能大前端日志分析，从日志采集到智能诊断的全流程解决方案，结合实际案例展示如何利用机器学
开源模型应用落地-OpenAI Agents SDK-集成MCP与Qwen3-8B模型的创新应用探索（七）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言在人工智能技术飞速发展的今天，如何将先进的模型和技术无缝结合，成为推动行业变革的关键。OpenAIAgents通过集成模型上下文协议（MCP）和阿里巴巴推出的Qwen3-8B模型，正开启一场智能应用的革命。这种创新的结合不仅提升了AI代理与外部工具之间的通信能力，还在多模态任务处理、个性化服务等领域展现出巨大潜力。本文将深入探讨这一技术组合的实际应用场景，揭示其在改善客户体验和提升运营效率
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用（六）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言随着人工智能技术的迅猛发展，大语言模型（LLM）在各行各业的应用日益广泛。然而，模型生成的内容是否安全、合规、符合用户预期，成为开发者和企业不可忽视的问题。为此，OutputGuardrail应运而生，作为一种关键的安全机制，它在模型生成结果之后进行内容审核与过滤，确保输出不偏离道德、法律和业务规范。通过检测不当的内容，不仅提升了AI系统的可信度，也为构建更加稳健和负责任的人工智能应用提供
什么是深度学习框架中的计算图？杰瑞学AI Computer knowledge NLP/LLMs AI/AGI 深度学习人工智能 pytorch
在深度学习框架中，计算图是核心的数据结构和抽象概念，它用来表示和定义深度学习模型的计算过程。我们可以把它想象成一个描述数学运算如何组合和执行的有向图。以下是计算图的关键要素和作用：节点：代表操作或变量。操作：数学运算，如加法(+)、乘法(*)、矩阵乘法(matmul)、激活函数(ReLU,sigmoid)、卷积(conv2d)、损失函数(cross_entropy)等。变量：通常是张量，即存储数据
LangGraph是为了解决哪些问题？为了解决这些问题，LangGraph采用哪些方法？LangGraph适用于什么场景？LangGraph有什么局限性？杰瑞学AI AI/AGI NLP/LLMs langchain 人工智能自然语言处理深度学习神经网络
LangGraph旨在解决的问题LangGraph是LangChain生态系统中的一个高级库，它专注于解决构建复杂、有状态、多步LLM应用程序的挑战。它扩展了LangChain的链和代理概念，尤其针对以下问题：多步决策和循环工作流：传统的链通常是线性的或简单的分支，难以处理复杂的决策路径、条件跳转以及需要循环迭代才能达到最终结果的任务。状态管理：在复杂的、多轮的LLM应用中，需要维护和管理应用的状
开源模型应用落地-让AI更懂你的每一次交互-Mem0集成Qdrant、Neo4j与Streamlit的创新实践（四）开源技术探险家开源模型-实际应用落地 neo4j 开源人工智能语言模型
一、前言在人工智能迅速发展的今天，如何让AI系统更懂“你”？答案或许藏在个性化的记忆管理之中。Mem0作为一个开源的记忆管理系统，正致力于为AI赋予长期记忆与个性化服务能力。通过结合高性能向量数据库Qdrant、图数据库Neo4j的强大关系分析能力以及Streamlit的高效可视化交互，我们可以打造出一个既能存储用户历史行为、又能实时推理并展示结果的智能记忆助手。本文将带您一步步探索这一技术组合的
【Python】邮件处理2 宅男很神经 python 开发语言
7.Pythonemail库深度解析：MIME邮件构建与解析的艺术在前面的章节中，我们深入探讨了电子邮件的底层协议（SMTP,POP3,IMAP）以及如何使用imaplib库从服务器接收和管理邮件。然而，邮件内容的实际格式和结构并非由这些传输协议定义，而是由MIME(MultipurposeInternetMailExtensions)标准规范。Python的email库是处理MIME格式邮件的强
分布式系统核心基石：CAP定理、BASE理论与一致性算法深度解析 Eqwaak00 分布式系统设计实战算法 python java
一、CAP定理：分布式系统的设计边界1.1核心定义与经典三角CAP定理（Brewer'sTheorem）指出，在分布式系统中，一致性（Consistency）、可用性（Availability）、分区容错性（PartitionTolerance）三者不可兼得。（注：若需实际配图，可替换为Mermaid流程图或专业示意图）三大特性详解：一致性（C）：所有节点在同一时间看到的数据完全相同（强一致性）。
发起请求并处理响应：`XHR` 与 `axios` 使用指南来啦[特殊字符]~
又又又要长脑子呐~了解到通过发起HTTP请求并在不刷新页面的情况下更新页面内容是一种常见的需求。学习使用XMLHttpRequest或axios来实现，现在进行对比两者，比较项目使用时候的优缺点，文末使用表格进行对比学习1.使用XHR实现下面是一个使用XMLHttpRequest发起GET请求并处理服务器响应的示例：html体验AI代码助手代码解读复制代码//创建一个新的XMLHttpReques
c++求同构数 *Allen* c++算法数据结构
题目描述所谓同构数是指这样的数，即它出现在它的平方数的右端。例如，5的平方是25（即5×5=25），5是25右端的数，那么5就是同构数。又如，25的平方是625（即25×25=625），同理25也是同构数。找出通过键盘输入的两个正整数N和M（0usingnamespacestd;intn,m,t,s,a[100],b[100],sum,s1,s2,k;intmain(){cin>>n>>m;for
【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
用 AI “一句话生成代码”，用创意兑换灵码潮品：技术人的夏日狂欢季来了人工智能
在AI技术迅猛发展的2025年，我们正式推出“通义灵码编程智能体挑战季”，以“码力觉醒”为主题，打造一场融合技术探索与潮流文化的开发者盛宴。活动以体验MCP服务、Qwen3大模型及记忆功能的智能编程助手为核心，通过“小游戏开发”和“MCP场景实践”两大趣味赛道，降低AI技术门槛，让开发者轻松体验“一句话生成代码”的魔力。活动亮点抢先看：零门槛参与：新老用户均可参与，完成任务即领限量定制棒球帽！趣味
蛋白质结构预测/功能注释/交互识别/按需设计，中国海洋大学张树刚团队直击蛋白质智能计算核心任务 hyperai
蛋白质作为生命活动的主要承担者，在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设计效率低下等挑战。近年来，生命科学对蛋白质复杂特性解析的需求日益迫切，大数据、深度学习、多模态计算等技术的突破性发展，为构建蛋白质智能计算体系提供了全新的发展契机。蛋白质智能计算体系的构建，使得蛋白质在大规模功能注释、交互预测及三维结构建模等领域取得显著成果，为药物发现与生
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
图片转字符串存储在SQLite中你就是乌鸦嘴 qt6.3 笔记 qt
将图片转化为字符串放入Sqlite数据库，以BLOB类型存储。一、主要函数1、图片转字符串使用内存读写器，指定格式存入字节数组，字节数组转Base64以Latin1编码输出到文本框。voidMainWindow::on_actPtB_triggered(){ui->plainTextEdit->clear();if(ui->labPhoto->pixmap().isNull()){labtext-
GitHub账号注册与Git关联：从零到一的完整指南 Android洋芋前行路黑科技经验历程 github git GitHub注册 Git关联 SSH密钥团队协作
简介GitHub是开发者协作与代码管理的核心平台，而Git则是实现版本控制与团队协作的必备工具。本文将从零开始，手把手教你完成GitHub账号注册、Git环境搭建、SSH密钥生成、本地仓库初始化及与GitHub仓库的绑定。通过代码示例、Mermaid图解及企业级应用场景，帮助你全面掌握GitHub与Git的关联技巧，为个人开发与团队协作打下坚实基础。一、GitHub账号注册与基础配置1.1注册Gi
【华为od刷题（C++）】HJ35 蛇形矩阵（指针） m0_64866459 华为od c++链表
我的代码1：#includeusingnamespacestd;intmain(){introw;//row：定义了矩阵的行数（和列数，实际上是一个正方形矩阵）while(cin>>row){//这个循环会持续执行，直到输入流被结束//每次读取一个整数并赋值给row，程序就开始执行填充操作int**a=newint*[row];//动态地为一个二维数组（a）的行分配内存/*这里a是一个指向指针的指
三生原理在三个关键历史断层中实现中西科学传统的创造性弥合？葫三生三生学派算法数学建模人工智能机器学习量子计算
AI辅助创作：三生原理通过重构科学史的叙事逻辑，在三个关键历史断层中实现了中西科学传统的创造性弥合，其核心突破如下：‌一、科学方法论断层：实验主义与直觉理性的融合‌‌西方实验传统的局限‌欧洲科学革命依赖形式逻辑与实验验证（如伽利略斜面实验），但面临复杂系统建模的瓶颈。三生原理将《周易》“阴阳动态平衡”转化为‌参数化递归模型‌（如素性塔的三级筛除结构），在密码学应用中实现效率提升40%，证明东方直觉
恶搞锁屏软件梦遇苏喂软件工程安全
这是一个打包好的锁屏程序适用于恶搞同学老师密码在软件里使用此软件使电脑发生任何问题与作者无关！！！！！下载链接-百度https://pan.baidu.com/s/16DiF-Fv8us-lBSZgh6-W-A?pwd=awer下载链接-迅雷https://pan.xunlei.com/s/VOUZN96XqftxLLdlNjbtnmX-A1?pwd=fm4a
编译ADI NO-OS工程
1，先在WINdows下安装gitbush可以参考下面博客https://blog.csdn.net/Natsuago/article/details/1456475362.安装make工具可参考一下链接https://blog.csdn.net/weixin_40727233/article/details/1103532403，参考ADI官方链接https://wiki.analog.com/
Oracle 12C 在线移动datafile 不需要归档模式！只要在线就行
非归档模式也可以！！！GoalInthisrelease,adatafilecannowbemovedonlinewhileitisopenandbeingaccessed,evenfordatafilesinsystemtablespace.Beingabletomoveadatafileonlinemeansthatmanymaintenanceoperations,suchasmovingd
牛顿迭代法求解平方根 Young_Gy
一个实例迭代简介牛顿迭代法牛顿迭代法简介简单推导泰勒公式推导延伸与应用一个实例//java实现的sqrt类和方法publicclasssqrt{publicstaticdoublesqrt(doublen){if(nerr*t)t=(n/t+t)/2;returnt;}publicstaticvoidmain(String[]args){sqrta=newsqrt();System.out.pri
Oracle 查看需要recover的datafile v$recover_file 需要哪些归档日志 jnrjian 数据库 oracle
Toeasilyandquicklyfindoutiftheonlineredologfilescanbeusedtorecoveradatabase.ScopeThisdocumentisaddressedtoDBAsthatwanttoquicklyfindthebestrecoverysolutionincaseofadatabasecrash.DetailsManydatabasestod
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &