CV_ML_DP

【机器学习】【Apriori算法-2】Apriori算法的Python实现 + 代码讲解

1.Apriori算法原理详解

请详见：Apriori算法原理详解+示例展示数学求解过程

2.Python实现Apriori算法

2.1算法的重要Python操作知识点

实现Apriori算法时，重要Python知识点：

1）如何实现二维list 转化为set

2）如何判断list A是list B的子集

此处A和B是一维序列；另外A是B的有序子集，比如[1, 3]是[1,2,3]的有序子集，但不是[3, 2, 1]的有序子集

3）如何实现由[[1], [2], [3]]得到[[1, 2], [1, 3], [2, 3]]

4）如何实现由[[1, 2], [1, 3], [2, 3], [2, 4], [3, 4]]得到[[1,2,3], [1,2,4], [1,3,4], [2,3,4]]

这个是Apriori的重要操作。是根据旧的支持数据集得到新的支持数据集的关键操作。

5）算法的另外一个关键操作是，计算一个序列在序列列表里面的出现次数

注：下面2.2是精简的Python代码，2.3是展示数学求解过程的Python代码，如果是理解算法思路可以看2.3的代码，其他可以看2.2代码。

2.2精简的Python代码

# -*- coding: utf-8 -*-
"""
@author: Tom
Talk is cheap, show me the code
Aim:实现Apriori算法
"""

import numpy as np

class CApriori(object):
    '''
    实现Apriori算法
    '''
    def __init__(self, goods, minSupport):
        self.goods = goods           #交易商品列表
        #最小支持度，支持度过滤时支持度小于此值的频繁项会被过滤掉
        self.minSupport = minSupport 
        
        self.N = np.shape(goods)[0]  #交易次数
        self.goodsSet = set([])      #商品集合, 元素是单个商品
        self.max_len  = 0            #最长交易的商品总数
        #支持数据集，元素是[频繁项, 支持项]，频繁项=商品序列list, 支持项=支持度*交易总次数
        self.supportData = []        
        
        self._init() #初始化
        self._work() #开始迭代运算直到找到支持数据集
        
    def _isSubset(self, A, B):
        '''判断序列a是否序列b的子集，且是有序子集，此处有序子集详见下面Note
        :param a, 一维序列
        :param b, 一维序列
        :return True:a是b的子集，False：a不是b的子集
        :Note [1, 3] 是 [1, 2, 3]的有序子集，[3, 1]不是[1, 2, 3]的有序子集
        '''
        A,B = list(A),list(B)
        if np.shape(A)[0] == 0:
            return False

        pre_ind = -1
        for e in A:
            if e not in B: #不是子集
                return False
            elif B.index(e) < pre_ind: #不满足有序
                return False
            pre_ind = B.index(e)

        return True

    def _support(self, item, goods):
        '''
        :param item, 频繁项
        :param goods, 交易商品列表
        :return 频繁项的支持度
        '''
        subset_cnt = [self._isSubset(item, e) for e in goods]
        cnt = subset_cnt.count(True)
        support = cnt * 1.0 / self.N
        return support
        
    def _init(self):
        '''初始化支持数据集和迭代计数器
        '''
        self.supportData = []
        #设置迭代计数器
        for item in self.goods:
            if np.shape(item)[0] > self.max_len:
                self.max_len = np.shape(item)[0]
        #交易商品数据，一维list
        goods_data = []
        for e in self.goods:
            goods_data.extend(e)

        #交易商品集合，set
        self.goodsSet = set(goods_data)
        
        #初始数据集(频繁项，支持项)
        for i in range(len(self.goodsSet)):
            e = list(self.goodsSet)[i] #频繁项，单个商品
            cnt = goods_data.count(e)  #支持项
            support = cnt *1.0 / self.N
            if (support >= self.minSupport):
                self.supportData.append([[e], cnt])
        return self.supportData, self.max_len
        
    def _uniq(self, supportData):
        '''去除支持数据集中的重复频繁项，重复频繁项的产生示例:
         [1, 2, 3] 和 [1, 3, 5] 组合成频繁项: [1, 2, 3, 5]
         [1, 2, 3] 和 [2, 3, 5] 组合成频繁项: [1, 2, 3, 5]
        '''
        newSupportData = []
        data = []  #频繁项
        for e in supportData:
            if e[0] not in data:
                data.append(e[0])
                newSupportData.append(e)
        return newSupportData
        
    def _work(self):
        '''Apriori发现频繁项和支持项，即支持数据集
        '''
        preData = self.supportData
        
        #Apriori算法发现频繁项集的过程代码
        new_supportData = []
        for i in range(np.shape(preData)[0]):
            e = preData[i][0] #就频繁项, current item in current supportdata
            #旧频繁项发现新的频繁项，只考虑后面的旧频繁项配对发现新的频繁项（提高算法时间性能）
            for j in np.arange(start=i+1, stop=len(preData)):
                be = preData[j][0] #item at the back of current item 
                #发现新数据集的频繁项, new_e
                new_e = []
                if 1 == np.shape(e)[0]:#旧频繁项是初始频繁项
                    new_e = e + be
                elif be.count(e[-1]) > 0 and be[-1] != e[-1]:
                    ind = be.index(e[-1])
                    new_e = e + be[ind+1:len(be)]
                if 0 == np.shape(new_e)[0]:
                    continue
                #支持度过滤
                support = self._support(new_e, self.goods)
                if (support >= self.minSupport):
                    new_supportData.append([new_e, support*self.N]) #[频繁项，支持项]
        #更新支持数据集,使用重复频繁项去重后的支持数据集
        self.supportData = self._uniq(new_supportData)
        if 0 == np.shape(self.supportData)[0] or self.max_len == np.shape(self.supportData[0][0])[0]:
            return self.supportData #exit apriori algorithm
        else:
            return self._work() #开始下次迭代计算
        
    def GetSupportData(self):
        return self.supportData

if __name__=='__main__':
    goods = [[1, 2, 5],
             [2, 4],
             [2, 3],
             [1, 2, 4],
             [1, 3],
             [2, 3],
             [1, 3],
             [1, 2, 3, 5],
             [1, 2, 3, 5],
             [1, 2, 3]]
    minSupport = 0.2
    apr = CApriori(goods, minSupport)
    
    supportData = apr.GetSupportData()
    print('最小支持度:', minSupport)
    print('交易商品列表:\n', goods)
    print('Apriori得到的支持数据集:\n', np.array(supportData))

运行结果

最小支持度: 0.2
交易商品列表:
 [[1, 2, 5], [2, 4], [2, 3], [1, 2, 4], [1, 3], [2, 3], [1, 3], [1, 2, 3, 5], [1, 2, 3, 5], [1, 2, 3]]
Apriori得到的支持数据集:
 [[[1, 2, 3, 5] 2.0]]

2.3Python实现代码

人肉出品，代码详见：

# -*- coding: utf-8 -*-
"""
@author: Tom
Talk is cheap, show me the code
Aim:实现Apriori算法
"""

import numpy as np

class CApriori(object):
    '''
    实现Apriori算法
    '''
    def __init__(self, goods, minSupport):
        self.goods = goods           #交易商品列表
        #最小支持度，支持度过滤时支持度小于此值的频繁项会被过滤掉
        self.minSupport = minSupport 
        
        self.N = np.shape(goods)[0]  #交易次数
        self.goodsSet = set([])      #商品集合, 元素是单个商品
        self.max_len  = 0            #最长交易的商品总数
        self.debug_cnt = 0           #记录迭代次数，调试使用，可以删除此变量
        #支持数据集，元素是[频繁项, 支持项]，频繁项=商品序列list, 支持项=支持度*交易总次数
        self.supportData = []        
        
        self._init() #初始化
        self._work() #开始迭代运算直到找到支持数据集
        
    def _isSubset(self, A, B):
        '''判断序列a是否序列b的子集，且是有序子集，此处有序子集详见下面Note
        :param a, 一维序列
        :param b, 一维序列
        :return True:a是b的子集，False：a不是b的子集
        :Note [1, 3] 是 [1, 2, 3]的有序子集，[3, 1]不是[1, 2, 3]的有序子集
        '''
        A,B = list(A),list(B)
        if np.shape(A)[0] == 0:
            return False

        pre_ind = -1
        for e in A:
            if e not in B: #不是子集
                return False
            elif B.index(e) < pre_ind: #不满足有序
                return False
            pre_ind = B.index(e)

        return True

    def _support(self, item, goods):
        '''
        :param item, 频繁项
        :param goods, 交易商品列表
        :return 频繁项的支持度
        '''
        subset_cnt = [self._isSubset(item, e) for e in goods]
        cnt = subset_cnt.count(True)
        support = cnt * 1.0 / self.N
        return support
        
    def _init(self):
        '''初始化支持数据集和迭代计数器
        '''
        N,goods,minSupport = self.N, self.goods,self.minSupport
        self.supportData = []
        
        #设置迭代计数器
        for item in goods:
            if np.shape(item)[0] > self.max_len:
                self.max_len = np.shape(item)[0]
        
        #交易商品数据，一维list
        goods_data = []
        for e in goods:
            goods_data.extend(e)

        #交易商品集合，set
        self.goodsSet = set(goods_data)
        
        #初始数据集(频繁项，支持项)
        for i in range(len(self.goodsSet)):
            e = list(self.goodsSet)[i] #初始频繁项
            cnt = goods_data.count(e)
            support = cnt *1.0 / N
            if (support >= minSupport):
                self.supportData.append([[e], cnt])
                
        #debug
        self.debug_cnt += 1
        print('=================迭代执行次数:', self.debug_cnt)
        print('交易商品列表:\n', goods)
        print('最长交易记录的商品总数为:', self.max_len)
        print('交易商品集合:\n', self.goodsSet)
        print('初始数据集:\n', self.supportData)
        
    def _uniq(self, supportData):
        '''去除支持数据集中的重复频繁项，重复频繁项的产生示例:
         [1, 2, 3] 和 [1, 3, 5] 组合成频繁项: [1, 2, 3, 5]
         [1, 2, 3] 和 [2, 3, 5] 组合成频繁项: [1, 2, 3, 5]
        '''
        newSupportData = []
        data = []  #频繁项
        for e in supportData:
            if e[0] not in data:
                data.append(e[0])
                newSupportData.append(e)
        return newSupportData
        
    def _work(self):
        '''Apriori的主体函数，发现新的频繁项和支持项，即由旧的支持数据集发现新的支持数据集，直到发现完成
        '''        
        self.debug_cnt += 1
        print('\n=================迭代执行次数:', self.debug_cnt)
        N,goods,minSupport = self.N, self.goods,self.minSupport
        preData = self.supportData
        
        #Apriori算法发现频繁项集的过程代码
        new_supportData = []
        for i in range(np.shape(preData)[0]):
            print('\n',preData[i][0],'go to 发现新的频繁项:')
            #旧频繁项e
            e = preData[i][0] #current item in current supportdata
            #旧频繁项发现新的频繁项，只考虑后面的旧频繁项配对发现新的频繁项（提高算法时间性能）
            for j in np.arange(start=i+1, stop=len(preData)):
                be = preData[j][0] #item at the back of current item 
                #发现新数据集的频繁项, new_e
                new_e = []
                if 1 == np.shape(e)[0]:#旧频繁项是初始频繁项
                    new_e = e + be
                elif be.count(e[-1]) > 0 and be[-1] != e[-1]:
                    ind = be.index(e[-1])
                    new_e = e + be[ind+1:len(be)]
                if 0 == np.shape(new_e)[0]:
                    print('\t',e,'和',be ,'无法组合成新的频繁项.')
                    continue
                #支持度过滤
                support = self._support(new_e, goods)
                if (support >= minSupport):
                    new_supportData.append([new_e, support*N])
                    print('\t',e,'和',be ,'组合成频繁项:',new_e,'支持度:',support,'经过支持度过滤，增加此频繁项:', np.array([new_e, support*N]))
                else: #debug
                    print('\t',e,'和',be ,'组合成频繁项:',new_e,'支持度:',support,'经过支持度过滤，丢弃此频繁项:', np.array([new_e, support*N]))
        #更新支持数据集,使用重复频繁项去重后的支持数据集
        self.supportData = self._uniq(new_supportData)
        print('\nnew_supportData:\n', np.array(new_supportData))
        if 0 == np.shape(self.supportData)[0] or self.max_len == np.shape(self.supportData[0][0])[0]:
            print('Apriori succeed, supportData:\n', np.array(self.supportData))
        else:
            return self._work()

        print('======exit Apriori======\n')
        return self.supportData
        
    def GetSupportData(self):
        return self.supportData

if __name__=='__main__':
    goods = [[1, 2, 5],
             [2, 4],
             [2, 3],
             [1, 2, 4],
             [1, 3],
             [2, 3],
             [1, 3],
             [1, 2, 3, 5],
             [1, 2, 3, 5],
             [1, 2, 3]]
    minSupport = 0.2
    apr = CApriori(goods, minSupport)
    
    supportData = apr.GetSupportData()
    print('最小支持度:', minSupport)
    print('交易商品列表:\n', goods)
    print('最小支持度为%f时的支持数据集为:\n'%minSupport, np.array(supportData))

3.运行结果

=================迭代执行次数: 1
交易商品列表:
 [[1, 2, 5], [2, 4], [2, 3], [1, 2, 4], [1, 3], [2, 3], [1, 3], [1, 2, 3, 5], [1, 2, 3, 5], [1, 2, 3]]
最长交易记录的商品总数为: 4
交易商品集合:
 {1, 2, 3, 4, 5}
初始数据集:
 [[[1], 7], [[2], 8], [[3], 7], [[4], 2], [[5], 3]]

=================迭代执行次数: 2

 [1] go to 发现新的频繁项:
         [1] 和 [2] 组合成频繁项: [1, 2] 支持度: 0.5 经过支持度过滤，增加此频繁项: [[1, 2] 5.0]
         [1] 和 [3] 组合成频繁项: [1, 3] 支持度: 0.5 经过支持度过滤，增加此频繁项: [[1, 3] 5.0]
         [1] 和 [4] 组合成频繁项: [1, 4] 支持度: 0.1 经过支持度过滤，丢弃此频繁项: [[1, 4] 1.0]
         [1] 和 [5] 组合成频繁项: [1, 5] 支持度: 0.3 经过支持度过滤，增加此频繁项: [[1, 5] 3.0]

 [2] go to 发现新的频繁项:
         [2] 和 [3] 组合成频繁项: [2, 3] 支持度: 0.5 经过支持度过滤，增加此频繁项: [[2, 3] 5.0]
         [2] 和 [4] 组合成频繁项: [2, 4] 支持度: 0.2 经过支持度过滤，增加此频繁项: [[2, 4] 2.0]
         [2] 和 [5] 组合成频繁项: [2, 5] 支持度: 0.3 经过支持度过滤，增加此频繁项: [[2, 5] 3.0]

 [3] go to 发现新的频繁项:
         [3] 和 [4] 组合成频繁项: [3, 4] 支持度: 0.0 经过支持度过滤，丢弃此频繁项: [[3, 4] 0.0]
         [3] 和 [5] 组合成频繁项: [3, 5] 支持度: 0.2 经过支持度过滤，增加此频繁项: [[3, 5] 2.0]

 [4] go to 发现新的频繁项:
         [4] 和 [5] 组合成频繁项: [4, 5] 支持度: 0.0 经过支持度过滤，丢弃此频繁项: [[4, 5] 0.0]

 [5] go to 发现新的频繁项:

new_supportData:
 [[[1, 2] 5.0]
 [[1, 3] 5.0]
 [[1, 5] 3.0]
 [[2, 3] 5.0]
 [[2, 4] 2.0]
 [[2, 5] 3.0]
 [[3, 5] 2.0]]

=================迭代执行次数: 3

 [1, 2] go to 发现新的频繁项:
         [1, 2] 和 [1, 3] 无法组合成新的频繁项.
         [1, 2] 和 [1, 5] 无法组合成新的频繁项.
         [1, 2] 和 [2, 3] 组合成频繁项: [1, 2, 3] 支持度: 0.3 经过支持度过滤，增加此频繁项: [[1, 2, 3] 3.0]
         [1, 2] 和 [2, 4] 组合成频繁项: [1, 2, 4] 支持度: 0.1 经过支持度过滤，丢弃此频繁项: [[1, 2, 4] 1.0]
         [1, 2] 和 [2, 5] 组合成频繁项: [1, 2, 5] 支持度: 0.3 经过支持度过滤，增加此频繁项: [[1, 2, 5] 3.0]
         [1, 2] 和 [3, 5] 无法组合成新的频繁项.

 [1, 3] go to 发现新的频繁项:
         [1, 3] 和 [1, 5] 无法组合成新的频繁项.
         [1, 3] 和 [2, 3] 无法组合成新的频繁项.
         [1, 3] 和 [2, 4] 无法组合成新的频繁项.
         [1, 3] 和 [2, 5] 无法组合成新的频繁项.
         [1, 3] 和 [3, 5] 组合成频繁项: [1, 3, 5] 支持度: 0.2 经过支持度过滤，增加此频繁项: [[1, 3, 5] 2.0]

 [1, 5] go to 发现新的频繁项:
         [1, 5] 和 [2, 3] 无法组合成新的频繁项.
         [1, 5] 和 [2, 4] 无法组合成新的频繁项.
         [1, 5] 和 [2, 5] 无法组合成新的频繁项.
         [1, 5] 和 [3, 5] 无法组合成新的频繁项.

 [2, 3] go to 发现新的频繁项:
         [2, 3] 和 [2, 4] 无法组合成新的频繁项.
         [2, 3] 和 [2, 5] 无法组合成新的频繁项.
         [2, 3] 和 [3, 5] 组合成频繁项: [2, 3, 5] 支持度: 0.2 经过支持度过滤，增加此频繁项: [[2, 3, 5] 2.0]

 [2, 4] go to 发现新的频繁项:
         [2, 4] 和 [2, 5] 无法组合成新的频繁项.
         [2, 4] 和 [3, 5] 无法组合成新的频繁项.

 [2, 5] go to 发现新的频繁项:
         [2, 5] 和 [3, 5] 无法组合成新的频繁项.

 [3, 5] go to 发现新的频繁项:

new_supportData:
 [[[1, 2, 3] 3.0]
 [[1, 2, 5] 3.0]
 [[1, 3, 5] 2.0]
 [[2, 3, 5] 2.0]]

=================迭代执行次数: 4

 [1, 2, 3] go to 发现新的频繁项:
         [1, 2, 3] 和 [1, 2, 5] 无法组合成新的频繁项.
         [1, 2, 3] 和 [1, 3, 5] 组合成频繁项: [1, 2, 3, 5] 支持度: 0.2 经过支持度过滤，增加此频繁项: [[1, 2, 3, 5] 2.0]
         [1, 2, 3] 和 [2, 3, 5] 组合成频繁项: [1, 2, 3, 5] 支持度: 0.2 经过支持度过滤，增加此频繁项: [[1, 2, 3, 5] 2.0]

 [1, 2, 5] go to 发现新的频繁项:
         [1, 2, 5] 和 [1, 3, 5] 无法组合成新的频繁项.
         [1, 2, 5] 和 [2, 3, 5] 无法组合成新的频繁项.

 [1, 3, 5] go to 发现新的频繁项:
         [1, 3, 5] 和 [2, 3, 5] 无法组合成新的频繁项.

 [2, 3, 5] go to 发现新的频繁项:

new_supportData:
 [[[1, 2, 3, 5] 2.0]
 [[1, 2, 3, 5] 2.0]]
Apriori succeed, supportData:
 [[[1, 2, 3, 5] 2.0]]
======exit Apriori======

最小支持度: 0.2
交易商品列表:
 [[1, 2, 5], [2, 4], [2, 3], [1, 2, 4], [1, 3], [2, 3], [1, 3], [1, 2, 3, 5], [1, 2, 3, 5], [1, 2, 3]]
最小支持度为0.200000时的支持数据集为:
 [[[1, 2, 3, 5] 2.0]]

（end）

国内领先的AI智能体平台大比拼 zhulangfly AI 人工智能智能体
在当今人工智能飞速发展的时代，AI智能体平台如雨后春笋般涌现，为各行业带来了前所未有的创新机遇。今天，我们就来深入了解一下国内几家做得相当出色的AI智能体平台，包括百度的文心智能体平台、阿里巴巴的魔塔智能体平台、腾讯的元器智能体开放平台以及字节跳动的扣子AI平台，看看它们各自都有哪些独特之处，以及在市场中的表现如何。一、百度文心智能体平台详细介绍百度文心智能体平台依托百度强大的人工智能技术研发实力
从自然语言到提示词：编程范式的革命 AI天才研究院计算机软件编程原理与应用实践大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
从自然语言到提示词：编程范式的革命关键词：编程范式、自然语言处理、提示词编程、人工智能、算法原理摘要：随着人工智能技术的不断发展，编程范式正经历着从自然语言处理向基于提示词的人工智能编程模式的转变。本文旨在探讨这一转变的背景、动机、原理及其在软件开发实践和工程方法论中的影响。文章将逐步分析自然语言处理和提示词编程的核心概念，讲解算法原理和数学模型，并通过实际案例展示编程范式转变的应用效果。第一部分
嵌入式专业英语(第二周) 佩佩(@ 。 @) c语言 linux
在第一周的基础上增加一、学预科准备、linux基础接触的专业英文、知识点Crack：破解，裂开virtualmachine：虚拟机terminal：终端，站台Permissiondenied：权限不允许password：密码remove：删除regular：普通的empty：空的directory：目录、路径、文件夹名cannot：不能necessary：必须的catch：抓取omitting：省
【AI论文】PaSa：一款用于全面学术论文搜索的大型语言模型（LLM）代理东临碣石82 人工智能语言模型自然语言处理
摘要：我们推出了PaSa，这是一款由大型语言模型驱动的高级论文搜索代理。PaSa能够自主做出一系列决策，包括调用搜索工具、阅读论文以及选择相关参考文献，从而最终为复杂的学术查询提供全面且准确的结果。我们使用强化学习方法和一个合成数据集AutoScholarQuery对PaSa进行了优化，该数据集包含3.5万个细粒度的学术查询以及来自顶级人工智能会议出版物的相应论文。此外，我们还开发了RealSch
ChatGPT写作助手：论文写作必备提示词一览学境思源AcademicIdeas 学境思源 ChatGPT AI写作 chatgpt
随着人工智能技术的发展，ChatGPT在学术写作领域的应用越来越广泛。它不仅能够帮助撰写论文，还可以通过不同的提示词完成构思、文献综述、数据分析、润色等任务，极大提升写作效率。今天的内容将分享ChatGPT在论文写作中最常用的提示词，帮助学术工作者更好地利用这一工具，从构思到定稿，全方位提升写作体验与效率。1.论文构思与选题目的：帮助确定研究方向、制定研究问题和目标。常用提示词：“提出一个关于[主
AI写代码工具：程序员的效率利器与职业发展新机遇前端
在如今竞争激烈的职业环境中，个人职业发展至关重要。提升工作效率，专注于核心竞争力，已成为每位职场人士，特别是程序员的共同追求。而随着人工智能技术的飞速发展，各种AI写代码工具应运而生，为程序员们提供了前所未有的效率提升和职业发展新机遇。本文将深入探讨AI代码生成工具如何帮助程序员提升效率，掌握新技术，并最终促进职业发展。提升效率，专注核心竞争力程序员的工作常常涉及大量重复性的代码编写，例如前端页面
AI代码生成器赋能跨平台开发：效率提升与未来展望前端
跨平台开发一直以来都是软件开发领域的一大挑战。开发者们常常面临着效率低下、开发成本高昂以及不同平台适配性差等难题。为了在iOS、Android、Web等多个平台上部署应用，开发者需要编写大量的平台特定代码，这不仅耗时费力，而且容易出错，极大增加了项目开发的复杂性和风险。然而，随着人工智能技术的快速发展，特别是AI代码生成器的出现，为解决这些难题带来了新的希望，为跨平台开发带来了革命性的变革。智能适
AI代码生成器赋能跨平台开发：效率提升与未来展望前端
跨平台开发一直以来都是软件开发领域的一大挑战。开发者们常常面临着效率低下、开发成本高昂以及不同平台适配性差等难题。为了在iOS、Android、Web等多个平台上部署应用，开发者需要编写大量的平台特定代码，这不仅耗时费力，而且容易出错，极大增加了项目开发的复杂性和风险。然而，随着人工智能技术的快速发展，特别是AI代码生成器的出现，为解决这些难题带来了新的希望，为跨平台开发带来了革命性的变革。智能适
OpenCompass评测大模型辣条少年人工智能
OpenCompass简介上海人工智能实验室科学家团队于2024.01.30正式发布了大模型开源开放评测体系“司南”(OpenCompass2.0)，用于为大语言模型、多模态模型等提供一站式评测服务。OpenCompass平台广泛支持超过100种HuggingFace和API模型，融合了100多个数据集，包含约40万个问题，用以从八个维度评估模型。其高效的分布式评估系统能够快速且全面地评估十亿级规
销售易CRM：引领数字化转型，助力企业智能增长人工智能程序员
在全球数字化浪潮下，企业对智能化、数字化转型的需求愈发迫切。销售易CRM作为中国领先的企业级智能CRM解决方案提供商，凭借其强大的产品能力、丰富的行业经验和卓越的服务品质，成为众多知名企业的首选合作伙伴。本文将深入分析销售易CRM的核心优势，以及其如何助力企业实现数字化转型与业务增长。一、销售易CRM的核心优势领先的技术实力销售易CRM基于自主研发的新一代智能商业引擎，将人工智能、大数据分析等前沿
销售易与Salesforce：CRM市场的龙争虎斗 crmsaas
在当今数字化时代，客户关系管理软件在企业运营中扮演着至关重要的角色。销售易和Salesforce作为两款备受瞩目的CRM软件，各自具有独特的特点和优势。销售易是连续8年成为唯一入选Gartner销售自动化魔力象限的中国CRM厂商，并且在多项能力指标上超越国际厂商。在中国，销售易在大中型企业市场占有率排名第一，它通过整合移动、社交、人工智能、大数据和物联网技术，提供了全面的业务管理解决方案，被多家5
机器学习、基础算法、python常见面试题必知必答系列大全：（面试问题持续更新） promptllm人工智能
基础算法常见面试篇1.1过拟合和欠拟合常见面试篇一、过拟合和欠拟合是什么？二、过拟合/高方差（overfiting/highvariance）篇2.1过拟合是什么及检验方法？2.2导致过拟合的原因是什么？2.3过拟合的解决方法是什么？三、欠拟合/高偏差（underfiting/highbias）篇3.1欠拟合是什么及检验方法？3.2导致欠拟合的原因是什么？3.3过拟合的解决方法是什么？1.2Bat
深度学习模型开发文档 Ares代码行者深度学习
深度学习模型开发文档1.简介2.深度学习模型开发流程3.数据准备3.1数据加载3.2数据可视化4.构建卷积神经网络(CNN)5.模型训练5.1定义损失函数和优化器5.2训练过程6.模型评估与优化6.1模型评估6.2超参数调优7.模型部署8.总结参考资料1.简介深度学习是人工智能的一个分支，利用多层神经网络从数据中提取特征并进行学习。它被广泛应用于图像识别、自然语言处理、语音识别等领域。本文将以构建
AI 基础设施的儿童保护：智能化儿童安全监护系统 AI天才研究院【精选大厂面试题详解】大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
AI基础设施的儿童保护：智能化儿童安全监护系统随着人工智能技术的快速发展，AI基础设施在儿童保护方面发挥着越来越重要的作用。智能化儿童安全监护系统通过应用AI技术，为儿童的安全保驾护航。本文将探讨该领域的典型问题/面试题库和算法编程题库，并给出详尽的答案解析说明和源代码实例。1.AI技术在儿童保护中的应用题目：请简要介绍AI技术在儿童保护中的几种应用。答案：AI技术在儿童保护中的应用主要包括：人脸
2024全球十大工程成就：文生视频大模型Sora引领AI时代前端
2024年，中国工程院院刊《Engineering》公布了备受瞩目的“2024全球十大工程成就”，这不仅是对过去一年工程科技领域杰出贡献的肯定，更标志着全球科技发展进入一个新的阶段。这十大成就涵盖了航天探索、生物医学、人工智能、新能源等多个领域，体现了当今科技前沿的最高水平。其中，文生视频大模型Sora的入选尤为引人注目，它代表着AI代码生成技术在内容创作领域的突破性进展，预示着未来内容生产方式的
CES Asia 2025优惠期倒计时5天，科技盛宴即将开启赛逸展张胜科技
随着时间的推移，备受瞩目的CESAsia2025优惠期已进入最后5天倒计时。作为亚洲顶级的消费电子盛会，CESAsia2025将汇聚众多国内外知名的科技企业，展示涵盖智能家居、智能出行、虚拟现实、人工智能等热门赛道的顶尖成果，是行业交流、商贸合作、趋势洞察的绝佳平台。在这最后的优惠时段内，参展商们仍有机会享受到展位费用的梯度折扣，越早锁定，优惠力度越大，还能优先挑选心仪展位，获得额外的宣传推广资源
AI Agent 原理解析及应用场景深度洞察 power-辰南大模型算法实战工程人工智能 ai agent 大模型
在当今科技飞速发展的时代，AIAgent作为人工智能领域的重要分支，正以其独特的智能特性和广泛的应用潜力，逐渐渗透到各个行业和我们生活的方方面面。它为解决复杂问题、提升系统效率和实现智能化交互提供了全新的途径。本文将深入剖析AIAgent的原理，并详细探讨其在多个领域的关键应用场景。一、AIAgent的定义与基本概念AIAgent，即人工智能代理，是一种能够感知其所处环境，并基于所感知的信息自主地
1. 基于大模型能力，如何提炼出优质prompt（入门版）姚瑞南 prompt系列课程人工智能 AIGC chatgpt
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）本文简介：入门版：基于大模型能力，如何提炼出优质prompt提示词的重要性和价值大模型基础能力简介prompt的基本定义如何定义优质的promptprompt的万能公式与套路prom
从System Prompt来看GPT-3.5到GPT-4的进化 herosunly 大模型 system prompt gpt-3 chatgpt gpt4 gpt4o
大家好，我是herosunly。985院校硕士毕业，现担任算法t研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了从SystemPrompt来看GPT-3.5到GPT-4的进化之路，希
R语言机器学习算法实战系列（十九）特征选择之Monte Carlo算法（Monte Carlo Feature Selection）生信学习者1 R语言机器学习实战 r语言机器学习算法数据分析数据挖掘数据可视化人工智能
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍原理步骤下载数据加载R包导入数据数据预处理数据分割MCFS运行MCFS-ID过程混淆矩阵重要特征的RI最小阈值距离与共同部分收敛特征重要性排序选择重要特征构建特征依赖图提取重要特征基于重要特征构建随机森林模型混淆矩阵评估模型AUC曲线刻画模型在训练和测试数据集的表现总结系统信息介绍特征选择（FeatureSel
F#语言的图形用户界面沈霁晨包罗万象 golang 开发语言后端
F#语言的图形用户界面开发引言随着软件开发的日益复杂化，图形用户界面（GUI）在现代应用程序中的重要性不可忽视。它提供了一种直观的方式，使用户能够与应用程序进行交互。F#语言作为一种函数式编程语言，近年来在开发领域越来越受到关注，尤其是在数据分析和机器学习领域。但F#同样能够用于图形用户界面的开发，尤其是结合.NET平台及其丰富的库。本文将深入探讨F#语言在图形用户界面开发中的应用，包括常用的框架
【Springboot】——响应与分层解耦架构 Y小夜架构 spring boot 后端 java spring
博主现有专栏：C51单片机（STC89C516），c语言，c++，离散数学，算法设计与分析，数据结构，Python，Java基础，MySQL，linux，基于HTML5的网页设计及应用，Rust（官方文档重点总结），jQuery，前端vue.js，Javaweb开发，设计模式、Python机器学习、Springboot等主页链接：Y小夜-CSDN博客目录响应响应数据✨@ResponseBody✨G
AI系统架构原理与代码实战案例讲解 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI系统架构原理与代码实战案例讲解1.背景介绍1.1人工智能的发展历程1.1.1人工智能的起源与早期发展人工智能的概念可以追溯到上世纪50年代，图灵测试的提出标志着人工智能作为一门学科的诞生。早期的研究主要集中在符号推理、专家系统等领域，取得了一些突破，例如机器定理证明、西洋跳棋程序等。1.1.2人工智能的黄金时期上世纪80年代，随着专家系统的兴起，人工智能进入了一个黄金时期。专家系统通过模拟人类
【多模态 AI】从跨模态学习到生成革命：文本、图像与音频的深度交融网罗开发人工智能 AI 大模型机器学习人工智能 AIGC
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
美国采取行动扩大人工智能出口限制数据分析能量站机器学习人工智能
大幅拓展限制：美国政府（拜登执政末期提出）出台新规，显著扩大人工智能技术出口限制，构建针对先进芯片与模型获取的国际分级体系。出口限制范围：对多数国家限制出口人工智能芯片与模型，仅少数亲密盟友除外。新规创建三级体系，对不同国家区别对待，并首次限制大型AI模型封闭权重出口。规则运作方式意见征询与生效：新规在媒体曝光后发布，设120天公众意见征询期，供新政府参考调整，预计一年后生效。国家分级及限制一级国
通用人工智能的多层次提示词架构 AI天才研究院计算机软件编程原理与应用实践大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
通用人工智能的多层次提示词架构关键词通用人工智能（AGI），多层提示词架构，人工智能设计原则，算法原理，系统架构设计，应用案例摘要本文将深入探讨通用人工智能（AGI）的多层次提示词架构，阐述其背景、核心概念、设计原则和实现方法。我们将逐步分析这一架构在不同领域的应用，并展望其未来的发展方向。通过本文，读者将了解如何构建能够模拟人类智能的多层次提示词系统，并思考其在实际应用中的潜力与挑战。目录第一部
半导体、芯片、人工智能、智能驾驶汽车的趋势不爱原创的Yoga 人工智能汽车
1.市场增长与需求汽车半导体市场：预计到2025年，中国汽车半导体市场仍将保持稳健增长态势，AI和能源将成为未来最重要的两大变革因素。2023年中国汽车电子芯片行业市场规模约为820.8亿元，预计2024年有望增至905.4亿元左右。随着新能源汽车和智能化的快速发展，一些新的半导体技术在中国汽车领域迅速应用，如集中式架构和高性能处理器需求正日益增加。AI芯片市场：随着AI技术的不断普及和应用场景的
Minimax 开源的 4 百万超长上下文模型百态老人人工智能大数据笔记
MiniMax开源4百万超长上下文模型MiniMax开源模型概述2025年1月15日，MiniMax发布并开源了MiniMax-01全新系列模型，这一举措在人工智能领域引发了广泛关注。该系列包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax作为大模型六小强（或六小虎）企业之一，其推出的这一系列模型有着诸多独特之处。这一系列模型的开源是Min
程序员创业公司的技术栈选择与性能优化 AI天才研究院 ChatGPT AI大模型企业级应用开发实战大数据AI人工智能大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
《程序员创业公司的技术栈选择与性能优化》概述本文旨在探讨程序员创业公司在选择技术栈和进行性能优化方面的策略与实践。随着技术的不断进步和市场的快速变化，技术栈的选择和优化成为创业公司成功的关键因素。正确的技术栈选择不仅能够提升系统的性能和可扩展性，还能降低开发成本和维护难度。关键词技术栈选择性能优化创业公司云计算数据库微服务人工智能区块链边缘计算摘要本文首先分析了技术栈选择的重要性以及创业公司在技术
AI人工智能深度学习算法：高并发场景下深度学习代理的性能调优 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度学习代理的兴起近年来，随着人工智能技术的飞速发展，深度学习在各个领域都取得了显著的成果。特别是在自然语言处理、图像识别、语音识别等领域，深度学习模型的性能已经超越了传统方法。为了更好地将深度学习技术应用于实际场景，深度学习代理应运而生。深度学习代理是一种将深度学习模型封装起来，并提供对外接口的服务。它可以接收来自客户端的请求，将请求数据输入到深度学习模型中进行推理，并将推理结
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f