面狐

Apriori算法整理

实践课题报告： Apriori算法

学校：xxx大学

学院：大数据与智能工程学院

专业：信息工程（数据科学与大数据技术）

年级：2017级

姓名：xxx

指导老师：xxx

日期：2019 年 6 月 24 日

一、简介

关联规则学习（Association rule learning）是一种在大型数据库中发现变量之间的有趣性关系的方法。它的目的是利用一些有趣性的量度来识别数据库中发现的强规则。
关联分析是一种在大规模数据集中寻找有趣关系的任务。这些关系可以有两种形式:频繁项集或者关联规则。频繁项集(frequent item sets)是经常出现在一块的物品的集合,关联规则(association rules)暗示两种物品之间可能存在很强的关系。
这些关系可以有两种形式：频繁项集、关联规则。

频繁项集：经常出现在一块的物品的集合

关联规则：暗示两种物品之间可能存在很强的关系

二、挖掘步骤：

1.依据支持度找出所有频繁项集（频度）

2.依据置信度产生关联规则（强度）

三、基本概念

对于A->B

①支持度（support）：P(A ∩ B)，既有A又有B的概率： 

support({A,B}) = num(A∪B) / W = P(A∩B)
num(A∪B)表示含有物品集{A,B}的事务集的个数，不是数学中的并集。


②置信度（Confidence）：

P(B|A)，在A发生的事件中同时发生B的概率 p(AB)/P(A)：

Confidence(A->B) = support({A,B}) / support({A}) = P(B|A)     

例如购物车分析：牛奶 ⇒ 面包

例子：[支持度：3%，置信度：40%]

支持度3%：意味着3%顾客同时购买牛奶和面包

置信度40%：意味着购买牛奶的顾客40%也购买面包


③如果事件A中包含k个元素，那么称这个事件A为k项集事件A满足
最小支持度阈值的事件称为频繁k项集


④同时满足最小支持度阈值和最小置信度阈值的规则称为强规则

四、基本原理

apriori算法使用一种成为逐层搜索的迭代算法，其中k项集用于探索（k+1）项集。首先，通过扫描数据库，累计每个项的计数，并搜集满足最小支持度的项，找出频繁1项集的集合。该集合记为L1。然后，使用L1找出频繁2项集的集合L2，使用L2找出L3，如此下去，直到不能再找到频繁k项集。

该算法基本思路计算复杂度是非常大的。为了提高频繁项集的产生效率，使用先验性质（频繁项集的所有非空子集也一定是频繁的；换句话说，若某个集合存在一个非空子集不是频繁项集，则该集合不是频繁项集）来压缩搜索空间。

如何在算法中使用先验性质？为了理解这一点，我们考察如何使用Lk-1找出Lk，其中k>=2。主要由两步构成：连接步和剪枝步。

连接步：为找出Lk，通过将Lk-1与自身相连接产生候选集k项集的集合。该候选集的集合记为Ck。设l1和l2是Lk-1中的项集。记号li[j]表示li的第j项（例如，l1[k-2]表示l1的倒数第2项）。为了有效实现，apriori算法假定事务或项集中的项按字典序排列。对于（k-1）项集li，这意味着把项排序，使得li[1]（l1[2]=l2[2]）…^{（l1[k-2]=l2[k-2]）}（l1[k-1]

剪枝步： CK是LK的超集，也就是说，CK的成员可能是也可能不是频繁的。通过扫描所有的事务（交易），确定CK中每个候选的计数，判断是否小于最小支持度计数，如果不是，则认为该候选是频繁的。为了压缩Ck,可以利用Apriori性质：任一频繁项集的所有非空子集也必须是频繁的，反之，如果某个候选的非空子集不是频繁的，那么该候选肯定不是频繁的，从而可以将其从CK中删除。（该步利用了标红的先验性质）。

五、Java实现

运行环境：

1.eclipse开发工具
2.MySQL数据库

1、伪代码

算法：Apriori
	输入：D - 事务数据库；min_sup - 最小支持度计数阈值
	输出：L - D中的频繁项集
	方法：
		 L1=find_frequent_1-itemsets(D); // 找出所有频繁1项集
		 For(k=2;Lk-1!=null;k++){
			Ck=apriori_gen(Lk-1); // 产生候选，并剪枝
			For each 事务t in D{ // 扫描D进行候选计数
				Ct =subset(Ck,t); // 得到t的子集
				For each 候选c 属于 Ct
							 c.count++;
			}
			Lk={c属于Ck | c.count>=min_sup}
	}
	Return L=所有的频繁集；

	Procedure apriori_gen(Lk-1:frequent(k-1)-itemsets)
		  For each项集l1属于Lk-1
				  For each项集 l2属于Lk-1
						   If((l1[1]=l2[1])&&( l1[2]=l2[2])&&…….
	&& (l1[k-2]=l2[k-2])&&(l1[k-1]

 
  2、Apriori算法Java代码 
          package com.yumo.machine.learning.algorithms;
        import java.util.ArrayList;
        import java.util.HashMap;
        import java.util.List;
        import java.util.Map;
        import java.util.Set;

        public class Apriori{
            // 支持度阈值
            private final static int SUPPORT = 2;
            // 置信度阈值
            private final static double CONFIDENCE = 0.7;
            // 项之间的分隔符
            private final static String GAP = ";";
             // 项之间的分隔符
            private final static String CON = "-->";

            /**
             * 这个是用来找出1-频繁项集的方法，因为1-频繁项集的特殊性，
             * 所以需要特别的方法来返回1-频繁项集
             * @param dataList
             * @return
             */

            private Map find1_FrequentSet(ArrayList dataList){
                Map resultSetMap = new HashMap<>();
                for (String data:dataList) {
                    String [] strings = data.split(GAP);
                    //这是把所有的购买记录一条条的筛选出来
                    for (String string : strings) {
                        string += GAP;
                        if (resultSetMap.get(string)==null) {
                            resultSetMap.put(string,1);
                        }
                        else {
                            resultSetMap.put(string, resultSetMap.get(string)+1);
                        }
                    }
                }
                //返回的是一个各种商品对应出现频次的Map（或可称之为频繁项集）。键为商品序号，值为出现次数。
                return resultSetMap;    
            }

            /**
             * 使用先验知识，判断候选集是否是频繁项集
             * @param candidate
             * @param setMap
             * @return
             */

            private boolean hasInfrequentSubset(String candidateString, Map setMap){
                String[] strings = candidateString.split(GAP);
                //找出候选集所有的子集，并判断每个子集是否属于频繁子集
                for (int i=0; i aprioriGen(Map setMap){
                //此处传入的参数就是上面返回的频繁项集。
                Map candidateSetMap = new HashMap<>();
                // 对每个商品取集合
                Set candidateSet = setMap.keySet();
                //单独考虑每个商品的支持度，如果合格，就可以进行拼接。否则丢掉。
                for (String s1 : candidateSet) {
                    String[] strings1 = s1.split(GAP);
                    String s1string = "";
                    for (String temp : strings1) {
                        s1string += temp+GAP;
                    }
                    for (String s2 :  candidateSet) {
                        //此处也是默认商品序号是有序的。这样先判定前len-1项是否相等。
                        //如果前面相等，第len项不相等，那么就可以拼接成len+1长度的候选集了。
                        String[] strings2 = s2.split(GAP);
                        boolean flag = true;
                        for (int i=0; i< strings1.length-1;++i) {
                            if (strings1[i].compareTo(strings2[i]) != 0) {
                                flag = false;
                                break;
                            }
                        }
                        if (flag && strings1[strings1.length-1].compareTo(strings2[strings2.length-1])<0) {
                           //连接步：产生候选
                           String c=s1string+strings2[strings2.length-1]+GAP;
                           if (hasInfrequentSubset(c,setMap)) {
                                //剪枝步：删除非频繁的候选
                            } 
                            else {
                                candidateSetMap.put(c,0);
                            }
                        }
                    }
                }
                return candidateSetMap;
            }

            /**
             * 算法主程序
             * @param dataList
             * @return
             */

            public Map apriori(ArrayList dataList){
                Map setpFrequentSetMap = new HashMap<>();
                setpFrequentSetMap.putAll(find1_FrequentSet(dataList));

                Map frequentSetMap = new HashMap();
                frequentSetMap.putAll(setpFrequentSetMap);
                // Into the loop choose
                while(setpFrequentSetMap!=null && setpFrequentSetMap.size() > 0){
                    Map candidateSetMap = aprioriGen(setpFrequentSetMap);
                    //得到的就是候选集 candidateSetMap ，当然我们只要key部分即可啦！
                    Set candidateKeySet = candidateSetMap.keySet();

                    //扫描D，进行计数
                    for (String data : dataList) {
                        for (String candidate :  candidateKeySet) {
                            boolean flag = true;
                            String[] strings = candidate.split(GAP);
                            for (String string : strings) {
                                //意味着在Data，也就是在初始的购物记录中查找当前的频繁项集中的某一条。寻找string如果不成功，则返回-1；
                                // indexOf(Object o)方法 
                                // 功能：查找某个元素在ArrayList中第一次出现的位置。
                                if (data.indexOf(string+GAP)==-1) {
                                    flag = false;
                                    break;
                                }
                            }
                            //如果查找成功，那么就可以丢到正式的候选集中了。
                            if (flag) {
                                candidateSetMap.put(candidate,candidateSetMap.get(candidate)+1);
                            }
                        }
                    }
                    //从候选集中找到符合支持度的频繁项集，stepFrequentSetMap顾名思义就是每一次找到的新的频繁集。
                    //所以在置入新的频繁集之前，都要先把上次的清空掉。
                    setpFrequentSetMap.clear();
                    for (String candidate : candidateKeySet) {
                        Integer count = candidateSetMap.get(candidate);
                        if (count>=SUPPORT) {
                            setpFrequentSetMap.put(candidate,count);
                        }
                    }
                    // puaAll的作用是把一个Map的所有元素置入并且去重。
                    // 合并所有频繁集
                    frequentSetMap.putAll(setpFrequentSetMap);
                }
                //While循环结束的条件是新的频繁项集的大小为0.也就是必须要完全空了才出来。
                //这时候已经确保了frequentSetMap包含有所有的频繁项集了。
                return frequentSetMap;
            }
            /**
             * 求一个集合所有的非空真子集
             * 
             * @param sourceSet
             * @return
             * 为了以后可以用在其他地方，这里我们不是用递归的方法
             * 
             *
             * 思路：假设集合S（A,B,C,D），其大小为4，拥有2的4次方个子集，即0-15，二进制表示为0000，0001，...，1111。
             * 对应的子集为空集，{D}，...，{A,B,C,D}。
             */

            private List subset(String sourceSet){
                //“按位对应法”,从1-2^strings.length-1位，可以用二进制来表示是否取到该值。
                /*
                如集合A={a,b,c},对于任意一个元素，在每个子集中，要么存在，要么不存在。 映射为子集：
                (a,b,c)
                (1,1,1)->(a,b,c)
                (1,1,0)->(a,b)
                (1,0,1)->(a,c)
                (1,0,0)->(a)
                (0,1,1)->(b,c)
                (0,1,0)->(b)
                (0,0,1)->(c)
                (0,0,0)->@(@表示空集)
                */
                List result = new ArrayList<>();
                String[] strings = sourceSet.split(GAP);
                for (int i = 1; i<(Math.pow(2,strings.length)) - 1; ++i ) {
                    String item = "";
                    int ii = i;
                    int[] flag = new int[strings.length]; 
                    int count = 0;
                    while(ii>=0 && count getRelationRules(Map frequentSetMap){
                Map relationMap = new HashMap<>();
                Set KeySet = frequentSetMap.keySet();
                for (String key : KeySet) {
                    List keySubset = subset(key);
                    for (String keySubSetItem : keySubset) {
                        //子集keySubsetItem也是频繁项
                        Integer count = frequentSetMap.get(keySubSetItem);
                        if (count!=null) {
                             /*
                             置信度：
                             置信度(confidence)揭示了A出现时B是否一定出现，如果出现，则出现的概率是多大。如果A->B的置信度是100%，则说明A出现时B一定会出现（返回来不一定）。
                                上图中底板共出现5次，其中4次同时购买了胶皮，底板->胶皮的置信度是80%。
                             用公式表示是，物品A->B的置信度=物品{A,B}的支持度 / 物品{A}的支持度：
                             Confidence(A->B) = support({A,B}) / support({A}) = P(B|A)
                            */ 
                            Double confidence = (1.0*frequentSetMap.get(key))/(1.0*frequentSetMap.get(keySubSetItem));
                            if (confidence > CONFIDENCE) {
                                relationMap.put(keySubSetItem+CON+expect(key,keySubSetItem),confidence);
                            }
                        }
                    }
                }   
                return relationMap;
            }

        }


#### 3、测试

#####  数据库连接类

    package com.crop.jdbc;

    import java.sql.DriverManager;
    import java.sql.ResultSet;
    import java.sql.SQLException;

    import java.sql.Connection;
    import java.sql.Statement;

    /** 
     * ClassName: DBUtil
     * @Description: TODO 连接数据库
     * @author zhangkaifu
     */
    public class DBUtil {

        // 数据库连接对象
        private static Connection conn=null; 

        // 数据库连接地址
        private static String URL = "jdbc:mysql://localhost:3306/data?characterEncoding=utf8&useSSL=true";

        // 数据库的用户名
        private static String UserName = "root";
        // 数据库的密码
        private static String Password = "mysqldata";

        /**
         * * @Description: TODO 获取访问数据库的Connection对象
         * @param @return
         * @return Connection 连接数据的对象
         * @author zhangkaifu
         */
        public static Connection getConnection() {

            try {

                Class.forName("com.mysql.jdbc.Driver"); // 加载驱动

                System.out.println("加载驱动成功!!!");
            } catch (ClassNotFoundException e) {
                // TODO: handle exception
                e.printStackTrace();
            }

            try {

                //通过DriverManager类的getConenction方法指定三个参数,连接数据库
                conn = (Connection)DriverManager.getConnection(URL, UserName, Password);
                System.out.println("连接数据库成功!!!");

                //返回连接对象
                return conn;

            } catch (SQLException e) {
                // TODO: handle exception
                e.printStackTrace();
                return null;
            }
        }

    }
 
  数据库辅助类 
      package com.yumo.machine.learning.algorithms.data;

    import java.sql.Connection;
    import java.sql.PreparedStatement;
    import java.sql.ResultSet;
    import java.sql.SQLException;
    import java.sql.Statement;
    import java.util.ArrayList;

    /** 
     * ClassName:  DBhelper
     * @Description: TODO 数据库辅助类
     * @author zhangkaifu
     */
    public class DBhelper {
        // 获取类中可以共用的对象
            private static Connection conn = null;
            private static PreparedStatement ps = null;
            private static ResultSet rs = null;
            // 代码运行时即开始连接数据库
            static {
                conn = DBUtil.getConnection();
            }
        /**
         * Description:放全部资源
         * @param conn
         * @param ps
         * @param rs
         * @throws SQLException
         */
            public static void closeAll(Connection conn, Statement ps, ResultSet rs)
                    throws SQLException {
                if (conn != null) {
                    conn.close();
                }
                if (ps != null) {
                    ps.close();
                }
                if (rs != null) {
                    rs.close();
                }
            }

            // 释放所用资源
            public static void closePart(Connection conn, Statement stt)
                    throws SQLException {
                if (conn != null) {
                    conn.close();
                }
                if (stt != null) {
                    stt.close();
                }
            }
            // 查询元素
            public static ArrayList selectAll() {
                ArrayList data = new ArrayList<>();
                String sql = "select keyvalue from mvshopping";
                try {
                    ps = conn.prepareStatement(sql);
                    rs = ps.executeQuery();// 执行sql
                    // 遍厉打印元素
                    while (rs.next()) {
                        data.add(rs.getString("keyvalue"));// 将对象添加到集合中
                    }
                } catch (SQLException e) {
                    System.out.println("数据获取失败！！！！");;
                } finally {
                    try {
                        DBhelper.closeAll(conn, ps, rs);
                    } catch (SQLException e) {
                        e.printStackTrace();
                    }
                }
                return data;
            }
    }
 
  数据集 
  数据集保存在数据库中，内容如下。
 
   
  测试主函数 
      package com.yumo.machine.learning.algorithms.test;

    import java.util.ArrayList;
    import java.util.Map;
    import java.util.Set;

    import com.yumo.machine.learning.algorithms.Apriori;
    import com.yumo.machine.learning.algorithms.data.DBhelper;

    public class test {
        public static void main(String[] args)
        {
            ArrayList dataList = new ArrayList<>();
            //从数据库获取数据
            dataList = DBhelper.selectAll();
            System.out.println("***数据集合**********");
            for(String string:dataList)
            {
                System.out.println(string);
            }

            Apriori apriori = new Apriori();

            System.out.println("***频繁项集**********");

            Map frequentSetMap = apriori.apriori(dataList);
            Set keySet = frequentSetMap.keySet();
            for(String key:keySet)
            {
                System.out.println(key+" : "+frequentSetMap.get(key));
            }

            System.out.println("***关联规则**********");
            Map relationRulesMap = apriori.getRelationRules(frequentSetMap);
            Set rrKeySet = relationRulesMap.keySet();
            for (String rrKey : rrKeySet)
            {
                System.out.println(rrKey + "  :  " + relationRulesMap.get(rrKey));
            }

        }

    }
 
  运行结果 
  
  
  六、算法分析 
  1、时间复杂度 
  在进行算法分析时，语句总的执行次数T(n)是关于问题规模n的函数，进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度，也就是算法的时间量度，记作：T(n)= O(f(n))。它表示随问题规模n的增大，算法执行时间的增长率和f(n)的增长率相同，称作算法的渐近时间复杂度，简称为时间复杂度，是一种“渐进表示法”。其中f(n)是问题规模n的某个函数。 
  用大写O()来体现算法时间复杂度的记法，我们称之为大O记法。 
  一般情况下，随着输入规模n的增大，T(n)增长最慢的算法为最优算法。
 显然，由此算法时间复杂度的定义可知，我们的三个求和算法的时间复杂度分别为O(1)，O(n)，O(n^2) 。。。。。 
  分析如下 
  方法（函数）find1_FrequentSet的时间复杂度为： 
  T（n) = O(n^2) 
  代码如下：| 
      private Map find1_FrequentSet(ArrayList dataList){
            Map resultSetMap = new HashMap<>();
            for (String data:dataList) {
                String [] strings = data.split(GAP);
                //这是把所有的购买记录一条条的筛选出来
                for (String string : strings) {
                    string += GAP;
                    if (resultSetMap.get(string)==null) {
                        resultSetMap.put(string,1);
                    }
                    else {
                        resultSetMap.put(string, resultSetMap.get(string)+1);
                    }
                }
            }
            //返回的是一个各种商品对应出现频次的Map（或可称之为频繁项集）。键为商品序号，值为出现次数。
            return resultSetMap;    
        }
 
  方法（函数） hasInfrequentSubset的时间复杂度为： 
  T（n) = O(n^2) 
  代码如下：| 
       /**
         * 使用先验知识，判断候选集是否是频繁项集
         * @param candidate
         * @param setMap
         * @return
         */

        private boolean hasInfrequentSubset(String candidateString, Map setMap){
            String[] strings = candidateString.split(GAP);
            //找出候选集所有的子集，并判断每个子集是否属于频繁子集
            for (int i=0; i
 
  方法（函数） sourceSet的时间复杂度为： 
  T（n) = O(n^2) 
  代码如下：| 
      /**
         * 求一个集合所有的非空真子集
         * 
         * @param sourceSet
         * @return
         * 为了以后可以用在其他地方，这里我们不是用递归的方法
         * 
         * 
         * 思路：假设集合S（A,B,C,D），其大小为4，拥有2的4次方个子集，即0-15，二进制表示为0000，0001，...，1111。
         * 对应的子集为空集，{D}，...，{A,B,C,D}。
         */

        private List subset(String sourceSet){
            //“按位对应法”,从1-2^strings.length-1位，可以用二进制来表示是否取到该值。
            /*
            如集合A={a,b,c},对于任意一个元素，在每个子集中，要么存在，要么不存在。 映射为子集：
            (a,b,c)
            (1,1,1)->(a,b,c)
            (1,1,0)->(a,b)
            (1,0,1)->(a,c)
            (1,0,0)->(a)
            (0,1,1)->(b,c)
            (0,1,0)->(b)
            (0,0,1)->(c)
            (0,0,0)->@(@表示空集)
            */
            List result = new ArrayList<>();
            String[] strings = sourceSet.split(GAP);
            for (int i = 1; i<(Math.pow(2,strings.length)) - 1; ++i ) {
                String item = "";
                int ii = i;
                int[] flag = new int[strings.length]; 
                int count = 0;
                while(ii>=0 && count
 
  方法（函数） expect的时间复杂度为： 
  T（n) = O(n^2) 
  代码如下：| 
      /**
         * 集合运算，A/B
         * @param A
         * @param B
         * @return
         */
        private String expect(String stringA, String stringB){
            String result = "";
            String[] stringAs = stringA.split(GAP);
            String[] stringBs = stringB.split(GAP);

            for(int i=0; i
 
  方法（函数） frequentSetMap 中嵌套调用了expect和subset方法，综合分析其时间复杂度为： 
  T（n) = O(n^4) 
  代码如下：| 
      /**
         * 由频繁项集产生关联规则
         * @param frequentSetMap
         * @return
         */
        public Map getRelationRules(Map frequentSetMap){
            Map relationMap = new HashMap<>();
            Set KeySet = frequentSetMap.keySet();
            for (String key : KeySet) {
                List keySubset = subset(key);
                for (String keySubSetItem : keySubset) {
                    //子集keySubsetItem也是频繁项
                    Integer count = frequentSetMap.get(keySubSetItem);
                    if (count!=null) {
                         /*
                         置信度：
                         置信度(confidence)揭示了A出现时B是否一定出现，如果出现，则出现的概率是多大。如果A->B的置信度是100%，则说明A出现时B一定会出现（返回来不一定）。
                            上图中底板共出现5次，其中4次同时购买了胶皮，底板->胶皮的置信度是80%。
                         用公式表示是，物品A->B的置信度=物品{A,B}的支持度 / 物品{A}的支持度：
                         Confidence(A->B) = support({A,B}) / support({A}) = P(B|A)
                        */ 
                        Double confidence = (1.0*frequentSetMap.get(key))/(1.0*frequentSetMap.get(keySubSetItem));
                        if (confidence > CONFIDENCE) {
                            relationMap.put(keySubSetItem+CON+expect(key,keySubSetItem),confidence);
                        }
                    }
                }
            }   
            return relationMap;
        }

   方法（函数） aprioriGen的时间复杂度为：
   
   ### T（n)  = O(n^3)
   
   代码如下：|

     /**
         * 根据上面的频繁项集的集合选出候选集
         * @param setMap
         * @return
         */
        private Map aprioriGen(Map setMap){
            //此处传入的参数就是上面返回的频繁项集。
            Map candidateSetMap = new HashMap<>();
            // 对每个商品取集合
            Set candidateSet = setMap.keySet();
            //单独考虑每个商品的支持度，如果合格，就可以进行拼接。否则丢掉。
            for (String s1 : candidateSet) {
                String[] strings1 = s1.split(GAP);
                String s1string = "";
                for (String temp : strings1) {
                    s1string += temp+GAP;
                }
                for (String s2 :  candidateSet) {
                    //此处也是默认商品序号是有序的。这样先判定前len-1项是否相等。
                    //如果前面相等，第len项不相等，那么就可以拼接成len+1长度的候选集了。
                    String[] strings2 = s2.split(GAP);
                    boolean flag = true;
                    for (int i=0; i< strings1.length-1;++i) {
                        if (strings1[i].compareTo(strings2[i]) != 0) {
                            flag = false;
                            break;
                        }
                    }
                    if (flag && strings1[strings1.length-1].compareTo(strings2[strings2.length-1])<0) {
                       //连接步：产生候选
                       String c=s1string+strings2[strings2.length-1]+GAP;
                       if (hasInfrequentSubset(c,setMap)) {
                            //剪枝步：删除非频繁的候选
                        } 
                        else {
                            candidateSetMap.put(c,0);
                        }
                    }
                }
            }
            return candidateSetMap;
        }
 
  方法（函数） apriori 中还嵌套调用了 aprioriGen方法，综合分析故其时间复杂度为： 
  T（n) = O(n^4) 
  代码如下：| 
  /**
     * 算法主程序
     * @param dataList
     * @return
     */

    public Map apriori(ArrayList dataList){
        Map setpFrequentSetMap = new HashMap<>();
        setpFrequentSetMap.putAll(find1_FrequentSet(dataList));

        Map frequentSetMap = new HashMap();
        frequentSetMap.putAll(setpFrequentSetMap);
        // Into the loop choose
        while(setpFrequentSetMap!=null && setpFrequentSetMap.size() > 0){
            Map candidateSetMap = aprioriGen(setpFrequentSetMap);
            //得到的就是候选集 candidateSetMap ，当然我们只要key部分即可啦！
            Set candidateKeySet = candidateSetMap.keySet();

            //扫描D，进行计数
            for (String data : dataList) {
                for (String candidate :  candidateKeySet) {
                    boolean flag = true;
                    String[] strings = candidate.split(GAP);
                    for (String string : strings) {
                        //意味着在Data，也就是在初始的购物记录中查找当前的频繁项集中的某一条。寻找string如果不成功，则返回-1；
                        // indexOf(Object o)方法 
                        // 功能：查找某个元素在ArrayList中第一次出现的位置。
                        if (data.indexOf(string+GAP)==-1) {
                            flag = false;
                            break;
                        }
                    }
                    //如果查找成功，那么就可以丢到正式的候选集中了。
                    if (flag) {
                        candidateSetMap.put(candidate,candidateSetMap.get(candidate)+1);
                    }
                }
            }
            //从候选集中找到符合支持度的频繁项集，stepFrequentSetMap顾名思义就是每一次找到的新的频繁集。
            //所以在置入新的频繁集之前，都要先把上次的清空掉。
            setpFrequentSetMap.clear();
            for (String candidate : candidateKeySet) {
                Integer count = candidateSetMap.get(candidate);
                if (count>=SUPPORT) {
                    setpFrequentSetMap.put(candidate,count);
                }
            }
            // puaAll的作用是把一个Map的所有元素置入并且去重。
            // 合并所有频繁集
            frequentSetMap.putAll(setpFrequentSetMap);
        }
        //While循环结束的条件是新的频繁项集的大小为0.也就是必须要完全空了才出来。
        //这时候已经确保了frequentSetMap包含有所有的频繁项集了。
        return frequentSetMap;
    }
 
  综合上述分析，Apriori算法的时间复杂度为: T(n) = O(n^4) 
  2、空间复杂度 
  算法的空间复杂度通过计算算法所需的存储空间实现，算法的空间复杂度的计算公式记作：S(n)=O(f(n))，其中，n为问题的规模，f(n)为语句关于n所占存储空间的函数，也是一种“渐进表示法”，这些所需要的内存空间通常分为“固定空间内存”（包括基本程序代码、常数、变量等）和“变动空间内存”（随程序运行时而改变大小的使用空间） 
  通常，我们都是用“时间复杂度”来指运行时间的需求，是用“空间复杂度”指空间需求。 
  计算方法
 忽略常数，用O(1)表示
 递归算法的空间复杂度=递归深度N*每次递归所要的辅助空间
 对于单线程来说，递归有运行时堆栈，求的是递归最深的那一次压栈所耗费的空间的个数，因为递归最深的那一次所耗费的空间足以容纳它所有递归过程。 
  从测试函数来分析空间复杂度 
      public static void main(String[] args)
        {
            ArrayList dataList = new ArrayList<>();
            //从数据库获取数据
            dataList = DBhelper.selectAll();
            System.out.println("***数据集合**********");
            for(String string:dataList)
            {
                System.out.println(string);
            }

            Apriori apriori = new Apriori();

            System.out.println("***频繁项集**********");

            Map frequentSetMap = apriori.apriori(dataList);
            Set keySet = frequentSetMap.keySet();
            for(String key:keySet)
            {
                System.out.println(key+" : "+frequentSetMap.get(key));
            }

            System.out.println("***关联规则**********");
            Map relationRulesMap = apriori.getRelationRules(frequentSetMap);
            Set rrKeySet = relationRulesMap.keySet();
            for (String rrKey : rrKeySet)
            {
                System.out.println(rrKey + "  :  " + relationRulesMap.get(rrKey));
            }

        }

 
  从以上代码来看， 主要的存储空间是 对dataList，frequentSetMap，keySet，relationRulesMap，rrKeySet的数据的存储， 
  综合考虑分析，算法的空间复杂度级别为： 
  S(n) = 5*n *O(n) 
  七、应用场景 
  经典的关联规则数据挖掘算法Apriori 算法广泛应用于各种领域，通过对数据的关联性进行了分析和挖掘，挖掘出的这些信息在决策制定过程中具有重要的参考价值。
 Apriori算法广泛应用于商业中，应用于消费市场价格分析中，它能够很快的求出各种产品之间的价格关系和它们之间的影响。通过数据挖掘，市场商人可以瞄准目标客户，采用个人股票行市、最新信息、特殊的市场推广活动或其他一些特殊的信息手段，从而极大地减少广告预算和增加收入。百货商场、超市和一些老字型大小的零售店也在进行数据挖掘，以便猜测这些年来顾客的消费习惯。
 Apriori算法应用于网络安全领域，比如网络入侵检测技术中。早期中大型的电脑系统中都收集审计信息来建立跟踪档，这些审计跟踪的目的多是为了性能测试或计费，因此对攻击检测提供的有用信息比较少。它通过模式的学习和训练可以发现网络用户的异常行为模式。采用作用度的Apriori算法削弱了Apriori算法的挖掘结果规则，是网络入侵检测系统可以快速的发现用户的行为模式，能够快速的锁定攻击者，提高了基于关联规则的入侵检测系统的检测性。
 Apriori算法应用于高校管理中。随着高校贫困生人数的不断增加，学校管理部门资助工作难度也越加增大。针对这一现象，提出一种基于数据挖掘算法的解决方法。将关联规则的Apriori算法应用到贫困助学体系中，并且针对经典Apriori挖掘算法存在的不足进行改进，先将事务数据库映射为一个布尔矩阵，用一种逐层递增的思想来动态的分配内存进行存储，再利用向量求"与"运算，寻找频繁项集。实验结果表明，改进后的Apriori算法在运行效率上有了很大的提升，挖掘出的规则也可以有效地辅助学校管理部门有针对性的开展贫困助学工作。
 Apriori算法被广泛应用于移动通信领域。移动增值业务逐渐成为移动通信市场上最有活力、最具潜力、最受瞩目的业务。随着产业的复苏，越来越多的增值业务表现出强劲的发展势头，呈现出应用多元化、营销品牌化、管理集中化、合作纵深化的特点。针对这种趋势，在关联规则数据挖掘中广泛应用的Apriori算法被很多公司应用。依托某电信运营商正在建设的增值业务Web数据仓库平台，对来自移动增值业务方面的调查数据进行了相关的挖掘处理，从而获得了关于用户行为特征和需求的间接反映市场动态的有用信息，这些信息在指导运营商的业务运营和辅助业务提供商的决策制定等方面具有十分重要的参考价值。 
  应用实列 
  穿衣搭配是服饰鞋包导购中非常重要的课题，基于搭配专家和达人生成的搭配组合数据，百万级别的商品的文本和图像数据，以及用户的行为数据。期待能从以上行为、文本和图像数据中挖掘穿衣搭配模型，为用户提供个性化、优质的、专业的穿衣搭配方案，预测给定商品的搭配商品集合。 
  八、结语 
  Apriori算法是一种挖掘关联规则的频繁项集算法，其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。主要用于做快速的关联规则分析。Apriori算法在世界上广为流传，得到极大的关注。Apriori算法已经被广泛的应用到商业、网络安全、高校管理和移动通信等领域。

JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
日历插件-FullCalendar的详细使用老马聊技术 JavaScript 前端 javascript
一、介绍FullCalendar是一个功能强大、高度可定制的JavaScript日历组件，用于在网页中显示和管理日历事件。它支持多种视图（月、周、日等），可以轻松集成各种框架，并提供丰富的事件处理功能。二、实操案例具体代码如下：FullCalendar日期选择body{font-family:Arial,sans-serif;margin:20px;}#calendar{max-width:900
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
Java 调用 HTTP 接口的 7 种方式：全网最全指南
Java调用HTTP接口的7种方式：全网最全指南在开发过程中，调用HTTP接口是最常见的需求之一。本文将详细介绍Java中7种主流的调用HTTP接口的方式，包括每种工具的优缺点和完整代码实现。1.使用RestTemplateRestTemplate是Spring提供的同步HTTP客户端，适用于传统项目。尽管从Spring5开始被标记为过时，它仍然是许多开发者的首选。示例代码importorg.sp
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
javascript高级程序设计第3版——第12章 DOM2与DOM3 weixin_30687587 javascript 数据结构与算法 ViewUI
12章——DOM2与DOM3为了增强D0M1，DOM级规范定义了一些模块。DOM2核心：为不同的DOM类型引入了一些与XML命名空间有关的方法，还定义了以编程方式创建Document实例的方法；DOM2级样式：针对操作元素的样式而开发；其特性总结：1.每个元素都有一个关联的style对象，可用来确定和修改行内样式；2.要确定某个元素的计算样式，可使用getComgetComputedStyle（）
Java设计模式实战：高频场景解析与避坑指南 mckim_ 笔记学习 java 设计模式
引言设计模式是软件开发的基石，但许多开发者面对23种模式时容易陷入“学完就忘”或“滥用模式”的困境。本文从工业级项目视角出发，精选10种高频设计模式，结合真实代码案例与主流框架应用，帮你建立模式思维，拒绝纸上谈兵。一、创建型模式：告别new的暴力美学1.工厂方法模式（FactoryMethod）核心痛点：对象创建逻辑散落各处，难以统一管理。场景案例：电商平台需要支持多种支付方式（支付宝、微信、银联
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
《Java前端开发全栈指南：从Servlet到现代框架实战》
前言在当今Web开发领域，Java依然是后端开发的主力语言，而随着前后端分离架构的普及，Java开发者也需要掌握前端技术栈。本文将全面介绍JavaWeb前端开发的核心技术，包括传统Servlet/JSP体系、现代前端框架集成方案，以及全栈开发的最佳实践。通过本文，您将了解如何构建现代化的JavaWeb应用前端界面。一、JavaWeb前端技术演进1.1传统技术栈Servlet：JavaWeb基础，处
javaSE面试题---语法基础、面向对象、常用类、集合、多线程、文件和IO yang_xiao_wu_ java 面试开发语言 javase java基础多线程文件和IO
目录语法基础1.jdkjrejvm区别2.基本数据类型3.引用数据类型4.自动类型转换、强制类型转换5.常见的运算符6.&和&&区别7.++--在前和在后的区别8.+=有什么作用9.switch..case中switch支持哪些数据类型10.break和continue区别11.while和dowhile区别12.如何生成一个取值范围在[min,max]之间的随机数13.数组的长度如何获取？数组下
JAVA 高频八股文 Day03 Conqueror675 java 开发语言
12.TCP和Http的区别是什么TCP是传输层协议，负责建立可靠的点对点连接，确保数据有序、完整地传输（如铁路轨道）；HTTP是应用层协议，基于TCP构建，定义了Web服务交互的报文格式和规则（如货运订单）。TCP关注数据如何可靠送达，通过三次握手建立连接、流量控制等机制保证传输；HTTP关注传输内容的意义，提供请求/响应语义（GET/POST等）和无状态通信。补充：说一下什么是三次握手四次挥手
JVM字节码加载与存储中的细节
问题引出：为什么Java定义int型变量为32767时使用的是bipush32767，而定义int型变量为32768时使用的是ldc#4？在Java中，如果这样定义int型变量：publicclassTest{publicstaticvoidmain(String[]args){inti=0;intj=5;intk=6;intm=32768;intn=32767;}}变量对应的字节码文件内容是这样
JVM与Spring Boot核心解析 AIHacksCash Java场景面试宝典 Java JVM Spring Boot
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
HashMap的Get(),Put()源码解析 Ttang23 哈希算法散列表算法
1、什么是HashMap？HashMap是Java中用于存储键值对（Key-Value）的集合类，它实现了Map接口。其核心特点是：无序性：不保证元素的存储顺序，也不保证顺序恒定不变。唯一性：键（Key）不能重复，若插入重复键会覆盖原有值。允许null：允许一个null键和任意数量的null值。非线程安全：相比HashTable，HashMap不支持同步，性能更高。2.核心数据结构：哈希表（Has
Java中的Tomcat，开启Web应用腾飞【基础版】
目录一、Tomcat初登场：揭开神秘面纱（一）啥是Tomcat（二）为啥要有Tomcat二、Tomcat的安装与启动：开启第一步（一）下载Tomcat（二）启动Tomcat三、Tomcat的目录结构：探秘内部布局（一）核心目录介绍（二）目录间的协同工作四、部署JavaWeb应用到Tomcat：让应用上线（一）打包Web应用为WAR文件（二）部署WAR文件到Tomcat五、Tomcat的配置优化：让
Java Web 之 Session 详解艾伦~耶格尔 java 开发语言后端前端 session
在JavaWeb开发中，Session就像网站的专属记忆管家，为每个用户保管着重要的信息和状态，确保用户在网站的旅程顺畅无阻。场景一：想象你去一家大型超市购物，推着购物车挑选商品。这个购物车就如同Session，它记录了你的购物信息，方便你在结账时一次性结算。场景二：你在玩一个在线游戏，登录账号后，你的游戏进度、等级、装备等信息都会被保存在Session中，即使你中途关闭游戏，下次登录时依然可以继
JavaScript之DOM操作与事件处理详解 AA-代码批发V哥 JavaScript javascript
JavaScript之DOM操作与事件处理详解一、DOM基础：理解文档对象模型二、DOM元素的获取与访问2.1基础获取方法2.2集合的区别与注意事项三、DOM元素的创建与修改3.1创建与插入元素3.2修改元素属性与样式3.2.1属性操作3.2.2样式操作3.3元素内容的修改四、DOM元素的删除与替换4.1删除元素4.2替换元素五、事件处理：实现页面交互5.1事件绑定的三种方式5.1.1HTML属性
V少JS基础班之第五弹 V少在逆向 JS基础班 javascript 开发语言 ecmascript
文章目录一、前言二、本节涉及知识点三、重点内容1-函数的定义2-函数的构成1.函数参数详解1）参数个数不固定2）默认参数3）arguments对象（类数组）4）剩余参数（Rest参数）5）函数参数是按值传递的6）解构参数传递7）参数校验技巧（JavaScript没有类型限制，需要手动校验）2.函数返回值详解3-函数的分类1-函数声明式：2-函数表达式：3-箭头函数：4-构造函数：5-IIFE：6-
Javaweb学习之Vue模板语法（三）不要数手指啦 vue.js 学习前端
目录学习资料前情回顾本期介绍（vue模板语法）文本插值Vue的Attribute绑定使用JavaScript表达式综合实例代码：学习资料Vue.js-渐进式JavaScript框架|Vue.js(vuejs.org)前情回顾项目的创建大家可以看这篇文章Vue学习之项目的创建-CSDN博客本期介绍（vue模板语法）首先，找到我们编写代码的地方找到自己项目的src文件夹，打开之后点击component
Tomcat：Java Web应用的幕后英雄互联网动态分析 tomcat
在当今数字化浪潮中，Java作为一门成熟且广泛应用的编程语言，支撑着无数企业级应用和互联网服务的稳定运行。而在JavaWeb开发领域，Tomcat无疑是一个举足轻重的存在，它宛如一位默默耕耘的幕后英雄，为众多Web应用提供了可靠的运行环境。Tomcat的起源与发展Tomcat的故事始于1999年，当时SunMicrosystems（后被Oracle收购）与Apache软件基金会合作，旨在为Java
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情

Apriori算法整理

实践课题报告： Apriori算法

学校：xxx大学

学院：大数据与智能工程学院

专业：信息工程（数据科学与大数据技术）

年级：2017级

姓名：xxx

指导老师：xxx

日期：2019 年 6 月 24 日

一、简介

二、挖掘步骤：

三、基本概念

四、基本原理

五、Java实现

运行环境：

1、伪代码

2、Apriori算法Java代码

数据库辅助类

数据集

测试主函数

运行结果

六、算法分析

1、时间复杂度

分析如下

T（n) = O(n^2)

T（n) = O(n^2)

T（n) = O(n^2)

T（n) = O(n^2)

T（n) = O(n^4)

T（n) = O(n^4)

综合上述分析，Apriori算法的时间复杂度为: T(n) = O(n^4)

2、空间复杂度

从测试函数来分析空间复杂度

从以上代码来看，主要的存储空间是对dataList，frequentSetMap，keySet，relationRulesMap，rrKeySet的数据的存储，

综合考虑分析，算法的空间复杂度级别为：

S(n) = 5n O(n)

七、应用场景

应用实列

八、结语

你可能感兴趣的:(大数据算法,Java)

Apriori算法整理

实践课题报告： Apriori算法

学 校：xxx大学

学 院：大数据与智能工程学院

专 业：信息工程（数据科学与大数据技术）

年 级：2017级

姓 名：xxx

指导老师：xxx

日 期：2019 年 6 月 24 日

一、简介

二、挖掘步骤：

三、基本概念

四、基本原理

五、Java实现

运行环境：

1、 伪代码

2、Apriori算法Java代码

数据库辅助类

数据集

测试主函数

运行结果

六、算法分析

1、时间复杂度

分析如下

T（n) = O(n^2)

T（n) = O(n^2)

T（n) = O(n^2)

T（n) = O(n^2)

T（n) = O(n^4)

T（n) = O(n^4)

综合上述分析，Apriori算法的时间复杂度为: T(n) = O(n^4)

2、空间复杂度

从测试函数来分析空间复杂度

从以上代码来看， 主要的存储空间是 对dataList，frequentSetMap，keySet，relationRulesMap，rrKeySet的数据的存储，

综合考虑分析，算法的空间复杂度级别为：

S(n) = 5*n *O(n)

七、应用场景

应用实列

八、结语

你可能感兴趣的:(大数据算法,Java)

学校：xxx大学

学院：大数据与智能工程学院

专业：信息工程（数据科学与大数据技术）

年级：2017级

姓名：xxx

日期：2019 年 6 月 24 日

1、伪代码

从以上代码来看，主要的存储空间是对dataList，frequentSetMap，keySet，relationRulesMap，rrKeySet的数据的存储，

S(n) = 5n O(n)