wenyusuran

典型关联分析（Canonical Correlation Analysis）

1. 问题

在线性回归中，我们使用直线来拟合样本点，寻找n维特征向量X和输出结果（或者叫做label）Y之间的线性关系。其中，。然而当Y也是多维时，或者说Y也有多个特征时，我们希望分析出X和Y的关系。

当然我们仍然可以使用回归的方法来分析，做法如下：

假设，，那么可以建立等式Y=AX如下

其中，形式和线性回归一样，需要训练m次得到m个。

这样做的一个缺点是，Y中的每个特征都与X的所有特征关联，Y中的特征之间没有什么联系。

我们想换一种思路来看这个问题，如果将X和Y都看成整体，考察这两个整体之间的关系。我们将整体表示成X和Y各自特征间的线性组合，也就是考察和之间的关系。

这样的应用其实很多，举个简单的例子。我们想考察一个人解题能力X（解题速度，解题正确率）与他/她的阅读能力Y（阅读速度，理解程度）之间的关系，那么形式化为：

和

然后使用Pearson相关系数

来度量u和v的关系，我们期望寻求一组最优的解a和b，使得Corr(u, v)最大，这样得到的a和b就是使得u和v就有最大关联的权重。

到这里，基本上介绍了典型相关分析的目的。

2. CCA表示与求解

给定两组向量和（替换之前的x为，y为），维度为，维度为，默认。形式化表示如下：

是x的协方差矩阵；左上角是自己的协方差矩阵；右上角是；左下角是，也是的转置；右下角是的协方差矩阵。

与之前一样，我们从和的整体入手，定义

我们可以算出u和v的方差和协方差：

上面的结果其实很好算，推导一下第一个吧：

最后，我们需要算Corr(u,v)了

我们期望Corr(u,v)越大越好，关于Pearson相关系数，《数据挖掘导论》给出了一个很好的图来说明：

横轴是u，纵轴是v，这里我们期望通过调整a和b使得u和v的关系越像最后一个图越好。其实第一个图和最后一个图有联系的，我们可以调整a和b的符号，使得从第一个图变为最后一个。

接下来我们求解a和b。

回想在LDA中，也得到了类似Corr(u,v)的公式，我们在求解时固定了分母，来求分子（避免a和b同时扩大n倍仍然符号解条件的情况出现）。这里我们同样这么做。

这个优化问题的条件是：

Maximize

Subject to:

求解方法是构造Lagrangian等式，这里我简单推导如下：

求导，得

令导数为0后，得到方程组：

第一个等式左乘，第二个左乘，再根据，得到

也就是说求出的即是Corr(u,v)，只需找最大即可。

让我们把上面的方程组进一步简化，并写成矩阵形式，得到

写成矩阵形式

令

那么上式可以写作：

显然，又回到了求特征值的老路上了，只要求得的最大特征值，那么Corr(u,v)和a和b都可以求出。

在上面的推导过程中，我们假设了和均可逆。一般情况下都是可逆的，只有存在特征间线性相关时会出现不可逆的情况，在本文最后会提到不可逆的处理办法。

再次审视一下，如果直接去计算的特征值，复杂度有点高。我们将第二个式子代入第一个，得

这样先对求特征值和特征向量，然后根据第二个式子求得b。

待会举个例子说明求解过程。

假设按照上述过程，得到了最大时的和。那么和称为典型变量（canonical variates），即是u和v的相关系数。

最后，我们得到u和v的等式为：

我们也可以接着去寻找第二组典型变量对，其最优化条件是

Maximize

Subject to:

其实第二组约束条件就是。

计算步骤同第一组计算方法，只不过是取的第二大特征值。

得到的和其实也满足

即

总结一下，i和j分别表示和得到结果

3. CCA计算例子

我们回到之前的评价一个人解题和其阅读能力的关系的例子。假设我们通过对样本计算协方差矩阵得到如下结果：

然后求，得

这里的A和前面的中的A不是一回事（这里符号有点乱，不好意思）。

然后对A求特征值和特征向量，得到

然后求b，之前我们说的方法是根据求b，这里，我们也可以采用类似求a的方法来求b。

回想之前的等式

我们将上面的式子代入下面的，得

然后直接对求特征向量即可，注意和的特征值相同，这个可以自己证明下。

不管使用哪种方法，

这里我们得到a和b的两组向量，到这还没完，我们需要让它们满足之前的约束条件

这里的应该是我们之前得到的VecA中的列向量的m倍，我们只需要求得m，然后将VecA中的列向量乘以m即可。

这里的是VecA的列向量。

因此最后的a和b为：

第一组典型变量为

4. Kernel Canonical Correlation Analysis（KCCA）

通常当我们发现特征的线性组合效果不够好或者两组集合关系是非线性的时候，我们会尝试核函数方法，这里我们继续介绍Kernel CCA。

在《支持向量机-核函数》那一篇中，大致介绍了一下核函数，这里再简单提一下：

当我们对两个向量作内积的时候

我们可以使用，来替代和，比如原来的特征向量为，那么

我们可以定义

如果与的构造一样，那么

这样，仅通过计算x和y的内积的平方就可以达到在高维空间（这里为）中计算和内积的效果。

由核函数，我们可以得到核矩阵K，其中

即第行第列的元素是第个和第个样例在核函数下的内积。

一个很好的核函数定义：

其中样例x有n个特征，经过变换后，从n维特征上升到了N维特征，其中每一个特征是。

回到CCA，我们在使用核函数之前

这里假设x和y都是n维的，引入核函数后，和变为了N维。

使用核函数后，u和v的公式为：

这里的c和d都是N维向量。

现在我们有样本，这里的表示样本x的第i个样例，是n维向量。

根据前面说过的相关系数，构造拉格朗日公式如下：

其中

然后让L对a求导，令导数等于0，得到（这一步我没有验证，待会从宏观上解释一下）

同样对b求导，令导数等于0，得到

求出c和d干嘛呢？c和d只是的系数而已，按照原始的CCA做法去做就行了呗，为了再引入和？

回答这个问题要从核函数的意义上来说明。核函数初衷是希望在式子中有，然后用K替换之，根本没有打算去计算出实际的。因此即是按照原始CCA的方式计算出了c和d，也是没用的，因为根本有没有实际的让我们去做。另一个原因是核函数比如高斯径向基核函数可以上升到无限维，N是无穷的，因此c和d也是无穷维的，根本没办法直接计算出来。我们的思路是在原始的空间中构造出权重和，然后利用将和上升到高维，他们在高维对应的权重就是c和d。

虽然和是在原始空间中（维度为样例个数M），但其作用点不是在原始特征上，而是原始样例上。看上面得出的c和d的公式就知道。通过控制每个高维样例的权重，来控制c。

好了，接下来我们看看使用和后，u和v的变化

表示可以将第i个样例上升到的N维向量，意义可以类比原始CCA的x。

鉴于这样表示接下来会越来越复杂，改用矩阵形式表示。

简写为

其中X（M×N）为

我们发现

我们可以算出u和v的方差和协方差（这里实际上事先对样本和做了均值归0处理）：

这里和维度可以不一样。

最后，我们得到Corr(u,v)

可以看到，在将和处理成，后，得到的结果和之前形式基本一样，只是将替换成了两个K乘积。

因此，得到的结果也是一样的，之前是

其中

引入核函数后，得到

其中

注意这里的两个w有点区别，前面的维度和x的特征数相同，维度和y的特征数相同。后面的维度和x的样例数相同，维度和y的样例数相同，严格来说“维度=维度”。

5. 其他话题

1、当协方差矩阵不可逆时，怎么办？

要进行regularization。

一种方法是将前面的KCCA中的拉格朗日等式加上二次正则化项，即：

这样求导后得到的等式中，等式右边的矩阵一定是正定矩阵。

第二种方法是在Pearson系数的分母上加入正则化项，同样结果也一定可逆。

2、求Kernel矩阵效率不高怎么办？

使用Cholesky decomposition压缩法或者部分Gram-Schmidt正交化法，。

3、怎么使用CCA用来做预测？

4、如果有多个集合怎么办？X、Y、Z…？怎么衡量多个样本集的关系？

这个称为Generalization of the Canonical Correlation。方法是使得两两集合的距离差之和最小。可以参考文献2。

6. 参考文献

1、 http://www.stat.tamu.edu/~rrhocking/stat636/LEC-9.636.pdf

2、 Canonical correlation analysis: An overview with application to learning methods. David R. Hardoon , Sandor Szedmak and John Shawe-Taylor

3、 A kernel method for canonical correlation analysis. Shotaro Akaho

4、 Canonical Correlation a Tutorial. Magnus Borga

5、 Kernel Canonical Correlation Analysis. Max Welling

关联性分析源码如下：

#coding=utf-8

'''
Created on Mar 24, 2011
Ch 11 code
@author: Peter


使用Apriori算法进行关联分析

关联分析
Apriori算法
优点:易编码实现。
缺点:在大数据集上可能较慢。
适用数据类型:数值型或者标称型数据。
    关联分析是一种在大规模数据集中寻找有趣关系的任务。这些关系可以有两种形式:频繁项
集或者关联规则。频繁项集(frequent item sets)是经常出现在一块的物品的集合，关联规则
( association rules)暗示两种物品之间可能存在很强的关系。

    一个项集的支持度(support)被定义为数据集中包含该项集的记录所占的比例。从图11-1中
可以得到，{豆奶}的支持度为4/5。而在5条交易记录中有3条包含{豆奶，尿布}，因此王豆奶，尿
布}的支持度为3/5。支持度是针对项集来说的，因此可以定义一个最小支持度，而只保留满足最
小支持度的项集。
    可信度或置信度(confidence)是针对一条诸如{尿布}‘{葡萄酒}的关联规则来定义的。这
条规则的可信度被定义为“支持度({尿布，葡萄酒”伎持度({尿布””。从图11-1中可以看到，由
于{尿布，葡萄酒}的支持度为3/5，尿布的支持度为4/5，所以“尿布‘葡萄酒”的可信度为3/4=0.75 0
这意味着对于包含“尿布”的所有记录，我们的规则对其中75%的记录都适用。


总结：
    关联分析是用于发现大数据集中元素间有趣关系的一个工具集，可以采用两种方式来量化这
些有趣的关系。第一种方式是使用频繁项集，它会给出经常在一起出现的元素项。第二种方式是
关联规则，每条关联规则意味着元素项之间的“如果……那么”关系。
    发现元素项间不同的组合是个十分耗时的任务，不可避免需要大量昂贵的计算资源，这就需
要一些更智能的方法在合理的时间范围内找到频繁项集。能够实现这一目标的一个方法是Apriori算法
它使用Apriori原理来减少在数据库上进行检查的集合的数目。Apriori原理是说如果一个元
素项是不频繁的
过组合满足最小
现的频率。
，那么那些包含该元素的超集也是不频繁的。Apriori算法从单元素项集开始，通
支持度要求的项集来形成更大的集合。支持度用来度量一个集合在原始数据中出
关联分析可以用在许多不同物品上。
商店中的商品以及网站的访问页面是其中比较常见的例
子。关联分析也曾用于查看选举人及法官的投票历史。
    每次增加频繁项集的大小，Apriori算法都会重新扫描整个数据集。当数据集很大时，这会显
著降低频繁项集发现的速度。下一章会介绍FPgrowth算法①，和Apriori算法相比，该算法只需要
对数据库进行两次遍历，能够显著加快发现繁项集的速度。


'''
from numpy import *
'''
Apriori算法的一般流程
(1)收集数据:使用任意方法。
(2)准备数据:任何数据类型都可以，因为我们只保存集合。
(3)分析数据:使用任意方法。
(4)训练算法:使用Apriori算法来找到频繁项集。
(5)刚试算法:不需要测试过程。
(6)使用算法:用于发现频繁项集以及物品之间的关联规则。

Apriori原理是说如果某个项集是频繁的，那么它的所有子集也是频繁的。
对于图11-2给出的例子，这意味着如果{{0,1 }是频繁的，那么{0}, {1}也一定是频繁的。这个原理
直观上并没有什么帮助，但是如果反过来看就有用了，也就是说如果一个项集是非频繁集，那么
它的所有超集也是非频繁的

    11.1节提到，关联分析的目标包括两项:发现频繁项集和发现关联规则。首先需要找到频繁
项集，然后才能获得关联规则。本节将只关注于发现频繁项集。
    Apriori算法是发现频繁项集的一种方法。Apriori}法的两个输人参数分别是最小支持度和数
据集。该算法首先会生成所有单个物品的项集列表。接着扫描交易记录来查看哪些项集满足最小
支持度要求，那些不满足最小支持度的集合会被去掉。然后，对剩下来的集合进行组合以生成包
含两个元素的项集。接下来，再重新扫描交易记录，去掉不满足最小支持度的项集。该过程重复
进行直到所有项集都被去掉。


生成候选集
对数据集中的每条交易记录tran
对每个候选项集can:
    检查一下can是否是tran的子集:
    如果是，则增加can的计数值
    对每个候选项集:
如果其支持度不低于最小值，则保留该项集
返回所有频繁项集列表


上述程序包含三个函数。第一个函数loadDataSet()创建了一个用于测试的简单数据集，
另外两个函数分别是createCl()和scanD ( )。
    不言自名，函数createCl()将构建集合C1o C1是大小为1的所有候选项集的集合。Apriori
算法首先构建集合C1，然后扫描数据集来判断这些只有一个元素的项集是否满足最小支持度的要
求。那些满足最低要求的项集构成集合L1。而L1中的元素相互组合构成C2, C2再进一步过滤变
为L2。到这里，我想读者应该明白了该算法的主要思路。
    因此算法需要一个函数createCl()来构建第一个候选项集的列表C1。由于算法一开始是从输
人数据中提取候选项集列表，所以这里需要一个特殊的函数来处理，而后续的项集列表则是按一定
的格式存放的。这里使用的格式就是Python中的frozense淡型。frozense提指被“冰冻”的集合，就
是说它们是不可改变的，即用户不能修改它们。这里必须要使用frozensetf}TJ不是se璞型，因为之后
必须要将这些集合作为字典键值使用，使用frozense呵以实现这一点，而set}[1做不到。
    首先创建一个空列表c1，它用来存储所有不重复的项值。接下来遍历数据集中的所有交易记
录。对每一条记录，遍历记录中的每一个项。如果某个物品项没有在c1中出现，则将其添加到
C1中。这里并不是简单地添加每个物品项，而是添加只包含该物品项的一个列表①。这样做的目
的是为每个物品项构建一个集合。因为在Apriori算法的后续处理中，需要做集合操作。Python不
能创建只有一个整数的集合，因此这里实现必须使用列表(有兴趣的读者可以试一下)。这就是
我们使用一个由单物品列表组成的大列表的原因。最后，对大列表进行排序并将其中的每个单元
素列表映射到frozenset()，最后返回frozenset的列表Do
    程序清单11-1中的第二个函数是scanD ( )，它有三个参数，分别是数据集Ck、包含候选集合
的列表以及感兴趣项集的最小支持度minSupport。该函数用于从C1生成L1。另外，该函数会返
回一个包含支持度值的字典以备后用。scanD ( )函数首先创建一个空字典ssCn七，然后遍历数据
集中的所有交易记录以及C1中的所有候选集。如果C1中的集合是记录的一部分，那么增加字典
中对应的计数值。这里字典的键就是集合。当扫描完数据集中的所有项以及所有候选集时，就需
要计算支持度。不满足最小支持度要求的集合不会输出。函数也会先构建一个空列表，该列表包
含满足最小支持度要求的集合。下一个循环遍历字典中的每个元素并且计算支持度.。如果支持
度满足最小支持度要求，则将字典元素添加到retList中。可以使用语句retL乒st.
insert (0 , key)在列表的首部插人任意新的集合。当然也不一定非要在首部插人，这只是为了
让列表看起来有组织。函数最后返回最频繁项集的支持度supportData
'''
def loadDataSet():
    return [[1, 3, 4], [2, 3, 5], [1, 2, 3, 5], [2, 5]]

def createC1(dataSet):
    C1 = []
    for transaction in dataSet:
        for item in transaction:
            if not [item] in C1:
                C1.append([item])
                
    C1.sort()
    return map(frozenset, C1)#use frozen set so we
                            #can use it as a key in a dict    

def scanD(D, Ck, minSupport):
    ssCnt = {}
    for tid in D:
        for can in Ck:
            if can.issubset(tid):
                if not ssCnt.has_key(can): ssCnt[can]=1
                else: ssCnt[can] += 1
    numItems = float(len(D))
    retList = []
    supportData = {}
    for key in ssCnt:
        support = ssCnt[key]/numItems
        if support >= minSupport:
            retList.insert(0,key)
        supportData[key] = support
    return retList, supportData
'''
整个Aprior滇法的伪代码如下:
当集合中项的个数大于0时
    构建一个k个项组成的候选项集的列衣
检查数据以确认每个项集都是频繁的
保留频繁项集并构建k+l项组成的候选项集的列农

程序清单11-2包含两个函数aprioriGen()与apriori(),其中主函数是apriori()，它会
调用aprioriGen()来创建候选项集Ck,函数aprioriGen()
的输人参数为频繁项集列表Lk与项集元素个数k,输出为Ck,首先创建一个
空列表，然后计算Lk中的元素数目。接下来，’比较Lk中的每一个元素与其他元素，
这可以通过两个for循环来实现。紧接着，取列表中的两个集合进行比较。如果这两个集合的前面k-2个元
素都相等，那么就将这两个集合合成一个大小为k的集合.。这里使用集合的并操作来完成，在
Python中对应操作符|。


    上面所有的操作都被封装在apriori()函数中。给该函数传递一个数据集以及一个支持度，
函数会生成候选项集的列表，这通过首先创建C1然后读人数据集将其转化为D(集合列表)来完
成。程序中使用map函数将set()映射到da七aSet列表中的每一项。接下来，使用程序清单11-1
中的scanD ( )函数来创建L1，并将L1放人列表L中。L会包含L1 } L2 , L3 ...。现在有了L1，后面
会继续找L2, L3...，这可以通过 while循环来完成，它创建包含更大项集的更大列表，直到下一
个大的项集为空。如果这听起来让人有点困惑的话，那么等一下你会看到它的工作流程。首先使
用aprioriGen()来创建Ck，然后使用scanD()基于Ck来创建Lko Ck是一个候选项集列表，然
后scanD()会遍历Ck，丢掉不满足最小支持度要求的项集)a Lk列表被添加到L，同时增加k的
值，重复上述过程。最后，当Lk为空时，程序返回L并退出。



'''
def aprioriGen(Lk, k): #creates Ck
    retList = []
    lenLk = len(Lk)
    for i in range(lenLk):
        for j in range(i+1, lenLk): 
            L1 = list(Lk[i])[:k-2]; L2 = list(Lk[j])[:k-2]
            L1.sort(); L2.sort()
            if L1==L2: #if first k-2 elements are equal
                retList.append(Lk[i] | Lk[j]) #set union
    return retList

def apriori(dataSet, minSupport = 0.5):
    C1 = createC1(dataSet)
    D = map(set, dataSet)
    L1, supportData = scanD(D, C1, minSupport)
    L = [L1]
    k = 2
    while (len(L[k-2]) > 0):
        Ck = aprioriGen(L[k-2], k)
        Lk, supK = scanD(D, Ck, minSupport)#scan DB to get Lk
        supportData.update(supK)
        L.append(Lk)
        k += 1
    return L, supportData
'''
关联规则生成函数

可以首先从一个频繁项集开始，接着创建一个规则列表，其中规则右部只包含一个
元素，然后对这些规则进行测试。
接下来合并所有剩余规则来创建一个新的规则列表，其中规则
右部包含两个元素。这种方法也被称作分级法。

    上述程序中包含三个函数。第一个函数generateRules()是主函数，它调用其他两个函数。
其他两个函数是rulesFromConseq()和calcConf()，分别用于生成候选规则集合以及对规则
进行评估。
    函数generateRules()有3个参数:频繁项集列表、包含那些频繁项集支持数据的字典、最
小可信度阑值。函数最后要生成一个包含可信度的规则列表，后面可以基于可信度对它们进行排
序。这些规则存放在bigRuleList中。如果事先没有给定最小可信度的闽值，那么默认值设为
0.7o generateRules)的另两个输入参数正好是程序清单11-2中函数apriori()的输出结果。
该函数遍历L中的每一个频繁项集并对每个频繁项集创建只包含单个元素集合的列表H1。因为无
法从单元素项集中构建关联规则，所以要从包含两个或者更多元素的项集开始规则构建过程Oo
如果从集合{{0,1,2}开始，那么H1应该是〔{0},{1},{2}]。如果频繁项集的元素数目超过2，那么会考
虑对它做进一步的合并。具体合并可以通过函数rulesFromConseq()来完成，后面会详细讨论
合并过程。如果项集中只有两个元素，那么使用函数calcConf()来计算可信度值。
    我们的目标是计算规则的可信度以及找到满足最小可信度要求的规则。所有这些可以使用函
数calcConf()来完成，而程序清单11-3中的其余代码都用来准备规则。函数会返回一个满足最
小可信度要求的规则列表，为了保存这些规则，需要创建一个空列表prunedH。接下来，遍历H
中的所有项集并计算它们的可信度值。可信度计算时使用。upportData中的支持度数据。通过
导人这些支持度数据，可以节省大量计算时间。如果某条规则满足最小可信度值，那么将这些规
则输出到屏幕显示。通过检查的规则也会被返回，并被用在下一个函数rulesFromConseq()中。
同时也需要对列表brl进行填充，而brl是前面通过检查的bigRuleListo

    为从最初的项集中生成更多的关联规则，可以使用rulesFromConseq()函数。该函数有2
个参数:一个是频繁项集，另一个是可以出现在规则右部的元素列表H。函数先计算H中的频繁集
大小m)。接下来查看该频繁项集是否大到可以移除大小为m的子集。如果可以的话，则将其移
除。可以使用程序清单11-2中的函数aprioriGen()来生成H中元素的无重复组合O。该结果会
存储在Hmp1中，这也是下一次迭代的H列表。Hmp1包含所有可能的规则。可以利用calcConf ( )
来测试它们的可信度以确定规则是否满足要求。如果不止一条规则满足要求，那么使用Hmp1迭
代调用函数rulesFromConseq(，来判断是否可以进一步组合这些规则

'''
def generateRules(L, supportData, minConf=0.7):  #supportData is a dict coming from scanD
    bigRuleList = []
    for i in range(1, len(L)):#only get the sets with two or more items
        for freqSet in L[i]:
            H1 = [frozenset([item]) for item in freqSet]
            if (i > 1):
                rulesFromConseq(freqSet, H1, supportData, bigRuleList, minConf)
            else:
                calcConf(freqSet, H1, supportData, bigRuleList, minConf)
    return bigRuleList         

def calcConf(freqSet, H, supportData, brl, minConf=0.7):
    prunedH = [] #create new list to return
    for conseq in H:
        conf = supportData[freqSet]/supportData[freqSet-conseq] #calc confidence
        if conf >= minConf: 
            print freqSet-conseq,'-->',conseq,'conf:',conf
            brl.append((freqSet-conseq, conseq, conf))
            prunedH.append(conseq)
    return prunedH

def rulesFromConseq(freqSet, H, supportData, brl, minConf=0.7):
    m = len(H[0])
    if (len(freqSet) > (m + 1)): #try further merging
        Hmp1 = aprioriGen(H, m+1)#create Hm+1 new candidates
        Hmp1 = calcConf(freqSet, Hmp1, supportData, brl, minConf)
        if (len(Hmp1) > 1):    #need at least two sets to merge
            rulesFromConseq(freqSet, Hmp1, supportData, brl, minConf)
            
def pntRules(ruleList, itemMeaning):
    for ruleTup in ruleList:
        for item in ruleTup[0]:
            print itemMeaning[item]
        print "           -------->"
        for item in ruleTup[1]:
            print itemMeaning[item]
        print "confidence: %f" % ruleTup[2]
        print       #print a blank line
        
'''
收集数据:构建美国国会投票记录的事务数据集
(1)收集数据:使用votesmart模块来访问投票记录。
(2)准备数据:构造一个函数来将投票转化为一串交易记录。
(3)分析数据:在Python提示符下查看准备的数据以确保其正确性。
(#)训练算法:使用本章早先的apriori()和generateRules()函数来发现投票记录中
  的有趣信息。
(5)测试算法:不适用，即没有刚试过程。
(6)使用算法:这里只是出于娱乐的目的，不过也可以使用分析结果来为政治竞选活动服
  务，或者预测选举官员会如何投票。


    上述程序中导人了votesmart模块并通过引人sleep函数来延迟API调用。getActions工ds()
函数会返回存储在recent20bills.txt文件中议案的action工d。程序先导人API key，然后创建两个
空列表。这两个列表分别用来返回actionsId和标题。首先打开recent20bills.tx改件，对每一行内不
同元素使用tab进行分隔，之后进人try-excep七模块。由于在使用外部”I时可能会遇到错误，
并且也不想让错误占用数据获取的时间，上述try-except模块调用是一种非常可行的做法。所
以，首先尝试使用getBill()方法来获得一个billDetail对象。接下来遍历议案中的所有行为，
来寻找有投票数据的行为.。在Passage阶段与Amendment Vote(修正案投票)阶段都会有投票数
据，要找的就是它们。现在，在行政级别上也有一个Passage阶段，但那个阶段并不包含任何投票
数据，所以要确保这个阶段是发生在众议院.。如果确实如此，程序就会将actionId打印出来
并将它添加到action工dList中。同时，也会将议案的标题添加到billTitleList中。如果在
API调用时发生错误，就不会执行actionIdList的添加操作。一旦有错误就会执行except模块
并将错误信息输出。最后，程序会休眠1秒钟，以避免对Votesmart.org网站的过度频繁访问。程序
活行结束时，action工dList与billTitleLis七会被返回用于进一步的处理。

    可以看到action工d显示了出来，它同时也被添加到action工dList中输出，以后我们可以使
用这些action工d了。如果程序运行错误，则尝试使用try..excep七代码来捕获错误。我自己就曾
经在获取所有actiondId时遇到一个错误。接下里可以继续来获取这些action工d的投票信息。
    选举人可以投是或否的表决票，也可以弃权。需要一种方法来将这些上述信息转化为类似于
项集或者交易数据库之类的东西。前面提到过，一条交易记录数据只包含一个项的出现或不出现
信息，并不包含项出现的次数。基于上述投票数据，可以将投票是或否看成一个元素。
    美国有两个主要政党:共和党与民主党。下面也会对这些信息进行编码并写到事务数据库中。
幸运的是，这些信息在投票数据中已经包括。下面给出构建事务数据库的流程:首先创建一个字
典，字典中使用政客的名字作为键值。当某政客首次出现时，将他及其所属政党(民主党或者共
和党)添加到字典中，这里使用。来代表民主党，1来代表共和党。下面介绍如何对投票进行编码。
对每条议案创建两个条目:bill+'Yea'以及bill十·Nay'。该方法允许在某个政客根本没有投
票时也能合理编码

'''            
from time import sleep
from votesmart import votesmart
votesmart.apikey = 'a7fa40adec6f4a77178799fae4441030'
#votesmart.apikey = 'get your api key first'
def getActionIds():
    actionIdList = []; billTitleList = []
    fr = open('recent20bills.txt') 
    for line in fr.readlines():
        billNum = int(line.split('\t')[0])
        try:
            billDetail = votesmart.votes.getBill(billNum) #api call
            for action in billDetail.actions:
                if action.level == 'House' and \
                (action.stage == 'Passage' or action.stage == 'Amendment Vote'):
                    actionId = int(action.actionId)
                    print 'bill: %d has actionId: %d' % (billNum, actionId)
                    actionIdList.append(actionId)
                    billTitleList.append(line.strip().split('\t')[1])
        except:
            print "problem getting bill %d" % billNum
        sleep(1)                                      #delay to be polite
    return actionIdList, billTitleList
'''
函数getTransList()会创建一个事务数据库.于是在此基础上可以使用前面的Apriori代码
来生成频繁项集与关联规则。该函数也会创建一个标题列表,所以很容易了解每个元素项的含义。
一开始使用前两个元素“Repbulican”和“Democratic" 创建一个含义列表itemMeaning。当想
知道某些元素项的具体含义时，需要做的是以元素项的编号作为索引访问itemMeaning即可。
接下来遍历所有议案，然后在议案标题后添加Nay(反对) 或者Yea(同意)并将它们放人
itemMeaning列表中,接下来创建一个空字典用于加人元素项，然后遍历函数getActionIds()
返回的每一个action工do遍历时要做的第一件事是休眠，即在for循环中一开始调用sleep ( )
函数来延迟访问，这样做可以避免过于频繁的API调用。接着将运行结果打印出来，以便知道程
序县否在正常工作。再接着通过try..except块来使用VotesmartAPI获取某个特定action工d
相关的所有投票信息。然后，遍历所有的投票信息(通常voteList会超过400个投票)。在遍历
时，使用政客的名字作为字典的键值来填充transDicto,如果之前没有遇到该政客，那么就要获
取他的政党信息。字典中的每个政客都有一个列表来存储他投票的元素项或者他的政党信息。接
下来会看到该政客是否对当前议案投了赞成(Yea )或反对(Nay)票。如果他们之前有投票，
那么不管是投赞成票还是反对票，
这些信息都将添加到列表中。如果API调用中发生了什么错误，
except模块中的程序就会被调用并将错误信息孰输出到屏幕上，之后函数仍然继续执行。最后，
程序返回事务字典transDict及元素项含义类表itemMeaningo






'''        
def getTransList(actionIdList, billTitleList): #this will return a list of lists containing ints
    itemMeaning = ['Republican', 'Democratic']#list of what each item stands for
    for billTitle in billTitleList:#fill up itemMeaning list
        itemMeaning.append('%s -- Nay' % billTitle)
        itemMeaning.append('%s -- Yea' % billTitle)
    transDict = {}#list of items in each transaction (politician) 
    voteCount = 2
    for actionId in actionIdList:
        sleep(3)
        print 'getting votes for actionId: %d' % actionId
        try:
            voteList = votesmart.votes.getBillActionVotes(actionId)
            for vote in voteList:
                if not transDict.has_key(vote.candidateName): 
                    transDict[vote.candidateName] = []
                    if vote.officeParties == 'Democratic':
                        transDict[vote.candidateName].append(1)
                    elif vote.officeParties == 'Republican':
                        transDict[vote.candidateName].append(0)
                if vote.action == 'Nay':
                    transDict[vote.candidateName].append(voteCount)
                elif vote.action == 'Yea':
                    transDict[vote.candidateName].append(voteCount + 1)
        except: 
            print "problem getting actionId: %d" % actionId
        voteCount += 2
    return transDict, itemMeaning

你可能感兴趣的:(典型关联分析（Canonical Correlation Analysis）)

【软考高项论文】论信息系统项目的质量管理 _Richard_ 软考高项论文软考高项软考高级信息系统项目管理师
摘要在信息系统项目管理里，质量管理是保障项目成果契合预期、满足用户需求与业务目标的关键。本文以2024年6月启动的一个典型信息系统项目为例，阐述了信息系统项目质量管理的过程，包括质量规划、质量控制和质量保证三个核心活动及其目的、涉及角色与主要工作成果。同时，详细说明了质量保证的实施步骤，如建立质量政策、制定质量保证计划等。此外，还为QA制定了质量核对单，涵盖需求文档、设计文档等多个方面，以此确保项
spring boot 注解@Component yu15050186065 spring boot annotation spirng spring ioc
@Component。Spring提供进一步典型的注解：@Component，@Service，和@Controller。@Component是任何Spring托管组件的通用注解。而@Repository，@Service和@Controller是@Component针对更特定用例的专业化（分别在持久性，服务和表示层）。因此可以用他们来注解你的组件类与@Component具有同样作用，通过与注解它
瀑布式开发与敏捷开发的区别是什么易成技术团队 pingcode 研发管理工具 IT 项目管理企业管理智能化研发管理工具
摘要：瀑布模型式是最典型的预见性的方法，严格遵循预先计划的需求、分析、设计、编码、测试的步骤顺序进行。敏捷开发以用户的需求进化为核心，采用迭代、循序渐进的方法进行软件开发。我们将在文章中详细说明两者各自的适合场景。详细解答：瀑布和敏捷都不是什么新概念，关于敏捷开发与瀑布开发的优势与缺点都已经比较明确，这里根据全网的资料给大家做一些整理和总结。一、瀑布开发瀑布模型式是最典型的预见性的方法，严格遵循预
3258. 统计满足 K 约束的子字符串数量 I Joyner2018 python 算法 python leetcode 开发语言数据结构
高效计算满足K约束的子字符串数量：两种解法解析在字符串处理问题中，如何高效地计算满足特定条件的子字符串个数是一个常见的挑战。在本篇博客中，我们将探讨一个典型的字符串问题：给定一个二进制字符串s和一个整数k，要求我们计算所有满足如下条件的子字符串数量：子字符串中0的数量不超过k，或者子字符串中1的数量不超过k我们将展示两种不同的解法：一种是暴力解法，另一种是使用滑动窗口技术的优化解法。问题分析假设我
双指针几种常见用法小李不秃头♛ java 数据结构算法双指针
双指针的常见用法及适用场景详解双指针是算法中一种高效且灵活的解题技巧，通过两个指针的协同操作降低时间复杂度和空间复杂度。以下是双指针的核心用法及适用场景分析：一、对撞指针（反向双指针）核心思想：两个指针分别从序列的两端向中间移动，适用于有序数组或可通过排序转化为有序的问题。在反向双指针里面right指向的是数组的长度，在循环的时候直接while(left
SAP-ABAP：SAP全模块的架构化解析，涵盖核心功能、行业方案及技术平台爱喝水的鱼丶运维 SAP ABAP 服务器 ERP
一、核心业务模块（Logistics&Operations）模块代号核心功能典型流程关键事务码物料管理MM采购/库存/发票校验采购到付款(P2P)ME21N（采购订单）,MI31（库存盘点）销售与分销SD订单/定价/发货/开票订单到现金(OTC)VA01（销售订单）,VF01（开票）生产计划PPMRP/工艺路线/成本核算计划到生产(P2P)MD04（MRP清单）,COOIS（生产订单监控）质量管理
电商用户行为可视化大屏--大数据项目
一．项目目的1.深入了解服务：用户的浏览路径、购买频率、商品评价等数据，能够精准地刻画用户画像。了解用户的年龄、性别、地域等基本信息，以及他们的兴趣爱好、消费习惯等更深入的特征，从而为个性化的营销和服务提供依据。2.优化用户体验：通过分析用户在页面之间的跳转时间、购物车的使用情况等，找出可能存在的流程不畅或设计不合理的地方。3.提高运营效率：对商品销售数据、库存数据等进行关联分析，有助于合理安排库
ZLG嵌入式笔记 | 工业现场掉电，系统异常如何破解？ ZLG 致远电子边缘计算 ZLG嵌入式开发应用笔记嵌入式硬件
在工业现场，设备常因掉电导致文件系统损坏或数据丢失。本文将介绍如何通过硬件和系统设计优化，解决这一问题，提升设备稳定性。前言在工业应用现场，不可避免会出现异常掉电或者一些偶发性频繁上下电的情况，这样对系统是有非常大的影响的，特别是写数据过程中发生了掉电，可能会引发下列异常：引起文件系统损坏或者系统异常；数据丢失，带来经济损失。这是非常典型的产品运行过程中有写数据操作，但数据
华为路由器典型配置（附案例） normanhere 华为智能路由器 iphone
案例拓扑：#主用路由器R_ShenZhen_1配置displaycurrent-configurationsysnameR_ShenZhen_1#SNAT调用，将IPSEC流量排除aclnumber3000rule5denyipsource10.2.0.00.0.255.255destination10.4.0.00.0.255.255rule10permitipsource10.0.0.00.2
计算机系统中隐藏的‘时间陷阱’——为什么你的代码总比预期慢10倍？尤物程序猿 java 开发语言
引言大家经常遇到一个诡异现象：明明算法时间复杂度算得好好的，为什么实际运行速度总比预期慢得多？你以为是数据库查询的锅，优化了SQL却收效甚微；你怀疑是网络延迟，但抓包数据又显示一切正常。这背后可能隐藏着计算机系统中鲜为人知的“时间陷阱”——那些未被计入传统性能分析，却真实吞噬效率的底层机制。本文将揭示5个最典型的陷阱，从CPU缓存失效到操作系统调度暗坑，并用真实案例展示如何绕过它们。陷阱1：CPU
从快递配送看 AutoGen 主题订阅机制：四种通信场景的全解析佑瞻 AutoGen 人工智能 AutoGen
在多智能体系统开发中，我们常常面临这样的困惑：如何让不同智能体之间实现精准高效的消息传递？就像快递公司需要将包裹准确送达不同地址一样，AutoGen框架通过主题（Topic）与订阅（Subscription）机制构建了智能体通信的"物流网络"。今天，我们将以快递公司的业务场景为例，深入解析四种典型的广播模式，帮助你彻底掌握智能体通信的核心技术。一、智能体通信与快递配送的类比框架1.1核心概念映射快
autobank渗流分析计算教程_高土石坝坡稳定性分析 Oliverzzzhang
原标题：基于滑弧动力有限元耦合法的高土石坝坝坡稳定性分析摘要:为研究高土石坝坝坡的稳定性，以某水电站高土石坝坝坡为例，采用条分法与有限元法耦合的计算方法进行分析，选取3个典型断面，对其设计工况和校核工况下的上下游断面的安全系数进行计算。计算结果表明:(1)下游坝坡最小安全系数比上游大，设计工况安全系数比校核工况安全系数大;(2)3个断面在各工况下取得最小值的时刻近似，符合坝坡稳定的计算规律;(3)
Vue中的v-if与emit事件传递：一个常见陷阱分析发现你走远了 vue.js javascript 前端
Vue中的v-if与事件传递：一个常见陷阱分析在Vue开发中，v-if与事件传递的组合可能会导致一些难以排查的问题。本文将分析一个典型案例，并提供解决方案。问题描述在一个登录流程中，我们有三个组件嵌套：InviteCodeDialog（邀请码验证组件）PcLogin（登录组件，包含InviteCodeDialog）PcLoginView（页面组件，包含PcLogin）每个组件都有自己的日志输出：/
Python爬虫实战：使用Scrapy+Selenium+Playwright高效爬取Coursera课程信息 Python爬虫项目 2025年爬虫实战项目 python 爬虫 scrapy 微信开发语言科技 selenium
前言在当今信息爆炸的时代，在线教育平台如Coursera提供了海量的高质量课程资源。对于学习者、教育研究者和数据分析师来说，获取这些平台的课程信息具有重要价值。本文将详细介绍如何使用Python爬虫技术高效爬取Coursera课程信息，并分析其中的技术难点与解决方案。1.Coursera网站分析Coursera是一个典型的现代Web应用，具有以下特点：采用React/Vue等前端框架构建，大量内容
Flutter多设备之典型布局场景 harmonyos
Flutter多设备之典型布局场景参考鸿蒙原生典型布局场景，保持相似体验。布局能力使用场景使用说明页签栏使用页签控制内容切换的容器，每个页签对应一个内容视图。基于动态断点，当位于sm,md时,使用flutter内置组件DefaultTabController、TabBar和TabBarView显示底部页签栏；当位于lg时，使用DefaultTabController和NavigationRail显
【软件系统架构】系列四：数字信号处理器（DSP）
目录一、什么是DSP？二、DSP的核心架构特点1.基本结构2.工作流程：3.关键特性：三、DSP与MCU/MPU/NPU的对比四、DSP与通用处理器的对比五、常用DSP算法类型六、常见DSP芯片平台七、开发工具链与语言支持八、典型应用场景举例通信领域：音频处理：图像与视频处理：工业控制：军事与航空航天：九、选型关键因素十、技术趋势总结一、什么是DSP？DSP（DigitalSignalProces
MQTT 和 CoAP物联网通信协议之争：MQTT 与CoAP 深度对比分析 34号树洞 #MQTT专栏物联网传输层通信专栏物联网通讯协议 MQTT CoAP
目录一、核心特性对比二、关键设计目标1.MQTT2.CoAP三、优缺点分析MQTT的优缺点CoAP的优缺点四、典型应用场景对比五、技术细节对比1.消息传输流程2.安全性实现3.资源发现机制六、选择建议1.优先选择MQTT的场景2.优先选择CoAP的场景3.混合使用策略七、未来趋势总结在物联网（IoT）领域，选择合适的通信协议对于设备性能、电池寿命、网络效率和应用可靠性至关重要。MQTT(Messa
ahk入门的典型例子 aaa_111222aaa
热键有时也称为快捷键,因为它们能简便地触发动作(例如运行程序或键盘宏).在下面的例子中,Win+N被设置为启动记事本.磅的符号[#]表示Windows键,它被称为修饰符:#n::RunNotepadreturn在前面的最后一行中,return用来结束此热键.不过,如果热键只需要执行单行语句,那么此行可以直接放在双冒号的右边.换句话说,return可以省略:#n::RunNotepad要在热键中使用
07-Seq2Seq英译法案例郜太素自然语言处理人工智能 nlp 自然语言处理 word2vec 机器翻译分类
Seq2Seq英译法案例1任务目的：目的:给定一段英文，翻译为法文典型的文本分类（token分类）任务:每个时间步去预测应该属于哪个法文单词2数据格式注意：两列数据，第一列是英文文本，第二列是法文文本，中间用制表符号"\t"隔开iamfrombrazil.jeviensdubresil.iamfromfrance.jeviensdefrance.iamfromrussia.jeviensderus
RNN人名分类器案例
RNN人名分类器案例1任务目的：目的:给定一个人名，来判定这个人名属于哪个国家典型的文本分类任务:18分类---多分类任务2数据格式注意：两列数据，第一列是人名，第二列是国家类别，中间用制表符号"\t"隔开AngChineseAuYongChineseYuasaJapaneseYuharaJapaneseYunokawaJapanese3任务实现流程1.获取数据:案例中是直接给定的2.数据预处理:
中间件复习（java向，示例代码为java），所有问题都会有链接单独解析搞不懂语言的程序员重拾java 中间件中间件 java 开发语言
根据近些年情况整理的Java服务常用中间件及面试复习指南（每个中间件10个以上问题+实战模拟）一、核心中间件清单（2020-2023高频使用）中间件分类典型中间件核心应用场景RPC框架Dubbo3.x、gRPC、SpringCloudOpenFeign微服务通信、跨语言调用消息队列Kafka、RocketMQ、RabbitMQ异步解耦、削峰填谷、顺序消息缓存Redis（集群/Redisson）、C
JMeter中变量如何使用？测试者家园智能化测试性能测试 JMeter jmeter 智能化测试性能测试软件测试质量效能软件开发和测试持续测试
在性能测试的世界中，ApacheJMeter是一把利器，凭借其强大的可扩展性与图形化操作界面，在工业界和开源社区中广受青睐。而“变量的使用”作为JMeter中提高测试灵活性、可维护性和复用性的关键技术点，却常常被初学者忽略或误用。本文将从变量的定义方式、作用域、典型应用场景到高级技巧全面展开剖析，并结合实际案例为读者提供具有启发性的思维视角。一、什么是变量？为什么JMeter离不开它？JMeter
生成式AI技术对未来知识生产模式的颠覆性影响：跨学科案例分析德宿人工智能
引言随着人工智能技术的迅猛发展，生成式AI作为一种革命性技术正在深刻地改变人类知识生产和学术研究的范式。生成式AI不仅能够创建原创内容，还能模拟人类思维过程，处理和生成大量数据，从而在各个学科领域展现出广阔的应用前景。本研究报告旨在深入探讨生成式AI技术对未来知识生产模式的颠覆性影响，通过对比传统学术研究与AI辅助研究的范式差异，并选取医学、法学、文学、经济学和艺术学等五个典型领域进行深度案例分析
小柿子影视安卓版，跨平台开发的技术挑战与解决方案 2501_92530989 音视频百度经验分享其他
在移动应用开发的浪潮中，视频类App因其对性能、用户体验、跨平台兼容性要求高，成为开发者面临的重点技术难题之一。本文将结合实际案例，分析一个典型的视频类项目“小柿子”的跨平台开发过程中的关键技术点。一、背景介绍“小柿子影视”是一款轻量级视频播放App，专注于提供清爽的界面和流畅的播放体验。该项目同时支持小柿子安卓与小柿子iOS两个平台，目标用户覆盖广泛。因此，跨平台开发策略、播放器内核选择、缓存机
推荐算法特征工程实战：用户与物料动态画像构建指南 Jay Kay 推荐算法推荐算法算法机器学习
在推荐系统的特征工程中，动态画像是提升推荐精准性的核心武器。通过捕捉用户行为偏好和物料热度变化，算法能实现千人千面的精准推荐。本文结合两张关键图表，深入解析动态画像的构建方法与工程实践。一、用户动态画像：六大维度精准刻画兴趣偏好用户动态画像基于六个关键维度构建（如表2-1所示），形成"6W"行为模型：用户粒度物料属性时间粒度动作类型统计对象统计方法1.核心维度解析（附典型场景）维度可选值应用场景用
【LangChain】langchain.chains.create_sql_query_chain() 函数：基于自然语言生成 SQL 查询的链（Chain）彬彬侠 LangChain langchain chains create_sql_quer sql_database sql
langchain.chains.create_sql_query_chain函数是LangChain库中的一个函数，用于创建基于自然语言生成SQL查询的链（Chain），结合语言模型（LLM）和数据库上下文生成可执行的SQL语句。本文基于LangChain0.3.x，详细介绍create_sql_query_chain的定义、参数、方法和典型场景，并提供一个独立示例，展示如何使用create_s
C#.NET in、out、ref详解 c#.net
简介在C#中，in、ref和out是用于修改方法参数传递方式的关键字，它们决定了参数是按值传递还是按引用传递，以及参数是否必须在传递前初始化。基本语义对比修饰符传递方式可读写性必须初始化调用前必须赋值典型场景ref引用传递可读可写需先在调用前初始化是修改调用者变量；传大对象避免拷贝in只读引用传递只读（不能赋值）需先在调用前初始化是传递大值类型以避免拷贝out引用传递必须在方法体内赋值调用前可未初
IDP单点登录流程就叫飞六吧 java
单点登录（SSO，SingleSign-On）的核心是通过**统一的身份认证中心（IdentityProvider,IdP）**管理用户身份，避免用户在多个系统中重复登录。以下是基于IdP的认证思路及典型流程：一、核心角色IdentityProvider(IdP)负责认证用户身份（如输入用户名密码、短信验证、OAuth授权等）。颁发令牌（如SAML断言、JWT、OAuthToken）给服务提供方。
Web中间件性能调优指南：线程池、长连接与负载均衡的最佳实践编程实战派-李工《Java 负载均衡中间件优化 Tomcat调优 Nginx配置性能工程线程池技术 Keep-Alive优化
目录引言一、Web容器线程池配置不当1.1线程池参数的核心作用与影响1.2线程池大小计算模型1.3动态调优实践二、Keep-Alive机制配置缺陷2.1Keep-Alive的工作原理2.2典型配置问题与影响2.3优化配置建议三、负载均衡策略缺失3.1负载均衡的核心价值3.2主流负载均衡算法对比3.3Nginx关键配置优化四、全链路压测与调优方案4.1压测实施流程4.2典型优化案例4.3持续监控体系
IPv4 前缀长度与主机位关系大全表（/0 到 /32）-版本2 韩公子的Linux大集市二网络AiOps 服务器网络运维
文章目录关键说明：以下是IPv4地址空间中前缀长度与主机位关系的完整表格大全，按照前缀长度从小到大（主机位从大到小）排列：前缀长度子网掩码主机位数量地址总数可用主机数典型应用场景/00.0.0.0324,294,967,296不可用默认路由/1128.0.0.0312,147,483,648不可用理论划分/2192.0.0.0301,073,741,8241,073,741,822国家级网络/32
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置