佩亦之

机器学习--朴素贝叶斯分类器（python手动实现）

机器学习-朴素贝叶斯分类器

简介
名词介绍
公式
概率分布
数据集及代码实现
- 代码实现
- - 定义容器对象
  - 循环提取十个桶文件中的数据，分门别类存储
  - 计算先验概率，条件概率
  - 预测分类
  - 测试集验证
  - 预测测试
  - 十折交叉验证
- 代码汇总
总结

简介

朴素贝叶斯（Naive Bayes）是基于贝叶斯定理和概率论预测样本类别的概率算法，而朴素一词的来源就是假设各特征之间相互独立。朴素贝叶斯属于监督学习的生成模型，实现简单，没有迭代，并有坚实的数学理论（即贝叶斯定理）作为支撑。在大量样本下会有较好的表现，不适用于输入向量的特征条件有关联的场景。
关于贝叶斯定理的详细介绍

名词介绍

拿西瓜是否成熟举例，假设判断西瓜成熟的特征有：瓜蒂是否脱落，敲打的声音-浊响|清脆

先验概率：
先验概率是根据以往经验和分析得到的概率，先验概率无需样本数据，不受任何条件的影响。比如有1000个西瓜，其中熟瓜600，涩瓜400，则先验概率p（熟瓜）=0.6，p（涩瓜）=0.4，并不受瓜蒂和敲打声音的影响。再比如硬币正反面概率各为0.5也是先验概率。
后验（条件）概率：
已知结果或者某一条件（结果也是一种条件），求知条件或者结果的概率。比如已知某西瓜瓜蒂脱落，判断瓜成熟的概率，即p(成熟|瓜蒂脱落)。
拉普拉斯平滑（Laplace smoothing）：
它的思想非常简单，就是对先验概率的分子（划分的计数）加1，分母加上类别数；对条件概率分子加1，分母加上对应特征的可能取值数量。这样在解决零概率问题的同时，也保证了概率和依然为1。
直接的作用就是防止模型“过拟合”，提高了模型的泛化性能。
也是解决样本为0的时概率为0的问题，因为若p(B)为0，则P(B|A)也为0，而实际并非如此。
概率密度函数：
用于描述连续型随机变量所服从的概率分布，由此判断不可列的连续型随机变量的概率。

公式

贝叶斯公式：
朴素贝叶斯基本公式：
即P(B|A) = P(A|B)P(B)
概率密度函数：
正态分布：

概率分布

高斯分布型：
正态曲线呈钟型，两头低，中间高，左右对称因其曲线呈钟形，因此人们又经常称之为钟形曲线
多项式型：
用于离散值模型里。比如文本分类问题里面我们提到过，我们不光看词语是否在文本中出现，也得看出现次数。如果总词数为n，出现词数为m的话，有点像掷骰子n次出现m次这个词的场景。
伯努利型：
亦称“零一分布”、“两点分布”：一个事情有两种可能的结果，其中结果为1的发生概率为a,结果2发生的概率为1-a

数据集及代码实现

数据集是使用了分层抽样的十折交叉验证的，所以分为了十个名字相似的各类样本相近的数据集桶文件，如下：
该数据集为国会投票的样本：

分析数据集：
democrat为民主党，republican为共和党，即标签，表示类别
此后y和n表示特征，共16个特征，每个特征两个类别

代码实现

定义容器对象

存储从数据集中提取的数据，存储对数据统计分析的结果
数据分为三类：标签类别（democrat/republican），字符型特征（y/n），数值型（即连续型，该数据集没有此类型）

        '''
        params:
            bucketPrefix： 桶文件名的前缀
            testBucketNumber：测试数据所在的桶的编号
            dataFormat: 数据文件格式列表
        
        '''
        total=0    #记录总数据量
        classes={} #存类别出现的次数
        counts={} #每个类别对应的属性值出现的次数
        self.format = dataFormat.strip().split('\t') # 切分每一列的数据类型
        
        '''
        存储数值型数据信息
        '''
        totals={} # 每种类别对应的值的总和
        numericValues={} #存每种类别对应的列的取值  
        
        '''
        存储计算出的概率
        '''
        self.prior={} #先验概率
        self.condition={} #条件概率

循环提取十个桶文件中的数据，分门别类存储

十个桶文件中根据传入的参数指定一个为测试数据集，其他九个都为训练数据集

        for i in range(1,11): #循环10次
            if i!=testBucketNumber: #判断是否为测试集
                filename='%s-%02i'%(bucketPrefix,i)
                f=open(filename,'r')
                lines = f.readlines()
                f.close()
                for line in lines:
                    
                    total=total+1 #统计总数
                    fields = line.strip().split('\t') #分割文件的每列 
                    vector =[]  #存储字符型特征
                    '''
                    保存每一条数据的数值型数据
                    '''
                    nums=[]
                    #分门别类存储标签和不同类型的特征
                    for i in range(len(fields)):
                        if self.format[i]=='attr':
                            vector.append(fields[i])
                        elif self.format[i]=='class':
                            category=fields[i]
                        elif self.format[i]=='num':
                            nums.append(float(fields[i]))
                            
                    #记录每个列别出现的次数
                    classes.setdefault(category,0)
                    counts.setdefault(category,{})
                    classes[category]+=1
                    
                    '''
                    记录每个数值型数据
                    '''
                    totals.setdefault(category,{})
                    numericValues.setdefault(category,{})
                    
                    #循环处理么每条记录出现的属性值
                    #循环vector 取出每列值
                    col=0
                    for columnValue in vector:
                        col+=1
                        counts[category].setdefault(col,{})
                        counts[category][col].setdefault(columnValue,0)
                        counts[category][col][columnValue]+=1
                    '''
                    counts形成的结构为：
                    {
                    'democrat': 
                        {
                            1: {'y': 64, 'n': 48}, 
                            2: {'n': 64, 'y': 48},
                            ...
                            16: {'y': 105, 'n': 7}
                        },
                   'republican': 
                       {
                           1: {'y': 22, 'n': 76},
                           2: {'y': 46, 'n': 52},
                           ...
                           16: {'n': 30, 'y': 68}
                        }
                    }
                    '''
                    
                    '''
                    保存每个数值型数据与类别的对应字典
                    '''
                    col=0
                    for columnValue in nums:
                        col+=1
                        totals[category].setdefault(col,0)
                        totals[category][col]+=columnValue
                        numericValues[category].setdefault(col,[])
                        numericValues[category][col].append(columnValue)

计算先验概率，条件概率

多项式类型数据的概率，利用贝叶斯公式（引入拉普拉斯平滑）计算先验概率，再计算条件概率

#开始计算概率
		# classes：  {'democrat': 112, 'republican': 98}
        for (category, count) in classes.items():
            self.prior[category] = count/total
            
        #条件概率： 注意：columns是一个字典
        for (category, columns) in counts.items():
            self.condition.setdefault(category,{})
            
            for (col,valueCount) in columns.items():
                self.condition[category].setdefault(col, {})
                
                # 此处引入拉普拉斯平滑处理已存在值
                for (attrValue, count) in valueCount.items():
                    # 此处先计算所有在样本中已存在值的条件概率 ( nc+(mp))/(N+m)
                    m=len(counts[category][col].items())
                    self.condition[category][col][attrValue] = (count+1)/(classes[category]+m)
                    
        # 设置为类成员，方便在创建类对象后查看
        self.counts=counts
        self.classes=classes

处理连续型数值型数据的概率，因为连续型数据的分布不如多项式型数据直观，引入概率密度函数使得我们能直观的从数据上比较观察,这里先计算概率密度函数所需的均值和样本标准差

		self.means={}
        self.totals=totals
        #先计算均值
        for (category, columns) in totals.items():
            self.means.setdefault(category,{})
            for (col,colTotal) in columns.items():
                self.means[category][col]=colTotal/classes[category]
        #在计算样本标准差
        self.ssd={}
        for (category,columns) in numericValues.items():
            self.ssd.setdefault(category,{})
            for (col,values) in columns.items():
                sumOfSquareDifferences=0
                theMean = self.means[category][col]
                for value in values:
                    sumOfSquareDifferences+= (value-theMean)**2
                columns[col] =0
                self.ssd[category][col] = math.sqrt(sumOfSquareDifferences/(classes[category]-1))

预测分类

在处理完所有样本的信息后，我们已经得到样本类别的统计，各类别（标签）中每个特征的数量统计，以及各类别每个特征的概率，接下来就可以利用这些数据和贝叶斯公式预测待测样本在各类别的概率

    def classify(self, itemVector, numVector):
        self.results=[] # [()]
        for (category, prior) in self.prior.items():
            prob = prior
            col=1
            for attrValue in itemVector:
                if not attrValue in self.condition[category][col]:
                    # prob=0 即nc=0 ( nc+(mp))/(N+m) = 1/(n+m) 
                    #此处计算缺失值的概率/处理样本中0概率事件 ,因为实际情况事件概率可能不为0,只是概率低未出现在样本中
                    #如果想进一步优化,可以对拉普拉斯平滑值调参
     
                    m=len(self.counts[category][col].items())
                    temp=1/(self.classes[category]+m)
                    prob=prob*temp
                else:
                    prob = prob*self.condition[category][col][attrValue]
                col+=1
            '''
            数值型的联合概率运算
            '''
            sqrt2pi = math.sqrt(2*math.pi)
            col=1
            for x in numVector:
                mean = self.means[category][col]
                ssd = self.ssd[category][col]
                # 使用概率密度公式
                ePart = math.pow(math.e, -(x-mean)**2/(2*ssd**2))
                prob = prob*((1.0/(sqrt2pi*ssd))*ePart)
                col+=1
            self.results.append((prob,category))
            
        #这里返回值为预测概率最大的类别
        return max(self.results)[1]

测试集验证

因为十个桶文件中有一个是测试集，之前的操作都是处理训练集数据训练模型，我们需要用测试来评断模型的好坏

    def testBucket(self,bucketPrefix, bucketNumber):
    	'''
		用 bucketNumber 这个桶做测试集，来完成十折交叉测试
		'''
    	#提取测试集数据
        filename = '%s-%02i'%(bucketPrefix,bucketNumber)
        print('待测试的桶为：',filename)
        f = open(filename)
        lines = f.readlines()
        f.close()
        #循环lines中的每一行数据，调用classify进行预测，保留预测结果
        totals={}
        for line in lines:
            data = line.strip().split('\t')
            vector=[] # 存储真实的待预测的数据
            numV=[]
            classInColumn=-1  # 类别在原始数据中的列索引
            for i in range(len(self.format)):
                if self.format[i]=='attr':
                    vector.append(data[i])
                elif self.format[i]=='class':
                    classInColumn=i
                elif self.format[i]=='num':
                    numV.append(float(data[i]))
            #取出这个一行line的实际类别名
            theRealClass = data[classInColumn]
           	# 对vector 特征向量进行预测类别
            predictClass = self.classify(vector,numV)
            # 预测结果 totals结构为{'democrat': {'democrat': 12}, 'republican': {'republican': 10}}
            totals.setdefault(theRealClass,{})
            totals[theRealClass].setdefault(predictClass,0)
            totals[theRealClass][predictClass]+=1
        return totals

预测测试

使用第七个文件作为测试数据集

c=Classifer('house-votes/hv', 7, 'class\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr')
c.testBucket('house-votes/hv',7)

结果：
真实标签为democrat的12个预测中，有9个预测结果为democrat，3个预测结果为republican
真实标签为republican的11个预测中，有10个预测结果为republican，1个预测结果为democrat

待测试的桶为： house-votes/hv-07
{'democrat': {'republican': 3, 'democrat': 9},
 'republican': {'republican': 10, 'democrat': 1}}

十折交叉验证

从一个测试桶文件中看不出什么，我们将十个桶的每个桶文件轮流做测试数据集，而其他九个桶文件做训练集，这样得到的十个结果的准确率的平均值，就是比较理想的预测正确率，
当然这里做了混淆矩阵的正确率，准确率，召回率三指标的输出，方便观察模型的好坏

#自动化进行10折交叉验证
def tenfold(bucketPrefix, dataFormat):
    results = {}
    for i in range(1,11):
        c = Classifer(bucketPrefix,i,dataFormat)
        t = c.testBucket(bucketPrefix,i)
        for (key,value) in t.items():
            results.setdefault(key, {})
            for (ckey ,cvalue) in value.items():
                results[key].setdefault(ckey, 0)
                results[key][ckey]+= cvalue
    print(results)
    categories  =list(results.keys()) #['democrat', 'republican']
    categories.sort()
    print("\n          混淆矩阵")
    header = "         "
    subheader = "                +"
    for category in categories:
        header+= "  %10s   " %category
        subheader += "-------+"
    print(header)
    print(subheader)
    total = 0.0
    correct = 0.0
    confusion_matrix=[]
    for category in categories: #['democrat', 'republican']
        row = " %10s     |" %category
        for c2 in categories:##['democrat', 'republican']    tp0               fn 1                              tn   3             fp2
            if c2 in results[category]:  #{'democrat': {'democrat': 111, 'republican': 13}, 'republican': {'republican': 99, 'democrat': 9}}
                count = results[category][c2]
            else:
                count = 0
            row+= " %5i  |"%count
            total +=count
            if c2 == category:
                correct +=count
                confusion_matrix.append(count)
            else:
                confusion_matrix.append(count)

        print(row)
    print(subheader)
    
    print("\n正确率：%5.3f "%((correct * 100 )/total))
    print("实例总数： %s" %total)
    print("准确率：\ndemocrat:%5.3f\nrepublican:%5.3f"%(confusion_matrix[0]/(confusion_matrix[0]+confusion_matrix[2]),confusion_matrix[3]/(confusion_matrix[3]+confusion_matrix[1])))
    print("召回率：\ndemocrat:%5.3f\nrepublican:%5.3f"%(confusion_matrix[0]/(confusion_matrix[0]+confusion_matrix[1]),confusion_matrix[3]/(confusion_matrix[3]+confusion_matrix[2])))
    
    return (results,total)

tenfold("house-votes/hv", 'class\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr\tattr')

待测试的桶为： house-votes/hv-01
待测试的桶为： house-votes/hv-02
待测试的桶为： house-votes/hv-03
待测试的桶为： house-votes/hv-04
待测试的桶为： house-votes/hv-05
待测试的桶为： house-votes/hv-06
待测试的桶为： house-votes/hv-07
待测试的桶为： house-votes/hv-08
待测试的桶为： house-votes/hv-09
待测试的桶为： house-votes/hv-10
{'democrat': {'democrat': 111, 'republican': 13}, 'republican': {'republican': 101, 'democrat': 7}}

          混淆矩阵
             democrat     republican   
                +-------+-------+
   democrat     |   111  |    13  |
 republican     |     7  |   101  |
                +-------+-------+

正确率：91.379 
实例总数： 232.0
准确率：
democrat:0.941
republican:0.886
召回率：
democrat:0.895
republican:0.935

总预测正误情况

({'democrat': {'democrat': 111, 'republican': 13},
  'republican': {'republican': 101, 'democrat': 7}},
 232.0)

代码汇总

import math
class Classifer:
    def __init__(self, bucketPrefix, testBucketNumber, dataFormat):
        '''
        params:
            bucketPrefix： 桶文件名的前缀
            testBucketNumber：测试数据所在的桶的编号
            dataFormat: 数据文件格式列表
        
        '''
        total=0    #记录总数据量
        classes={} #存类别出现的次数
        counts={} #每个类别对应的属性值出现的次数
        self.format = dataFormat.strip().split('\t') # 切分每一列的数据类型
        
        '''
        存储数值型数据信息
        '''
        totals={} # 每种类别对应的值的总和
        numericValues={} #存每种类别对应的列的取值  
        
        '''
        存储计算出的概率
        '''
        self.prior={} #先验概率
        self.condition={} #条件概率
        
        for i in range(1,11): #循环10次
            if i!=testBucketNumber: #判断是否为测试集
                filename='%s-%02i'%(bucketPrefix,i)
                f=open(filename,'r')
                lines = f.readlines()
                f.close()
                for line in lines:
                    
                    total=total+1 #统计总数
                    fields = line.strip().split('\t') #分割文件的每列 
                    vector =[]  #存储字符型特征
                    '''
                    保存每一条数据的数值型数据
                    '''
                    nums=[]
                    #分门别类存储标签和不同类型的特征
                    for i in range(len(fields)):
                        if self.format[i]=='attr':
                            vector.append(fields[i])
                        elif self.format[i]=='class':
                            category=fields[i]
                        elif self.format[i]=='num':
                            nums.append(float(fields[i]))
                            
                    #记录每个列别出现的次数
                    classes.setdefault(category,0)
                    counts.setdefault(category,{})
                    classes[category]+=1
                    
                    '''
                    记录每个数值型数据
                    '''
                    totals.setdefault(category,{})
                    numericValues.setdefault(category,{})
                    
                    #循环处理么每条记录出现的属性值
                    #循环vector 取出每列值
                    col=0
                    for columnValue in vector:
                        col+=1
                        counts[category].setdefault(col,{})
                        counts[category][col].setdefault(columnValue,0)
                        counts[category][col][columnValue]+=1
                    '''
                    counts形成的结构为：
                    {
                    'democrat': 
                        {
                            1: {'y': 64, 'n': 48}, 
                            2: {'n': 64, 'y': 48},
                            ...
                            16: {'y': 105, 'n': 7}
                        },
                   'republican': 
                       {
                           1: {'y': 22, 'n': 76},
                           2: {'y': 46, 'n': 52},
                           ...
                           16: {'n': 30, 'y': 68}
                        }
                    }
                    '''
                    
                    '''
                    保存每个数值型数据与类别的对应字典
                    '''
                    col=0
                    for columnValue in nums:
                        col+=1
                        totals[category].setdefault(col,0)
                        totals[category][col]+=columnValue
                        numericValues[category].setdefault(col,[])
                        numericValues[category][col].append(columnValue)
                        
        print(counts)  
#开始计算概率
# classes：  {'democrat': 112, 'republican': 98}
        for (category, count) in classes.items():
            self.prior[category] = count/total
            
        #条件概率： 注意：columns是一个字典
        for (category, columns) in counts.items():
            self.condition.setdefault(category,{})
            
            for (col,valueCount) in columns.items():
                self.condition[category].setdefault(col, {})
                
                # 此处引入拉普拉斯平滑处理已存在值
                for (attrValue, count) in valueCount.items():
                    # 此处先计算所有在样本中已存在值的条件概率 ( nc+(mp))/(N+m)
                    m=len(counts[category][col].items())
                    self.condition[category][col][attrValue] = (count+1)/(classes[category]+m)
                    
        # 设置为类成员，方便在创建类对象后查看
        self.counts=counts
        self.classes=classes
        '''
        开始计算数值型数据的概率密度函数
        '''
        self.means={}
        self.totals=totals
        #先计算均值
        for (category, columns) in totals.items():
            self.means.setdefault(category,{})
            for (col,colTotal) in columns.items():
                self.means[category][col]=colTotal/classes[category]
        #在计算样本标准差
        self.ssd={}
        for (category,columns) in numericValues.items():
            self.ssd.setdefault(category,{})
            for (col,values) in columns.items():
                sumOfSquareDifferences=0
                theMean = self.means[category][col]
                for value in values:
                    sumOfSquareDifferences+= (value-theMean)**2
                columns[col] =0
                self.ssd[category][col] = math.sqrt(sumOfSquareDifferences/(classes[category]-1))
        
        
    def classify(self, itemVector, numVector):
        self.results=[] # [()]
        for (category, prior) in self.prior.items():
            prob = prior
            col=1
            for attrValue in itemVector:
                if not attrValue in self.condition[category][col]:
                    # prob=0 即nc=0 ( nc+(mp))/(N+m) = 1/(n+m) 
                    #此处计算缺失值的概率/处理样本中0概率事件 ,因为实际情况事件概率可能不为0,只是概率低未出现在样本中
                    #如果想进一步优化,可以对拉普拉斯平滑值调参
     
                    m=len(self.counts[category][col].items())
                    temp=1/(self.classes[category]+m)
                    prob=prob*temp
                else:
                    prob = prob*self.condition[category][col][attrValue]
                col+=1
            '''
            数值型的联合概率运算
            '''
            sqrt2pi = math.sqrt(2*math.pi)
            col=1
            for x in numVector:
                mean = self.means[category][col]
                ssd = self.ssd[category][col]
                # 使用概率密度公式
                ePart = math.pow(math.e, -(x-mean)**2/(2*ssd**2))
                prob = prob*((1.0/(sqrt2pi*ssd))*ePart)
                col+=1
            self.results.append((prob,category))
            
        #这里返回值为预测概率最大的类别
        return max(self.results)[1]
    
    def testBucket(self,bucketPrefix, bucketNumber):
        '''
        用 bucketNumber 这个桶做测试集，来完成十折交叉测试
        '''
        #提取测试集数据
        filename = '%s-%02i'%(bucketPrefix,bucketNumber)
        print('待测试的桶为：',filename)
        f = open(filename)
        lines = f.readlines()
        f.close()
        #循环lines中的每一行数据，调用classify进行预测，保留预测结果
        totals={}
        for line in lines:
            data = line.strip().split('\t')
            vector=[] # 存储真实的待预测的数据
            numV=[]
            classInColumn=-1  # 类别在原始数据中的列索引
            for i in range(len(self.format)):
                if self.format[i]=='attr':
                    vector.append(data[i])
                elif self.format[i]=='class':
                    classInColumn=i
                elif self.format[i]=='num':
                    numV.append(float(data[i]))
            #取出这个一行line的实际类别名
            theRealClass = data[classInColumn]
           	# 对vector 特征向量进行预测类别
            predictClass = self.classify(vector,numV)
            # 预测结果 totals结构为{'democrat': {'democrat': 12}, 'republican': {'republican': 10}}
            totals.setdefault(theRealClass,{})
            totals[theRealClass].setdefault(predictClass,0)
            totals[theRealClass][predictClass]+=1
        return totals

#自动化进行10折交叉验证
def tenfold(bucketPrefix, dataFormat):
    results = {}
    for i in range(1,11):
        c = Classifer(bucketPrefix,i,dataFormat)
        t = c.testBucket(bucketPrefix,i)
        for (key,value) in t.items():
            results.setdefault(key, {})
            for (ckey ,cvalue) in value.items():
                results[key].setdefault(ckey, 0)
                results[key][ckey]+= cvalue
    print(results)
    categories  =list(results.keys()) #['democrat', 'republican']
    categories.sort()
    print("\n          混淆矩阵")
    header = "         "
    subheader = "                +"
    for category in categories:
        header+= "  %10s   " %category
        subheader += "-------+"
    print(header)
    print(subheader)
    total = 0.0
    correct = 0.0
    confusion_matrix=[]
    for category in categories: #['democrat', 'republican']
        row = " %10s     |" %category
        for c2 in categories:##['democrat', 'republican']    tp0               fn 1                              tn   3             fp2
            if c2 in results[category]:  #{'democrat': {'democrat': 111, 'republican': 13}, 'republican': {'republican': 99, 'democrat': 9}}
                count = results[category][c2]
            else:
                count = 0
            row+= " %5i  |"%count
            total +=count
            if c2 == category:
                correct +=count
                confusion_matrix.append(count)
            else:
                confusion_matrix.append(count)

        print(row)
    print(subheader)
    
    print("\n正确率：%5.3f "%((correct * 100 )/total))
    print("实例总数： %s" %total)
    print("准确率：\ndemocrat:%5.3f\nrepublican:%5.3f"%(confusion_matrix[0]/(confusion_matrix[0]+confusion_matrix[2]),confusion_matrix[3]/(confusion_matrix[3]+confusion_matrix[1])))
    print("召回率：\ndemocrat:%5.3f\nrepublican:%5.3f"%(confusion_matrix[0]/(confusion_matrix[0]+confusion_matrix[1]),confusion_matrix[3]/(confusion_matrix[3]+confusion_matrix[2])))
    
    return (results,total)

总结

朴素贝叶斯代码的实现其实分为下面几部分：

提取数据集数据
分析处理数据集数据
计算概率（先验，条件，联合）
根据贝叶斯公式计算预测概率

其中处理不同数据类型（伯努利，多项式，连续型）和0概率情况，还用到了：

概率密度函数
拉普拉斯平滑

但是在官方sklearn的朴素贝叶斯函数中还有许多地方可以调参优化模型准确率，这里只是简单的实现，熟悉基本原理。
若有不足之处，请提醒我改正，感激不尽

python中的静态方法绛洞花主敏明 python
问题：pycharm中建立新的方法，出现如下的警告：在python中建立类一般使用如下的方法：classDog(object):defrun(self):print("running")run方法是类中的普通方法声明和创建静态方法，在方法上加上staticmethod注明一下classDog(object):@staticmethoddefrun(self):print("running")如下的
一文弄懂Python 变量初始化与内存管理宇寒风暖 python编程 python 开发语言笔记学习
在Python中，变量的初始化并不一定会开辟新的内存空间。Python的内存管理机制非常灵活，它会根据变量的值、类型以及Python的内部优化策略来决定是否复用已有的内存空间。1.变量初始化的基本概念在Python中，变量是对象的引用。当你初始化一个变量时，Python会执行以下操作：创建一个对象（如果该对象不存在）。将变量名绑定到该对象。例如：a=10b="hello"a是一个整数对象的引用。b
python静态方法_Python静态方法 cunchi4221 python java 深度学习设计模式 javascript ViewUI
python静态方法Python静态方法(Pythonstaticmethod)Inthisquickpost,wewilllearnhowtocreateanduseaPythonstaticmethod.Wewillalsohavealookatwhatadvantagesanddisadvantagesstaticmethodsofferascomparedtotheinstancemeth
python中的类方法，静态方法，对象方法 a174817529
原文地址：http://blog.chinaunix.net/uid-26602509-id-3087296.htmlclassA:count=100def__init__(self,instancedata):self.instancedata=instancedata@staticmethod#静态方法不能访问类参数和实例参数defsm():print"sm"@classmethod#类方法不
Python 静态方法和类方法 a540366413 Python python
静态方法我们知道在其他语言中静态方法一般使用static修饰，静态方法的主要特点是不需要new出对象，直接通过类名就可以访问，也可以通过对象访问。需要使用staticmethod装饰器装饰方法举例：classA:@staticmethoddefstaticfunc():print("A")A.staticfunc()#A类方法类方法和静态方法类似，也可以直接通过类名访问，不过要使用classmet
Python静态方法 Frank_Yee python
在Python中，静态方法是一种不会自动接收类（cls）或实例（self）作为第一个参数的方法。它可以通过类直接调用，而不需要类的实例。静态方法通常用于实现与当前类的对象状态无关的功能，或者提供一些通用的工具函数。一、使用场景1.工具函数：当方法不需要访问对象属性或类属性时，可以将其定义为静态方法。2.常量类：有时候，你可能需要一个类仅仅作为一个容器，用来存储常量。3.工厂方法：在某些情况下，你可
【机器学习】建模流程 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能线性回归逻辑回归
1、数据获取1.1来源数据获取是机器学习建模的第一步，常见的数据来源包括数据库、API、网络爬虫等。数据库是企业内部常见的数据存储方式，例如：MySQL、Oracle等关系型数据库，以及MongoDB等非关系型数据库，它们能够存储大量的结构化和非结构化数据API（应用程序编程接口）提供了从外部获取数据的便捷方式，例如：社交媒体平台的API可以获取用户发布的内容和互动信息网络爬虫则适用于从网页中提取
day11 学习笔记豆豆学习笔记 python
文章目录前言一、类方法二、静态方法三、构造方法四、魔术方法前言通过今天的学习，我掌握了更多Python中有关面向对象编程思想中方法的概念与操作，包括类方法，静态方法，构造方法，魔术方法一、类方法类方法是属于类的行为，一般使用类而非对象进行调用类方法需要使用@classmethod装饰器定义类方法至少有一个形参用于绑定类，约定为cls类和该类的实例都可以调用类方法，但一般不用实例进行调用类方法不能访
Python 正则表达式小结1 大收藏家 Python 正则表达式 python
[声明]：本文参考了白夜黑雨老师的网页讲解。如有侵权，请与我联系！！！Python正则表达式小结11.正则表达式验证2.特殊元字符及含义3匹配某种字符类型4.正则表达式举例大收藏家说1.正则表达式验证提供两个网站用于正则表达式的验证，可以敲入文本与正则表达式。通过该网站，验证正则表达式的正确性。非常好用！英文网站中文网站2.特殊元字符及含义元字符含义.表示要匹配除了换行符之外的任何单个字符*星号-
python离线语音转文本_使用Python将语音转换为文本的方法 weixin_39760619 python离线语音转文本
使用Python将语音转换为文本的方法,语音,转换为,文本,您的,麦克风使用Python将语音转换为文本的方法易采站长站，站长之家为您整理了使用Python将语音转换为文本的方法的相关内容。语音识别是计算机软件识别口语中的单词和短语，并将其转换为可读文本的能力。那么如何在Python中将语音转换为文本？如何使用SpeechRecognition库在Python中将语音转换为文本？我们不需要从头开始
Open-Sora - 为所有人实现高效的视频制作大众化小众AI AI开源音视频人工智能 AI编程
GitHub：https://github.com/hpcaitech/Open-Sora更多AI开源软件：发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AI这是一款开源的SOTA（State-of-the-Art）视频生成模型，仅用20万美元（224张GPU）就能训练出商业级11B参数的视频生成大模型。它采用Python语言和PyTorch深度学习框架开发，具有生成速度快、资源消
8、Python 字符串处理与正则表达式实战指南 wolf犭良 python python 正则表达式
Python字符串处理与正则表达式实战指南文章概述本文深入探讨Python字符串处理核心方法与正则表达式实战技巧，涵盖字符串编码转换、分割替换、正则表达式语法精髓，并通过日志解析、数据清洗等真实场景案例展示高阶应用。最后提供10道阶梯式练习题（附完整答案代码），助你从基础到进阶全面掌握文本处理技能。一、字符串处理核心三剑客1.1编码转换（encode/decode）text="中文文本"utf8_
deepseek api参数详解孽小倩大语言模型 python java 前端人工智能 deepseek
deepseek的参数与openai保持兼容，所以openai能用的参数deepseek都可以使用，以下是常用的参数介绍。在使用Deepseek/OpenAI的PythonAPI时，最常用的API端点是chat/completions，用于调用deepseek生成文本对话内容。以下是openai.ChatCompletion.create()方法的主要参数及其作用：1.model作用：指定使用的模
算法基础——蓝桥杯（python实现，实际上大多数用c++更明白易懂）（第一部分，共12个小题） New_Teen 算法蓝桥杯 python
1.成绩统计问题描述:编写一个程序，建立一个字典，每个字典包含姓名、学号、英语成绩、数学成绩和C++成绩，并通过字典操作平均分最高的学生和平均分最低的学生并且输出。输入格式：输入n+1行，第一行输入一个正整数n，表示学生数量；接下来的n行每行输入5个数据，分别表示姓名、学号、英语成绩、数学成绩和C++成绩。注意成绩有可能会有小数。输出格式：输出两行，第一行输出平均成绩最高的学生姓名。第二行输出平均
Python（正则表达式）羡江007 Python进阶 python 正则表达式开发语言
re模块#在Python中需要通过正则表达式对字符串进行匹配的时候，可以使用一个re模块'''re模块三步走#第一步：导入re模块importre#第二步：使用match方法进行匹配操作result=re.match(pattern正则表达式,string要匹配的字符串,flags=0)#第三步：如果数据匹配成功，使用group方法来提取数据result.group()re.match(patte
Ubuntu20.04安装并配置Pycharm2020.2.5 搬砖的打工人!!! ubuntu pycharm python
一.下载pycharm社区版1.下载地址：PyCharm:thePythonIDEfordatascienceandwebdevelopmentThePythonIDEfordatascienceandwebdevelopmentwithintelligentcodecompletion,on-the-flyerrorchecking,quick-fixes,andmuchmore.https:/
使用python中you-get库实现下载网抑云瞎老弟 python python 音视频爬虫
WYY音乐下载前言代码实现使用说明前言前几天，我做了b站视频的下载，有好兄弟表示，只下载视频，不能够让人满足，我还希望能够下载网易云的音乐。上一次在我发布的b站视频下载中，使用了you-get库作为下载方式，但是实际上，这个库也可以下载网易云音乐，因此，我们只需要参考我们上次的b站视频下载，简单的进行一下修改，就可以完成音乐的下载了。为了能够更加方便的批量下载音乐，这里采用了“按艺术家“的下载方式
机器学习课堂4线性回归模型+特征缩放木尘152132 机器学习线性回归 python
一、实验2-2，线性回归模型，计算模型在训练数据集和测试数据集上的均方根误差代码：#2-2线性回归模型importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#参数设置iterations=3000#迭代次数learning_rate=0.0001#学习率m_train=3000#训练样本的数量flag_plot_lines=False
Python用Pyqt5制作音乐播放器 Aix959 python 开发语言
具体效果如下需要实现的功能主要的几个有：1、搜索结果更新至当前音乐的列表，这样播放下一首是搜素结果的下一首2、自动播放3、滚动音乐文本4、音乐进度条5、根据实际情况生成音乐列表。我这里的是下面的情况，音乐文件的格式是歌名_歌手.mp3所以根据需求修改find_mp3_files方法，我这里返回的是[{"path":音乐文件路径,"music":歌名,"singer":歌手},{"path":音乐文
使用vscode远程连接linux运行项目报错解决方案大数据lsy 笔记 vscode linux python
报错：subprocess.CalledProcessError:Command'['/xxx/anaconda3/envs/graphinvent/bin/python','./graphinvent/main.py','--job-dir','/xxx/GraphINVENT/output_gdb13_1K/example/job_0/']'returnednon-zeroexitstatus
代码管理工具——SVN weixin_33728708 git 开发工具 python
2019独角兽企业重金招聘Python工程师标准>>>SVN版本控制的作用：记录若干文件内容变化，以便将来查阅特定版本修订情况。版本管理工具发展简史，cvs-->svn-->Git（参考：http://luckypoem14.github.io/test/2012/04/24/scm-history/）。svn全称subversion，是一个开源版本控制系统（C/S架构），始于2000年；git（
jieba库词频统计_jieba分词器（应用及字典的补充）及文档高频词提取实战袁圆园建建 jieba库词频统计
jieba分词器是Python中最好的中文分词组件，本文讲解一下jieba分词器及其应用。1、jieba分词器的分词模式jieba分词器提供了三种常用的分词模式1、精确模式：将句子按照最精确的方法进行切分，适合用于进行文本分析；2、全模式：将句子当中所有可以成词的词语都扫描出来，分词速度很快但容易产生歧义；3、搜索引擎模式：在精确模式分词的基础上，将长的句子再次进行切分，提高召回率，适用于搜索引擎
【LeetCode 热题 100】3. 无重复字符的最长子串 | python 【中等】一只小白跳起来 leetcode java 算法开发语言
美美超过管解题目：3.无重复字符的最长子串给定一个字符串s，请你找出其中不含有重复字符的最长的长度。示例1:输入:s="abcabcbb"输出:3解释:因为无重复字符的最长子串是"abc"，所以其长度为3。注意：考虑空字符串问题有重复之后要在重复的那个后面新建序列，减少时间，故需要列表储存（标准做法里用的集合捏）标准做法：把重复的set.remove（），a指针步进，没有重复的话，b指针一直步进怎
并发爬虫实战：多线程高效抓取王者荣耀全英雄皮肤 YiFoEr_Liu 爬虫案例实操爬虫部署 python 爬虫 python 大数据
一、场景与挑战在网络爬虫开发中，我们常常面临以下挑战：需要处理成百上千个页面的数据抓取目标服务器存在反爬机制和请求频率限制单线程模式下载效率低下，难以充分利用带宽本文以王者荣耀英雄皮肤下载为例（日访问量超过1亿的热门游戏），演示如何通过Python并发编程实现高效数据抓取。二、技术选型分析2.1为什么选择并发线程？I/O密集型场景：网络请求占比90%以上GIL限制：Python线程适合I/O密集型
【机器学习】模型拟合 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能欠拟合过拟合
1、欠拟合1.1现象欠拟合是机器学习和统计建模中的一种常见问题，表现为模型无法充分捕捉数据中的潜在规律和模式。无论是训练数据还是测试数据，模型的预测误差都居高不下。在实际应用中，欠拟合的模型往往显得过于简单和粗糙，无法对数据进行有效的拟合和描述。1.2原因模型过于简单是导致欠拟合的主要原因：例如，使用直线去拟合具有明显曲线趋势的数据，或者使用低阶多项式去拟合高阶的复杂函数关系。这种情况下，模型的表
使用提示词进行信息抽取的实用方法 scaFHIO windows python
在大规模语言模型（LLM）中进行信息抽取时，我们不一定需要工具调用功能。通过精心设计的提示词（prompt）可以指导模型输出特定格式的信息，然后对其进行解析以生成结构化数据。这种方法依赖于创建良好的提示词，并将LLM的输出解析为所需的Python对象。技术背景介绍大规模语言模型可以根据提示词生成特定格式的文本。例如，我们可以要求模型以JSON格式输出所需的信息。在信息抽取的场景中，设计良好的提示词
深入解析Python测试框架pytest 一休哥助手 python python pytest 开发语言
目录引言pytest简介安装与配置安装pytest配置pytest基础用法编写测试用例运行测试用例测试结果报告
怎么进入python 的venv文件夹_python虚拟环境模块venv使用及示例 weixin_39796140 怎么进入python 的venv文件夹
相信只要学习python的同学对于虚拟环境这个概念肯定不会太陌生，虚拟环境指的是一个个单独隔离的python开发环境。各个虚拟环境之间互不干扰，都有自己独立的开发包。就像是在电脑上装了很多个虚拟机，每个虚拟机里面你随便折腾，不会影响到物理机，也不会影响到其他虚拟机。既然这么有用，那么Python里面用来创建虚拟环境的模块virtualenv是怎么使用的呢？我们一起来看一下。virtualenv基本
python的离线安装包下载 Lake说科技 python 服务器 linux 开发语言运维
Python,安装相关视频讲解：python的or运算赋值用法用python编程Excel有没有用处？011_编程到底好玩在哪？查看python文件_输出py文件_cat_运行python文件_shel如何实现Python的离线安装包下载一、流程：步骤说明1确定需要下载的Python安装包版本2下载对应版本的离线安装包3将下载好的安装包传输至目标机器4在目标机器上进行安装二、具体步骤及代码：步骤1
python3+ffmpeg下载B站视频，附代码才华横溢吴道简爬虫 python windows
最近要去外面玩，旅途漫长，于是乎，就写了个代码，从B站上下载纪录片看，代码附后，请自取，如果觉得有用，麻烦点个赞，鼓励一下。感谢~~一、下载安装ffmpegFfmpeg是一款自由软件，用于视频和音频文件的处理，在本例中，我使用它进行视频文件和音频文件的合并。合并代码写在python脚本中，你只需下载好ffmpeg即可，而且因为合并代码中使用ffmpeg的绝对路径，所以也不用设置环境配置。Ffmpe
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。