风度78

【机器学习】关联规则代码练习

本课程是中国大学慕课《机器学习》的“关联规则”章节的课后代码。

课程地址：

https://www.icourse163.org/course/WZU-1464096179

课程完整代码：

https://github.com/fengdu78/WZU-machine-learning-course

代码修改并注释：黄海广，[email protected]

Apriori算法实现

import numpy as np

def loadDataSet():
    return [[1, 3, 4], [2, 3, 5], [1, 2, 3, 5], [2, 5]]

# 获取候选1项集，dataSet为事务集。返回一个list，每个元素都是set集合
def createC1(dataSet):
    C1 = []   # 元素个数为1的项集（非频繁项集，因为还没有同最小支持度比较）
    for transaction in dataSet:
        for item in transaction:
            if not [item] in C1:
                C1.append([item])
    C1.sort()  # 这里排序是为了，生成新的候选集时可以直接认为两个n项候选集前面的部分相同
    # 因为除了候选1项集外其他的候选n项集都是以二维列表的形式存在，所以要将候选1项集的每一个元素都转化为一个单独的集合。
    return list(map(frozenset, C1))   #map(frozenset, C1)的语义是将C1由Python列表转换为不变集合（frozenset，Python中的数据结构）

# 找出候选集中的频繁项集
# dataSet为全部数据集，Ck为大小为k（包含k个元素）的候选项集，minSupport为设定的最小支持度
def scanD(dataSet, Ck, minSupport):
    ssCnt = {}   # 记录每个候选项的个数
    for tid in dataSet:
        for can in Ck:
            if can.issubset(tid):
                ssCnt[can] = ssCnt.get(can, 0) + 1   # 计算每一个项集出现的频率
    numItems = float(len(dataSet))
    retList = []
    supportData = {}
    for key in ssCnt:
        support = ssCnt[key] / numItems
        if support >= minSupport:
            retList.insert(0, key)  #将频繁项集插入返回列表的首部
        supportData[key] = support
    return retList, supportData   #retList为在Ck中找出的频繁项集（支持度大于minSupport的），supportData记录各频繁项集的支持度

# 通过频繁项集列表Lk和项集个数k生成候选项集C(k+1)。
def aprioriGen(Lk, k):
    retList = []
    lenLk = len(Lk)
    for i in range(lenLk):
        for j in range(i + 1, lenLk):
            # 前k-1项相同时，才将两个集合合并，合并后才能生成k+1项
            L1 = list(Lk[i])[:k-2]; L2 = list(Lk[j])[:k-2]   # 取出两个集合的前k-1个元素
            L1.sort(); L2.sort()
            if L1 == L2:
                retList.append(Lk[i] | Lk[j])
    return retList

# 获取事务集中的所有的频繁项集
# Ck表示项数为k的候选项集，最初的C1通过createC1()函数生成。Lk表示项数为k的频繁项集，supK为其支持度，Lk和supK由scanD()函数通过Ck计算而来。
def apriori(dataSet, minSupport=0.5):
    C1 = createC1(dataSet)  # 从事务集中获取候选1项集
    D = list(map(set, dataSet))  # 将事务集的每个元素转化为集合
    L1, supportData = scanD(D, C1, minSupport)  # 获取频繁1项集和对应的支持度
    L = [L1]  # L用来存储所有的频繁项集
    k = 2
    while (len(L[k-2]) > 0): # 一直迭代到项集数目过大而在事务集中不存在这种n项集
        Ck = aprioriGen(L[k-2], k)   # 根据频繁项集生成新的候选项集。Ck表示项数为k的候选项集
        Lk, supK = scanD(D, Ck, minSupport)  # Lk表示项数为k的频繁项集，supK为其支持度
        L.append(Lk);supportData.update(supK)  # 添加新频繁项集和他们的支持度
        k += 1
    return L, supportData

dataSet = loadDataSet()  # 获取事务集。每个元素都是列表
# C1 = createC1(dataSet)  # 获取候选1项集。每个元素都是集合
# D = list(map(set, dataSet))  # 转化事务集的形式，每个元素都转化为集合。
# L1, suppDat = scanD(D, C1, 0.5)
# print(L1,suppDat)

L, suppData = apriori(dataSet,minSupport=0.7)
print(L,suppData)

[[frozenset({5}), frozenset({2}), frozenset({3})], [frozenset({2, 5})], []] {frozenset({1}): 0.5, frozenset({3}): 0.75, frozenset({4}): 0.25, frozenset({2}): 0.75, frozenset({5}): 0.75, frozenset({2, 5}): 0.75, frozenset({3, 5}): 0.5, frozenset({2, 3}): 0.5}

FP树

# FP树类
class treeNode:
    def __init__(self, nameValue, numOccur, parentNode):
        self.name = nameValue  #节点元素名称，在构造时初始化为给定值
        self.count = numOccur   # 出现次数，在构造时初始化为给定值
        self.nodeLink = None   # 指向下一个相似节点的指针，默认为None
        self.parent = parentNode   # 指向父节点的指针，在构造时初始化为给定值
        self.children = {}  # 指向子节点的字典，以子节点的元素名称为键，指向子节点的指针为值，初始化为空字典

    # 增加节点的出现次数值
    def inc(self, numOccur):
        self.count += numOccur

    # 输出节点和子节点的FP树结构
    def disp(self, ind=1):
        print(' ' * ind, self.name, ' ', self.count)
        for child in self.children.values():
            child.disp(ind + 1)

# =======================================================构建FP树==================================================

# 对不是第一个出现的节点，更新头指针块。就是添加到相似元素链表的尾部
def updateHeader(nodeToTest, targetNode):
    while (nodeToTest.nodeLink != None):
        nodeToTest = nodeToTest.nodeLink
    nodeToTest.nodeLink = targetNode

# 根据一个排序过滤后的频繁项更新FP树
def updateTree(items, inTree, headerTable, count):
    if items[0] in inTree.children:
        # 有该元素项时计数值+1
        inTree.children[items[0]].inc(count)
    else:
        # 没有这个元素项时创建一个新节点
        inTree.children[items[0]] = treeNode(items[0], count, inTree)
        # 更新头指针表或前一个相似元素项节点的指针指向新节点
        if headerTable[items[0]][1] == None:  # 如果是第一次出现，则在头指针表中增加对该节点的指向
            headerTable[items[0]][1] = inTree.children[items[0]]
        else:
            updateHeader(headerTable[items[0]][1], inTree.children[items[0]])

    if len(items) > 1:
        # 对剩下的元素项迭代调用updateTree函数
        updateTree(items[1::], inTree.children[items[0]], headerTable, count)

# 主程序。创建FP树。dataSet为事务集，为一个字典，键为每个事物，值为该事物出现的次数。minSup为最低支持度
def createTree(dataSet, minSup=1):
    # 第一次遍历数据集，创建头指针表
    headerTable = {}
    for trans in dataSet:
        for item in trans:
            headerTable[item] = headerTable.get(item, 0) + dataSet[trans]
    # 移除不满足最小支持度的元素项
    keys = list(headerTable.keys()) # 因为字典要求在迭代中不能修改，所以转化为列表
    for k in keys:
        if headerTable[k] < minSup:
            del(headerTable[k])
    # 空元素集，返回空
    freqItemSet = set(headerTable.keys())
    if len(freqItemSet) == 0:
        return None, None
    # 增加一个数据项，用于存放指向相似元素项指针
    for k in headerTable:
        headerTable[k] = [headerTable[k], None]  # 每个键的值，第一个为个数，第二个为下一个节点的位置
    retTree = treeNode('Null Set', 1, None) # 根节点
    # 第二次遍历数据集，创建FP树
    for tranSet, count in dataSet.items():
        localD = {} # 记录频繁1项集的全局频率，用于排序
        for item in tranSet:
            if item in freqItemSet:   # 只考虑频繁项
                localD[item] = headerTable[item][0] # 注意这个[0]，因为之前加过一个数据项
        if len(localD) > 0:
            orderedItems = [v[0] for v in sorted(localD.items(), key=lambda p: p[1], reverse=True)] # 排序
            updateTree(orderedItems, retTree, headerTable, count) # 更新FP树
    return retTree, headerTable

# =================================================查找元素条件模式基===============================================

# 直接修改prefixPath的值，将当前节点leafNode添加到prefixPath的末尾，然后递归添加其父节点。
# prefixPath就是一条从treeNode（包括treeNode）到根节点（不包括根节点）的路径
def ascendTree(leafNode, prefixPath):
    if leafNode.parent != None:
        prefixPath.append(leafNode.name)
        ascendTree(leafNode.parent, prefixPath)

# 为给定元素项生成一个条件模式基（前缀路径）。basePet表示输入的频繁项，treeNode为当前FP树中对应的第一个节点
# 函数返回值即为条件模式基condPats，用一个字典表示，键为前缀路径，值为计数值。
def findPrefixPath(basePat, treeNode):
    condPats = {}  # 存储条件模式基
    while treeNode != None:
        prefixPath = []  # 用于存储前缀路径
        ascendTree(treeNode, prefixPath)  # 生成前缀路径
        if len(prefixPath) > 1:
            condPats[frozenset(prefixPath[1:])] = treeNode.count  # 出现的数量就是当前叶子节点的数量
        treeNode = treeNode.nodeLink  # 遍历下一个相同元素
    return condPats

# =================================================递归查找频繁项集===============================================
# 根据事务集获取FP树和频繁项。
# 遍历频繁项，生成每个频繁项的条件FP树和条件FP树的频繁项
# 这样每个频繁项与他条件FP树的频繁项都构成了频繁项集

# inTree和headerTable是由createTree()函数生成的事务集的FP树。
# minSup表示最小支持度。
# preFix请传入一个空集合（set([])），将在函数中用于保存当前前缀。
# freqItemList请传入一个空列表（[]），将用来储存生成的频繁项集。
def mineTree(inTree, headerTable, minSup, preFix, freqItemList):
    # 对频繁项按出现的数量进行排序进行排序
    sorted_headerTable = sorted(headerTable.items(), key=lambda p: p[1][0])  #返回重新排序的列表。每个元素是一个元组，[（key,[num,treeNode],()）
    bigL = [v[0] for v in sorted_headerTable]  # 获取频繁项
    for basePat in bigL:
        newFreqSet = preFix.copy()  # 新的频繁项集
        newFreqSet.add(basePat)     # 当前前缀添加一个新元素
        freqItemList.append(newFreqSet)  # 所有的频繁项集列表
        condPattBases = findPrefixPath(basePat, headerTable[basePat][1])  # 获取条件模式基。就是basePat元素的所有前缀路径。它像一个新的事务集
        myCondTree, myHead = createTree(condPattBases, minSup)  # 创建条件FP树

        if myHead != None:
            # 用于测试
            print('conditional tree for:', newFreqSet)
            myCondTree.disp()
            mineTree(myCondTree, myHead, minSup, newFreqSet, freqItemList)  # 递归直到不再有元素

# 生成数据集
def loadSimpDat():
    simpDat = [['r', 'z', 'h', 'j', 'p'],
               ['z', 'y', 'x', 'w', 'v', 'u', 't', 's'],
               ['z'],
               ['r', 'x', 'n', 'o', 's'],
               ['y', 'r', 'x', 'z', 'q', 't', 'p'],
               ['y', 'z', 'x', 'e', 'q', 's', 't', 'm']]
    return simpDat

# 将数据集转化为目标格式
def createInitSet(dataSet):
    retDict = {}
    for trans in dataSet:
        retDict[frozenset(trans)] = 1
    return retDict

minSup = 3
simpDat = loadSimpDat()  # 加载数据集
initSet = createInitSet(simpDat)  # 转化为符合格式的事务集
myFPtree, myHeaderTab = createTree(initSet, minSup)  # 形成FP树
# myFPtree.disp()  # 打印树

freqItems = []  # 用于存储频繁项集
mineTree(myFPtree, myHeaderTab, minSup, set([]), freqItems)  # 获取频繁项集
print(freqItems)  # 打印频繁项集

conditional tree for: {'y'}
  Null Set   1
   x   3
    z   3
conditional tree for: {'y', 'z'}
  Null Set   1
   x   3
conditional tree for: {'s'}
  Null Set   1
   x   3
conditional tree for: {'t'}
  Null Set   1
   y   3
    z   2
     x   2
    x   1
     z   1
conditional tree for: {'z', 't'}
  Null Set   1
   y   3
conditional tree for: {'x', 't'}
  Null Set   1
   y   3
conditional tree for: {'x'}
  Null Set   1
   z   3
[{'r'}, {'y'}, {'y', 'x'}, {'y', 'z'}, {'y', 'x', 'z'}, {'s'}, {'x', 's'}, {'t'}, {'y', 't'}, {'z', 't'}, {'y', 'z', 't'}, {'x', 't'}, {'y', 'x', 't'}, {'x'}, {'x', 'z'}, {'z'}]

参考

https://www.cnblogs.com/lsqin/p/9342926.html

往期精彩回顾




适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载黄海广老师《机器学习课程》视频课黄海广老师《机器学习课程》711页完整版课件

本站qq群955171419，加入微信群请扫码：

python期末复习——python知识要点敲代码痛苦吗？ Python 其他 python
1、Python语言的特点及书写规范。特点：Python语言是一种面向对象的解释型语言1、解释型，开源，简单，易学，免费2.可扩展性，丰富的库，可移植性，面向对象3.规范的代码，可读性较强书写规范：缩进；注释；每个import只导入一个模块，尽量避免一次导入多个模块；语句太长可以在行尾使用续行符’’’’，来表示下面紧接的一行仍然属于当前的语句，也可以使用括号来包含多行内容；使用必要的空格和空行增强
python系列：如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？坦笑&&life #python python fastapi windows
如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？问题：回答：虽然`Pydantic模型`过去不允许使用`Query字段`，并且必须在单独的依赖类中实现查询`parameter-parsing`，如本答案和本答案所示，但这一点最近发生了变化，因此，可以使用`BaseModel类`将`Q
Python使用FastApi开发接口冉成未来 python fastapi 开发语言
文章目录python开发web框架简介FastApi安装安装依赖包代码编写创建数据库连接模块database.py创建数据库实体模块model.py创建实体类模型模块schemas.py创建操作数据库模块curd.py创建接收请求模块main.py创建运行模块run.py项目运行编写完以上代码，通过以下命令进行项目启动查看项目接口pyinstalle打包FastApi项目项目通过uvicorn运行
python力扣刷题记录——349. 两个数组的交集钟灵毓秀M 数据结构与算法 leetcode python
题目：349.两个数组的交集给定两个数组，编写一个函数来计算它们的交集。方法一：执行用时:52ms内存消耗:15.1MBclassSolution:defintersection(self,nums1:List[int],nums2:List[int])->List[int]:returnlist(set(nums1)&set(nums2))方法二：执行用时:68ms内存消耗:14.9MBclas
适合win7的python版本_Python 3.9 发布，不再支持 Win7！ weixin_39928818 适合win7的python版本
Python3.9正式发布Python3.9和之后的版本将不再支持Windows7，还没用上Windows10的可以考虑换系统了。而且这里默认下载的是64位，不再是32位。版本亮点新的语法特性>>>x={"key1":"value1fromx","key2":"value2fromx"}>>>y={"key2":"value2fromy","key3":"value3fromy"}>>>x|y{'
笨办法学python3进阶篇_笨办法学Python 3 进阶篇 weixin_39959298 笨办法学python3进阶篇
第一部分准备知识1如果不喜欢作者的个人流程怎么办2如果发现自己太糟糕怎么办2习题0准备工作3程序员用的编辑器3Python3.63工作终端4pip和virtualenv的配置4实验笔记4GitHub账号5git5可选：录屏软件5进一步研究5习题1论流程7习题挑战8巩固练习9进一步研究9习题2论创新11习题挑战11巩固练习12习题3论质量13习题挑战14巩固学习14第二部分快速实现15如何练习创新1
这可能是史上最全的计算机编程语言列表了 BoolBear 计算机语言计算机语言
计算机编程语言可用于将指令传达给计算机。它们基于某些句法和语义规则，定义了编程语言中每种结构的含义。计算机编程语言可用于将指令传达给计算机。它们基于某些句法和语义规则，定义了编程语言中每种结构的含义。现在我得到了一个凡是可以找得到的每种编程语言的列表。我将它们分为以下几类：解释型编程语言函数式编程语言编译型编程语言过程式编程语言脚本编程语言标记编程语言基于逻辑的编程语言并发编程语言面向对象编程语言
Python FastAPI 多参数传递大数据东哥(Aidon) python fastapi python fastapi 参数传递 FastAPI参数传递路径/POST/GET参数传递
PythonFastAPI请求参数传递FastAPI多参数传递类型FastAPI通过模板来匹配URL中的参数列表，大致有如下三类方式传递参数：路径参数传递：获取自定义的构造URL中的参数GET参数传递：获取一个URL后面带的?param1=1¶m2=2这种类型参数POST参数传递：获取POST请求中的参数，因为POST是加密的，因此更加安全，但有额外开销，测试API使用额外工具或插件或者自
《解码AI大模型涌现能力：从量变到质变的智能跃迁》人工智能深度学习
在当今科技飞速发展的时代，人工智能大模型的涌现能力成为了众人瞩目的焦点。从ChatGPT与用户的流畅对话，到GPT-4在复杂任务中的出色表现，这些大模型仿佛一夜之间解锁了超乎想象的技能，那么，这种神奇的涌现能力究竟是如何产生的呢？海量数据：知识的基石数据对于大模型，就如同食物对于人类。随着互联网的迅猛发展，数据呈爆炸式增长，为大模型的训练提供了丰富的素材。以GPT-3为例，它的训练数据涵盖了海量的
基于vue实现九宫格大转盘抽奖 HhhDreamof_ vue html js
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、基于vue实现九宫格大转盘抽奖二、使用步骤基于vue实现九宫格大转盘抽奖总结前言基于vue实现九宫格大转盘抽奖提示：以下是本篇文章正文内容，下面案例可供参考一、基于vue实现九宫格大转盘抽奖示例：为活动而写的一小段代码。二、使用步骤1.基于vue实现九宫格大转盘抽奖代码如下（示例）： javascript实现
Python 3.9 下载 (含兼容win7补丁) 焦研全Praised
Python3.9下载(含兼容win7补丁)Python3.9下载含兼容win7补丁本仓库提供了一个特别版本的Python3.9下载，该版本包含了兼容Windows7的补丁。由于原版的Python3.9无法在Windows8以下的系统中运行，因此本资源特别整理了支持Windows7的Python3.9版本。经过测试，该版本不仅支持运行IDLE，还能够正常使用pip安装和运行如pygame等库，功能
开启Windows 7上的Python之旅：特别版Python 3.9解析与推荐毕昕露Lionel
开启Windows7上的Python之旅：特别版Python3.9解析与推荐【下载地址】Python3.9下载含兼容win7补丁本仓库提供了一个特别版本的Python3.9下载，该版本包含了兼容Windows7的补丁。由于原版的Python3.9无法在Windows8以下的系统中运行，因此本资源特别整理了支持Windows7的Python3.9版本。经过测试，该版本不仅支持运行IDLE，还能够正常
mybatis 嵌套子查询传参是list CCCout mybatis 数据库
提示：现在要写一个sql以及关联一个子查询，而子查询传入参数和父查询一致例如：接口传参为platIdList，这个列表不仅要作为主查询条件还是子查询条件，这里需要把传参转为字符串并作为返回列传给子查询，由于从list->String所以使用find_in_set或者转为list处理SELECTDISTINCTidFROMdeptWHEREFIND_IN_SET(plat_id,REPLACE(RE
python:我写了一个类似js库moment库龙雨LongYu12 python javascript 开发语言
py其实有这个库可以下，但是我发现1、里面可用的方法很少，而且打包exe后运行会导致报错2、不是很习惯，毕竟我是习惯写js库源码：fromdatetimeimportdatetime,date,timedeltaclassmoment():def__init__(self,datestr:str=None):ifdatestrisNone:self.date=datetime.now()else:
如果缓存数据在导出导入之间过期了，您又怎么处理这些数据呢？思维导图代码示例（java 架构) 用心去追梦 memcached java 架构
处理导出导入之间缓存数据过期的问题当Memcached中的数据在导出和重新导入之间过期时，可能会导致恢复的数据不完整或丢失。为了确保数据的一致性和完整性，可以采取以下策略和技术来处理这种情况：1.记录TTL信息保存TTL：在导出数据时，不仅记录键值对本身，还应该同时保存每个键的生存时间（TTL），以便在恢复时能够正确设置。相对时间戳：使用相对的时间戳而不是绝对时间戳来表示TTL，这样即使系统时间不
Python复习总结——期末复习知识点总结大全 HhhDreamof_ python 开发语言
Python复习总结——期末复习知识点总结大全第1章程序设计基本方法1.1计算机的概念1.2程序设计语言1.3Python语言概述1.4Python语言开发环境1.5程序的基本编写方法1.6Python语言的版本更迭第2章Python程序实例解析2.1实例1：温度转换2.2Python程序语法元素分析2.3实例2：Python蟒蛇绘制2.4turtle语法元素分析第3章基本数据类型3.1数字类型3
python中assert的使用晓东邪 python基础学习 python 异常断言 assert
python中assert断言是声明其布尔值必须为真的判定，如果发生异常就说明表达式为假。可以理解assert断言语句为raise-if-not，用来测试表示式，其返回值为假，就会触发异常。Python的assert是用来检查一个条件，如果它为真，就不做任何事。如果它为假，则会抛出AssertError并且包含错误信息。assert的异常参数，其实就是在断言表达式后添加字符串信息，用来解释断言并更
python断言assert实例_python接口测试assert断言 weixin_39722921
广告关闭腾讯云11.11云上盛惠，精选热门产品助力上云，云服务器首年88元起，买的越多返的越多，最高返5000元！unittest.texttestrunner(verbosity=2).run(suite)在一个测试用例中，会有期望结果这个说法，来验证这个测试用例是通过还是失败，在unittest的测试框架中，也提供了assert，我们先来看python中的断言assert，来修改下源码，看看p
前馈神经网络——最基本的神经网络架构纠结哥_Shrek 神经网络人工智能深度学习
前馈神经网络（FeedforwardNeuralNetwork,FNN）是一种基本的人工神经网络类型，其结构简单，广泛应用于各种机器学习任务。它由多个层次组成，包括输入层、隐藏层和输出层。FNN中的每一层与下一层的神经元之间是完全连接的，但不同层之间的神经元不相互连接。FNN以其数据流动方式来命名——前馈，意味着信息从输入层开始，经过一系列的隐藏层，最终输出结果，不存在任何循环或反馈连接。与递归神
Powershell无法激活Python虚拟环境 weixin_30681615 python shell
问题描述：Win10环境，亲测在cmd中可以激活，但是在Powershell中无法激活新建的conda环境。1.问题复现查看当前的环境，想从base切换到新建的scipython环境尝试激活但失败在cmd下尝试，成功2.寻根问底参考【1】，因为PowerShell默认不允许执行“*.ps1”脚本文件，所以首先需要开启权限。.ps1文件路径（...\envs\yourenv\Lib\venv\scr
如何解决Webview和H5缓存问题，确保每次加载最新版本的资源 qq_39279448 缓存
WebView用于加载H5页面是常见的做法，它能够加载远程的HTML、CSS、JavaScript资源，并且让Web应用嵌入到原生App中。然而，WebView的缓存机制有时会导致用户看到的是旧版本的页面或资源，尤其是在H5发版后，iOS端用户可能仍然加载到缓存的旧页面，造成了不一致的体验。本篇文章将详细分析这个问题的根本原因，并介绍一些有效的缓存处理策略，确保每次加载的都是最新的资源。一、Web
AI光速发展的时代，普通人怎么才能上车？头脑旋风 AI变现之路人工智能
文章开始之前希望大家支持一下我独立开发的微信小程序“头脑旋风”，或微信扫描我的头像进入，谢谢支持~在人工智能快速发展的今天，普通人上车并非易事，但通过系统化的策略和持续的努力，是可以实现个人成长和职业转型的。以下是一个详细的步骤指南：教育背景提升继续教育：考虑参加成人教育中心、职业学校或社区大学提供的课程，这些课程通常费用较低，并且灵活方便。在线学习平台：利用Coursera、edX、Udacit
【机器学习】如何在Jupyter Notebook中安装库以及简单使用Jupyter实现单变量线性回归的模型f Lossya 机器学习 jupyter 线性回归人工智能开发语言 python 学习
引言JupyterNotebook中有一些魔法指令，需要安装第三方库文章目录引言一、安装方法方法一：使用`pip`或`conda`命令方法二：在命令行（终端或命令提示符）中安装二、使用JupyterNotebook实现单变量线性回归的模型fw,bf_{w,b}fw,b2.1工具2.2问题陈述2.3创建`x_train`和`y_train`变量2.4训练示例的数量`m`2.5训练示例`x_i,y_i
【Python进阶】assert 使用 | assert触发条件，使用实践示例 Qodicat Python学习 python 开发语言
文章目录1基本介绍2其他实践示例2.1检查函数参数2.2检查输入数据是否合规2.3检查操作是否合规1基本介绍assert是Python中的一个关键字，用于在代码中进行断言检查。它的作用是在条件为False的情况下触发AssertionError异常，用于帮助开发者在程序中捕获和处理错误。assert的语法如下：assertexpression,message其中expression是要进行断言检查
SQLAlchemy ORM在Python Web开发中的核心作用探究不一样的信息安全网络杂烩 sql
摘要在PythonWeb开发领域，SQLAlchemyORM扮演着至关重要的角色。作为一种对象关系映射工具，它能够将Python类与数据库表相映射，实现数据行与Python对象之间的转换。开发者可以使用面向对象的方法操作数据库，无需直接编写SQL语句，从而大幅提升开发效率并降低出错概率。SQLAlchemyORM提供了一套强大而灵活的数据库操作方法，助力开发者快速构建和维护复杂的数据模型。关键词S
如何激活python的虚拟环境怪咖学生 python 开发语言
要激活Python的虚拟环境，首先需要确保你已经创建了一个虚拟环境。假设你已经在项目目录中创建了一个虚拟环境，名为venv。以下是激活虚拟环境的步骤：在Windows上：打开命令提示符（CommandPrompt）。导航到包含虚拟环境的目录。输入以下命令激活虚拟环境：.\venv\Scripts\activate在macOS或Linux上：打开终端（Terminal）。导航到包含虚拟环境的目录。输
学习python你必须弄懂的 Python、Pycharm、Anaconda 三者之间的关系经纬数智 python python pycharm 开发语言 conda
Python作为深度学习和人工智能学习的热门语言，学习一门语言，除了学会其简单的语法之外还需要对其进行运行和实现，才能实现和发挥其功能和作用。下面来介绍运行Python代码常用到的工具总结。一.Python、Pycharm、Anaconda关系介绍1.PythonPython是一种跨平台的计算机程序语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(
Python从0到100（二十二）：用Python读写CSV文件是Dream呀 python 数据库开发语言
一、CSV文件概述CSV，即逗号分隔值（CommaSeparatedValues），是一种以纯文本形式存储表格数据的通用格式。它因其简洁和易于使用而广泛应用于数据交换，如在数据库、电子表格等应用程序中导入和导出数据。CSV文件的纯文本特性使其与操作系统和编程语言无关，大多数编程语言都提供了处理CSV文件的功能，使其在数据处理和科学领域中极为流行。CSV文件的主要特点包括：纯文本格式：使用特定字符集
Python语法学习 weixin_44256848 Python python
Python标识符Python中的标识符是区分大小写的。以下划线开头的标识符是有特殊意义的。以单下划线开头_foo的代表不能直接访问的类属性，需通过类提供的接口进行访问，不能用fromxxximport*而导入。以双下划线开头的__foo代表类的私有成员，以双下划线开头和结尾的__foo__代表Python里特殊方法专用的标识，如__init__()代表类的构造函数。Python可以同一行显示多条
破解编程语言“鄙视链”：深度剖析其成因与背后的逻辑 TravisBytes 其他网络协议网络协程 coroutine c++
在编程世界里，各种编程语言的使用者之间似乎存在着一条无形的“鄙视链”。从古老神秘的C到灵动便捷的Python，从严谨规范的Java到天马行空的Ruby，不同语言的拥趸们总是在暗自较量。这条所谓的“鄙视链”究竟源自何处？它是基于语言特性的理性分级，还是仅仅是程序员们的主观臆断？本文将深入探讨“鄙视链”的成因，揭示其背后的逻辑与动因，帮助读者全面理解这一现象。目录1.历史与传统的影响2.语言特性的差异
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

【机器学习】关联规则代码练习

Apriori算法实现

FP树

参考

你可能感兴趣的:(列表,人工智能,python,机器学习,java)