bebr

学习笔记-简单的排序算法（Python实现）

1、直接插入排序

时间复杂度：O(n^2)

空间复杂度：O(1)

稳定性：稳定

插入排序就是将一个数据插入到已经排好序的序列中。

如图所示，插入元素是2，则用2依次与左边的元素比较，只要左边的元素大于2，就将左边的元素右移一位，直到2大于左边元素为止。

def insert_sort(lst):
    for i in range(1, len(lst)):
        x = lst[i]
        temp = i
        while temp > 0 and lst[temp-1] > x:
            lst[temp] = lst[temp-1] #只要左边元素大于右边元素，就将较大的元素交换到右边
            temp -= 1
        lst[temp] = x
    return lst

if __name__=="__main__":
    lst = [4,1,6,8,34,9,2,5]
    print(insert_sort(lst))

2、希尔排序

时间复杂度：与所选的增量序列有关

空间复杂度：O(1)

稳定性：不稳定

基本思想：取一个递减的增量序列{n/2，(n/2)/2，...，1}，首先取增量n/2，所有距离为n/2的倍数的记录放在同一个组中，在各组内进行直接插入排序；然后取第二个增量(n/2)/2，继续上述操作；直至所有的增量为1，即所有记录放在同一个组中进行直接插入排序为止。

该算法实质上是一种分组插入方法。进行一次比较可以跨过多个元素，可能消除多个元素交换。

def shell_sort(lists):
    length = len(lists)
    gap = length // 2
    while gap > 0:
        for i in range(0, gap):
            j = i + gap        #j是待插入元素位置
            while j < length:
                temp = j
                key = lists[temp]
                while temp > 0 and lists[temp-gap] > key: #利用直接插入排序将每个组中的元素排序
                    lists[temp] = lists[temp-gap]
                    temp -= gap
                lists[temp] = key
                j += gap #同一个小组中，再向已排序小组中插入j+gap位置的元素
        gap //= 2
    return lists

if __name__=="__main__":
    lst = [30,13,25,16,47,26,19,10]
    print(shell_sort(lst))

3、直接选择排序

时间复杂度：O(n^2)

空间复杂度为：O(1)

稳定性：不稳定

每次都顺序扫描出未排序序列中最小的元素，然后将其添加在已排序序列的末尾。

def select_sort(lst):
    for i in range(len(lst) - 1):  # 只需要比较len(lst)-1次，剩余的最后一个元素肯定是最大的
        min_position = i  # min_position记录最小元素的位置
        for j in range(i + 1, len(lst)):
            if lst[j] < lst[min_position]:  # 如果有更小的元素，则更新min_position
                min_position = j
        # if i != min_position: #有可能位置i已经是最小元素的位置，所以此时就不需要交换了
        #     lst[i], lst[min_position] = lst[min_position], lst[i]
        lst[i], lst[min_position] = lst[min_position], lst[i]
    return lst


if __name__ == "__main__":
    lst = [4, 1, 6, 8, 34, 9, 2, 5]
    print(select_sort(lst))

直接选择排序的实际排序效率低于插入排序。所以直接选择排序很少被实际应用。

将原来已排序序列的后一个元素交换到最小元素的位置，有可能出现两个相同的元素做交换，这说明算法不稳定。

延伸：

直接选择排序比较低效，是因为在做顺序扫描时，每次都需要从头做一次完整的比较，这个过程中做了很多重复的工作。要想克服这个缺点，就应该设法记录比较之后的获得的信息。利用树的结构来记录这种信息，由此出现了堆排序：图解堆排序。但是堆排序也可能出现两个相同元素被交换的情况。所以算法也具有不稳定性。堆排序的时间复杂度为O(nlog n)，空间复杂度是O(1)。

4、堆排序

时间复杂度为：O(nlog n)，

空间复杂度为：O(1)

稳定性：不稳定

当元素个数较少时，堆排序的大部分时间花在了堆的初始化和向下筛选上，当元素较多时，具有较好的效率。

具体原理和程序参见：点击打开链接

5、交换排序：冒泡排序

最坏的时间复杂度：O(n^2)

平均时间复杂度：O(n^2)

最好的时间复杂度：O(n)

空间复杂度：O(1)

一个未排序序列中，肯定存在逆序对（即前一个元素大于后一个元素），通过不断交换逆序对中两个元素的位置，最终将得到排序序列。

冒泡排序最坏的时间复杂度是O(n^2),平均时间复杂度也是O(n^2),最好情况下的时间复杂度是O(n)。其也是一种原位排序算法，空间复杂度是O(1)。是一种稳定的排序算法。

如果初始序列有序，则只需要扫描一次就结束了，时间复杂度是O(n)。

上图中的排序过程中，每一遍检查都可以将最大的元素交换到最后面。这就像水中的气泡浮起，也是这种算法名字的由来。

当序列中最小元素在序列的最后时，冒泡排序需要n-1遍扫描。在一般情况下，并不需要这么多次。只要在某次扫描中没有发现逆序对，则说明排序已经完成了。

def bubble_sort(lst):
    for i in range(len(lst)-1): #最多需要比较len(lst)-1次
        found = False #found变量初始为false，如果存在逆序对，则置为True，如果不存在，则为false，则会控制循环提前结束
        for j in range(1, len(lst)-i): #第一次需扫描n个元素，第二次需扫描n-1个元素，依此类推
            if lst[j-1] > lst[j]: #如果存在逆序对，则交换元素
                lst[j-1], lst[j] = lst[j], lst[j-1]
                found = True
        if not found:
            break
    return lst

if __name__=="__main__":
    lst = [30,13,25,16,47,26,19,10]
    print(bubble_sort(lst))

冒泡排序效率低于插入排序。一是因为反复交换相邻元素，累加起来代价较大；二是一些距离最终位置较远的元素会拖累整个算法。

此外，还有一种交错起泡的算法，可以将小元素快速地移向左方。从左向右扫描一次，再从右向左扫描一次，交替进行。

只需要 4遍就可以完成以下的排序工作。

6、快速排序

时间复杂度：O(nlog n)

空间复杂度：O(log n)

稳定性：不稳定

快速排序算法在实践中是平均速度最快的算法之一。

基本思想是：从序列中选一个元素作为‘标准’，将序列中剩余的元素与这个标准一一比较，小于‘标准’的元素放在其左边，大于‘标准’的元素放在其右边；这样就将数据分割成了独立的两部分，然后在两个子序列中按照同样的方式递归地划分下去，直到整个数据变成有序序列。

算法实现：

取序列中第一个元素作为‘标准’，记为R。小于R的元素在其左边，大于R的元素在其右边，中间是尚未检查的元素。此外，下标i和j分别指向未检查元素序列的第一个位置和最后一个位置（i初始时指向整个序列的第一个元素）。然后交替进行如下操作：

(1)从位置j开始向左逐个比较当前元素与R的大小，直至找到第一个小于R的元素，将其存入位置i。然后i加1，指向下一个需要检查的元素。

(2)从位置i开始向右逐个比较当前元素与R的大小，直至找到第一个大于R的元素，将其存入位置j。

重复以上两步，直到i与j相等，此时将R存入i=j的这个位置，一次划分完成。

def quick_sort(lst):
    record = qsort_rec(lst, 0, len(lst)-1) #i和j分别初始化为序列的第0个和最后一个位置
    return record

def qsort_rec(lst, l, r):
    if l >= r:    #说明序列中没有元素或者只有一个元素
        return
    i, j = l, r
    standard = lst[i] #标准元素为序列中最左边的元素
    while i < j:      #终止时i=j
        while i < j and lst[j] >= standard: #从右向左找到第一个小于标准的元素
            j -= 1
        if i < j:      #将上面找到的元素放到位置i
            lst[i] = lst[j]
            i += 1
        while i < j and lst[i] <= standard: #从左向右找到第一个大于标准的元素
            i += 1
        if i < j:      #将上面找到的元素放到位置j
            lst[j] = lst[i]
            j -= 1
    lst[i] = standard
    qsort_rec(lst, l, i-1)
    qsort_rec(lst, i+1, r)
    return lst


if __name__=="__main__":
    lst = [30,13,25,16,47,26,19,10]
    print(quick_sort(lst))

如果每次划分都能将序列分成两个基本相等的子序列，那么整个序列将被分为大约log n层；在其中一层中，元素的比较次数不会超过序列的长度n，所以快速排序的平均时间复杂度是O(nlog n)。

但是，如果每层划分得到的两个子序列中总有一个为空，另一个子序列中的元素个数只比本层划分前少一个，这样需要分为n-1层，每层的比较次数从n-1逐层减少到1,。此时是快速排序最坏的时间复杂度O(n^2)。

其空间复杂度最坏时是O(n)，但是可以通过不同的实现方式，提升至O(log n)。

7、归并排序

时间复杂度：O(nlog n)

空间复杂度：O(n)

稳定性：稳定

基本过程：

首先，将待排序序列中的n个元素看作n个有序子序列，每个子序列长度为1。
然后，将当前序列中的有序子序列两两归并，完成一遍后整个序列中的已排序序列个数减半，每个子序列长度翻倍。
对长度翻倍后的子序列继续两两归并，最后将得到一个长度为n的有序序列。

归并排序适合处理存储在外存中的大量数据。

下图是一个例子：第一遍将序列归并为一组长度为2的有序序列，最后的元素44没有归并对象，原样留到下一步；第二遍归并出3个长度为4的有序序列；第三遍只能归并出一个长度为8的有序序列，剩余的3个元素原样留到下一步；最后一步便已经得到了排序序列。

# 实现一对有序序列的归并操作，将归并的结果存入另一个顺序表的相同位置。
def merge(lfrom, lto, low, mid, high):
    i, j, k = low, mid, low
    while i < mid and j < high:  # 每次都将两个子序列中最小的元素加入到lto中，但是总是会有某个序列的后面会剩下几个元素，需要下面的两个循环再将这些元素加到lto中
        if lfrom[i] <= lfrom[j]:
            lto[k] = lfrom[i]
            i += 1
        else:
            lto[k] = lfrom[j]
            j += 1
        k += 1

    while i < mid:  # 将第一个子序列的剩余元素加入到lto中
        lto[k] = lfrom[i]
        i += 1
        k += 1

    while j < high:  # 将第二个子序列的剩余元素加入到lto中
        lto[k] = lfrom[j]
        j += 1
        k += 1
    return lto


# 其中的某一遍归并操作，将表中的所有元素进行一遍归并
def merge_pass(lfrom, lto, list_len, sub_len):  # list_len为整个序列的长度，sub_len为子序列的长度
    i = 0
    while i + 2 * sub_len <= list_len:  # 处理序列中长度为sub_len的两个子序列
        merge(lfrom, lto, i, i + sub_len, i + 2 * sub_len)
        i += 2 * sub_len
    if i + sub_len < list_len:  # 此时剩下两个子序列，但只有第一个子序列的长度满足sub_len
        merge(lfrom, lto, i, i + sub_len, list_len)
    else:  # 否则，此时只剩下一个子序列，直接将这个子序列添加在lto后面
        for j in range(i, list_len):
            lto[j] = lfrom[j]


# 主函数，分配不同长度的sub_len，调用归并函数
def merge_sort(lst):
    sub_len, list_len = 1, len(lst)
    temp_lst = [None] * list_len
    while sub_len < list_len:  # 不断将sub_len的长度翻倍
        merge_pass(lst, temp_lst, list_len, sub_len)
        sub_len *= 2
        merge_pass(temp_lst, lst, list_len, sub_len)
        sub_len *= 2


if __name__ == "__main__":
    lst = [30, 13, 25, 16, 47, 26, 19]
    merge_sort(lst)
    print(lst)

8、基数排序

时间复杂度：O(d*(n+r))

空间复杂度：O(n+r)

稳定性：稳定

d为位数，r为基数，n为数组中元素的个数。

基数排序不需要将元素相互比较，只需要将元素分类即可。如果对效率有所要求，而不太关心空间的使用时，可以考虑使用。

下面以最低位优先法（LSD）为例：

原数组为：[73,22,93,43,55,14,28,65,39,81]

首先根据个位的数值，将元素分配到0~9的桶中：

然后将这些元素重新汇总起来：

[81,22,73,93,43,14,55,65,28,39]

在根据十位的数值来分配：

然后再将这些元素汇总起来：

[14,22,28,39,43,55,65,73,81,93]

此时的元素已经被排序完毕。

LSD适用于位数少的数列，如果位数多，则使用最高位优先法（MSD）。

MSD是从最高位开始进行分配，分配之后不马上汇总为一个数组，而是在每个桶中再建立子桶，将每个子桶中的元素按照下一数位的值分配到子桶中，在进行完最低数位的分配后，再汇总回一个数组中。

import math
def radix_sort(lists, radix=10):
    k = int(math.ceil(math.log(max(lists), radix)))
    bucket = [[] for i in range(radix)]
    for i in range(1, k+1):
        for j in lists:
            bucket[j//(radix**(i-1)) % (radix**i)].append(j)
        del lists[:]
        for z in bucket:
            lists += z
            del z[:]
    return lists

if __name__=="__main__":
    lst = [30,13,25,16,47,26,19,10]
    print(radix_sort(lst))

排序方法	最坏情况	平均情况	最好情况	空间复杂度	稳定性
直接插入排序					稳定
希尔排序					不稳定
直接选择排序					不稳定
堆排序					不稳定
冒泡排序					稳定
快速排序					不稳定
归并排序					稳定
基数排序					稳定

注：d为位数，r为基数，n为数组中元素的个数。

1、直接插入排序：对于一个无序的序列，需要将元素从第一位挨个取出，将其当做新元素插入到有序序列中；每个元素在插入到有序序列中时，需要从后向前与元素挨个比较。这里两个操作都需要遍历原序列，所以其时间复杂度最坏和平均时都是，当原来序列有序时，最好的时间复杂度是。

2、希尔排序的分析是一个复杂问题，与其所取的增量函数有关，其中涉及到数学上一些未解决的问题。一般认为在之间，较快的实现可以到。

3、直接选择排序：每次都需要顺序扫描出未排序序列中最小的元素，然后将其添加在已排序序列的末尾。其中需要遍历每个位置；在确定每个位置上的元素时，又需要从未排序序列中挨个比较出最小的一个元素。所以其时间复杂度都是。

4、堆排序：构建堆的时间是。交换堆顶与末尾元素，这个过程需要执行n次；堆顶元素下移的距离不会超过log n，所以重建堆的时间是。

5、冒泡排序：需要遍历n-1遍元素，第一遍遍历n个元素，第二遍遍历n-1个元素，......，依此类推，所以其时间复杂度为。当序列有序时，需要时间即可。

6、快速排序：最好的情况是每次取到的元素都刚好平分整个数组，这样便划分为了log n层，每层元素的比较次数不超过序列的长度。所以时间复杂度为。最坏的情况就是每次取到的元素都是数组中最大或者最小的（正序或者逆序排列），每次划分只得到比上一次少一个元素的子序列，此时需要时间。当每一次都平分数组时，其空间复杂度为；最坏情况时，空间复杂度为。

7、归并排序：完成整个排序的归并遍数不会超过log n + 1，在每遍归并中需要做的比较次数不会超过n，所以总的时间为。算法中需要用到一个与原数组同样大小的临时数组，所以其空间复杂度为。归并排序很消耗空间，一般内部排序不用，外部排序时才考虑使用。

8、基数排序：将元素分配到每个桶中的时间复杂度为，将元素再汇总起来的时间复杂度为，分配和汇总共需要d次，所以总的时间复杂度为。将元素进行‘装桶’操作时，都需要n+r个临时空间，所以空间复杂度为。

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
数据结构之哈希表 X同学的开始数据结构数据结构散列表
哈希表(散列表)出现的原因在顺序表中查找时，需要从表头开始，依次遍历比较a[i]与key的值是否相等，直到相等才返回索引i；在有序表中查找时，我们经常使用的是二分查找，通过比较key与a[i]的大小来折半查找，直到相等时才返回索引i。最终通过索引找到我们要找的元素。但是，这两种方法的效率都依赖于查找中比较的次数。我们有一种想法，能不能不经过比较，而是直接通过关键字key一次得到所要的结果呢？这时，
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$

学习笔记-简单的排序算法（Python实现）

你可能感兴趣的:(数据结构,插入排序,选择排序,冒泡排序,快速排序,Python)