北京地铁1号线

24.排序，插入排序，交换排序

一. 插入排序

（1）直接插入排序

（2）折半插入排序

（3）希尔排序

二. 交换排序

（1）冒泡排序

（2）快速排序

排序：将一组杂乱无章的数据按一定规律顺次排列起来。即，将无序序列排成一个有序序列（由小到大或由大到小)的运算。如果参加排序的数据结点包含多个数据域，那么排序往往是针对其中某个域而言。

排序方法：

按数据存储介质：内部排序和外部排序
按比较器个数：串行排序和并行排序
按主要操作：比较排序和基数排序（后面会讲）
按辅助空间：原地排序和非原地排序
按稳定性：稳定排序和非稳定排序
按自然性：自然排序和非自然排序

本章学习内容：

插入排序：直接插入排序、折半插入排序、希尔排序
交换排序：冒泡排序、快速排序
选择排序：简单选择排序、堆排序
归并排序：2-路归并排序
基数排序

衡量排序算法的指标有时间复杂度，空间复杂度和稳定性等。对于稳定性做一点说明。稳定排序指的是能够使任何数值相等的元素，排序以后相对次序不变。例如，下面的示例1是稳定排序，示例2就不是稳定排序。

排序的稳定牲只对结构类型数据排序有意义。例如：n个学生信息（学号、姓名、语文、数学、英语、总分)，首先按数学成绩从高到低排序，然后按照总分从高到低排序。若是稳定排序，总分相同的情况下，数学成绩高的仍然排在前面。

存储结构：本章基于的存储结构均以顺序表存储。

#define MAXSIZE 20  //设记录不超过20个
typedef int KeyType;  //设关键字为整型量(int型)

typedef struct{  //定义每个记录（数据元素）的结构
    KeyType key;  //关键字
    InfoType otherinfo;  //其它数据项
}RedType;  //Record Type

typedef struct{  //定义顺序表的结构
    RedType r[MAXSIZE+1];  //存储顺序表的向量
    //r[0]一般作哨兵或缓冲区
    int length;  //顺序表的长度
}SqList;

一. 插入排序

基本思想：每步将一个待排序的对象，按其关键码大小，插入到前面已经排好序的一组对象的适当位置上，直到对象全部插入为止。即边插入边排序。

根据确定插入位置的方法不同，我们可以有以下三种插入排序的方法：

（1）直接插入排序

顺序法定位插入位置：一个一个比较。

首先，复制待插入的元素，复制插入元素。x=a[i]；
然后，记录后移，查找插入位置；for(j=i-1; j>=0&&x
最后，插入到正确位置，a[j+1]=x；

对于复制待插入的元素，我们可以使用哨兵。把待插入的元素复制到0号位，这样省去了越界的判断：

此外，如果待插入元素比有序表最后一位还大，那就不用进行任何操作了，这个位置就是待插入元素的位置。

void InsertSort(SqList &L){
    int i, j;
    for(i=2; i<=L.length; ++i){  //第1个元素不用排序，从插入第2个元素开始
        if (L.r[i].key < L.r[i-1].key){  //若"<",需将L.r[i]插入有序子表
            L.r[0]=L.r[i];  //复制为哨兵
                for(j=i-1; L.r[0].key

 
  下面我们来分析时间效率。实现排序的基本操作有两个：(1)“比较”序列中两个关键字的大小；(2)“移动”记录。最好的情况是，关键字在记录序列中顺序有序。这时比较的次数是，不需要移动。最坏的情况是，关键字在记录序列中逆序有序。这时比较的次数是，移动的次数是，从而我们可以得到以下结论： 
   
   原始数据越接近有序，排序速度越快； 
   最坏情况下(输入数据是逆有序的)Tw(n)=O(n^2)； 
   平均情况下，耗时差不多是最坏情况的一半Te(n)=O(n^2)； 
   空间复杂度是O（1）； 
   要提高查找速度，可以从减少元素的比较次数和减少元素的移动次数入手； 
   
  （2）折半插入排序 
  查找插入位置采用折半查找法。 
   
  void BlnsertSort (SqList &L){
    for (i = 2; i<= L.length ; ++i){  //依次插入第2~第n个元素
        L.r[0] = L.r[i];  //当前插入元素存到“哨兵”位置
        low = 1 ; high = i-1;  //采用二分查找法查找插入位置
        while (low <= high){
            mid = (low + high)/2;
            if (L.r[0].key < L.r[mid].key) high = mid-1;
            else low = mid + 1;
        }  //循环结束，high+1则为插入位置
        for (j=i-1; j>=high+1; --j) 
            L.r[j+1] = L.r[j];  //移动元素
            L.r[high+1] = L.r[0];  //插入到正确位置
}// BInsertSort
 
  最后我们分析算法的时间效率。折半查找比顺序查找快，所以折半插入排序就平均性能来说比直按插入排序要快。它所需要的关键码比较次数与待排序对象序列的初始排列无关，仅依赖于对象个数。在插入第i个对象时，需要经过次关键码比较，才能确定它应插入的位置。 
  当n较大时，总关键码比较次数比直接插入排序的最坏情况要好得多，但比其最好情况要差。在对象的初始排列已经按关键码排好序或接近有序时，直接插入排序比折半插入排序执行的关键码比较次数要少。对移动次数，折半插入排序的对象移动次数与直接插入排序相同，依赖于对象的初始排列。所以折半插入排序减少了比较次数，但没有减少移动次数。平均性能优于直接插入排序。其时间复杂度为O（n^2），空间复杂度是O（1），是一种稳定的排序方法。 
  （3）希尔排序 
  直接排序什么时候效率较高？一是序列基本有序，二是序列长度较小。基于此我们提出希尔排序的基本思路：先将整个待排记录序列分割成若干子序列，分别进行直接插入排序，待整个序列中的记录“基本有序”时，再对全体记录进行一次直接插入排序。希尔排序的算法特点是： 
   
   一次移动，移动位置较大，跳跃式地接近排序后的最终位置 
   最后一次只需要少量移动 
   增量序列必须是递减的，最后一个必须是1 
   增量序列应该是互质的 
   
   
  首先：定义增量序列，刚才的例子中
 然后：对每个进行“-间隔”插入排序(k=M，M-1，...1)。 
  //主程序
void ShellSort(Sqlist &L,int dlta[],int t){
    //按增量序列dlta[0..t-1]对顺序表L作希尔排序,t是增量序列的长度
    for(k=O; k0 &&(r[0].key < r[j].key); j = j-dk)
                r[j+dk]=r[j];  //后移
        L.r[j+dk]=L.r[0];  //插入，退出循环时r[j]
 
  希尔排序的算法效率与增量序列的取值有关。 
  对于Hibbard增量序列，，相邻元素互质。最坏情况；猜想：；
 Sedgewick增量序列{1,5,19,41,109...}，或。猜想：，； 
  希尔排序法是一种不稳定的排序算法，例如对下面d=2的情况： 
   
  总结：对希尔排序来说，时间复杂度是n和d的函数，空间复杂度是O（1），是一种不稳定的排序方法。关于如何选择最佳d序列，目前尚未有解决方案。但是，最后一个增量值必须为1，其他序列元素之间无除了1之外的公因子。此外，希尔排序不宜在链式存储结构上实现。 
  二. 交换排序 
  基本思想：两两比较，如果发生逆序则交换，直到所有记录都排好序为止。 
  常见的交换排序方法：冒泡排序，快速排序。 
  （1）冒泡排序 
  给定初始序列：21，25，49，25*，16，08，n=6。 
  第1趟：
 位置0，1进行比较——判断——不交换——结果：21，25，49，25*，16，08 
  位置1，2进行比较——判断——不交换——结果：21，25，49，25*，16，08 
  位置2，3进行比较——判断——交换——结果：21，25，25*，49，16，08 
  位置3，4进行比较——判断——交换——结果：21，25，25*，16，49，08 
  位置4，5进行比较——判断——交换——结果：21，25，25*，16，08，49 
  第1趟结束后：21，25，25*，16，08，49
 第2趟： 
  位置0，1进行比较——判断——不交换——结果：21，25，25*，16，08，49 
  位置1，2进行比较——判断——不交换——结果：21，25，25*，16，08，49 
  位置2，3进行比较——判断——交换——结果：21，25，16，25*，08，49 
  位置3，4进行比较——判断——交换——结果：21，25，16，08，25*，49 
  第2趟结束后：21，25，16，08，25*，49 
  继续下一趟，每一趟增加一个有序元素。
 第3趟结果：21，16，08，25，25*，49 
  第4趟结果：16，08，21，25，25*，49 
  第5趟结果：08，16，21，25，25*，49 
  总结：n个记录，需要比较n-1趟。第m趟需要比较n-m次。 
  void bubble_sort(SqList &L){  //冒泡排序算法
    int m,i,j; 
    RedType x;  //交换时临时存储
    for(m=1; m<=n-1; m++){  //总共需n-1趟
        for(j=1; j<=n-m; j++)  //第m趟需要比较n-m次
            if(L.r[j].key > L.r[j+1].key){  //发生逆序
                x=L.r[j]; L.r[j]=L.r[j+1]; L.r[j+1]=x;  //交换
            }//endif
    }//for
}
 
  冒泡排序的优点：每趟结束时，不仅能挤出一个最大值到最后面位置，还能同的部力理顺其他元素。实际上，一旦某一趟比较时不出现记录交换,说明已排好序了，就可以结束本算法。所以我们可以增设一个标识flag： 
  void bubble_sort(SqList &L){  //改进的冒泡排序算法
    int m,i,j;
    flag=1;  //flag作为是否有交换的标记
    RedType x; 
    for(m=1; m<=n-1 && flag==1; m++){
        flag=0;
        for(j=1; j<=n-m; j++){
            if(L.r[j].key>L.r[j+1].key){//发生逆序
                flag=1;  //发生交换，flag置为1，若本趟没发生交换，flag保持为零
                x=L.r[j]; L.r[j]=L.r[j+1]; L.r[j+1]=x;  //交换
            }//endif
        }//for
    }
}
 
  下面分析时间复杂度。最好情况是全为正序，这时比较次数是n-1，移动的次数是0；最坏情况是全为逆序，比较次数是，移动次数是（包含向中间辅助变量x移动）。所以，冒泡排序最好时间复杂度是O(n)，最坏时间复杂度为O(n^2)，平均时间复杂度为O(n^2)。冒泡排序算法中增加一个辅助空间temp，辅助空间为S(n)=O(1)，冒泡排序是稳定的排序算法。 
  （2）快速排序 
  快速排序是一种改进的交换排序。基本思想是递归思想：任取一个元素(如:第一个)为中心pivot，所有比它小的元素一律前放，比它大的元素一律后放，形成左右两个子表。对各子表重新选择中心元素并依此规则调整，直到每个子表的元素只剩一个（结束条件）。下面的过程，每个表中都选取第一个作为中心点（分界点）。 
   
  例如：给定序列 
   
  序列共8个数，界点直接取第一个数49，并把它搬到0号位。指针low=1，high=8.由于第1个位置已空，我们从后往前移动high，找一个小于界点的数把它搬到1号位。high--，当high=7的时候，数27满足，把27搬到1号位。此时7位空出来，我们向后移动low，找一个大于界点的数搬到空出来的7号位。low++，当low=3的时候，数65满足，把65搬到7号位，此时3号位空出来。我们再往前移动high，找一个大于界点的数搬到3号位。当high=6，数字13符合，13搬到3号位，6号位又空出。继续往后移动low，low=4，数97符合，97搬到6号位，4号位空出。然后往前移动high，high=5没有符合题意的，继续向前移动至high=4，此时high与low都重合。再把界点49填到4号位。此时8个数字的表就能以4号位49为界分成两个子表：前面1-3位，后面5-8位。然后在对两个子表分别执行相同的操作。 
  总结：①每一趟的子表的形成是采用从两头向中间交替式逼近法；②由于每趟中对各子表的操作都相似，可采用递归算法。 
  void main(){
    QSort(L, 1, L.length);
}

void QSort(SqList &L, int low, int high){  //对顺序表L快速排序
    if(low < high){  //长度大于1
        pivotloc = Partition(L, low, high);
        //将L一分为二，pivotloc为中心点元素排好序的位置
        QSort(L, low, pivotloc-1);  //对低子表递归排序
        QSort(L, pivotloc+1, high);  //对高子表递归排序
    }//end if 
}//QSort

int Partition(SqList &L, int low, int high){
    L.r[0] = L.r[low];  //取[low,high]的第一个元素作为中心点，并搬前面去 
    pivotkey = L.r[low].key;  //这里也是取中心点
    while (low < high){  //循环终止的条件是low=high
        while (low < high && L.r[high].key >= pivotkey) --high;  
        //low指针指的地方空出，前移high，直到找到一个小于pivotkey的
        L.r[low] = L.r[high];  //然后搬到空出的地方low，此时high又空出来

        while (low < high && L.r[low].key <= pivotkey) ++low;  
        //high指针指的地方空出，后移low，直到找到一个大于pivotkey的
        L.r[high] = L.r[low];  //然后搬到空出的地方high，此时low又空出来
    }
    L.r[low]=L.r[0];  //退出循环，再把最后指针重合的地方就是空的地方，填回中心点
    return low;  //返回中心点所在的位置
} 
  下面分析算法效率：可以证明，时间复杂度是，其中对上面的Qsort（）是，对下面的Partition（）是。实验结果表明：就平均计算时间而言，快速排序是我们所讨论的所有内排序方法中最好的一个。 
  接下来分析空间复杂度：快速排序不是原地排序。由于程序中使用了递归，需要递归调用栈的支持，而栈的长度取决于递归调用的深度(即使不用递归，也需要用用户栈)。在平均情况下，需要O(logn)的栈空间；最坏情况下，栈空间可达O(n)。 
  快速排序同前面的希尔排序，它也是不稳定的排序算法。例如:49，38，49*，20，97，76，经过一次划分后：20，38，49*，49，97，76。 
  快速排序不适于对原本有序或基本有序的记录序列进行排序。例如，对(46,50,68,74,79,85,90)进行快速排序，会发现：由于每次枢轴记录的关键字都是小于其它所有记录的关键字，致使一次划分之后得到的子序列(1)的长度为0，这时已经退化成为没有改进措施的冒泡排序。 
  划分元素的选取是影响时间性能的关键。输入数据次序越乱，所选划分元素值的随机性越好，排序速度反而越快，快速排序不是自然排序方法。需要注意的是，改变划分元素的选取方法，至多只能改变算法平均情况的下的世界性能，无法改变最坏情况下的时间性能。即最坏情况下，快速排序的时间复杂度总是O(n^2)。

C#基于MVC模式实现TCP三次握手，附带简易日志管理模块风，停下 C#设计模式网络协议 c#mvc tcp/ip
C#基于MVC模式实现TCP三次握手1Model1.1ServerModel1.2ClientModel1.3配置参数模块1.4日志管理模块1.4.1数据结构1.4.1日志管理工具类1.4.1日志视图展示1.4.1.1UcLogManage.cs1.4.1.2UcLogManage.Designer.cs2视图（View）2.1ViewServer2.1.1ViewServer.cs2.1.1Vi
JDK8 Stream 数据流效率分析，Java开发你需要了解的那些事气质大叔程序员后端面试 java
此外还有一系列特化流，如IntStream，LongStream，DoubleStream等），Java8引入的的Stream主要用于取代部分Collection的操作，每个流代表一个值序列，流提供一系列常用的聚集操作，可以便捷的在它上面进行各种运算。集合类库也提供了便捷的方式使我们可以以操作流的方式使用集合、数组以及其它数据结构；作为阅读福利，小编也整理了一些Java学习笔记（包含面试真题+脑图
2025美团最新面试题—Java程序减少GC的设计程序员共鸣 java jvm 开发语言
1.对象复用与池化线程局部变量：通过ThreadLocal缓存线程私有对象，避免竞争。可变对象：优先使用可修改对象（如StringBuilder代替String拼接）。2.减少对象创建避免隐式装箱：使用基本类型（int而非Integer）。优化循环：避免在循环内创建临时对象。静态不可变对象：将常量声明为staticfinal（如配置参数）。3.数据结构优化预分配容量：初始化集合时指定合理大小（如A
腾讯云与MongoDB战略合作升级，瞄准AI时代的数据管理服务 CSDN资讯腾讯云 mongodb 人工智能
2025年3月20日，腾讯云与MongoDB联合宣布续签战略合作协议，双方将围绕AI时代的技术变革为全球用户提供卓越的数据管理服务。文档数据库MongoDB以其灵活的数据结构、强大的性能和原生的分布式扩展性等特点，成为最受欢迎的NoSQL数据库之一，广泛应用于游戏、社交媒体、电商、金融和物联网等各行各业。在DB-Engines全球数据库排行榜上，MongoDB长期位居NoSQL数据库第一。据了解，
List 和 Set 的区别不会搬砖的淡水鱼数据结构 list windows 数据结构
List和Set的区别在Java中，List和Set都是Collection接口的子接口，但它们的存储结构、特点、使用场景不同。对比项List（有序、可重复）Set（无序、不可重复）是否允许重复元素✅允许❌不允许是否有序✅按插入顺序排序❌无序（TreeSet除外）是否可以有null✅允许多个null✅只允许一个null底层数据结构数组、链表哈希表、红黑树访问方式通过索引访问通过iterator遍历
【C++篇】排队的艺术：用生活场景讲解优先级队列的实现 far away4002 C++c++stl 优先级队列向下（向上）调整算法
文章目录须知欢迎讨论：如果你在学习过程中有任何问题或想法，欢迎在评论区留言，我们一起交流学习。你的支持是我继续创作的动力！点赞、收藏与分享：觉得这篇文章对你有帮助吗？别忘了点赞、收藏并分享给更多的小伙伴哦！你们的支持是我不断进步的动力！分享给更多人：如果你觉得这篇文章对你有帮助，欢迎分享给更多对C++感兴趣的朋友，让我们一起进步！深入理解与实现：C++优先级队列的模拟实现1.引言在算法和数据结构中
Redis 使用入门与进阶指南 ohn.yu 技术杂谈 redis 数据库缓存
Redis（RemoteDictionaryServer）是一个高性能的开源内存数据存储系统，常被用作数据库、缓存和消息队列。它以速度快、支持多种数据结构和简单易用而著称。本文将带你从Redis的基础用法开始，逐步深入到适合中级技术人员的实际应用场景。如果你是一个初学者或有一定经验的技术人员，这篇博客会帮助你更好地掌握Redis。什么是Redis？Redis是一个键值对存储系统，但它不仅仅是简单的
Opencv计算机视觉编程攻略-第一节图像读取与基本处理 weixin_44242403 深度学习 opencv 计算机视觉
1.图像读取导入依赖项的h文件#include#include#include#include项目Valuecore.hpp基础数据结构和操作（图像存储、矩阵运算、文件I/O）highgui.hpp图像显示、窗口管理、用户交互（图像/视频显示、用户输入处理、结果保存）imgproc.hpp图像处理算法（图像滤波、几何变换、边缘检测、形态学操作）二读取图片Matimage;//图像矩阵std::co
数据结构-ArrayList 小豪GO! java的养成方法 java
文章目录1.线性表2.顺序表3.ArrayList4.ArrayList的问题以及思考4.2增容的性能消耗问题4.3空间浪费问题1.线性表线性表（LinearList）是n个具有相同特性的数据元素的有限序列。线性表是一种在实际中广泛使用的数据结构，常见线性表：顺序表、链表、栈、队列…线性表在逻辑上是线性结构，也就是连续的一条直线。但是在物理上不一定是连续的，线性表在物理上存储时，通常以数组和链式结
《算法笔记》9.4小节——数据结构专题(2)-＞二叉查找树（BST）问题 A: 二叉排序树圣保罗的大教堂《算法笔记》算法
题目描述输入一系列整数，建立二叉排序数，并进行前序，中序，后序遍历。输入输入第一行包括一个整数n(1#include#include#include#include#include#include#include#include#include#include#include#include#include#defineINF0x3f3f3f3f#definedb1(x)coutleft);Fre
数据结构篇——线索二叉树张二娃同学数据结构
一、引入遍历二叉树是按一定规则将二叉树结点排成线性序列，得到先序、中序或后序序列，本质是对非线性结构线性化，使结点（除首尾）在线性序列中有唯一前驱和后继；但以二叉链表作存储结构时，只能获取结点左右孩子信息，无法直接得任一序列中的前驱和后继信息，该信息需在遍历动态过程中获取，所以我们将引入线索二叉树来保存遍历动态过程中得到的前驱和后继信息。二、线索二叉树的基本概念试做如下规定:若结点有左子树,则其l
[NOIP2017 提高组] 列队题解零衣贰题解 c++
数据结构。n=1n=1n=1的case：考虑有m+qm+qm+q个位置，每次操作队移，出队人直接插入队尾。维护位置对应的人，每次查询第kkk个人的位置ppp，输出ppp位置对应的人，并将出对者加入队尾。实现考虑维护01序列，表示位置上是/否有人，每次查前缀和为kkk的位置即可。一般情况：每次操作只会影响某一行以及最后一列。考虑将最后一列单独处理。对于查询(x,y)(x,y)(x,y)：需查询第xx
TikTokenizer 开源项目教程邱纳巧Gillian
TikTokenizer开源项目教程tiktokenizerOnlineplaygroundforOpenAPItokenizers项目地址:https://gitcode.com/gh_mirrors/ti/tiktokenizer项目介绍TikTokenizer是一个基于Python的开源项目，旨在提供一个高效、灵活的文本分词工具。该项目利用先进的算法和数据结构，能够快速准确地对文本进行分词处
【图论】并查集的学习和使用猪猪成 C++学习算法图论
目录并查集是什么？举个例子组成父亲数组：find函数：union函数：代码实现：fa[]初始化code:findcode：递归实现:非递归实现:unioncode:画图模拟：路径压缩：路径压缩Code：并查集是什么？是一种树形的数据结构，一般用来处理集合的合并，查询操作。举个例子告诉你1的父节点是22的父节点是34的父节点是56没有父节点那么可以画出三个集合，或者说是树。然后我们一般用并查集判断：
1.1PaddleTS_环境配置：一个易用的深度时序建模的Python库 pythonQA python paddlepaddle
PaddleTS是一个易用的深度时序建模的Python库，它基于飞桨深度学习框架PaddlePaddle，专注业界领先的深度模型，旨在为领域专家和行业用户提供可扩展的时序建模能力和便捷易用的用户体验。PaddleTS的主要特性包括：设计统一数据结构，实现对多样化时序数据的表达，支持单目标与多目标变量，支持多类型协变量封装基础模型功能，如数据加载、回调设置、损失函数、训练过程控制等公共方法，帮助开发
Ada语言的数据结构与算法尤宸翎包罗万象 golang 开发语言后端
Ada语言的数据结构与算法引言在计算机科学的领域里，数据结构与算法是核心的组成部分，围绕着如何高效地存储和处理数据。这些概念不仅是程序设计的重要基础，也是提高程序性能的关键。Ada是一种强类型、结构化的编程语言，早在20世纪80年代就被设计用于军用和实时系统。由于其高可靠性和可维护性，Ada逐渐在航空航天、军事和其他需要高安全性的领域获得了广泛应用。本文将探讨Ada语言中的数据结构和算法，包括常见
软件设计师之树与二叉树：非线性数据结构的深度探索一杯年华@编程空间软考中级数据结构
软件设计师之树与二叉树：非线性数据结构的深度探索在软件开发领域，数据结构是程序设计的核心基础，其中树和二叉树作为重要的非线性数据结构，在众多场景中都有着广泛应用。我写这篇博客，就是希望和大家一起学习进步，深入解析树和二叉树的相关知识，用通俗易懂的语言结合图表和Java代码示例进行讲解，帮助大家更好地掌握这些内容。一、树的定义与基本概念树的定义树是由n（n≥0）个结点组成的有限集合。当n=0时，为空
http框架核心之ngx_http.c源码分析 qiuhui00 nginx源码分析 nginx 源码分析 http框架
ngx_http.c内主要实现了一个模块:ngx_http_module。ngx_http_module是nginx的http框架的一部分，它是所有http模块能够被加载的唯一入口，承担了http块配置解析，合并，以及http框架及其相关数据结构的初始化。它本身是NGX_CORE_MODULE类型，只有一个指令，就是http，如下所示:staticngx_command_tngx_http_com
Java数据类型 Arrays VS ArraysList VS LikedList 解析 fantasy_4 Java java
在学习Java过程中，在刷题时总是搞不清楚这三种数据结构的区别，打算写篇文章记录一下ArraysVSArrayListArrayListVSLinkedList总结ArraysVSArrayListArraysArrayList类型Java的基本数据类型Java集合框架中的一个类，实现了List接口存储内容基本数据类型+对象引用对象引用可变性数组长度创建后不可变长度可变适用场景查询元素会比较快，直
Pandas完全指南：数据处理与分析从入门到实战 xiaoyu❅ python python pandas 开发语言
目录引言一、Pandas环境配置与核心概念1.1安装Pandas1.2导入惯例1.3核心数据结构二、数据结构详解2.1Series创建与操作2.2DataFrame创建三、数据查看与基本操作3.1数据预览3.2索引与选择3.3数据排序四、数据清洗实战4.1处理缺失值4.2处理重复值4.3数据类型转换4.4字符串处理五、数据处理进阶5.1数据筛选5.2列操作5.3应用函数六、数据分组与聚合6.1基础
【C++】：位图（bitset） -元清- 重制C++版 c++开发语言 c语言数据结构算法
目录位图的概念位图的应用场景位图的构造函数位图的使用位图的概念位图（Bitmap）是一种基于二进制位（bit）的高效数据结构，用于表示一组布尔值（存在或不存在、真或假）。它的核心思想是：用每一个二进制位（0或1）来标记某个状态或资源是否被占用。第i位为1→表示第i个元素存在/被占用。第i位为0→表示第i个元素不存在/未被占用。关键特性：内存高效：每个布尔值仅占用1个二进制位（bit），而非传统布尔
【数据库】MySQL的索引详解此木|西贝数据库数据库 mysql
简介索引是一种用于快速查询和检索数据的数据结构，类似于书的目录。在几百页的书通过几页目录就可以精确定位到我们想看的章节优点和缺点优点正确的使用索引可以大大提高检索速度可以使用唯一索引保证数据在库中的唯一性使用聚合索引减少回表，降低IO次数缺点索引不宜创建的太多，否则增删改时不仅修改数据，还要修改大量的索引数据索引也会占用磁盘空间索引结构B树：多路平衡查找树，B树的所有节点都会存储key（索引）和d
深入理解 TypeScript 中的迭代器（Iterators）与生成器（Generators）念九_ysl typescript 前端 typescript
一、为什么需要迭代协议？在现代JavaScript/TypeScript开发中，我们经常需要处理各种集合型数据：数组、Map、Set甚至是自定义数据结构。ES6引入的迭代协议（IterationProtocols）正是为了解决统一遍历机制的问题。通过迭代器模式，我们可以：为不同的数据结构提供统一的访问接口实现惰性计算（LazyEvaluation）支持现代语言特性（for...of,扩展运算符等）
成为编程大佬！！-----＞数据结构与算法（2）——顺序表！！ Elnaij 算法数据结构 c语言
前言：线性表是数据结构与算法的重中之重，所有具有线性逻辑结构的数据结构，都能称为线性表。这篇文章我们先来讨论线性表中的顺序表，顺序表和线性表都是后续实现栈，树，串和图等等结构的重要基础。目录❀简单介绍线性表❀顺序表❀顺序表的存储❀动态存储❀静态存储❀静态存储与动态存储的优缺点❀顺序表操作❀1.初始化顺序表❀2.销毁顺序表❀3.插入数据❀插入数据之判断已满否❀插入操作之尾插❀插入操作之头插❀插入数据
基于C语言的数据结构之串——带你熟练掌握串的基本操作！！超级详细！！ Elnaij 数据结构 c语言算法
目录前言1.数据结构——串1.1基本知识主串、子串、模式串1.2对几个字符串库函数的简单介绍1.2.1strcmp1.2.2strcpy1.2.3strlen1.2.4strcat1.3串的分类1.3.1静态分配内存的串1.3.2动态分配内存的串2.串的基本操作2.1初始化串2.2输出字符2.3插入子串2.4删除子串2.5取子串操作2.6撤销删除操作结束语前言掌握串之前最好先去学习好顺序表和单链表
C++与C语言的区别 @haihi c++c语言开发语言
前言本文主要用C语言和C++做对比来学习C++，便于个人理解。C++包含C语言，是对C语言的扩展，在C++中，支持C语言的语法使用，C++是C语言的超集一、C++与C语言的区别C语言简单高效，适合低级系统编程和硬件相关的开发。C++更加灵活、强大，适合大型项目开发，尤其是需要面向对象、代码复用和复杂数据结构的应用。1.编程范式C语言：C是一种过程式编程语言，主要关注函数和过程。程序是通过一系列函数
什么是Apache Avro？ maozexijr apache
什么是ApacheAvro？ApacheAvro是一个开源的数据序列化框架，主要用于高效的数据交换和存储。它由ApacheHadoop项目开发，广泛应用于大数据生态系统中（如Hadoop、Kafka等）。Avro提供了一种紧凑、快速的二进制数据格式，同时支持丰富的数据结构和模式演化。核心特性跨语言支持Avro支持多种编程语言（如Java、Python、C++、Go等），使得不同语言之间的数据交换变
Python常用的库讲解（易懂版）不辉放弃 python 开发语言
NumPy：用于科学计算的基础库，提供多维数组对象、各种派生对象和对数组执行操作的工具。importnumpyasnp#创建一个numpy数组arr=np.array([1,2,3,4,5])print(arr)Pandas：数据处理库，提供数据结构和数据分析工具，特别适合处理结构化数据。importpandasaspd#创建一个Pandas数据帧df=pd.DataFrame({'A':[1,2
学习第十一天-树大橙子房 ai 学习
一、树的基础概念1.定义树是一种非线性数据结构，由n个有限节点组成层次关系集合。特点：有且仅有一个根节点其余节点分为若干互不相交的子树节点间通过父子关系连接2.关键术语术语定义节点包含数据和子节点引用的单元根节点树的起始节点，没有父节点子节点直接连接到父节点的节点叶子节点没有子节点的节点度节点拥有的子树数目树的高度从根节点到最远叶子节点的最长路径边数树的深度从根节点到当前节点的层数路径从根到某节点
Windows 图形显示驱动开发-WDDM 3.0功能- IOMMU DMA 重新映射（二）程序员王马 windows图形显示驱动开发驱动开发
地址描述符列表为了同时支持物理和逻辑访问模式，并在运行时无缝切换这两种模式，Dxgkrnl提供了一个描述地址描述符列表(ADL)的DXGK_ADL结构。此数据结构类似于MDL，但描述了一个可以是物理或逻辑的页面数组。由于这些页可以是逻辑页，因此不能将ADL描述的地址映射到虚拟地址以直接访问CPU。DxgkddiBuildpagingbuffer的DXGK_OPERATION_MAP_APERTUR
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod

24.排序，插入排序，交换排序

一. 插入排序

（1）直接插入排序

（2）折半插入排序

（3）希尔排序

二. 交换排序

（1）冒泡排序

（2）快速排序

你可能感兴趣的:(数据结构,数据结构)