C++软件工程师面试考点.md

C++软件工程师面试考察主要有C++基础(最好也懂Java)、数据结构及简单算法、TCP、操作系统、网络编程、Linux基本操作和Shell编程、数据库,设计模式和智力题也会涉及少量。

C++基础

参考资料:《Effective C++》、《C++ Prime》、《STL源码剖析》

  • C和C++的区别?
  1. C是面向过程的语言,C++是面向对象的语言
  2. C++中new和delete是对内存分配的运算符,取代了C中的malloc和free
  3. C++中有引用的概念,C中没有
  4. C++引入了类的概念,C中没有
  5. C++有函数重载,C中不能
  6. C变量只能在函数的开头处声明和定义,而C++随时定义随时使用
  • C++和Java之间的区别?
  1. Java的应用在高层,C++在中间件和底层
  2. Java语言简洁;取消了指针带来更高的代码质量;完全面向对象,独特的运行机制是其具有天然的可移植性。
  3. Java在web应用上具有C++无可比拟的优势
  4. 垃圾回收机制的区别。C++ 用析构函数回收垃圾,Java自动回收,写C和C++程序时一定要注意内存的申请和释放。
  5. Java用接口(Interface)技术取代C++程序中的多继承性
  • 什么是面向对象?面向对象的几大特性是什么?
    面向对象是一种基于对象的、基于类的的软件开发思想。面向对象具有继承、封装、多态的特性。
  • 指针和引用的区别
  1. 指针保存的是指向对象的地址,引用相当于变量的别名
  2. 引用在定义的时候必须初始化,指针没有这个要求
  3. 指针可以改变地址,引用必须从一而终
  4. 不存在空应引用,但是存在空指针NULL,相对而言引用更加安全
  5. 引用的创建不会调用类的拷贝构造函数
  • new/delete与malloc/free的区别
  1. new是运算符,malloc是C语言库函数
  2. new可以重载,malloc不能重载
  3. new的变量是数据类型,malloc的是字节大小
  4. new可以调用构造函数,delete可以调用析构函数,malloc/free不能
  5. new返回的是指定对象的指针,而malloc返回的是void*,因此malloc的返回值一般都需要进行类型转化
  6. malloc分配的内存不够的时候可以使用realloc扩容,new没有这样的操作
  7. new内存分配失败抛出bad_malloc,malloc内存分配失败返回NULL值
  • volatile关键字
  1. 访问寄存器要比访问内存要块,因此CPU会优先访问该数据在寄存器中的存储结果,但是内存中的数据可能已经发生了改变,而寄存器中还保留着原来的结果。为了避免这种情况的发生将该变量声明为volatile,告诉CPU每次都从内存去读取数据。
  2. 一个参数可以即是const又是volatile的吗?可以,一个例子是只读状态寄存器,是volatile是因为它可能被意想不到的被改变,是const告诉程序不应该试图去修改他
  • static关键字的作用
  1. 修饰全局变量
  2. 修饰局部变量
  3. 修饰全局函数
  4. 修饰局部函数
  5. 修饰类的成员变量、成员函数
  • static修饰全局函数有什么作用?
    限制他的作用域只能在本文件之内。

  • extern关键字作用
    声明一个外部变量。

  • const关键字的作用

  1. const修饰全局变量
  2. const修饰局部变量
  3. const修饰指针,const int *
  4. const修饰指针指向的对象, int * const
  5. const修饰引用做形参
  6. const修饰成员变量,必须在构造函数列表中初始化
  7. const修饰成员函数,说明该函数不应该修改非静态成员,但是这并不是十分可靠的,指针所指的非成员对象值可能会被改变
  • define/const/inline的区别
    本质:define只是字符串替换,const参与编译运行,具体的:
  1. define不会做类型检查,const拥有类型,会执行相应的类型检查
  2. define仅仅是宏替换,不占用内存,而const会占用内存
  3. const内存效率更高,编译器通常将const变量保存在符号表中,而不会分配存储空间,这使得它成为一个编译期间的常量,没有存储和读取的操作

本质:define只是字符串替换,inline由编译器控制,具体的:
12. 内联函数在编译时展开,而宏是由预处理器对宏进行展开
13. 内联函数会检查参数类型,宏定义不检查函数参数 ,所以内联函数更安全。
14. 宏不是函数,而inline函数是函数
15. 宏在定义时要小心处理宏参数,(一般情况是把参数用括弧括起来)。

  • C++预定义宏
描述
_LINE_ 这会在程序编译时包含当前行号
_FILE_ 这会在程序编译时包含当前文件名
_DATE_ 这会包含一个形式为 month/day/year
_TIME_ 这会包含一个形式为 hour:minute:second 的字符串,它表示程序被编译的时间。
这些宏的实例:
#include 
using namespace std;
 
int main ()
{
    cout << "Value of __LINE__ : " << __LINE__ << endl;
    cout << "Value of __FILE__ : " << __FILE__ << endl;
    cout << "Value of __DATE__ : " << __DATE__ << endl;
    cout << "Value of __TIME__ : " << __TIME__ << endl;
 
    return 0;
}

当上面的代码被编译和执行时,它会产生下列结果:

Value of __LINE__ : 6
Value of __FILE__ : test.cpp
Value of __DATE__ : Feb 28 2011
Value of __TIME__ : 18:52:48
  • C++构造函数能抛异常吗?析构呢?
    不能。

  • C++/C内存分配方式,堆与栈的区别

  • 构造函数为什么不能定义为虚函数,析构函数为什么可以?

  1. 虚函数的执行依赖于虚函数表。而虚函数表需要在构造函数中进行初始化工作,即初始化vptr,让他指向正确的虚函数表。而在构造对象期间,虚函数表还没有被初始化,将无法进行。
  2. 在类的继承中,如果有基类指针指向派生类,那么用基类指针delete时,如果不定义成虚函数,派生类中派生的那部分无法析构。
  3. 构造函数不要调用虚函数。在基类构造的时候,虚函数是非虚,不会走到派生类中,既是采用的静态绑定。显然的是:当我们构造一个子类的对象时,先调用基类的构造函数,构造子类中基类部分,子类还没有构造,还没有初始化,如果在基类的构造中调用虚函数,如果可以的话就是调用一个还没有被初始化的对象,那是很危险的,所以C++中是不可以在构造父类对象部分的时候调用子类的虚函数实现。但是不是说你不可以那么写程序,你这么写,编译器也不会报错。只是你如果这么写的话编译器不会给你调用子类的实现,而是还是调用基类的实现。
  • 有哪些内存泄漏?如何判断内存泄漏?如何定位内存泄漏?

内存泄漏类型:

  1. 堆内存泄漏 (Heap leak)。对内存指的是程序运行中根据需要分配通过malloc,realloc new等从堆中分配的一块内存,再是完成后必须通过调用对应的 free或者delete 删掉。如果程序的设计的错误导致这部分内存没有被释放,那么此后这块内存将不会被使用,就会产生Heap Leak.
  2. 系统资源泄露(Resource Leak).主要指程序使用系统分配的资源比如 Bitmap,handle ,SOCKET等没有使用相应的函数释放掉,导致系统资源的浪费,严重可导致系统效能降低,系统运行不稳定。

检测内存泄漏:

  1. 在windows平台下通过CRT中的库函数进行检测;
  2. 在可能泄漏的调用前后生成块的快照,比较前后的状态,定位泄漏的位置
  3. Linux下通过工具valgrind检测
  • 全局变量和局部变量的区别

  • C++智能指针

  • C++11新特性

  • 纯虚函数的作用和实现方式

  • STL源码、vector、list、map、set

  • 字节对齐的原则

  1. 从0位置开始存储;
  2. 变量存储的起始位置是该变量大小的整数倍;
  3. 结构体总的大小是其最大元素的整数倍,不足的后面要补齐;
  4. 结构体中包含结构体,从结构体中最大元素的整数倍开始存;
  5. 如果加入pragma pack(n) ,取n和变量自身大小较小的一个。
  • 空结构体的sizeof()返回值
    答案是1

  • 静态连接与动态链接的区别

  1. 静态链接
    所谓静态链接就是在编译链接时直接将需要的执行代码拷贝到调用处,优点就是在程序发布的时候就不需要依赖库,也就是不再需要带着库一块发布,程序可以独立执行,但是体积可能会相对大一些。
  2. 动态链接
    所谓动态链接就是在编译的时候不直接拷贝可执行代码,而是通过记录一系列符号和参数,在程序运行或加载时将这些信息传递给操作系统,操作系统负责将需要的动态库加载到内存中,然后程序在运行到指定的代码时,去共享执行内存中已经加载的动态库可执行代码,最终达到运行时连接的目的。优点是多个程序可以共享同一段代码,而不需要在磁盘上存储多个拷贝,缺点是由于是运行时加载,可能会影响程序的前期执行性能。
  • 多态是什么?举一个多态的例子

  • 多态性与虚函数表

  • 静态多态和动态多态
    多态分为静态多态和动态多态。静态多态是通过重载和模板技术实现,在编译的时候确定。动态多态通过虚函数和继承关系来实现,执行动态绑定,在运行的时候确定。

  • 重写、重载与隐藏的区别
    重载的函数都是在类内的。只有参数类型或者参数个数不同,重载不关心返回值的类型。
    覆盖(重写)派生类中重新定义的函数,其函数名,返回值类型,参数列表都跟基类函数相同,并且基类函数前加了virtual关键字。
    隐藏是指派生类的函数屏蔽了与其同名的基类函数,注意只要同名函数,不管参数列表是否相同,基类函数都会被隐藏。有两种情况:(1)参数列表不同,不管有无virtual关键字,都是隐藏;(2)参数列表相同,但是无virtual关键字,也是隐藏。

  • 构造函数为什么不能定义为虚函数,析构函数为什么可以

  1. 虚函数的执行依赖于虚函数表。而虚函数表需要在构造函数中进行初始化工作,即初始化vptr,让他指向正确的虚函数表。而在构造对象期间,虚函数表还没有被初始化,将无法进行。
  2. 在类的继承中,如果有基类指针指向派生类,那么用基类指针delete时,如果不定义成虚函数,派生类中派生的那部分无法析构。
  3. 构造函数不要调用虚函数。在基类构造的时候,虚函数是非虚,不会走到派生类中,既是采用的静态绑定。显然的是:当我们构造一个子类的对象时,先调用基类的构造函数,构造子类中基类部分,子类还没有构造,还没有初始化,如果在基类的构造中调用虚函数,如果可以的话就是调用一个还没有被初始化的对象,那是很危险的,所以C++中是不可以在构造父类对象部分的时候调用子类的虚函数实现。但是不是说你不可以那么写程序,你这么写,编译器也不会报错。只是你如果这么写的话编译器不会给你调用子类的实现,而是还是调用基类的实现。
  • 必须在构造函数初始化式里进行初始化的数据成员有哪些
  1. 常量成员,因为常量只能初始化不能赋值,所以必须放在初始化列表里面
  2. 引用类型,引用必须在定义的时候初始化,并且不能重新赋值,所以也要写在初始化列表里面
  3. 没有默认构造函数的类类型,因为使用初始化列表可以不必调用默认构造函数来初始化,而是直接调用拷贝构造函数初始化
  • C++四种类型转换
    static_cast, dynamic_cast, const_cast, reinterpret_cast
  1. const_cast用于将const变量转为非const
  2. static_cast用的最多,对于各种隐式转换,非const转const,void*转指针等, static_cast能用于多态想上转化,如果向下转能成功但是不安全,结果未知;
  3. dynamic_cast用于动态类型转换。只能用于含有虚函数的类,用于类层次间的向上和向下转化。只能转指针或引用。向下转化时,如果是非法的对于指针返回NULL,对于引用抛异常。要深入了解内部转换的原理。
  4. reinterpret_cast几乎什么都可以转,比如将int转指针,可能会出问题,尽量少用;
  5. 为什么不使用C的强制转换?C的强制转换表面上看起来功能强大什么都能转,但是转化不够明确,不能进行错误检查,容易出错。
  • 如何让一个类不能实例化?
    将类定义为抽象基类或者将构造函数声明为private。
  • 如何让main函数之前执行函数?
  1. C++中在main函数之前定义一个全局对象,调用构造函数。
#include 
using namespace std;

class TestClass{
public:
    TestClass();
};


TestClass::TestClass(){
    cout<<"TestClass"<<endl;
}

TestClass Ts;//定义个全局变量,让类里面的代码在main之前执行

int main(){
    cout<<"main"<<endl;

    return 0;
}

输出为

TestClass
main
  1. C语言中使用gcc的attribute关键字,声明constructor和destructor。
#include 

void static __attribute__((constructor)) before_main(){
    printf("before main\n");
}

void static __attribute__((destructor)) after_main(){
    printf("after main\n");
}
int main(int argc, char const *argv[]){
    printf("main\n");
    return 0;
}

程序结果为

before main
main
after main
  • C++如何创建一个类,使得他只能在堆或者栈上创建?
  1. 只能在堆上生成对象:将析构函数设置为私有。
    原因:C++是静态绑定语言,编译器管理栈上对象的生命周期,编译器在为类对象分配栈空间时,会先检查类的析构函数的访问性。若析构函数不可访问,则不能在栈上创建对象。
  2. 只能在栈上生成对象:将new 和 delete 重载为私有。
    原因:在堆上生成对象,使用new关键词操作,其过程分为两阶段:第一阶段,使用new在堆上寻找可用内存,分配给对象;第二阶段,调用构造函数生成对象。将new操作设置为私有,那么第一阶段就无法完成,就不能够再堆上生成对象。
  • C++命名空间,命名空间的嵌套
    可作为附加信息来区分不同库中相同名称的函数、类、变量等。使用了命名空间即定义了上下文。
#include 
using namespace std;
 
// 第一个命名空间
namespace first_space{
   void func(){
      cout << "Inside first_space" << endl;
   }
}
// 第二个命名空间
namespace second_space{
   void func(){
      cout << "Inside second_space" << endl;
   }
}
int main ()
{
 
   // 调用第一个命名空间中的函数
   first_space::func();
   
   // 调用第二个命名空间中的函数
   second_space::func(); 
 
   return 0;
}
  • C++多线程

  • explict关键字的作用


数据结构与算法

参考资料:《大话数据结构》、《数据结构浙大版》、《算法设计与分析》、《算法导论》、《剑指offer》、《LeetCode》、《组合数学》

链表

  • 输出链表中倒数第k个节点
  • 找到链表环结点入口
  • 单链表的倒置

排序算法

  • 手写快速排序(快速排序的基准)
/*快速排序函数*/
//输入:待排序的数组,排序其实位置>=0,排序终止位置<=length(a) - 1
void QuickSortHelper(ElemType a[],int low,int high)
{
    if(low >= high)
        return;
    ElemType temp = a[low];  //存储序列首位元素
    int i = low + 1;
    int j = high;
    while(i != j)
    {
        while(i < j && a[j] > temp)
            j--;
        while(i < j && a[i] < temp)
            i++;
        //交换两个元素
        if(i < j)
        {
            swap(a,i,j);
        }
    }
    a[low] = a[i];
    a[i] = temp;

    QuickSortHelper(a,low,i -1);
    QuickSortHelper(a,i + 1,high);
}

/*快速排序*/
void QuickSort(ElemType a[], int n)
{
    QuickSortHelper(a,0,n-1);
}
  • 归并排序
/*两个有序子列的合并*/
void Merge(ElemType a[], ElemType temp[], int left_begin, int right_begin, int right_end)
{
    int left_end = right_begin - 1;
    int i = left_begin; //存放结果数组的初始位置
    int num_element = right_end - left_begin + 1;
    //进行合并
    while (left_begin <= left_end && right_begin <= right_end)
    {
        if (a[left_begin] <= a[right_begin])
            temp[i++] = a[left_begin++];
        else
            temp[i++] = a[right_begin++];
    }
    while (left_begin <= left_end)
        temp[i++] = a[left_begin++];
    while (right_begin <= right_end)
        temp[i++] = a[right_begin++];

    //改变a中对应段的值
    for (int j = 0; j < num_element; j++)
    {
        a[right_end] = temp[right_end];
        right_end--;
    }
}

/*递归进行*/
void MSort(ElemType a[], ElemType temp[], int begin, int end)
{
    int mid;
    if (begin < end)
    {
        mid = (begin + end) / 2;
        MSort(a, temp, begin, mid);
        MSort(a, temp, mid + 1, end);
        Merge(a, temp, begin, mid + 1, end);
    }
}

/*归并排序*/
void MergeSort(ElemType a[], int n)
{
    ElemType *temp = (int *)malloc(sizeof(int) * n);
    if (temp != NULL)
    {
        MSort(a, temp, 0, n - 1);
        free(temp);
    }
    else
        cout << "空间不足!" << endl;
}
  • 堆排序
/*调整为最大堆*/
void PercDown(ElemType a[], int p, int n){
    // 将N个元素的数组中以a[p]为根的子堆调整为关于a[i]的最小堆
    int parent, child;
    int x;

    x = a[p]; //取出根节点的值

    for (parent = p; (parent * 2 + 1) < n; parent = child){
        child = parent * 2 + 1;
        if ((child != n - 1) && (a[child] < a[child + 1]))
            child++;
        if (x >= a[child])
            break;
        else
            a[parent] = a[child];
    }
    a[parent] = x;
}


/*堆排序*/
void HeapSort(ElemType a[], int n)
{
    for (int i = n / 2; i >= 0; i--)
        PercDown(a, i, n);    //建立一个最大堆
    for (int i = n - 1; i > 0; i--)
    {
        Swap(a, 0, i);  //交换最大最小元素,把最大元素给a[i]
        PercDown(a, 0, i); //剩下的i个元素调整为最大堆
    }
}

其他算法

  • 给定N张扑克牌和一个随机函数,设计一个洗牌算法
void shuffle(int cards[],int n)
{
    if(cards==NULL)
        return ;
    srand(time(0));
    for(int i=0;i<n-1;++i)
    {
        //保证每次第i位的值不会涉及到第i位以前
        int index=i+rand()%(n-i);
        int temp=cards[i];
        cards[i]=cards[index];
        cards[index]=temp;
    }
}

哈希表

  • 哈希处理冲突的解决方法
  1. 开放地址法
  2. 链表法

二叉树

  • 二叉树的非递归前序遍历,中序遍历,后续遍历,层序遍历
  • 二叉树的高度
  • 二叉树的镜像
  • 二叉树的前k大个节点(堆排序)
  • 红黑树和平衡二叉树

高级数据结构

  • 红黑树
  • 前缀树

算法

  • 找到数组中第一次出现1次的值
  • 背包九讲
  • 最大回文子串(动态规划)
  • 最长公共子序列(动态规划)
  • 最长重复子序列(find和rfind的应用)
  • 找零钱问题(动态规划&贪心算法)
  • 排列组合问题(递归&回溯)

海量数据处理问题


网络技术(TCP/IP)

  • OSI七层网络模型
应用层
表示层
会话层
运输层
网络层
数据链路层
物理层
  • TCP三次握手过程,为什么需要三次?
  1. 首先Client向Server发送请求报文段,同时同步自己的SYN(x),Client进入SYN_SENT状态。
  2. Server接收到Client的请求报文段,返回CLient自己的seq(y)及ack(x+1),Server进入SYN_REVD状态。
  3. CLinet收到Server的SYN+ACK包,向服务器发送一个序列号seq(x+1),确认号为ack(y+1),此包发送完毕,Client和Server进入ESTABLISHED(TCP连接成功)状态,完成三次握手。

需要三次的原因:防止已失效的报文段出现在本连接中。

  • TCP四次挥手的过程
  1. 客户端发送断开TCP连接请求的报文,其中报文中包含seq序列号,是由发送端随机生成的,并且还将报文中的FIN字段置为1,表示需要断开TCP连接。(FIN=1,seq=x,x由客户端随机生成)
  2. 服务端会回复客户端发送的TCP断开请求报文,其包含seq序列号,是由回复端随机生成的,而且会产生ACK字段,ACK字段数值是在客户端发过来的seq序列号基础上加1进行回复,以便客户端收到信息时,知晓自己的TCP断开请求已经得到验证。(FIN=1,ACK=x+1,seq=y,y由服务端随机生成)
  3. 服务端在回复完客户端的TCP断开请求后,不会马上进行TCP连接的断开,服务端会先确保断开前,所有传输到A的数据是否已经传输完毕,一旦确认传输数据完毕,就会将回复报文的FIN字段置1,并且产生随机seq序列号。(FIN=1,ACK=x+1,seq=z,z由服务端随机生成)
  4. 客户端收到服务端的TCP断开请求后,会回复服务端的断开请求,包含随机生成的seq字段和ACK字段,ACK字段会在服务端的TCP断开请求的seq基础上加1,从而完成服务端请求的验证回复。(FIN=1,ACK=z+1,seq=h,h为客户端随机生成)
    至此TCP断开的4次挥手过程完毕
  • 为什么TCP建立连接需要三次握手,而断开连接需要四次挥手?
    因为当Server端收到Client端的SYN连接请求报文后,可以直接发送SYN+ACK报文。其中ACK报文是用来应答的,SYN报文是用来同步的。但是关闭连接时,当Server端收到FIN报文时,很可能并不会立即关闭SOCKET,所以只能先回复一个ACK报文,告诉Client端,”你发的FIN报文我收到了”。只有等到我Server端所有的报文都发送完了,我才能发送FIN报文,因此不能一起发送。故需要四步握手。

  • TIME_WAIT的意义,为什么等于2MSL
    MSL是最长报文段寿命,设置的目的是:

  1. 保证A发送的最后一个ACK能够到达B
  2. 防止已失效的报文段出现在本连接中
  • TCP头部校验的原理,安全吗,可以仿造吗
    TCP校验和是一个端到端的校验和,由发送端计算,然后由接收端验证。其目的是为了发现TCP首部和数据在发送端到接收端之间发生的任何改动。如果接收方检测到校验和有差错,则TCP段会被直接丢弃。

  • TCP、UDP的区别?服务器和客户端建立的过程?
    TCP—传输控制协议,提供的是面向连接、可靠的字节流服务。当客户和服务器彼此交换数据前,必须先在双方之间建立一个TCP连接,之后才能传输数据。TCP提供超时重发,丢弃重复数据,检验数据,流量控制等功能,保证数据能顺序地从一端传到另一端。
    UDP—用户数据报协议,是一个简单的面向数据报的运输层协议。UDP不提供可靠性,它只是把应用程序传给IP层的数据报发送出去,但是并不能保证它们能到达目的地。由于UDP在传输数据报前不用在客户和服务器之间建立一个连接,且没有超时重发等机制,不保证数据按顺序传递,故而传输速度很快。

UDP编程的服务器端一般步骤

  1. 创建一个socket,用函数socket();
  2. 设置socket属性,用函数setsockopt();* 可选
  3. 绑定IP地址、端口等信息到socket上,用函数bind();
  4. 循环接收数据,用函数recvfrom();
  5. 关闭网络连接;

UDP编程的客户端一般步骤是

  1. 创建一个socket,用函数socket();
  2. 设置socket属性,用函数setsockopt();* 可选
  3. 绑定IP地址、端口等信息到socket上,用函数bind();* 可选
  4. 设置对方的IP地址和端口等属性;
  5. 发送数据,用函数sendto();
  6. 关闭网络连接;

TCP编程的服务器端一般步骤是

  1. 创建一个socket,用函数socket();
  2. 设置socket属性,用函数setsockopt(); * 可选
  3. 绑定IP地址、端口等信息到socket上,用函数bind();
  4. 开启监听,用函数listen();
  5. 接收客户端上来的连接,用函数accept();
  6. 收发数据,用函数send()和recv(),或者read()和write();
  7. 关闭网络连接;
  8. 关闭监听;

TCP编程的客户端一般步骤是

  1. 创建一个socket,用函数socket();
  2. 设置socket属性,用函数setsockopt();* 可选
  3. 绑定IP地址、端口等信息到socket上,用函数bind();* 可选
  4. 设置要连接的对方的IP地址和端口等属性;
  5. 连接服务器,用函数connect();
  6. 收发数据,用函数send()和recv(),或者read()和write();
  7. 关闭网络连接;
  • socket中的close是一次就关闭的吗?半关闭状态是怎么产生的?
    不是,当A发送给B控制FIN的时候,A到B这个方向的连接就关闭了,这个时候处于半关闭的状态,但是B到A这个方向的连接并没有关闭,因为B要等到将数据全部发送完毕之后才会发送FIN给A。

  • TCP拥塞控制
    重点掌握慢开始、拥塞避免、快重传、快恢复。

  • TCP流量控制,采用滑动窗口会用什么问题?
    流量控制是为了让发送方的发送速率不要太快,要让接收方来得及接收。
    Nagle算法:①当发送方首都哦啊哦对第一个数据字符的确认后,再把发送缓存中的所有数据组装成一个报文段发送出去,同时继续对随后到到达的数据进行缓存。②当到达的数据已达到发送窗口大小的一半或已达到报文段的长度的时候就立即发送一个报文段。
    糊涂窗口综合征:就是由于发送端和接收端上的处理不一致,导致网络上产生很多的小包,结果报文段包含了一个大大的头部,携带数据很少。数据传输效率低。处理方法是等待窗口大小满足一定的条件之后(能够接收一个最大报文,或者缓冲区的一半),再来发送窗口通告,这样就不会产生小报文。

    滑动窗口机制为端到端设备间的数据传输提供了可靠的流量控制机制。然而,它只能在源端设备和目的端设备起作用,当网络中间设备(例如路由器等)发生拥塞时,滑动窗口机制将不起作用。

  • 拥塞控制和流量控制的区别?

  1. 拥塞控制就是防止过多的数据注入到网络中,这样可以使网络中的路由器或链路不会过载
  2. 流量控制往往是点对点通信量的控制,是一个端到端的问题,流量控制要做的是抑制发送端发送数据的速率,以便接收端来得及接收。
  • TCP怎么保证可靠性?
  1. 应用数据被分割成TCP认为最适合发送的数据块
  2. 超时重传:当TCP发出一个段后,它启动一个定时器,等待目的端确认收到这个报文段。如果不能及时收到一个确认,将重发这个报文段
  3. TCP给发送的每一个包进行编号,接收方对数据包进行排序,把有序数据传送给应用层
  4. 校验和:TCP将保持它首部和数据的检验和。这是一个端到端的检验和,目的是检测数据在传输过程中的任何变化。如果收到段的检验和有差错,TCP将丢弃这个报文段和不确认收到此报文段
  5. TCP的接收端会丢弃重复的数据
  6. 流量控制:让发送方的发送速率不要太快,要让接收方来得及接收
  7. 拥塞控制:当网络拥塞时,减少数据的发送
  • TCP滑动窗口协议
  1. “窗口”对应的是一段可以被发送者发送的字节序列,其连续的范围称之为“窗口”
  2. “滑动”则是指这段“允许发送的范围”是可以随着发送的过程而变化的,方式就是按顺序“滑动”
  • http协议与TCP协议的联系
    TPC协议是传输层协议,主要解决数据如何在网络中传输,而HTTP是应用层协议,主要解决如何包装数据。
    Http协议是建立在TCP协议基础之上的,当浏览器需要从服务器获取网页数据的时候,会发出一次Http请求。Http会通过TCP建立起一个到服务器的连接通道,当本次请求需要的数据完毕后,Http会立即将TCP连接断开,这个过程是很短的。所以Http连接是一种短连接,是一种无状态的连接。

  • http/1.0和http/1.1的区别?

  1. http1.1提供永久性连接,即1.0使用非持久连接
  2. http1.1增加host头
  3. http1.1还提供了身份认证,状态管理和cache缓存机制等相关的请求头和响应头。
  • http请求方法有哪些?get和post的区别
  1. OPTIONS
    返回服务器针对特定资源所支持的HTTP请求方法,也可以利用向web服务器发送‘*’的请求来测试服务器的功能性
  2. HEAD
    向服务器索与GET请求相一致的响应,只不过响应体将不会被返回。这一方法可以再不必传输整个响应内容的情况下,就可以获取包含在响应小消息头中的元信息。
  3. GET
    向特定的资源发出请求。注意:GET方法不应当被用于产生“副作用”的操作中,例如在Web Application中,其中一个原因是GET可能会被网络蜘蛛等随意访问。Loadrunner中对应get请求函数:web_link和web_url
  4. POST
    向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改。 Loadrunner中对应POST请求函数:web_submit_data,web_submit_form
  5. PUT
    向指定资源位置上传其最新内容
  6. DELETE
    请求服务器删除Request-URL所标识的资源
  7. TRACE
    回显服务器收到的请求,主要用于测试或诊断
  8. CONNECT
    HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。

(1)根据HTTP规范,GET用于信息获取,而且应该是安全的和幂等的
(2)根据HTTP规范,POST表示可能修改变服务器上的资源的请求

  • http状态码

  • http和https的区别?由http升级到https需要哪些操作?
    HTTP 指的是超文本传输协议,https 指的是超文本传输安全协议。HTTPS 就是将 HTTP 中的传输内容进行了加密,然后通过可靠的连接,传输到对方的机器上。加密的协议是 TLS,其前身是 SSL。

  • https具体怎么实现?,怎么确保安全性?

  • http中浏览器一个URL的流程,这个过程中浏览器做些什么,URL包括哪三个部分?

  1. 浏览器向DNS服务器查找输入URL对应的IP地址。
  2. DNS服务器返回网站的IP地址。
  3. 浏览器根据IP地址与目标web服务器在80端口上建立TCP连接
  4. 浏览器获取请求页面的html代码。
  5. 浏览器在显示窗口内渲染HTML。
  6. 窗口关闭时,浏览器终止与服务器的连接。
    URL包括:①协议(或称为服务方式);②存有该资源的主机IP地址(有时也包括端口号);③主机资源的具体地址,如目录和文件名等。
  • http四个会话过程?
  1. 建立tcp连接
  2. 发出请求文档
  3. 发出响应文档
  4. 释放tcp连接
  • 网页解析的过程

  • 一个机器能使用的端口号上限是多少?为什么?可以改变吗?如果想要用的端口超过这个限制怎么办?
    端口号最多是65535个,端口号2个字节,16位,所以最大表示65535.不能改变

  • 对称加密和非对称加密
    对称加密(也叫私钥加密)指加密和解密使用相同密钥的加密算法。有时又叫传统密码算法,就是加密密钥能够从解密密钥中推算出来,同时解密密钥也可以从加密密钥中推算出来。
    非对称加密算法需要两个密钥:公开密钥(publickey)和私有密钥(privatekey)。公开密钥与私有密钥是一对,如果用公开密钥对数据进行加密,只有用对应的私有密钥才能解密;如果用私有密钥对数据进行加密,那么只有用对应的公开密钥才能解密。因为加密和解密使用的是两个不同的密钥,所以这种算法叫作非对称加密算法。

  • 数字证书的了解(高频)

  • 客户端为什么信任第三方证书?

  • RSA加密算法,MD5原理

  • 单条记录高并发访问的优化

  • 介绍一下ping的过程,分别用到了那些协议?
    ping用来测试两台主机之间的连通性。ICMP协议

  • TCP/IP分片粘包过程

  1. 正常情况:如果Socket Client 发送的数据包,在Socket Server端也是一个一个完整接收的,那个就不会出现粘包和分包情况,数据正常读取。
  2. 粘包情况:Socket Client发送的数据包,在客户端发送和服务器接收的情况下都有可能发送,因为客户端发送的数据都是发送的一个缓冲buffer,然后由缓冲buffer最后刷到数据链路层的,那么就有可能把数据包2的一部分数据结合数据包1的全部被一起发送出去了,这样在服务器端就有可能出现这样的情况,导致读取的数据包包含了数据包2的一部分数据,这就产生粘包,当然也有可能把数据包1和数据包2全部读取出来。
  3. 分包情况:意思就是把数据包2或者数据包1都有可能被分开一部分发送出去,接着发另外的部分,在服务器端有可能一次读取操作只读到一个完整数据包的一部分。
  4. 在数据包发送的情况下,有可能后面的数据包分开成2个或者多个,但是最前面的部分包,黏住在前面的一个完整或者部分包的后面,也就是粘包和分包同时产生了。
  • 有没有抓过TCP包,描述一下

  • 一个IP配置多个域名,靠什么识别?
    主机头

  • 路由器的工作原理和作用,交换机的工作原理和作用

  • 对路由协议的了解与介绍。内部网关协议IGP包括RIP,OSPF和外网网关协议EGP和BGP

  • 路由协议使用的算法

  • 服务器攻击(DDos攻击)


操作系统

  • 什么是临界区?进程进入临界区的调度原则是?
    临界区是一段对共享资源的保护代码,该保护代码在任意时刻只允许一个线程对共享资源访问。
    进程进入临界区的调度原则是:
    ①如果有若干进程要求进入空闲的临界区,一次仅允许一个进程进入。②任何时候,处于临界区内的进程不可多于一个。如已有进程进入自己的临界区,则其它所有试图进入临界区的进程必须等待。③进入临界区的进程要在有限时间内退出,以便其它进程能及时进入自己的临界区。④如果进程不能进入自己的临界区,则应让出CPU,避免进程出现“忙等”现象。

  • 互斥对象、临界区和事件的区别?
    互斥是一种用途非常广泛的内核对象。能够保证多个线程对同一共享资源的互斥访问。
    事件对象也是属于内核对象,它的主要成员包括:1.使用计数 2.指明该事件是一个自动重置事件还是一个人工重置事件的布尔值3.指明该事件处于已通知状态还是未通知状态的布尔值。

互斥对象、事件对象与临界区的比较:

  1. 互斥对象、事件对象都是属于内核对象,利用内核对象进行线程同步,速度较慢,但可以在多个进程中的多个线程间可以进行同步。
  2. 临界区属于在用户模式下,同步速度较快,但是很容易进入死锁状态,因为在等待进入临界区时无法设定超时值。
  • 进程和线程的区别?进程和程序的区别?
    进程是资源(CPU、内存等)分配的基本单位,它是程序执行时的一个实例。程序运行时系统就会创建一个进程,并为它分配资源,然后把该进程放入进程就绪队列,进程调度器选中它的时候就会为它分配CPU时间,程序开始真正运行。
    线程是程序执行时的最小单位,它是进程的一个执行流,是CPU调度和分派的基本单位,一个进程可以由很多个线程组成,线程间共享进程的所有资源,每个线程有自己的堆栈和局部变量。线程由CPU独立调度执行,在多CPU环境下就允许多个线程同时运行。同样多线程也可以实现并发操作,每个请求分配一个线程来处理。

进程和程序的区别

  1. 进程是动态的,而程序是静态的。
  2. 进程有一定的生命期,而程序是指令的集合,本身无“运动”的含义。没有建立进程的程序不能作为1个独立单位得到操作系统的认可。
  3. 1个程序可以对应多个进程,但1个进程只能对应1个程序。进程和程序的关系犹如演出和剧本的关系。
  • 一个进程可以创建多少个线程?和什么有关?
    一个进程可以创建的线程数由可用虚拟空间和线程的栈的大小共同决定

  • 僵尸进程?

  • 什么是死锁?死锁产生的原因?死锁四个必要条件?死锁的解除、死锁控制?
    死锁是指多个进程因竞争资源而造成的一种僵局(互相等待),若无外力作用,这些进程都将无法向前推进。

死锁产生的原因

  1. 系统资源的竞争
    系统资源的竞争导致系统资源不足,以及资源分配不当,导致死锁。

  2. 进程运行推进顺序不合适
    进程在运行过程中,请求和释放资源的顺序不当,会导致死锁。

死锁的四个条件

  1. 互斥条件:一个资源每次只能被一个进程使用,即在一段时间内某 资源仅为一个进程所占有。此时若有其他进程请求该资源,则请求进程只能等待。

  2. 请求与保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源 已被其他进程占有,此时请求进程被阻塞,但对自己已获得的资源保持不放。

  3. 不可剥夺条件:进程所获得的资源在未使用完毕之前,不能被其他进程强行夺走,即只能 由获得该资源的进程自己来释放(只能是主动释放)。

  4. 循环等待条件: 若干进程间形成首尾相接循环等待资源的关系
    这四个条件是死锁的必要条件,只要系统发生死锁,这些条件必然成立,而只要上述条件之一不满足,就不会发生死锁。

死锁的避免与预防

  1. 死锁避免的基本思想
    系统对进程发出每一个系统能够满足的资源申请进行动态检查,并根据检查结果决定是否分配资源,如果分配后系统可能发生死锁,则不予分配,否则予以分配。这是一种保证系统不进入死锁状态的动态策略。
    理解了死锁的原因,尤其是产生死锁的四个必要条件,就可以最大可能地避免、预防和解除死锁。所以,在系统设计、进程调度等方面注意如何让这四个必要条件不成立,如何确定资源的合理分配算法,避免进程永久占据系统资源。此外,也要防止进程在处于等待状态的情况下占用资源。因此,对资源的分配要给予合理的规划。

  2. 死锁避免和死锁预防的区别
    死锁预防是设法至少破坏产生死锁的四个必要条件之一,严格的防止死锁的出现,而死锁避免则不那么严格的限制产生死锁的必要条件的存在,因为即使死锁的必要条件存在,也不一定发生死锁。死锁避免是在系统运行过程中注意避免死锁的最终发生。

死锁的解除

一旦检测出死锁,就应立即釆取相应的措施,以解除死锁。死锁解除的主要两种方法:

  1. 抢占资源。从一个或多个进程中抢占足够数量的资源,分配给死锁进程,以解除死锁状态。

  2. 终止(或撤销)进程。终止(或撤销)系统中的一个或多个死锁进程,直至打破循环环路,使系统从死锁状态解脱出来。

  • Windows内存管理方式
  1. 分页存储
    用户程序的逻辑地址空间被划分成若干固定大小的区域,称为“页”或者“页面”,相应地,内存物理空间也分成相对应的若干个物理块,页和块的大小相等。提高了内存的利用率。
  2. 分段存储
    将用户程序地址空间分成若干个大小不等的段,每段可以定义一组相对完整的逻辑信息。提高程序的逻辑性。
  3. 段页式存储
    两者结合。作业的地址空间首先被分成若干个逻辑分段,每段都有自己的段号,然后再将每段分成若干个大小相等的页。
  • 一个程序从开始运行到结束的完整过程(四个过程)
    预处理,编译,汇编,链接。
  1. 源代码.c 文件先经过预处理器,生成一个中间文件.i 文件,这个阶段有两个作用,一是把include的头文件内容进行替换,二是处理宏定义。
  2. .i 文件经过编译生成汇编.s 文件
  3. .s 的汇编文件经过汇编器生成.obj 的目标文件
  4. .obj 经过链接器和 lib(静态链接库) dll(动态链接库)文件生成 exe 可执行程序
  • 头文件在编译过程中的作用?(网易游戏)
    头文件并不参加链接和编译。编译器第一步要做的就是简单的把头文件在包含它的源文件中展开。不知你是否能理解这句话。也就是头文件里面有什么内容,通通把它移到包含这个头文件的源文件里。(我觉得这是个很重要的概念,可以帮助我们简化理解编译链接的过程,包括理解头文件中定义静态变量或静态函数是怎么回事)。编译器经过这一步转换后剩下什么呢?就是一堆cpp文件了。而头文件已经不再是编译器需要关心的东西了。编译器接下来就要处理这一堆cpp文件了。
    所以第一个阶段是预处理阶段,在正式的编译阶段之前进行。预处理阶段将根据已放置在文件中的预处理指令来修改源文件的内容。如#include指令就是一个预处理指令,它把头文件的内容添加到.cpp文件中。 第二个阶段编译、优化阶段。

  • 为何不能在头文件中定义?
    防止多重定义。

  • 进程间通信的方法?

  1. 管道pipe:管道是一种半双工的通信方式,数据只能单向流动,而且只能在具有亲缘关系的进程间使用。进程的亲缘关系通常是指父子进程关系。
  2. 命名管道FIFO:有名管道也是半双工的通信方式,但是它允许无亲缘关系进程间的通信。
  3. 消息队列MessageQueue:消息队列是由消息的链表,存放在内核中并由消息队列标识符标识。消息队列克服了信号传递信息少、管道只能承载无格式字节流以及缓冲区大小受限等缺点。
  4. 共享存储SharedMemory:共享内存就是映射一段能被其他进程所访问的内存,这段共享内存由一个进程创建,但多个进程都可以访问。共享内存是最快的 IPC 方式,它是针对其他进程间通信方式运行效率低而专门设计的。它往往与其他通信机制,如信号两,配合使用,来实现进程间的同步和通信。
  5. 信号量Semaphore:信号量是一个计数器,可以用来控制多个进程对共享资源的访问。它常作为一种锁机制,防止某进程正在访问共享资源时,其他进程也访问该资源。因此,主要作为进程间以及同一进程内不同线程之间的同步手段。
  6. 套接字Socket:套解口也是一种进程间通信机制,与其他通信机制不同的是,它可用于不同及其间的进程通信。
  7. 信号 ( sinal ) : 信号是一种比较复杂的通信方式,用于通知接收进程某个事件已经发生。
  • 线程同步方法?
  1. 锁机制
    1. 互斥锁:提供了以排它方式阻止数据结构被并发修改的方法。
    2. 读写锁:允许多个线程同时读共享数据,而对写操作互斥。
    3. 条件变量:可以以原子的方式阻塞进程,直到某个特定条件为真为止。对条件测试是在互斥锁的保护下进行的。条件变量始终与互斥锁一起使用。
  2. 信号量机制:包括无名线程信号量与有名线程信号量
  3. 信号机制:类似于进程间的信号处理。
    线程间通信的主要目的是用于线程同步,所以线程没有象进程通信中用于数据交换的通信机制。
  • 线程创建的方式有几种?

  • 进程调度算法?

  1. 先来先去服务
  2. 短作业(进程)优先调度算法SJ§F
  3. 轮转法
  4. 多级反馈队列算法
  • 页面置换方法
  1. 最优页面置换算法
  2. 最近未使用页面置换算法(NRU)
  3. 先进先出页面置换算法(FIFO)及其改进
  4. 时钟页面置换算法(clock)
  5. 最近最少使用页面置换算法(LRU)
  6. 工作集算法
  • 布隆过滤器的优点与缺点

  • 布隆过滤器处理大规模问题时的持久化,包括内存大小首先、磁盘换入换出问题

  • 文件读写使用的系统调用

  • 线程池的了解、优点、调度处理方式和保护任务队列的方式
    于是为了避免一个程序需要大量创建线程时的不必要浪费,也就是最好的去避免线程创建与线程销毁的时间浪费,此时线程池就出现了。线程池的实现就是在初始的时候创建一些线程(业界通常认为创建CPU核心数的两倍为最佳,也有说是两倍+1),创建的线程为挂起状态(就绪),当我们有任务要处理的时候,我们就激活一个就绪的线程去完成任务,完成任务后,线程又变为就绪态进行继续等待任务的到来。这样过程使得每个线程一次创建,多次使用,如果你的程序并没有多次任务处理,使得线程池中的线程长时间处于就绪态,此时就建议你直接使用一个线程就好,不必使用线程池。

  • 线程池怎么创建?

  • 怎么回收线程

  • 多线程同步(项目中可能会问)

  • mencache

  • 异常和中断的区别

  • 如何保证线程安全?


Linux

  • Linux的I/O模型介绍以及同步异步阻塞非阻塞的区别?
  1. 阻塞IO
  2. 非阻塞IO
  3. IO复用
  4. 信号驱动IO
  5. 异步IO
  • Linux进程管理

  • Linux内核的进程调度

  • fork返回值是什么?

  • 什么是虚拟内存?

  • 文件系统的理解(EXT4,XFS,BTRFS)

  1. EXT4:使用广泛
  2. XFS:XFS 文件系统是扩展文件系统的一个扩展,XFS 文件系统有一些缺陷,例如它不能压缩,删除大量文件时性能低下。
  3. btrfs:有很多好用的功能,例如写复制、扩展校验、快照、清洗、自修复数据、冗余删除以及其它保证数据完整性的功能。
  • Linux的内存管理?

  • Linux基本命令?

命令 作用
pwd 显示当前目录
rm 删除
touch 生成文件
cat 读取指定文件的内容并打印到终端输出
mkdir 新建目录make directory
file 查看文件类型
whereis,which,find 和 locate 查找
chown 改变文件所有者
df 查看磁盘容量
wc 计数工具
tr 删除一段文本信息中的某些文字。或者将其进行转换
join 连接两个文件
paste 它是在不对比数据的情况下,简单地将多个文件合并一起,以Tab隔开
  • grep、awk、sed掌握程度?
  1. grep命令用于打印输出文本中匹配的模式串,它使用正则表达式作为模式匹配的条件。
  2. sed用于过滤和转换文本的流编辑器。
  3. AWK是一种用于处理文本的编程语言工具。
  • Linux是如何避免内存碎片的
  1. 伙伴算法,用于管理物理内存,避免内存碎片;
  2. 高速缓存Slab层用于管理内核分配内存,避免碎片。
  • 文件权限的查看与修改?
  1. 文件权限查看ls -l,查看文件所有者,所属组,其他的文件权限,rwx为777
  2. 修改使用chmod命令
  • Linux如何打开一个文件?如何处理一个正在动态增长的文件?
  • IO复用的三种方法,poll、epoll和select的特点和区别
    select,poll,epoll都是IO多路复用的机制。I/O多路复用就通过一种机制,可以监视多个描述符,一旦某个描述符就绪(一般是读就绪或者写就绪),能够通知程序进行相应的读写操作。但select,poll,epoll本质上都是同步I/O,因为他们都需要在读写事件就绪后自己负责进行读写,也就是说这个读写过程是阻塞的,而异步I/O则无需自己负责进行读写,异步I/O的实现会负责把数据从内核拷贝到用户空间。
  1. select:是最初解决IO阻塞问题的方法。用结构体fd_set来告诉内核监听多个文件描述符,该结构体被称为描述符集。由数组来维持哪些描述符被置位了。对结构体的操作封装在三个宏定义中。通过轮寻来查找是否有描述符要被处理,如果没有返回。
    存在的问题:
    1. 内置数组的形式使得select的最大文件数受限与FD_SIZE;
    2. 每次调用select前都要重新初始化描述符集,将fd从用户态拷贝到内核态,每次调用select后,都需要将fd从内核态拷贝到用户态;
    3. 轮寻排查当文件描述符个数很多时,效率很低;
  2. poll:通过一个可变长度的数组解决了select文件描述符受限的问题。数组中元素是结构体,该结构体保存描述符的信息,每增加一个文件描述符就向数组中加入一个结构体,结构体只需要拷贝一次到内核态。poll解决了select重复初始化的问题。轮寻排查的问题未解决。
  3. epoll:轮寻排查所有文件描述符的效率不高,使服务器并发能力受限。因此,epoll采用只返回状态发生变化的文件描述符,便解决了轮寻的瓶颈。
  • 为什么使用IO多路复用,最主要的原因是什么?

  • epoll有两种触发模式?这两种触发模式有什么区别?编程的时候有什么区别?

  • 上一题中编程的时候有什么区别,是在边缘触发的时候要把套接字中的数据读干净,那么当有多个套接字时,在读的套接字一直不停的有数据到达,如何保证其他套接字不被饿死(面试网易游戏的时候问的一个问题,答不上来,印象贼深刻)。

  • GDB调试

  • Linux进程和线程如何创建、退出?进程退出的时候,自己没有释放的资源(如内存没有free)会怎样?


数据库

  • 存储过程
    我们常用的关系型数据库是MySQL,操作数据库的语言一般为SQL语句,SQL在执行的时候需要要先编译,然后执行,而存储过程(Stored Procedure)是一组为了完成某种特定功能的SQL语句集,经编译后存储在数据库中,用户通过指定存储过程的名字并给定参数(如果该存储过程带有参数)来调用执行它。
    一个存储过程是一个可编程的函数,它在数据库中创建并保存。它可以有SQL语句和一些特殊的控制结构组成。当希望在不同的应用程序或平台上执行相同的函数,或者封装特定功能时,存储过程是非常有用的。数据库中的存储过程可以看做是对面向对象方法的模拟,它允许控制数据的访问方式。
    存储过程的优点:
  1. 存储过程增强了SQL语言的功能和灵活性:存储过程可以用流控制语句编写,有很强的灵活性,可以完成复杂的判断和较复杂的运算。
  2. 存储过程允许标准组件式编程:存储过程被创建后,可以在程序中被多次调用,而不必重新编写该存储过程的SQL语句。而且可以随时对存储过程进行修改,对应用程序源代码毫无影响。
  3. 存储过程能实现较快的执行速度:如果某一操作包含大量的Transaction-SQL代码或分别被多次执行,那么存储过程要比批处理的执行速度快很多。因为存储过程是预编译的。在首次运行一个存储过程时,优化器对其进行分析优化,并且给出最终被存储在系统表中的执行计划。而批处理的Transaction-SQL语句在每次运行时都要进行编译和优化,速度相对要慢一些。
  4. 存储过程能减少网络流量:针对同一个数据库对象的操作(如查询、修改),如果这一操作所涉及的Transaction-SQL语句被组织成存储过程,那么当在客户计算机上调用该存储过程时,网络中传送的只是该调用语句,从而大大增加了网络流量并降低了网络负载。
  5. 存储过程可被作为一种安全机制来充分利用:系统管理员通过执行某一存储过程的权限进行限制,能够实现对相应的数据的访问权限的限制,避免了非授权用户对数据的访问,保证了数据的安全。
  • 索引
    索引(Index)是帮助MySQL高效获取数据的数据结构;在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,可以在这些数据结构上实现高级查找算法,提高查询速度,这种数据结构,就是索引。
    B-Tree 索引:最常见的索引类型,大部分引擎都支持B树索引。
    HASH 索引:只有Memory引擎支持,使用场景简单。
    R-Tree 索引(空间索引):空间索引是MyISAM的一种特殊索引类型,主要用于地理空间数据类型。
    Full-text (全文索引):全文索引也是MyISAM的一种特殊索引类型,主要用于全文索引,InnoDB从MySQL5.6版本提供对全文索引的支持。

  • 事物是什么?
    事务(Transaction)是并发控制的基本单位。所谓的事务,它是一个操作序列,由一条或者多条sql语句组成,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。

  • acid特性?

  1. 原子性(Atomicity):指整个数据库事务是不可分割的工作单位。只有事务中所有的数据库操作都执行成功,整个事务的执行才算成功。事务中任何一个sql语句执行失败,那么已经执行成功的sql语句也必须撤销,数据库状态应该退回到执行事务前的状态。
  2. 一致性(Consistency):事务应确保数据库的状态从一个一致状态转变为另一个一致状态。一致状态的含义是数据库中的数据应满足完整性约束,也就是说在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏
  3. 隔离性(Isolation):隔离性也叫做并发控制、可串行化或者锁。事务的隔离性要求每个读写事务的对象与其它事务的操作对象能相互分离,即该事务提交前对其它事务都不可见,这通常使用锁来实现多个事务并发执行时,一个事务的执行不应影响其他事务的执行。
  4. 持久性(Durability):表示事务一旦提交了,其结果就是永久性的,也就是数据就已经写入到数据库了,如果发生了宕机等事故,数据库也能将数据恢复。
  • 数据库中的“主属性”、“码”、“主码”的区别是什么?
  1. 在数据库的表(关系)中能够用于唯一区分开每个记录(元组)的属性或属性的集合,我们称之为码(候选码)。
  2. 当我们指定其中一个用来区分开每个记录(元组)的码为主码。
  3. 主属性是指包含在候选码中的属性。
    换句话说:主码和码的关系就像班长和班长候选人之间的关系。
    每个班长候选人,我们可称之为主属性,只不过在数据库中,候选码可能是多个属性共同组成的。

设计模式

参考资料:《设计模式之禅》,简要了解一下即可

  • 23种设计模式
    单例模式程序的实现

软件工程

  • 软件的健壮性是指什么?
    健壮性是指程序可以适应正常和非正常的运行环境,都可以正确地运行;随着业务量的增加,不会出现阻塞和不可用的情况。
  • 影响程序健壮性的因素
  1. 没有容错控制
  2. 执行耗时的操作
  3. 执行复杂的任务
  4. 数据不一致
  5. 算法效率低
  6. 不能应对大流量冲击
  • 什么是正确性
  1. 不可重入的任务被重入
  2. 没有前置状态判定
  3. 没有遵守“受理—处理—关闭”AHC模型
  4. 没有遵守“申请—前置审批—审批—善后—完成”RPC模型
  5. 数据库复制造成数据延迟

智力题

  • 100层楼,2个鸡蛋,鸡蛋从某一个临界楼层丢下会摔碎,请设计方案,能用最小的次数找到临界楼层,3个鸡蛋呢?(华为一面)
  • 用3,4,5,6,7,8组成不重复的4位奇数,按照从小到大的顺序排序,第62个数字是?
    首先是奇数的话,末位只能是3,5,7中的一种,则有 C 3 1 C_{3}^{1} C31种方法。前面3个数是 A 5 3 A_{5}^{3} A53排列方法,那么总的方法数为 C 3 1 × A 5 3 = 180 C_{3}^{1}×A_{5}^{3} = 180 C31×A53=180种方法,组成的奇数按照从小到大排序。当第一位是3的时候,末位一定是5或者7,那么这样的数一共有 C 2 1 × A 4 2 = 24 C_{2}^{1}×A_{4}^{2} = 24 C21×A42=24种方法,当第一位是4的时候,末位一定是3或者5或者7,这样的数一共有 C 3 1 × A 4 2 = 36 C_{3}^{1}×A_{4}^{2} = 36 C31×A42=36种方法,那么这里一共就有 24 + 36 = 60 24+36=60 24+36=60种方法,当第一位是5的时候,末位一定是3或者7,取较小的数,第二位是3,最后一位是7,那么第61个数是5347,第62个数为5367.
  • 24点游戏(网易游戏)
  • 25匹马,5个跑道,如何通过最少的比赛次数确定前3名?
  • 一家人过桥问题(搜狗)
  • 10*10的方格可以装下多少个直径为1的圆?(华为)

你可能感兴趣的:(其他)