stonesharp

Gzip格式分析

GZIP文件格式简介

GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNIX系统的文件压缩。我们在Linux中经常会用到后缀为.gz的文件，它们就是GZIP格式的。现今已经成为Internet上使用非常普遍的一种数据压缩格式，或者说一种文件格式。HTTP协议上的GZIP编码是一种用来改进WEB应用程序性能的技术。大流量的WEB站点常常使用GZIP压缩技术来让用户感受更快的速度。

GZIP本身只是一种文件格式，其内部通常采用DEFLATE数据格式，而DEFLATE采用LZ77压缩算法来压缩数据。

GZIP文件由1到多个“块”组成，实际上通常只有1块。每个块包含头、数据和尾三部分。块的概貌如下：

+---+---+---+---+---+---+---+---+---+---+========//========+===========//==========+---+---+---+---+---+---+---+---+
|ID1|ID2| CM|FLG|     MTIME     |XFL| OS|   额外的头字段   |       压缩的数据      |     CRC32     |     ISIZE     |
+---+---+---+---+---+---+---+---+---+---+========//========+===========//==========+---+---+---+---+---+---+---+---+

1. 头部分

ID1与ID2：各1字节。固定值，ID1 = 31 (0x1F)，ID2 = 139(0x8B)，指示GZIP格式。 CM：1字节。压缩方法。目前只有一种：CM = 8，指示DEFLATE方法。 FLG：1字节。标志。

bit 0 FTEXT - 指示文本数据
bit 1 FHCRC - 指示存在CRC16头校验字段
bit 2 FEXTRA - 指示存在可选项字段
bit 3 FNAME - 指示存在原文件名字段
bit 4 FCOMMENT - 指示存在注释字段
bit 5-7 保留

MTIME：4字节。更改时间。UINX格式。 XFL：1字节。附加的标志。当CM = 8时，XFL = 2 - 最大压缩但最慢的算法；XFL = 4 - 最快但最小压缩的算法 OS：1字节。操作系统，确切地说应该是文件系统。有下列定义：

0 - FAT文件系统 (MS-DOS, OS/2, NT/Win32)
1 - Amiga
2 - VMS/OpenVMS
3 - Unix
4 - VM/CMS
5 - Atari TOS
6 - HPFS文件系统 (OS/2, NT)
7 - Macintosh
8 - Z-System
9 - CP/M
10 - TOPS-20
11 - NTFS文件系统 (NT)
12 - QDOS
13 - Acorn RISCOS
255 - 未知

额外的头字段：

(若 FLG.FEXTRA = 1)

+---+---+---+---+===============//================+
|SI1|SI2|  XLEN |      长度为XLEN字节的可选项     |
+---+---+---+---+===============//================+

(若 FLG.FNAME = 1)

+=======================//========================+
|               原文件名(以NULL结尾)              |
+=======================//========================+

(若 FLG.FCOMMENT = 1)

+=======================//========================+
|   注释文字(只能使用iso-8859-1字符，以NULL结尾)  |
+=======================//========================+

(若 FLG.FHCRC = 1)

+---+---+
| CRC16 |
+---+---+

存在额外的可选项时，SI1与SI2指示可选项ID，XLEN指示可选项字节数。如 SI1 = 0x41 ('A')，SI2 = 0x70 ('P')，表示可选项是Apollo文件格式的额外数据。

2. 数据部分

DEFLATE数据格式，包含一系列子数据块。子块概貌如下：

+......+......+......+=============//============+
|BFINAL|    BTYPE    |            数据           |
+......+......+......+=============//============+

BFINAL：1比特。0 - 还有后续子块；1 - 该子块是最后一块。 BTYPE：2比特。00 - 不压缩；01 - 静态Huffman编码压缩；10 - 动态Huffman编码压缩；11 - 保留。

各种情形的处理过程，请参考后面列出的RFC文档。

3. 尾部分

CRC32：4字节。原始(未压缩)数据的32位校验和。 ISIZE：4字节。原始(未压缩)数据的长度的低32位。

GZIP中字节排列顺序是LSB方式，即Little-Endian，与ZLIB中的相反。

下面是GZIP文件 gzip-1.3.3.tar.gz 格式的简要分析示意图：

GZIP与ZLIB有着很深的渊源。有关ZLIB, GZIP以及DEFLATE等更加详细的说明，可参考RFC 1950-1952。从这些文档里也能找到其它的参考文献。

GZIP已成为GNU Project的一个组成部分，其官方站点为www.gzip.org。在这里可以下载到GZIP源码。目前最新版本是1.2.4，以及beta版的1.3.3。

2011-07-26 10:20:54| 分类： linux学习 | 标签：gzip gzip-1.2.4 源代码文件格式分析 |字号大中小订阅

在windows下使用UltraEdit打开后缀的.gz的文件显示的数据格式如下：

2 bytes GZIP标志字节：0x1f, 0x8b (\037 \213)
1 byte   压缩方法： (0..7 reserved, 8 = deflate)
1 byte   标志位：
            bit 0 set: 文件可能是ASCII文本文件
            bit 1 set: 附加多个gzip文件部分
            bit 2 set: 存在有可选的附加内容
            bit 3 set: 提供了原始的文件名称
            bit 4 set: 则提供有一个O－终结的文件内容
            bit 5 set: 文件被加密
            bit 6,7:   保留
4 bytes 文件更改时间(Unix时间)
1 byte   额外的标志，决定了压缩方法。 2:使用最大的压缩，最慢的算法
                              4:采用最快的算法
1 byte   这个标志指明了进行压缩时系统的类型。
                 0 - FAT filesystem (MS-DOS, OS/2, NT/Win32)
                 1 - Amiga
                 2 - VMS (or OpenVMS)
                 3 - Unix
                 4 - VM/CMS
                 5 - Atari TOS
                 6 - HPFS filesystem (OS/2, NT)
                 7 - Macintosh
                 8 - Z-System
                 9 - CP/M
                10 - TOPS-20
                11 - NTFS filesystem (NT)
                12 - QDOS
                13 - Acorn RISCOS
               255 - unknown
2 bytes optional part number (second part=1) 可选的序号
2 bytes optional extra field length        可选的附加内容的长度
? bytes optional extra field           可选的附加内容
? bytes optional original file name, zero terminated
可选的原始文件名称，以'\0'结束
? bytes optional file comment, zero terminated
可选文件内容(这部分不被解释，而是可读的供人使用的，以'\0'结束
12 bytes optional encryption header
? bytes compressed data
4 bytes crc32                    这个是未压缩数据的循环冗余校验值。
4 bytes uncompressed input size modulo 2^32    这是原始数据的长度以2的32次方为模的值。

设计了一种可以单向编码的格式，而不用反向查找，也不用预知未压缩数据及输出的
已压缩数据的大小。如果输入的数据不是一个文件，那么修改时间被设置为压缩的开
始时间。
The format was designed to allow single pass compression without any
backwards seek, and without a priori knowledge of the uncompressed
input size or the available size on the output media. If input does
not come from a regular disk file, the file modification time is set
to the time at which compression started.

时间戳主要是用在在网络上传输gzip文件的情况下。在这种情况下，它不需要保存所有
者的属性。在本地传输的时候，所有者的属性在压缩/解压缩时由gzip所保存。忽略值为
0的时间戳。
The time stamp is useful mainly when one gzip file is transferred over
a network. In this case it would not help to keep ownership
attributes. In the local case, the ownership attributes are preserved
by gzip when compressing/decompressing the file. A time stamp of zero
is ignored.

标志位中，值为0的位是可选的，它可以使我们对输入的数据做一个预先的了解。在不
确定的时候，要将标志位清除。对有不同文件格式(文本文件和二进制文件)的系统来说，
解码时，可以使用标志位来选择不同的格式。
Bit 0 in the flags is only an optional indication, which can be set by
a small lookahead in the input data. In case of doubt, the flag is
cleared indicating binary data. For systems which have different
file formats for ascii text and binary data, the decompressor can
use the flag to choose the appropriate format.

如果有附加内容，则它必须包含一个或多个子字段，每个子字段有如下格式：
The extra field, if present, must consist of one or more subfields,
each with the following format:

subfield id   : 2 bytes    子字段ID
subfield size : 2 bytes (little-endian format)子字段长度(小端字节序)
subfield data        子字段内容

    子字段ID可以包含两个可记住的字母。请发送一些这样的ID给[email protected].
第二个字节为0的ID是被保留的。定义了如下的ID
The subfield id can consist of two letters with some mnemonic value.
Please send any such id to [email protected]. Ids with a zero second
byte are reserved for future use. The following ids are defined:

Ap (0x41, 0x70) : Apollo file type information

    子字段长度是子字段内容的长度，不包含ID及子字段长度这四字节。但是
前面所说的 "可选的附加内容的长度 "则包含了ID及子字段长度的四字节。
The subfield size is the size of the subfield data and does not
include the id and the size itself. The field 'extra field length' is
the total size of the extra field, including subfield ids and sizes.

必须可以在压缩数据中找到数据结束的位置，而不论数据的实际长度是多少。如果压缩
数据不能够放到一个文件中(如磁盘的情况)，每一部分都要由一个头字段开始，但是只
有最后一部分中有CRC32和原始数据的长度。解压程序应该可以提示输入另外的，存在
于多个压缩文件中的数据。这是必要，但不是绝对的，因为当一部分数据毁坏时，还需
要得到其它部分的内容。
It must be possible to detect the end of the compressed data with any
compression format, regardless of the actual size of the compressed
data. If the compressed data cannot fit in one file (in particular for
diskettes), each part starts with a header as described above, but
only the last part has the crc32 and uncompressed size. A decompressor
may prompt for additional data for multipart compressed files. It is
desirable but not mandatory that multiple parts be extractable
independently so that partial data can be recovered if one of the
parts is damaged. This is possible only if no compression state is
kept from one part to the other. The compression-type dependent flags
can indicate this.

如果压缩文件的系统对文件名的大小写不敏感，则原始文件名会会强制转换成小写。
如果是从标准输入读入的数据，则没有原始文件名。
If the file being compressed is on a file system with case insensitive
names, the original name field must be forced to lower case. There is
no original file name if the data was compressed from standard input.

即使压缩后的文件会比原来的文件大，压缩还是会完成的。
Compression is always performed, even if the compressed file is
slightly larger than the original. The worst case expansion is
a few bytes for the gzip file header, plus 5 bytes every 32K block,
or an expansion ratio of 0.015% for large files. Note that the actual
number of used disk blocks almost never increases.

The encryption is that of zip 1.9. For the encryption check, the
last byte of the decoded encryption header must be zero. The time
stamp of an encrypted file might be set to zero to avoid giving a clue
about the construction of the random header.

gzip-1.2.4程序分析

一点说明：
    在gzip.c中：
DECLARE(uch, inbuf, INBUFSIZ +INBUF_EXTRA);
DECLARE(uch, outbuf, OUTBUFSIZ+OUTBUF_EXTRA);
DECLARE(ush, d_buf, DIST_BUFSIZE);
DECLARE(uch, window, 2L*WSIZE);
#ifndef MAXSEG_64K
       DECLARE(ush, tab_prefix, 1L< #else
    DECLARE(ush, tab_prefix0, 1L<<(BITS-1));
    DECLARE(ush, tab_prefix1, 1L<<(BITS-1));
#endif
    实际上定义了一些数组：inbuf,outbuf,d_buf,window,tab_prefix,tab_prefix0,tabfix1.
1/
==================================================================================
入口程序：gzip-1.2.4/gzip.c
函数： int main (argc, argv)
         int argc;
         char **argv;
功能： 1)通过命令内容(gzip,gunzip,unzip等)，设置操作类型(压缩或是解压缩)。
    2)通过参数，设置一些全局变量的值，对我们而言，有用的是：ascii(表示
为文本文件，可以根据本地的换行符来代替解压后的文件中的换行符)、decompress(表示进行解压操作)和level(转换操作的级别 —进行更快
的转换还是进行更大压缩比的转换，当然，这只对压缩而言)。
    3)为输入、输出及窗口的缓冲分配内存。
    4)调用treat_file(argv[optind++]);对文件进行操作。

2/
==================================================================================
函数： local void treat_file(iname)
         char *iname;
参数：为文件名称；
功能： 1)得到输入的文件的状态：name,size,time,mode等。
    2)创建输出文件的名称。
    3)当进行解压操作时，调用    local int get_method(in) 来得到gz文件的压缩方法。
    4)如果命令行中的参数-l，则调用do_list()显示文件信息。
    5)调用local int create_outfile()创建输出文件。
    6) 调用(*work)(ifd, ofd)进行压缩、解压缩的操作。这时的work指针被get_method()
函数置为unzip()函数(解压时)，或是为默认的zip()函数。在解压缩时，
这个过程是在循环中的，因为可能会包含多个文件。

3/
==================================================================================
函数： local int get_method(in)
        int in;        /* input file descriptor */
参数：文件名称
功能： 1)验证第一第二字节是否为0x1F,0x8B。
    2)验证第三字节是否为0x08(deflate)。
    3)设置函数指针work = unzip。(work的默认值是zip)
    4)得到做为flags的第四字节。
    5)如果设置了第1、5、6、7位，则给出错误提示。(编号0到7是从最低位开始)
    6)将第5到8字节中的时间值保存在全局变量time_stamp中。
    7)跳过第9字节(压缩时采用的算法 —更快或是比例更高)和
第10字节(压缩时的操作系统)。
    8)如果设置了flags的第1位，则得到当前文件的编号
    9)如果设置了flags的第2位(存在有附加的内容)，则得到附加内容的长度，
并跳过这部分内容。
    10)如果设置了flags的第3位(存在有原始文件的名称)，则得到原始文件的名称。
    11)如果设置了flags的第4位(存在一段不用解析的内容，是给人提供可读信息的)，
跳过这部分可读信息。
    12) 设置头部信息的长度：header_bytes，包括了最后的CRC及文件长度部分。
返回：函数压缩方法(一般为"deflate "，程序中的返回值为8)

4/
==================================================================================
在文件gzip-1.2.4/unzip.c中：
函数： int unzip(in, out)
       int in, out;   /* input and output file descriptors */
参数：为输入、输出文件。
功能： 1)初始化全局变量crc。
    2)调用函数inflate()进行解码操作。
    3)得到原来文件中保存的CRC及长度值。如果与当前计算出的值不同，则产生提示。

5/
==================================================================================
在文件gzip-1.2.4/inflate.c中：
函数： int inflate()
说明： ulg bb;                         /* 是 bit buffer */
unsigned bk;                    /* 是bit buffer中还有多少位，即剩余的位数 */
功能： 1) 循环调用inflate_block(&e)，一块一块的解压数据。
   2)若bk>-8,即bb中有完整的字节，则将此字节放回输入中。
    3)输出解压得到的内容。

6/
==================================================================================
在文件gzip-1.2.4/inflate.c中：
函数： int inflate_block(e)
int *e;                 /* last block flag */
参数：如果是1，是说明当前块是最后一块。
功能： 1)得到第一位，这一位说明当前块是否为最后一块(0，不是；1，是)并相应的设置参数。
    2)得到下两位的值：
0，本块没有压缩，
1，用固定的Huffman编码压缩，见RFC1951的3.2.6节。
2，用动态的Huffman编码压缩，见RFC1951的3.2.7节。
    3)根据前面得到的值，调用不同的函数解压：
        inflate_stored();    对于未压缩的数据，调用这个函数。
        inflate_fixed(); 对于用固定的Huffman编码压缩的数据，调用这个函数。
        inflate_dynamic();    对于用动态的Huffman编码压缩的数据，调用这个函数。

7/
==================================================================================
在文件gzip-1.2.4/inflate.c中：
函数： int inflate_stored()
功能：处理非压缩的数据内容
1)丢弃不足一字节的位。由于非压缩的数据中，内容都是以字节为单位的，所以原来按
        位读取的时候，会剩余不足一字节位内容，现在要去掉这些位。
    2)读入两字节的内容，其值是未压缩的数据长度。再读入两字节的内容，其值应该是前
        两字节所表示的长度的补码，若不是，则错误。
    3)逐字节的读入内容，并输出到输出文件中。

8/
==================================================================================
在文件gzip-1.2.4/inflate.c中：
函数： int inflate_fixed()
功能：用固定的Huffman编码压缩的数据
1)     为0至287的文字/length值设定编码长度:
                   Lit Value    Bits        Codes
                   ---------    ----        -----
                     0 - 143     8          00110000 through
                                            10111111
                   144 - 255     9          110010000 through
                                            111111111
                   256 - 279     7          0000000 through
                                            0010111
                   280 - 287     8          11000000 through
                                            11000111
2)     调用huft_build()建造文字/length值的Huffman树
3)     设置所有distance值(从0至29)的编码长度为5。
4)     调用huft_build()建造distance值的Huffman树
5)     调用函数inflate_codes()进行解码。

9/
==================================================================================
在文件gzip-1.2.4/inflate.c中：
函数： int inflate_dynamic()
功能：用动态的Huffman编码压缩的数据
1)读入5位的值HLIT，算出nl = 257+HLIT。这是需要编码的最大值。
2)读入5位的值HDIST，算出nd = 1+HDIST。这是distance的最大值。
3)读入4位的值HCLEN，算出nb = 4+HCLEN。说明有多少种编码长度。
4)再读入3*nb位，每三位的值表示用多少位来表示所对应的编码长度。
5)调用huft_build()建造编码长度的Huffman树。
6)利用这个Huffman树，对接下来的若干位解码出nl+nd个值，这些值依次是0~nl-1
的编码长度(对于文字/length平说)，及0~nd-1的编码长度(对于distance来说)。
7)利用上面解码出的两组长度值，两次调用huft_build()函数，建造两个Huffman树
(一个是为文字/length，另一个是为distance)。
8)调用函数inflate_codes()进行解码。

10/
==================================================================================
在文件gzip-1.2.4/inflate.c中：
函数： int inflate_codes(tl, td, bl, bd)
struct huft *tl, *td;　/* literal/length and distance decoder tables */
int bl, bd;            /* number of bits decoded by tl[] and td[] */
参数： tl,td是进行Huffman编码解码时用到的结构体，由于length和distance用不同的编码
方式，所以要有两个指针进行解码。
    在两种编码中，用struct huft结构编码时，分别以bl,bd位进行编码。
功能：用两个以经做好的链表来进行解码。
1）解码一个值X，如果0<=X<=255，则X是一个字符，输出，循环1）。
2）如果X==255，则说明块结束，函数返回。
3） X>255，则说明读到的是一个length值，根据这个值，及其后的附加位，得到真实的
length值。
4）继续读入一个值，这个值是distance的标志值，根据这个值及其后的附加位得到真实
的distance。
5）在已经输出的串中，向前查找distance个字节，拷贝length个字节到输出串的末尾。
6）循环1）

11/
==================================================================================
在文件gzip-1.2.4/inflate.c中：
函数： int huft_build()　和函数int huft_free()比较独立，可以直接引用，不再分析。
功能： int huft_build()    ：建立Huffman解码链表。
int huft_free() ：清除链表。
12/
==================================================================================
在文件gzip-1.2.4/zip.c中：
函数： int zip(in, out)
       int in, out;   /* input and output file descriptors */
参数：为输入、输出文件。
功能：
1）向输出写入三字节：0x1F 0x8B 0x08。
2）向输出写入一个含有8个标志位的字节。
3）向输出写入4字节的系统时间。
4）初始化CRC的值。
5）调用bi_init(out)初始化读入位串的程序。
6）调用ct_init()进行分配内存，初始化变量表，保存原始文件信息的
操作。
7）调用lm_init()为新文件初始化"最长匹配"的程序。
8）再向输出写入2字节，一个为额外的标志，一个为系统类型。
9）如果需要，则保存原始文件名称。
10) 保存头部信息的长度。
11) 调用函数deflate()压缩。
12) 写入4字节的CRC值。
13) 写入4字节的原始内容长度值。
14）修改前面保存的头部信息长度的值。

13/
==================================================================================
在文件gzip-1.2.4/deflate.c中：
函数： ulg deflate()
功能：压缩数据。此函数通过一些复杂的算法来进行压缩操作，可以直接引用。
1)     如果需要快速压缩，则调用函数deflate_fast()，然后返回。
2)     将当前内容插入到哈希表中，并查找最长匹配。
3)     若找到匹配内容，则输出对的编码，否则输出字符编码。

14/
==================================================================================
在文件gzip-1.2.4/deflate.c中：
函数： ulg deflate()
功能：压缩数据。此函数通过一些稍简单一些的算法来进行压缩操作，可以直接引用。
1）将当前内容插入到哈希表中，并查找最长匹配。
2）若找到匹配内容，则输出对的编码，否则输出字符编码。

、

系统相关类——java.lang.Runtime 类（二）励志去大厂的菜鸟 Java思想和方法白话拆解Java Java学习 java 开发语言白话拆解Java 深度学习
前言：小编打算近期更俩三期类的专栏，一些常用的专集类，给大家分好类别总结和详细的代码举例解释。今天是第二个java.lang.Runtime类我们一直都是以这样的形式，让新手小白轻松理解复杂晦涩的概念，把Java代码拆解的清清楚楚，每一步都知道他是怎么来的，为什么用这串代码关键字，对比同类型的代码，让大家真正看完以后融会贯通，举一反三，实践应用！！！！①官方定义和大白话拆解对比②举生活中常见贴合例
后端开发面试题6（附答案）来年定当除暴安良面试面试跳槽后端 golang
前言在下首语言是golang，所以会用他作为示例。原文参见@arialdomartini的:Back-EndDeveloperInterviewQuestions分布式系统相关问题1.怎么测试一个分布式系统？测试分布式系统是一项复杂且具有挑战性的任务，因为它涉及到多个组件在不同的网络环境和硬件设施上的协同工作。以下是一些测试分布式系统的关键步骤和方法：单元测试：对分布式系统中的每个独立模块进行单元
api-ms-win-downlevel-kernel32-l2-1-0.dll 文件介绍及其丢失修复指南 Nebula_042 经验分享 windows
api-ms-win-downlevel-kernel32-l2-1-0.dll是一个与MicrosoftVisualC++Redistributable和Windows操作系统相关的动态链接库(DLL)文件。这个文件属于Windows的DownLevelAPI集合的一部分，它为新版本的Windows提供了向后兼容性支持，使得旧版本的软件能够在新版本的Windows上正常运行。具体来说，kerne
Python 标准库一马归一码 Python python
目录1.一些常见的标准库：2.os模块的导入和使用3.re模块的导入与调用4.math模块的导入与调用5.datetime模块的导入与调用标准库：Python本身带着的一些标准的模块库，这些模块被直接构建在解析器里，虽然不是语言内置的功能，但可以高效地调用，甚至是系统级调用也可以。1.一些常见的标准库：os模块：提供了很多与操作系统相关联的函数re模块：为高级字符串处理提供了正则表达式工具，对于复
大项目SDK跨Linux平台编译成功经验总结正义之兔 Linux linux ubuntu gnu
在工作中，我们可能会遇到一些项目的SDK（源码）是在很古老的Linux环境下开发的，因为历史的原因，这个项目一直没有进行开发环境的移植。而如果要继续在这个古老的Linux下开发，要么重新购买服务器硬件（费钱），要么在自己的电脑上装这个系统（慢，费时）。解决方案当然是把它移植到装有现代Linux环境的服务器下（资源合理利用）。本人在三周的时间内，把一个带有Linux嵌入式操作系统的电信终端SDK从原
软考笔记--系统架构评估赤露水软考笔记
系统架构评估是在对架构分析、评估的基础上，对架构策略的选取进行决策。它利用数据或逻辑分析技术，针对系统的一致性，正确性，质量属性，规划结果等不同方面，提供描述性，预测性和指令性的分析结果。系统结构评估的方法通常可以分为3类：基于调查问卷或检查表的方式，基于场景的方式和基于度量的方式。（1）基于调查问卷或检查表的方法。该方法的关键是要设计好问卷或检查表，充分利用系统相关人员的经验和知识，获得对架构的
Python 中的 sys 库和 os 库 Captain Hammer web安全
一，sys--系统相关的参数和函数1.sys.argv：#list传递给Python脚本的命令行参数列表，第一个参数是程序本身的路径，实现了从程序外部向程序内传递参数。importsys print("命令行参数如下：")foriinsys.argv: print(i) 结果如下：D:\st13\test>1.py西安北京2019-01-29命令行参数如下：D:\st13\test\1.py西安
Python3多进程multiprocessing模块的使用小菜菜-K PYTHON python
一、概念在使用multiprocessing库实现多进程之前，我们先来了解一下操作系统相关的知识。Unix/Linux实现多进程Unix/Linux操作系统提供了一个fork()系统调用，它非常特殊。普通的函数调用，调用一次，返回一次，但是fork()调用一次，返回两次，因为操作系统自动把当前父进程复制了一份子进程，然后，分别在父进程和子进程内返回。子进程永远返回0，而父进程返回子进程的ID。这样
ARM/Linux嵌入式面经（一）：海康威视 TrustZone_Hcoco ARM/Linux嵌入式面试 arm开发 linux 嵌入式
海康威视1.函数指针和指针函数区别1.定义的差异函数指针：函数指针的定义涉及到函数的地址。例如，定义一个指向函数的指针int(*fp)(int)，这里fp是一个指针，它指向一个接受一个整数参数并返回整数的函数。指针函数：指针函数是指其返回类型为指针的函数。例如，int*f(int)表示一个函数f，它接受一个整数参数并返回一个指向整数的指针。2.用法的不同函数指针：在编程中，函数指针主要用于指向和调
LLM大模型落地-从理论到实践 hhaiming_ 语言模型人工智能 ai 深度学习
简述按个人偏好和目标总结了学习目标和路径（可按需学习），后续将陆续整理出相应学习资料和资源。学习目标熟悉主流LLM（Llama,ChatGLM,Qwen）的技术架构和技术细节；有实际应用RAG、PEFT和SFT的项目经验较强的NLP基础，熟悉BERT、T5、Transformer和GPT的实现和差异，能快速掌握业界进展，有对话系统相关研发经验掌握TensorRT-LLM、vLLM等主流推理加速框架
ARM/Linux嵌入式面经（三二）：百度 TrustZone_Hcoco ARM/Linux嵌入式面试 arm开发 dubbo 芯片嵌入式硬件单片机
文章目录RTOS了解吗，展开讲一下对RTOS的线程和任务管理相关的有了解吗RTOS的线程和任务管理相关了解追问有深度的技术问题及答案vivado这个硬件平台怎么用的Vivado硬件平台使用了解追问有深度的技术问题及答案项目系统架构、配置是怎样的项目系统架构与配置系统架构配置追问有深度的技术问题及答案遇到的难点，怎么解决的？遇到的难点及解决方法追问有深度的技术问题及答案Linux上的异步IO了解过吗
ARM/Linux嵌入式面经（三十）：腾讯 C++开发工程师 TrustZone_Hcoco ARM/Linux嵌入式面试 arm开发 linux c++芯片嵌入式硬件单片机
文章目录自我介绍：首先让我做了一个简短的自我介绍。volatile关键字：解释了volatile关键字的作用和使用场景。回答volatile关键字的作用和使用场景追问几个有深度的技术问题malloc底层：详细描述了malloc函数的底层实现机制。malloc函数的底层实现机制概述深度技术追问及答案虚函数：讲解了虚函数的概念和用途。回答虚函数的概念和用途追问有深度的技术问题及答案内联函数：解释了内联
ARM/Linux嵌入式面经（二九）：经纬恒润Linux开发 TrustZone_Hcoco ARM/Linux嵌入式面试 arm开发芯片单片机嵌入式硬件
文章目录介绍自己的三个项目1.什么是内联函数和宏定义？内联函数与宏定义追问及答案2.宏定义作用在编译阶段的哪个阶段生效？3.指针和数组的异同指针和数组的异同追问几个有深度的技术问题4.讲一下结构体回答追问及答案5.结构体里面内存对齐的规则结构体内存对齐的规则追问几个有深度的技术问题6.结构体和联合体的关系与区别结构体（Struct）和联合体（Union）的关系与区别追问几个有深度的技术问题7.讲一
ARM/Linux嵌入式面经（十）：极氪 TrustZone_Hcoco ARM/Linux嵌入式面试 arm开发 linux 运维
开篇强调两个事情：pdf文件都在百度网盘群：911289806一定要把超链接里面的文章看了，那都是为了你们写的。老板！！！现在多学点，涨个2k工资，真的很值得。要不吃学习的苦，要不吃生活的苦。1.自我介绍专开新篇，等我！2.项目介绍，提问专开新篇，等我！3.SPI通信和I2C的速率SPI通信SPI主设备组件提供了行业标准的4线主设备SPI接口。此外，它还提供3线（双向）SPI接口。这两种接口都支持
ARM/Linux嵌入式面经（二七）：韶音 TrustZone_Hcoco ARM/Linux嵌入式面试 linux arm开发 java
一面7月8号hr面hr面问的都是基本情况，会浅浅的问些项目1、自我介绍2、高考排名是多少？3、是保研吗？保研时有拿到其他学校的offer吗4、实验室一共多少人？博士占比是多少？4、意向工作城市？为什么选择深圳？5、介绍一下第一个项目，有没有遇到过什么问题，怎么解决的6、有了解过韶音吗，双百计划了不了解？有一些问题忘记了，自然回答就好，就聊天二面7月16日技术面1、自我介绍2、介绍一下你实习期间做的
ARM/Linux嵌入式面经（十八）：TP-Link联洲 TrustZone_Hcoco ARM/Linux嵌入式面试 arm开发 linux android 架构嵌入式
文章目录虚拟内存，页表，copyonwrite面试题1：面试题2：面试题3：进程和线程的区别红黑树和b+树的应用红黑树的应用B+树的应用视频会议用了哪些协议1.H.323协议2.SIP协议（会话发起协议）3.WebRTC（网页实时通信）4.其他协议io多路复用（select，poll，epoll）面试题linux软连接和硬链接区别1.链接方式2.存储空间3.跨文件系统4.链接对象5.删除行为6.命
python常用库（二） Jr_l python python 开发语言
文章目录python常用库4、sys库4.1、**命令行参数**4.2、**模块导入**4.3、**退出程序**4.4、**标准输入输出**4.5、**系统相关信息**4.6、**内存管理**4.7、**其他功能**5、collections库5.1、**Counter计数器**5.2、**defaultdict默认字典**5.3、**OrderedDict有序字典**5.4、**deque双端队
CentOS 系统监控项 TechCraft 主机监控 CentOS Linux Shell Prometheus Grafana
在维护和优化CentOS系统时，实时监控硬件和资源的使用情况非常重要。为了满足工作需要，可以定时采集CentOS系统相关的监控数据，并将其推送到Prometheus进行集中监控和管理。以下是日常采集项及对应的shell命令，并附上每项命令的输出解释。1.CPU使用情况监控CPU使用情况可以帮助我们了解系统的负载和性能瓶颈。采集命令：top-b-n1|grep"Cpu(s)"输出：%Cpu(s):1
【深度学习】吴恩达-课后作业-搭建多层神经网络以及应用 —Xi— 深度学习深度学习机器学习人工智能 python 神经网络
Ng的深度学习，其实前几个月就听完了，课后作业也是大懂不懂的都做了一遍，代码也跟着各种各样的参考敲了一遍，但暑假几个月没怎么学习。。。基本也忘得差不多了，这几周回顾了一下深度学习这门课的笔记，看了别的博主的总结，对CNN，RNN,LSTM,注意力机制等网络结构进行了复盘，虽然感觉自己很心浮气躁，一边也在学集成学习那几个算法和推荐系统相关，这里也告诉自己：贪多嚼不烂，心急吃不了热豆腐，慢慢来，还是要
Linux外设接口使用及内核驱动开发---Ubuntu搭建Linux内核开发环境 Jason.rr linux ubuntu 驱动开发
文章目录前言一、安装依赖二、下载Linux内核源代码1.从Github下载2.从官网下载三、编译安装内核配置内核编译安装内核/模块：选用内核四、内核驱动例子前言进行Linux嵌入式系统开发时，如果还没有嵌入式系统的开发环境，可以先基于PC机Ubuntu系统进行开发.第一步就需要搭建内核开发环境．一、安装依赖sudoapt-getupdatesudoapt-getinstallbuild-essen
车辆电子围栏系统：守护爱车安全的智能新防线沧穹科技安全
在日新月异的科技时代，汽车已不再仅仅是代步工具，它们正逐步融入智能化、网络化的浪潮之中。其中，车辆电子围栏系统作为一项创新的安全技术，正悄然成为车主们守护爱车安全的新宠。下面我们看看深圳沧穹科技给大家具体介绍的关于车辆电子围栏系统相关内容。车辆电子围栏系统其实就是通过GPS定位、无线通信及大数据分析等高科技技术，为车辆设定一个虚拟的地理边界。一旦车辆跨越这个预设的“围栏”，系统便会立即触发警报，通
【产品经理】考证東方既白（积累版）产品经理
最重要的是项目经验，不过考证也算是锦上添花，没事可以看看。从工作经验看适合科目对于从事过相关工作的人员来说，更适合考与工作内容适配的科目，学习和考试都更得心应手，而且取得和工作岗位相对应的证书会更有利于职业发展。比如，软设适合从事软件编程开发的人员报考；从事过计算机网络系统相关工作的人员适合考网工；从事信息系统项目管理的管理人员或项目经理适合考集成；从事信息系统监理的适合考监理；从事IT运维、IT
四、linux常用命令爱泡脚的CXY
一、软件安装和卸载在centos7.3中使用软件相关命令：yuminstall软件名来安装软件yumremove软件名卸载软件yumsearch模糊名字搜索软件yumcleanpackages清理缓存yumlist列出已安装的列表yuminfo软件名软件包信息系统相关命令：内存：free-m硬盘：df-h负载：w/topcpu:cat/proc/cupinfolinux的目录结构：image.pn
linux嵌入式红绿灯,嵌入式上机课设(红绿灯)..doc 牛哥考研 linux嵌入式红绿灯
嵌入式上机课设(红绿灯).成绩_______指导教师评定成绩：审定成绩：重庆邮电大学移通学院课程设计报告设计题目：学校：重庆邮电大学移通学院学生姓名：专业：自动化班级：051学号：2012指导教师：设计时间：2015年10月重庆邮电大学移通学院《嵌入式系统》课程设计任务书Ⅰ一、设计题目：单路交通灯的控制Ⅰ二、系统工作过程说明Ⅱ三、设计步骤：Ⅲ摘要Ⅲ一、绪论11、设计目的12、设计内容13、要实现的
Linux嵌入式开发 C++学习：day1 墨鱼馒头 c++算法编程语言
C++:在C的基础上增加面向对象的思想【C++简介】1983年，贝尔实验室（BellLabs）的BjarneStroustrup发明了C++。C++在C语言的基础上进行了扩充和完善，是一种面向对象程序设计（OOP）语言。Stroustrup说：“这个名字象征着源自于C语言变化的自然演进”。还处于发展完善阶段时被称为“newC”，之后被称为“CwithClass”。C++被视为C语言的上层结构，19
springcloud面试题陈二狗想吃肉
1、什么是SpringCloud？Springcloud流应用程序启动器是于SpringBoot的Spring集成应用程序，提供与外部系统的集成。SpringcloudTask，一个生命周期短暂的微服务框架，用于快速构建执行有限数据处理的应用程序。2、使用SpringCloud有什么优势？使用SpringBoot开发分布式微服务时，我们面临以下问题（1）与分布式系统相关的复杂性-这种开销包括网络问
《幸福脑》认死理的人生寻梦成长空间
扣带回系统相关心理障碍认知僵化认知僵化是指不能游刃有余地面对生活中的起起落落，大部分因扣带回异常导致的疾病都会出现这种症状。在我做婚姻咨询的几年里，常发现另一种形式的认知僵化：必须立刻做某件事。下面的场景非常常见：妻子让丈夫晾衣服，丈夫想让她等一会儿，因为他正在玩游戏。妻子很生气，并要求丈夫立刻做，必须立刻做的需求就会给亲密关系带来严重问题。日常生活中有无数由注意力不能转移或认知僵化带来的麻烦，比
VS Code GD调试嵌入式Linux程序无法断点调试 “逛丢一只鞋” i.MX6 linux vscode c++gcc/gdb编译调试
文章目录问题vscode的launch.json添加-g修改优化等级-O0问题使用gdb调试嵌入式Linux上的程序时，简单的c代码小程序，通过以下的方法可以正常的调试和运行Linux嵌入式gdbVSCode图形化调试教程但是最近编写的程序比较复杂，代码量也比较多在程序中打断点会发现没有反应，并且启动gdb之后断点符号是灰色的板子上的程序也是直接运行，没有按照断点位置停下来vscode的launc
java获取系统变量之System.getenv()和System.getProperty() 小哇666 #springboot java
Java提供了System类的静态方法getenv()和getProperty()用于返回系统相关的变量与属性，getenv方法返回的变量大多于系统相关，getProperty方法返回的变量大多与java程序有关。System.getenv()方法是获取指定的环境变量的值。System.getenv(Stringstr)接收参数为任意字符串，当存在指定环境变量时即返回环境变量的值，否则返回null
浅析现代计算机启动流程 Aspiresky 计算机体系结构运维 linux
文章目录前言启动流程概述磁盘分区格式MBR磁盘GPT磁盘隐藏分区传统BIOS引导传统BIOS启动流程UEFI引导UEFI引导程序UEFI启动流程引导加载程序启动操作系统相关参考前言现代计算机的启动是一个漫长的流程，这个流程中会涉及到各种硬件的配置与交互，包括硬件状态检测、设备配置等，并最终引导到用户可操作的操作系统界面。启动流程概述现代计算机的启动流程总体上可以分成三个阶段：BIOS/UEFI启动
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S