iefswang

MP3文件格式详解

转一：笔者根据德国Fraunhofer IIS (http://www.iis.fhg.de/amm/ )公布的MPEG Audio解码程序进行简化后编写了一个最简MP3解码程序。有兴趣的读者可以参考对应的源程序(http://www.see.online.
sh.cn/ch/sw/self/rainplay/layer3.zip)。
　　MP3文件由多个帧组成，也就是说帧是MP3音乐文件的最小组成单位。每个帧又由帧头和帧数据组成。每个帧头长4字节。其数据结构如下：
　　typedef struct _tagHeader {
　　unsigned int sync:12; //同步信息
　　unsigned int version:1; //版本
　　unsigned int layer:2; //层
　　unsigned int error_protection:1; //CRC校正
　　unsigned int bit_rate_index:4; //位率索引
　　unsigned int sample_rate_index:2; //采样率索引
　　unsigned int padding:1; //空白字
　　unsigned int extension:1; //私有标志
　　unsigned int channel_mode:2; //立体声模式
　　unsigned int mode extension:2; //保留
　　unsigned int copyright:1; //版权标志
　　unsigned int original:1; //原始媒体
　　unsigned int emphasis:2; //强调方式
　　} HEADER, ＊LPHEADER;
　　其中帧同步标记为0xFFF。
　　在帧头后边是Side Info(姑且称之为通道信息)。对标准的立体声MP3文件来说其长度为32字节。通道信息后面是Scale factor(增益因子)信息。当解码器在读到上述信息后，就可以进行解码了。
　　当MP3文件被打开后，播放器首先试图对帧进行同步，然后分别读取通道信息及增益因子等数据，再进行霍夫曼解码，至此我们已经获得解压后的数据。但这些数据仍然不能进行播放，它们还处于频域，要想听到歌曲还要将它由频域通过特定的手段转换到时域。接下来的处理分别为立体化处理；抗锯齿处理；IMDCT变换；IDCT变换及窗口化滑动处理。

转二

转载自：http://blog.csdn.net/xiaoyao888/archive/2007/01/26/1493761.aspx
最近又在做MP3相关的程序，需要了解mp3的文件格式，于是就从网上找了一些资料，并将内容整理如下，加入了自己的一些理解。

　　MP3 文件是由帧(frame)构成的，帧是MP3 文件最小的组成单位。MP3 的全称应为MPEG1 Layer-3 音频文件，MPEG(Moving Picture Experts Group)在汉语中译为活动图像专家组，特指活动影音压缩标准，MPEG 音频文件是MPEG1 标准中的声音部分，也叫MPEG 音频层，它根据压缩质量和编码复杂程度划分为三层，即 Layer-1、Layer2、Layer3，且分别对应MP1、MP2、MP3 这三种声音文件，并根据不同的用途，使用不同层次的编码。MPEG音频编码的层次越高，编码器越复杂，压缩率也越高，MP1 和MP2 的压缩率分别为4：1 和 6：1-8：1，而MP3 的压缩率则高达10：1-12：1，也就是说，一分钟CD 音质的音乐，未经压缩需要10MB的存储空间，而经过MP3 压缩编码后只有1MB 左右。不过MP3 对音频信号采用的是有损压缩方式，为了降低声音失真度，MP3 采取了“感官编码技术”，即编码时先对音频文件进行频谱分析，然后用过滤器滤掉噪音电平，接着通过量化的方式将剩下的每一位打散排列，最后形成具有较高压缩比的MP3 文件，并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。

一、MPEG音频压缩基础

　　在众多音频压缩方法中，这些方法在保持声音质量的同时尽量压缩数字音频使之占用更小的存储空间。MPEG压缩是该领域中效果最好的一个。这种压缩是有损压缩，这意味着，当运用这一方法压缩时肯定会丢失一部分音频信息。但是，由于压缩方法的控制很难发现这种损失。使用几个非常复杂和苛刻的数学算法，使得只有原始音频中几乎听不到的部分损失掉。这就给重要的信息剩下了更多的空间。通过这种方法可以将音频压缩12倍（可以选择压缩率），效果显著。正是应为他的质量，MPEG音频变得流行起来。
MPEG-1，MPEG-2和MPEG-4都是人们熟悉的MPEG标准，MP3只涉及到前两中，另外还有一个非官方标准MPEG-2.5用于扩展MPEG-2/LSF到更低的采样率。
MPEG-1音频（ISO/IEC 11172-3）描述了具有如下属性的三层音频编码：
1或2个声道
采样频率为32kHz，44.1kHz或48kHz
位率从32kbps到448kbps
每一层都有自己的优点。
MPEG-2音频（ISO/IEC 13818-3）有两个MPEG-1的扩展，通常叫做MPEG-2/LSF和MPEG-2/Multichannel
MPEG-2/LSF有如下特点：
1或2个声道
采样频率为MPEG-1的一半
波特率从8kbps256kbps
MPEG-2/Mutichannel有如下特点：
多达5个声道和1个LFE-通道（低频增强不是重低音）
同MPEG-1一样的采样频率
5.1的最高波特率可能达到1Mbps

二、MPEG Layer3编/解码的基本原理

　　音乐CD具有44.1KHz 16Bits 立体声的音频质量，一张CD可以存储74分钟的歌曲(大约15首左右)。如何将这些歌曲无损或基本无损地进行压缩,以使在同样的媒体上存储更多的歌曲,一直困扰着软件业。当MPEG协会提出MPEG Audio Layer1～Layer3后，机会产生了。通过使用MPEG1 Layer3编码技术，制作者得以用大约12∶1的压缩率记录16KHz带宽的有损音乐信号。不过,同CD原声区别不大。人的听力系统具有非常优越的性能，其动态范围超过96dB。你既可以听到扣子掉在地上这样小的声音，也可以听到波音747的强大的轰鸣声。但当我们站在飞机场听着波音747的轰鸣时, 你还能分辨出扣子掉在地上的声音吗？不可能。人的听力系统适应声音的动态变化，人们对这种适应及屏蔽特性音质研究后得出对声音压缩非常有用的理论。人们很早以前就知道利用这种特性来为磁带录音降低噪音了(当没有音乐时嘶嘶声很容易听到，而当音乐信号电平很高时嘶嘶声不容易听到)。当声音较强时产生屏蔽效应。在阈值曲线下的噪音或小信号声音无法被人耳听到。在较强信号出现时，允许通过更多的信号。在此时增加被量化过的小信号数据(使用无用的位来携带更多的信息)可以达到一定程度的压缩的目的。通常情况下,MP3压缩器将原始声音通过FFT(快速傅立叶变换)变化到频域，然后通过一定的算法算出何种频率声音可以携带更多的信息。而在还原时解码器所需要做的仅仅是将其从频域再变换回来。

三、整个MP3文件结构：

MP3文件大体分为三部分：TAG_V2(ID3V2)，Frame, TAG_V1(ID3V1)

ID3V2

包含了作者，作曲，专辑等信息，长度不固定，扩展了ID3V1的信息量。

Frame

一系列的帧，个数由文件大小和帧长决定

每个FRAME的长度可能不固定，也可能固定，由位率bitrate决定

每个FRAME又分为帧头和数据实体两部分

帧头记录了mp3的位率，采样率，版本等信息，每个帧之间相互独立

ID3V1

包含了作者，作曲，专辑等信息，长度为128BYTE。

四、MPEG音频帧格式

　　一个MPEG音频文件是许多的称为帧的较小部分组成的，通常，帧是独立的组成部分。每一帧都拥有自己的头和音频信息。没有文件头。所以，我们可以剪切MPEG文件的任何部分并且能够正常播放（当然要分割到帧的结束处尽管许多程序会处理错误头）。在LayerIII中就并不是100%正确的。这是因为在MPEG-1LayerIII文件中的数据组织中，帧常常是互相关联的并且不能那样随便裁切。
　　当你想读取MPEG文件的信息时，通常只找到第一帧就足够了，读取它的头信息然后假设其它帧是相同的就可以。但这也不是所有情况。变比特率的MPEG文件使用使用所谓比特变换，也就是说每一帧的比特率依照具体内容变化。这种方法没有减少声音质量的帧将应用较低的波特率。这样就允许更好的压缩质量的同时又保证了高质量的音质。
帧头由每一帧的前4个字节（32位）组成。帧头的前11比特（或前12个位，见下文关于帧同步）总是固定的称作“帧同步”。因此，可以在整个文件中查找第一个帧同步（即：必须找到一个值为255的且其后跟着三到四个最高位置1的字节。）然后读取整个头检查值是否正确。关于头中每一个比特的具体含义应该验证那一个值的有效性可以操看下面的表格，如果存在被定义为保留，无效，损坏或不允许的值表明该头已经损坏。记住，光有这些是不够的，帧同步能在许多二进制文件里面的应用是很广的。而且，MPEG文件可能在开头包含可能有错误同步信息的垃圾，所以我们必须检查两个或者更多一些帧来确定我们现在读取的文件是一个MPEG文件。
帧可能还有CRC校验。如果存在的话，CRC校验紧跟在帧头之后，长为16比特。CRC校验之后是音频数据。计算出帧长度，如果你需要读取其他头或者计算该帧的CRC值，可以使用它比较文件中读出来的帧。验证MPEG头的有效性这是一个非常好的方法。

1、帧头格式

下面是一个头内容图示，使用字符A到M表示不同的区域。在表格中你可以看到每一区域的详细内容。

　　AAAAAAAA AAABBCCD EEEEFFGH IIJJKLMM

符号i

长度(bits)

位置(bits)

描述

(31-21)

帧同步（所有位置1）

(20,19)

MPEG 音频版本ID
00 – MPEG 2.5
01 – 保留
10 – MPEG 2 （ISO/IEC 13818-3）
11 – MPEG 1 （ISO/IEC 11172-3）
注：MPEG 2.5不是官方标准。帧头第20个比特用来表示2.5版本。不支持该版本的应用程序一般认为该比特位置位为帧同步位，也就是说帧同步（A）的长度为12而不是这里规定的11，这样B也就变成了1位（第19个位）。推荐使用该表的方法因为这样允许你可以区分三个版本以获得最高兼容性。

(18,17)

Layer描述
00 - 保留
01 - Layer III
10 - Layer II
11 - Layer I

(16)

校验位
0 - 紧跟帧头后有16位即2个字节用作CRC校验
1 - 没有校验

(15,12)

位率索引

索引值	MPEG 1			MPEG 2, 2.5 (LSF)
索引值	Layer I	Layer II	Layer III	Layer I	Layer II & III
0000	Free
0001	32	32	32	32	8
0010	64	48	40	48	16
0011	96	56	48	56	24
0100	128	64	56	64	32
0101	160	80	64	80	40
0110	192	96	80	96	48
0111	224	112	96	112	56
1000	256	128	112	128	64
1001	288	160	128	144	80
1010	320	192	160	160	96
1011	352	224	192	176	112
1100	384	256	224	192	128
1101	416	320	256	224	144
1110	448	384	320	256	160
1111	Bad

注：所有值单位为kbps，而且1kbit=1000bit而不是1024bit

Free表示空闲，如果固定比特率（这种文件不能变换比特率）和上表定义的不同，应该有应用程序决定。这种情况的实现应该只用于内部目的因为第三方应用程序是没有办法找出正确比特率的。但是这么做并不是很重要况且还浪费精力。Bad表示该值无效。
MPEG文件可以有VBR。表示文件的比特率可以变化。我已经知道了两种惯用方法：
比特率变换(bitrate switching)：每一帧都创建成不同的比特率。可以应用在任何层。LayerIII解码器必须支持该方法。LayerI和LayerII也可以支持。
比特池(bit reservoir)：比特率可以使从前面的帧中借来的（受限），以便腾出空间来容纳输入信号部分。然而这样就导致各帧之间不再相互独立，意味着不能随便分割文件。这种方法只有LayerIII支持。

LyaerII中有一些不被允许比特率组合和模式。下表是允许的组合。

bitrate	allowed modes
free	all
32	single channel
48	single channel
56	single channel
64	all
80	single channel
96	all
112	all
128	all
160	all
192	all
224	stereo, intensity stereo, dual channel
256	stereo, intensity stereo, dual channel
320	stereo, intensity stereo, dual channel
384	stereo, intensity stereo, dual channel

(11,10)

采样频率（单位：Hz）

bits	MPEG1	MPEG2	MPEG2.5
00	44100	22050	11025
01	48000	24000	12000
10	32000	16000	8000
11	保留

(9)

填充位
0 – 没有填充
1 – 填充了一个额外的空位
填充用来达到正确的比特率。例如：128k 44.1kHz LayerII使用了很多418bit或417bit长的帧来达到正确的128k比特率。LyaerI的空位有32bit长，LayerII和LayerIII的空位有8bit长。

(8)

私有bit，可以用来做特殊应用。例如可以用来触发应用程序的特殊事件。

(7,6)

声道
00 立体声
01 联合立体声（立体声）
10 双声道（立体声）
11 单声道（单声）

注：双声道文件由二个独立的单声道组成。每一个声道使用整个文件一半的位率。大多数的解码器把它当作立体声来输出，但是它并不总是这种情况。按我的理解就是是两个声道的信息是完全相同的，并不能把它当作立体声看待。

(5,4)

扩展模式（仅在联合立体声时有效）
扩展模式用来连接对立体声效果无用的信息，来减少所需的资源。这两个位在联合立体声模式下有编码器动态指定。
完整的MPEG文件的频率序列分成有32个子带。在LayerI和LayerII中这两个位确定强度立体声应用的频带。
LayerIII中这两个位确定应用了哪一种联合立体声（M/S stereo或者Intensity stereo）频带由解压算法决定。

值	Layer I & II	Layer III
值	Layer I & II	M/S stereo	Intensity stereo
00	bands 4 to 31	off	off
01	bands 8 to 31	off	on
10	bands 12 to 31	on	off
11	bands 16 to 31	on	on

(3)

版权
0无版权
1有版权

(2)

原创
0 原创拷贝
1 原创

(1,0)

强调
00 - 无
01 - 50/15 ms
10 - 保留
11 - CCIT J.17

关于读取帧头我使用了下面的方法
定义一个结构体
typedef struct frameHeader
{
unsigned int sync1:8; //同步信息1

unsigned int error_protection:1; //CRC校验
unsigned int layer:2; //层
unsigned int version:2; //版本
unsigned int sync2:3; //同步信息2

unsigned int extension:1; //版权
unsigned int padding:1; //填充空白字
unsigned int sample_rate_index:2; //采样率索引
unsigned int bit_rate_index:4; //位率索引

unsigned int emphasis:2; //强调方式
unsigned int original:1; //原始媒体
unsigned int copyright:1; //版权标志
unsigned int mode_extension:2; //扩展模式，仅用于联合立体声
unsigned int channel_mode:2; //声道模式

}FHEADER, *pFHEADER;

请注意我的同步信息分成了两个部分，而且其他的位的顺序也和上表列出的有所差别，这个主要是因为c语言在存取数据时总是从低位开始，而这个帧头是需要从高位来读取的。
读取方式如下
FHEADER header;
fread( &header, sizeof( FHEADER ), 1, streams );//这里假设文件已打开，读取位置已经指向帧头所在的位置

这样一次就可以读入帧头的所有信息了。

2、如何计算帧长度

我们首先区分两个术语：帧大小和帧长度。帧大小即每帧采样数表示一帧中采样的个数，这是恒定值。其值入下表所示


	MPEG 1	MPEG 2 (LSF)	MPEG 2.5 (LSF)
Layer I	384	384	384
Layer II	1152	1152	1152
Layer III	1152	576	576

帧长度是压缩时每一帧的长度，包括帧头。它将填充的空位也计算在内。LayerI的一个空位长4字节，LayerII和LayerIII的空位是1字节。当读取MPEG文件时必须计算该值以便找到相邻的帧。
注意：因为有填充和比特率变换，帧长度可能变化。
从头中读取比特率，采样频率和填充，
LyaerI使用公式：
帧长度（字节） = (( 每帧采样数 / 8 * 比特率 ) / 采样频率 ) + 填充 * 4
LyerII和LyaerIII使用公式：
帧长度（字节）= (( 每帧采样数 / 8 * 比特率 ) / 采样频率 ) + 填充
例：
LayerIII 比特率 128000，采样频率 44100，填充0
=〉帧大小 417字节

3、每帧的持续时间

之前看了一些文章都说mp3的一帧的持续时间是26ms，结果在实际程序的编写中发现无法正确按时间定位到帧，然后又查了一些文章才知道，所谓26ms一帧只是针对MPEG1 Layer III而且采样率为44.1KHz来说是对的，但mp3文件并不都是如此，其实这个时间也是可以通过计算来获得，下面给出计算公式

每帧持续时间(毫秒) = 每帧采样数 / 采样频率 * 1000

这样通过计算可知 MPEG1 Layer III 采样率为44.1KHz的一帧持续时间为26.12...不是整数，不过我们权且认为它就是26毫秒吧。
如果是MPEG2 Layer III 采样率为16KHz的话那一帧要持续36毫秒，这个相差还是蛮大的，所以还是应该通过计算来获的，当然可以按MPEG版本，层数和采样率来建一个表，这样直接查表就可以知道时间了。

4、CRC校验

如果帧头的校验位为0，则帧头后就有一个16位的CRC值，这个值是big-endian的值，把这个值和该帧通过计算得出的CRC值进行比较就可以得知该帧是否有效。
关于CRC校验下面给出我找到的英文原文，我的英文水平不高，翻译的不行。

If the protection bit in the header is not set, the frame contains a 16 bit CRC (Cyclic Redundancy Checksum). This checksum directly follows the frame header and is a big-endian WORD. To verify this checksum you have to calculate it for the frame and compare the calculated CRC with the stored CRC. If they aren't equal probably a transfer error has appeared. It is also helpful to check the CRC to verify that you really found the beginning of a frame, because the sync bits do in same cases also occur within the data section of a frame.

The CRC is calculated by applying the CRC-16 algorithm (with the generator polynom 0x8005) to a part of the frame. The following data is considered for the CRC: the last two bytes of the header and a number of bits from the audio data which follows the checksum after the header. The checksum itself must be skipped for CRC calculation. Unfortunately there is no easy way to compute the number of frames which are necessary for the checksum calculation in Layer II. Therefore I left it out in the code. You would need other information apart from the header to calculate the necessary bits. However it is possible to compute the number of protected bits in Layer I and Layer III only with the information from the header.

For Layer III, you consider the complete side information for the CRC calculation. The side information follows the header or the CRC in Layer III files. It contains information about the general decoding of the frame, but doesn't contain the actual encoded audio samples. The following table shows the size of the side information for all Layer III files.

	MPEG 1	MPEG 2/2.5 (LSF)
Stereo, Joint Stereo, Dual Channel	32	17
Mono	17	9

For Layer I files, you must consider the mode extension from the header. Then you can calculate the number of bits which are necessary for CRC calculation by applying the following formula:

4 * (number of channels * bound of intensity stereo + (32 - bound of intensity stereo));

This can be read as two times the number of stereo subbands plus the number of mono subbands and the result multiplied with 4. For simple mono frames, this equals 128, because the number of channels is one and the bound of intensity stereo is 32, meaning that there is no intensity stereo. For stereo frames this is 256. For more information have a look at the CRC code in the class CMPAFrame.

5、帧数据

在帧头后边是Side Info(姑且称之为通道信息)。对标准的立体声MP3文件来说其长度为32字节。通道信息后面是Scale factor(增益因子)信息。当解码器在读到上述信息后，就可以进行解码了。当MP3文件被打开后，播放器首先试图对帧进行同步，然后分别读取通道信息及增益因子等数据，再进行霍夫曼解码，至此我们已经获得解压后的数据。但这些数据仍然不能进行播放，它们还处于频域，要想听到歌曲还要将它由频域通过特定的手段转换到时域。接下来的处理分别为立体化处理；抗锯齿处理；IMDCT变换；IDCT变换及窗口化滑动处理。

我们知道，对于mp3来说现在有两种编码方式，一种是CBR，也就是固定位率，固定位率的帧的大小在整个文件中都是是固定的（公式如上所述），只要知道文件总长度，和从第一帧帧头读出的信息，就都可以通过计算得出这个mp3文件的信息，比如总的帧数，总的播放时间等等，要定位到某一帧或某个时间点也很方便，这种编码方式不需要文件头，第一帧开始就是音频数据。另一种是VBR，就是可变位率，VBR 是XING 公司推出的算法，所以在MP3 的FRAME 里会有“Xing"这个关键字（也有用"Info"来标识的，现在很多流行的小软件也可以进行VBR 压缩，它们是否遵守这个约定，那就不得而知了），它存放在MP3文件中的第一个有效帧的数据区里，它标识了这个MP3文件是VBR的。同时第一个帧里存放了MP3 文件的帧的总个数，这就很容易获得了播放总时间，同时还有100个字节存放了播放总时间的100个时间分段的帧索引，假设4 分钟的MP3 歌曲，240S，分成100 段，每两个相邻INDEX 的时间差就是2.4S，所以通过这个INDEX，只要前后处理少数的FRAME，就能快速找出我们需要快进的帧头。其实这第一帧就相当于文件头了。不过现在有些编码器在编码CBR文件时也像VBR那样将信息记入第一帧，比如著名的lame，它使用"Info"来做CBR的标记。

6、VBR 头

这里列出VBR的第一帧存储文件信息的头的格式。有两种格式，一种是常见的XING Header（头部包含字符‘Xing’），另一种是VBRI Header（头部包含字符‘VBRI’）鉴于VBRI Header不常见，下面只说XING Header，关于VBRI Header请看http://www.codeproject.com/audio/MPEGAudioInfo.asp。

XING Header的起始位置，相对于第一帧帧头的位置，单位是字节

36-39 "Xing" 文件为MPEG1并且不是单声道(大多数VBR的mp3文件都是如此)
21-24 "Xing" 文件为MPEG1并且是单声道
21-24 "Xing" 文件为MPEG2并且不是单声道
13-16 "Xing" 文件为MPEG2并且是单声道

XING Header格式

位置（从‘Xing’标记开始)	长度	含义	举例
0	4	VBR头标记，4个字节的ASCII字符，内容为 'Xing' 或者 'Info'	'Xing'
4	4	指示VBR头具体内容的标记, 组合方式为逻辑或. 区域是强制的. 0x0001 - 总帧数存储区域设置为存在，不包括第一帧 0x0002 - 文件长度存储区域设置为存在，不包括标签 0x0004 - TOC 索引存储区域设置为存在 0x0008 - 质量指示存储区域设置为存在	0x0007 (意味总帧数，文件长度，TOC的存储区有效)
8	4	存储总帧数的Big-Endian值	7344
8 or 12	4	存储文件长度Big-Endian值，单位为字节	45000
8, 12 or 16	100	100字节的 TOC 索引，用于快速定位对于这个区域的存储内容，我认为可有可无，因为用1个字节来索引一个几兆文件的一帧是不可能做到准确定位的，就我所见基本上所有的VBR的mp3文件的 TOC都几乎是相同的，就是把256平均分成100份然后填进去，其实和正确的值差不到哪里去，如果懒的话这么做也成吧，反正也是不准确的定位。 TCO索引的计算方式如下 (TOC[i] / 256) * 文件长度比如文件持续240秒，我需要跳到60秒，文件长度为5000000字节计算如下 TOC[(60/240)100] = TOC[25] 然后相对于文件中的位置大约是在 (TOC[25]/256) 5000000 如果要自己重建的话，基本是把这个步骤反过来做就可以了。要求准确的话，就需要根据时间点找到正确帧的位置然后再计算，我定位帧的做法都是从第一帧开始搜索，这样偏差我认为不会超过1帧，也比较准确，不过计算出来的TOC的值还是和偷懒的做法大同小异。
8, 12, 16, 108, 112 or 116	4	质量指示器，为0(最好)-100(最差)的Big-Endian值	0

这样算来，XING Header包括帧头一共最多只需要156个字节就够了。当然也可以在XING Header后面存储编码器的信息，比如lame在其后就是存储其版本，这需要给第一帧留足够的空间才行。

至于mp3的信息用从XING Header读出的信息就可以计算
比如
总持续时间 = 总帧数 * 每帧采样数 / 采样率（结果为秒）
平均位率 = 文件长度 / 总持续时间 * 8

五、MPEG音频标签

MPEG音频标签分为两种，一种是ID3v1，存在文件尾部，长度128字节，另一种是ID3v2，是对ID3v1的扩展，存在文件头部，长度不定。

1、ID3v1

ID3v1标签用来描述MPEG音频文件。包含艺术家，标题，唱片集，发布年代和流派。另外还有额外的注释空间。位于音频文件的最后固定为128字节。可以读取该文件的最后这128字节获得标签。

结构如下

AAABBBBB BBBBBBBB BBBBBBBB BBBBBBBB
BCCCCCCC CCCCCCCC CCCCCCCC CCCCCCCD
DDDDDDDD DDDDDDDD DDDDDDDD DDDDDEEE
EFFFFFFF FFFFFFFF FFFFFFFF FFFFFFFG

符号	长度 (bytes)	位置 (bytes)	描述
A	3	(0-2)	标签标志。如果存在标签并且正确的话，必须包含'TAG'。
B	30	(3-32)	标题
C	30	(33-62)	艺术家
D	30	(63-92)	唱片集
E	4	(93-96)	年代
F	30	(97-126)	注释
G	1	(127)	流派

该规格要求所有的空间必须以空字符(ASCII 0)填充。但是并不是所有的应用程序遵循该规则，比如winamp就用空格(ASCII 32)代替之。
在ID3v1.1结构中有些改变。注释部分的最后一个字节用来定义唱片集中的轨道号。如果不知道该信息时可以用空字符(ASCII 0)代替。
流派使用原码表示，为下列数字之一：

0	'Blues'	20	'Alternative'	40	'AlternRock'	60	'Top 40'
1	'Classic Rock'	21	'Ska'	41	'Bass'	61	'Christian Rap'
2	'Country'	22	'Death Metal'	42	'Soul'	62	'Pop/Funk'
3	'Dance'	23	'Pranks'	43	'Punk'	63	'Jungle'
4	'Disco'	24	'Soundtrack'	44	'Space'	64	'Native American'
5	'Funk'	25	'Euro-Techno'	45	'Meditative'	65	'Cabaret'
6	'Grunge'	26	'Ambient'	46	'Instrumental Pop'	66	'New Wave'
7	'Hip-Hop'	27	'Trip-Hop'	47	'Instrumental Rock'	67	'Psychadelic'
8	'Jazz'	28	'Vocal'	48	'Ethnic'	68	'Rave'
9	'Metal'	29	'Jazz+Funk'	49	'Gothic'	69	'Showtunes'
10	'New Age'	30	'Fusion'	50	'Darkwave'	70	'Trailer'
11	'Oldies'	31	'Trance'	51	'Techno-Industrial'	71	'Lo-Fi'
12	'Other'	32	'Classical'	52	'Electronic'	72	'Tribal'
13	'Pop'	33	'Instrumental'	53	'Pop-Folk'	73	'Acid Punk'
14	'R&B'	34	'Acid'	54	'Eurodance'	74	'Acid Jazz'
15	'Rap'	35	'House'	55	'Dream'	75	'Polka'
16	'Reggae'	36	'Game'	56	'Southern Rock'	76	'Retro'
17	'Rock'	37	'Sound Clip'	57	'Comedy'	77	'Musical'
18	'Techno'	38	'Gospel'	58	'Cult'	78	'Rock & Roll'
19	'Industrial'	39	'Noise'	59	'Gangsta'	79	'Hard Rock'

Winamp扩充了这个表

80	'Folk'	92	'Progressive Rock'	104	'Chamber Music'	116	'Ballad'
81	'Folk-Rock'	93	'Psychedelic Rock'	105	'Sonata'	117	'Poweer Ballad'
82	'National Folk'	94	'Symphonic Rock'	106	'Symphony'	118	'Rhytmic Soul'
83	'Swing'	95	'Slow Rock'	107	'Booty Brass'	119	'Freestyle'
84	'Fast Fusion'	96	'Big Band'	108	'Primus'	120	'Duet'
85	'Bebob'	97	'Chorus'	109	'Porn Groove'	121	'Punk Rock'
86	'Latin'	98	'Easy Listening'	110	'Satire'	122	'Drum Solo'
87	'Revival'	99	'Acoustic'	111	'Slow Jam'	123	'A Capela'
88	'Celtic'	100	'Humour'	112	'Club'	124	'Euro-House'
89	'Bluegrass'	101	'Speech'	113	'Tango'	125	'Dance Hall'
90	'Avantgarde'	102	'Chanson'	114	'Samba'
91	'Gothic Rock'	103	'Opera'	115	'Folklore'

其他扩充

126	'Goa'	132	'BritPop'	138	'BlackMetal'	144	'TrashMetal'
127	'Drum&Bass'	133	'Negerpunk'	139	'Crossover'	145	'Anime'
128	'Club-House'	134	'PolskPunk'	140	'ContemporaryChristian'	146	'JPop'
129	'Hardcore'	135	'Beat'	141	'ChristianRock'	147	'Synthpop'
130	'Terror'	136	'ChristianGangstaRap'	142	'Merengue'
131	'Indie'	137	'HeavyMetal'	143	'Salsa'

其他任何的数值都认为是“unknown”

2、ID3V2

ID3V2 到现在一共有4 个版本，但流行的播放软件一般只支持第3 版，既ID3v2.3。由于ID3V1 记录在MP3 文件的末尾，ID3V2 就只好记录在MP3 文件的首部了(如果有一天发布ID3V3，真不知道该记录在哪里)。也正是由于这个原因，对ID3V2 的操作比ID3V1 要慢。而且ID3V2 结构比ID3V1 的结构要复杂得多，但比前者全面且可以伸缩和扩展。
下面就介绍一下ID3V2.3。
每个ID3V2.3 的标签都一个标签头和若干个标签帧或一个扩展标签头组成。关于曲目的信息如标题、作者等都存放在不同的标签帧中，扩展标签头和标签帧并不是必要的，但每个标签至少要有一个标签帧。标签头和标签帧一起顺序存放在MP3 文件的首部。

（一）、标签头

在文件的首部顺序记录10 个字节的ID3V2.3 的头部。数据结构如下：

char Header[3]; /*必须为"ID3"否则认为标签不存在*/
char Ver; /*版本号ID3V2.3 就记录3*/
char Revision; /*副版本号此版本记录为0*/
char Flag; /*存放标志的字节，这个版本只定义了三位，稍后详细解说*/
char Size[4]; /*标签大小，包括标签头的10 个字节和所有的标签帧的大小*/
注:对这里我有疑惑，因为在实际寻找首帧的过程中，我发现有的mp3文件的标签大小是不包含标签头的，但有的又是包含的，可能是某些mp3编码器写标签的BUG，所以为了兼容只好认为其是包含的，如果按大小找不到，再向后搜索，直到找到首帧为止。

（1）.标志字节

标志字节一般为0，定义如下：
abc00000
a -- 表示是否使用Unsynchronisation(这个单词不知道是什么意思，字典里也没有找到，一般不设置)
b -- 表示是否有扩展头部，一般没有(至少Winamp 没有记录)，所以一般也不设置
c -- 表示是否为测试标签(99.99%的标签都不是测试用的啦，所以一般也不设置)
（2）.标签大小
一共四个字节，但每个字节只用7 位，最高位不使用恒为0。所以格式如下
0xxxxxxx 0xxxxxxx 0xxxxxxx 0xxxxxxx
计算大小时要将0 去掉，得到一个28 位的二进制数，就是标签大小(不懂为什么要这样做)，计算公式如
下：
int total_size;
total_size = (Size[0]&0x7F)*0x200000
+(Size[1]&0x7F)*0x4000
+(Size[2]&0x7F)*0x80
+(Size[3]&0x7F)

（二）、标签帧

每个标签帧都有一个10 个字节的帧头和至少一个字节的不固定长度的内容组成。它们也是顺序存放在文件
中，和标签头和其他的标签帧也没有特殊的字符分隔。得到一个完整的帧的内容只有从帧头中的到内容大
小后才能读出，读取时要注意大小，不要将其他帧的内容或帧头读入。
帧头的定义如下：
char FrameID[4]; /*用四个字符标识一个帧，说明其内容，稍后有常用的标识对照表*/
char Size[4]; /*帧内容的大小，不包括帧头，不得小于1*/
char Flags[2]; /*存放标志，只定义了6 位，稍后详细解说*/

（1）.帧标识

用四个字符标识一个帧，说明一个帧的内容含义，常用的对照如下：
TIT2=标题表示内容为这首歌的标题，下同
TPE1=作者
TALB=专集
TRCK=音轨格式：N/M 其中N 为专集中的第N 首，M 为专集中共M 首，N 和M 为ASCII 码表示的数字
TYER=年代是用ASCII 码表示的数字
TCON=类型直接用字符串表示
COMM=备注格式："eng/0 备注内容"，其中eng 表示备注所使用的自然语言

（2）.大小

这个可没有标签头的算法那么麻烦，每个字节的8 位全用，格式如下
xxxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx
算法如下：
int FSize;
FSize = Size[0]*0x100000000
+Size[1]*0x10000
+Size[2]*0x100
+Size[3];

（3）.标志

只定义了6 位，另外的10 位为0，但大部分的情况下16 位都为0 就可以了。格式如下：
abc00000 ijk00000
a -- 标签保护标志，设置时认为此帧作废
b -- 文件保护标志，设置时认为此帧作废
c -- 只读标志，设置时认为此帧不能修改(但我没有找到一个软件理会这个标志)
i -- 压缩标志，设置时一个字节存放两个BCD 码表示数字
j -- 加密标志(没有见过哪个MP3 文件的标签用了加密)
k -- 组标志，设置时说明此帧和其他的某帧是一组
值得一提的是winamp 在保存和读取帧内容的时候会在内容前面加个'/0'，并把这个字节计算在帧内容的
大小中。

附：帧标识的含义
（4）. Declared ID3v2 frames

The following frames are declared in this draft.
AENC Audio encryption
APIC Attached picture
COMM Comments
COMR Commercial frame
ENCR Encryption method registration
EQUA Equalization
ETCO Event timing codes
GEOB General encapsulated object
GRID Group identification registration
IPLS Involved people list
LINK Linked information
MCDI Music CD identifier
MLLT MPEG location lookup table
OWNE Ownership frame
PRIV Private frame
PCNT Play counter
POPM Popularimeter
POSS Position synchronisation frame
RBUF Recommended buffer size
RVAD Relative volume adjustment
RVRB Reverb
SYLT Synchronized lyric/text
SYTC Synchronized tempo codes
TALB Album/Movie/Show title
TBPM BPM (beats per minute)
TCOM Composer
TCON Content type
TCOP Copyright message
TDAT Date
TDLY Playlist delay
TENC Encoded by
TEXT Lyricist/Text writer
TFLT File type
TIME Time
TIT1 Content group description
TIT2 Title/songname/content description
TIT3 Subtitle/Description refinement
TKEY Initial key
TLAN Language(s)
TLEN Length
TMED Media type
TOAL Original album/movie/show title
TOFN Original filename
TOLY Original lyricist(s)/text writer(s)
TOPE Original artist(s)/performer(s)
TORY Original release year
TOWN File owner/licensee
TPE1 Lead performer(s)/Soloist(s)
TPE2 Band/orchestra/accompaniment
TPE3 Conductor/performer refinement
TPE4 Interpreted, remixed, or otherwise modified by
TPOS Part of a set
TPUB Publisher
TRCK Track number/Position in set
TRDA Recording dates
TRSN Internet radio station name
TRSO Internet radio station owner
TSIZ Size
TSRC ISRC (international standard recording code)
TSSE Software/Hardware and settings used for encoding
TYER Year
TXXX User defined text information frame
UFID Unique file identifier
USER Terms of use
USLT Unsychronized lyric/text transcription
WCOM Commercial information
WCOP Copyright/Legal information
WOAF Official audio file webpage
WOAR Official artist/performer webpage
WOAS Official audio source webpage
WORS Official internet radio station homepage
WPAY Payment
WPUB Publishers official webpage
WXXX User defined URL link frame

以上文字绝大多数来源于网络，当中也包含一些我自己的理解，如果有错请指正。

部分参考文章的网址

http://mpgedit.org/mpgedit/mpeg_format/mpeghdr.htm
http://www.codeproject.com/audio/MPEGAudioInfo.asp
http://le-hacker.org/hacks/mpeg-drafts/11172-3.pdf (ISO/IEC 11172-3 我想这个应该有很多人找吧，不过这里面定义的帧同步位为12位，因为是老标准)
http://webstore.iec.ch/preview/info_isoiec13818-3%7Bed2.0%7Den.pdf （ISO/IEC 13818-3 网站似乎是收费的，不过直接可下，应该不会有人找我麻烦吧）

你可能感兴趣的:(mp3)

微软ASR与开源模型分析老兵发新帖 microsoft 开源
一、微软ASR核心能力1.支持场景场景功能实时语音转文本低延迟流式识别（会议字幕/直播转录）音频文件转文本支持多种格式（WAV/MP3等），批量处理长音频定制化模型针对特定行业术语（医疗/金融）训练专属模型多语言混合识别中英文混合、方言识别（如中文普通话+粤语）说话人分离区分不同发言人（声纹识别）2.关键性能指标识别准确率：中文普通话>95%（安静环境）英文>96%（MicrosoftResear
Mac电脑-媒体文件格式转换-Permute 2401_88856700 媒体 mac macos 格式转换
Permute是一款功能强大的媒体文件格式转换工具。支持多种音视频和图像格式，包括但不限于MP4、AVI、MOV、MKV、MP3、WAV、FLAC、JPEG、PNG等。操作界面简洁明了，只需拖拽文件或点击添加按钮来选择需要转换的文件。转换设置区域，可自由选择输出格式、输出路径、输出参数等，实现个性化转换。原文地址：Permute媒体文件格式转换工具
Unreal Engine：声音设计与音频集成技术教程_2024-07-13_00-24-34.Tex chenjj4003 游戏开发虚幻音视频 javascript unity ar 游戏引擎网络
UnrealEngine：声音设计与音频集成技术教程声音设计基础音频格式与质量在声音设计中，理解音频格式和质量至关重要。不同的格式适用于不同的场景，而音频质量则直接影响游戏体验的沉浸感。音频格式WAV(WaveformAudioFileFormat)WAV是一种无损音频格式，保留了原始音频的所有数据，适用于编辑和处理阶段，但文件大小较大，不适合游戏中的实时加载。MP3(MPEG-1AudioLay
MP34DT05TR-A MEMS音频传感器全向数字麦克风：122.5dB AOP抗爆破音设计在工业警报系统中的应用验证 Hailey深力科 MP34DT05TR-A MEMS麦克风 MEMS音频传感器全向数字麦克风
一、产品架构与核心性能MP34DT05TR-A采用硅微加工电容传感单元+CMOSASIC双芯片集成架构，通过PDM接口输出数字音频流。其突破性在于：122.5dB声学过载点(AOP)：超越消费级麦克风常规100dB极限，耐受强声压冲击64dBSNR：1kHz频点底噪低至29dBA，保留语音高频细节（>6kHz）-26dBFS±3dB灵敏度一致性：产线匹配公差缩小50%，降低阵列设计校准成本二、关键
白盒测试实战：如何在Spring Boot项目中用白盒测试发现“上传MP3”功能的隐藏BUG？
白盒测试实战：如何在SpringBoot项目中用白盒测试发现“上传MP3”功能的隐藏BUG？✍作者：@LVZI|标签：白盒测试、单元测试、SpringBoot、文件上传、找bug、面试实战一、什么是白盒测试？为什么要用它？白盒测试简介白盒测试（WhiteBoxTesting）也被称为结构测试、透明盒测试、逻辑驱动测试，是软件测试中的一种重要类型。与黑盒测试关注“功能是否正确”不同，白盒测试关注程序
鸿蒙开发实战之Ringtone Kit打造美颜相机音效互动体系 harmonyos-next
一、核心音效场景通过RingtoneKit实现三大音效升级：定制化快门声音100+风格音效库（机械/电子/自然声等）支持用户音频导入（MP3/AAC格式）智能场景音效根据拍摄内容匹配音效（人像/风景/夜景）地理位置触发特色铃声（城市主题音）沉浸式反馈3D环绕快门声（头部追踪HRTF技术）振动与音效联动（触觉反馈同步）二、关键技术实现importringtonefrom'@ohos.ringtone
一个纯 html 手搓的音乐播放器，支持频谱显示汪子熙前端开发相关 html 前端 javascript
源代码如下：MP3元数据解析器body{font-family:'Arial',sans-serif;max-width:800px;margin:0auto;padding:20px;background-color:#f5f5f5;}h1{color:#333;text-align:center;}.container{background-color:white;padding:20px;b
unity 导入gltf_Unity3D使用glTF格式三维文件，glTF在unity中如何呈现，glTF导入unity weixin_39760689 unity 导入gltf
1，什么是glTF文件？一直在研究如何优化检查三维模型的问内容，单独从三维文件来说，有很多可以优化规范的内容，最近在看到有一个压缩格式，话说这个方式是要做一个三维文件的通用格式，比如图片的jpg格式，音频的mp3格式，这个也就是三维文件中的glTF格式如图：要作为标杆的格式此格式与多家软件等合作开发合作大品牌2，如何产生glTF文件？本人测试了maya和3dmax中导入glTF格式的三维文件，其中
unity 导入gltf_Unity3D使用glTF格式三维文件,在unity中如何呈现glTF 林书溪 unity 导入gltf
1，什么是glTF文件？一直在研究如何优化检查三维模型的问内容，单独从三维文件来说，有很多可以优化规范的内容，最近在看到有一个压缩格式，话说这个方式是要做一个三维文件的通用格式，比如图片的jpg格式，音频的mp3格式，这个也就是三维文件中的glTF格式如图：要作为标杆的格式此格式与多家软件等合作开发合作大品牌2，如何产生glTF文件？本人测试了maya和3dmax中导入glTF格式的三维文件，其中
STM32实战：数字音频播放器开发指南三三十二 stm32 嵌入式硬件单片机
基于STM32的数字音频播放器/效果器是个很棒的项目！这涉及到多个嵌入式开发的关键技术点。下面我为你拆解实现方案和关键学习内容：系统架构概览[SDCard]->[FileSystem(FATFS)]->[AudioDecoder(WAV/MP3)]->[DSPProcessing(EQ,Reverb,Pitch)]->[I2SDriver]->[DAC/Codec(e.g.WM8960,CS434
音频MP3切割器：剪辑与合并的实用工具觉昧
本文还有配套的精品资源，点击获取简介：音频MP3切割器是一款专业MP3编辑软件，它使得音频剪辑和合并变得轻而易举。本文将介绍软件的核心功能、操作方法、注册码与授权流程以及实用技巧。通过这些功能，用户可以轻松完成音频的裁剪、拼接和优化，广泛应用于制作个性化铃声、播客剪辑、语言学习和音频整理等领域。1.音频MP3切割器介绍在数字化媒体时代，音频文件的编辑和管理变得至关重要，尤其是MP3格式，因其广泛兼
七、MySQL体系架构 AllWe$ MySQL mysql
一、MySQL的分支、变种、替代1、分支与变种Drizzle（c++），高可用；MariaDB-->MySQL的扩展集；PerconaServer-->向后兼容MySQL，与MySQL重合度高；服务器信息（日志记录）改进；性能改进；操作灵活；2、替代PostgreSQL（PG）；//一专多长，稳定性强（安全、性能）；SQLite；//占用空间小，不需经常维护；MP3等设备；二、MySQL体系架构与
什么是DSP 雁过留声花欲落 #嵌软_音频相关 dsp
DSP解码（DigitalSignalProcessorDecoding）指利用数字信号处理器（DSP）对压缩或编码的音频/视频信号进行还原处理的过程。它是现代音频设备（如蓝牙耳机、智能音箱）的核心技术之一，其核心作用是通过高效算法将压缩的音频数据转换为可播放的模拟信号。DSP解码的关键点核心目的还原压缩数据：将MP3、AAC、aptX、LDAC等压缩格式的音频流，通过数学算法解压缩为原始PCM（
在h5端实现录音发送功能(兼容内嵌微信小程序) recorder-core 一蓑烟雨，一任平生移动端h5 微信小程序小程序
本文将通过一个实际的Vue3组件示例，带你一步步实现“按住录音，松开发送，上滑取消”的语音录制功能。我们将使用强大且小巧的开源库recorder-core，支持MP3、WAV、AAC等编码格式，兼容性较好。项目依赖pnpmaddrecorder-coredayjs#或npminstallrecorder-coredayjs我们实现的组件是一个input输入框，按下开始录音，松开结束录音，上滑取消录
（批处理）m4a、flac和mp4转mp3【ffmpeg实现】尼恩久 Python ffmpeg python batch
bat脚本处理优势就是处理文件占用空间小（1kb左右）、完全免费、简易、速度也挺快。下载ffmpeg.exeffmpeg.exe下载网址！所有的前提！（ffmpeg.exe要么将其所在目录添加到环境变量，要么放在新生成的bat文件同一目录下）一、bat指令实现（ANSI编码格式）chcp65001@echooffsetlocalenabledelayedexpansionfor/f"tokens=
uniapp - [微信小程序] 实现点击预览各种文件 pdf文档、视频mp4、mp3音乐、图片图像、word/excel/ppt 等，uniapp小程序文件预览功能（详细示例代码，一键复制开箱即用）十一猫咪爱养鱼前端组件与功能(开箱即用)uniapp常见问题解决 uniapp小程序文件预览微信小程序在线查看文件支付宝小程序实现文件预览 uniapp小程序开发预览文档 office文件预览word 预览excel xls文档预览mp3音乐mp4视频
效果图在uniapp微信小程序平台开发中，详细实现文件预览功能，支持预览pdf/mp3/mp4/图片/word/excel/ppt等常见文件，在线下载并预览功能。uniappVue3和Vue2都能用，直接复制运行示例代码，稍微改下就能用了。示例源码下面就是全部源码了，请复制运行后
介绍flv.js以及前端使用flv.js通过useWebsocket动态获取视频流地址进行播放 yellowCan777 前端 javascript 音视频 vue.js
简介flv.js是一款使用纯JavaScript编写的HTML5Flash视频(FLV)播放器，无需Flash即可播放视频。具有H.264+AAC/MP3编解码器播放功能的FLV容器多部分分段视频播放HTTPFLV低延迟直播流播放通过WebSocket播放FLV直播流兼容Chrome、FireFox、Safari10、IE11和Edge极低的开销，并由您的浏览器硬件加速tips：对于FLV直播流播
【重磅资源】1990-2024年大学英语四六级全套真题资源分享（含听力+答案解析）一吱喵喵学习经验分享笔记
资源介绍今天给大家分享一个全网最完整的大学英语四六级备考资源包，包含1990-2024年全部历年真题，特色如下：完整覆盖：34年真题合集（PDF高清版）听力配套：MP3音频文件+字幕文本（支持变速播放）权威解析：每套题配备详细答案与解题思路️多端适配：电脑/手机均可使用，支持电视投屏学习资源下载「【1990-2024年大学英语四六级历年真题】【含听力与答案解析】」，点击链接即可保存。打开「夸克AP
新手必追！树莓派系列教程第三弹：看电视疯狂的豆包树莓派 linux 嵌入式硬件
刚入手树莓派4B的小伙伴们，是不是满心期待却又不知从何下手？别慌！从系统安装开始，一不小心就可能踩坑。今天就为大家带来新手必看的树莓派系列教程第一弹，手把手教你避开系统安装的“雷区”，顺利开启树莓派探索之旅！VLC媒体播放器VLC能够播放几乎所有常见的音频和视频格式，如MP4、AVI、MKV、FLV、MP3、WAV等，无需额外安装解码器。它还支持一些较为小众或特殊的格式，如MPEG-2、MPEG-
DCT--离散余弦变换 LEEE@FPGA matlab数字信号处理 DCT
1DCT简介离散余弦变换（DCT）用在不同频率振荡的余弦函数之和来表示数据点的有限序列。DCT由NasirAhmed于1972年首次提出，是信号处理和数据压缩中广泛使用的转换技术。它用于大多数数字媒体，包括数字图像（如JPEG和HEIF，其中可以丢弃小型高频分量），数字视频（如MPEG和H.26x），数字音频（如杜比数字，MP3和AAC），数字电视（如SDTV，HDTV和VOD），数字广播（如AA
62 国语言+无广告格式工厂损坏修复到人声分离快速预览 + 协同工作 2501_91886517 windows 开源软件格式工厂电脑
各位数码小达人们！今天咱来聊聊FormatPlayer，它可是格式工厂（FormatFactory）的配套播放器组件，功能那叫一个牛！首先，它在多媒体文件播放支持方面超厉害。各种主流格式，像视频的MP4、AVI、MKV，音频的MP3、FLAC，还有图片啥的，它都能播。而且啊，它还整合了音视频解码功能，那些转换过程中损坏的文件，到它这儿就跟有了起死回生的魔法一样，能给修复好。接着说说它的专属特色功能
基于STM32、HAL库的BMP388 气压传感器驱动程序设计 colin工作室气压传感器驱动程序设计 stm32 嵌入式硬件单片机
一、简介：BMP388是BoschSensortec推出的一款高精度、低功耗的数字气压传感器，具有以下特点：压力测量范围：300hPa至1250hPa相对精度：±0.08hPa（相当于±0.5米）温度测量范围：-40°C至+85°C工作电压：1.65V至3.6V低功耗：2μA@1Hz采样率支持I2C和SPI接口（最高10MHz）内置FIFO和中断功能二、硬件接口：BMP388STM32L4----
破解 Qt QProcess 在 Release 模式下的“卡死”之谜吃面不喝汤66 Qt qt 开发语言
在使用Qt的QProcess以调用外部ffmpeg/ffprobe进行音视频处理时，常见的工作流程是：gatherParams：通过ffprobe同步获取媒体文件的参数（分辨率、采样率、声道数、码率等）。reencode：逐个文件调用ffmpeg-crf或者ffmpeg-c:alibmp3lame，异步重新编码到统一格式。concat：生成concat_list.txt后，调用ffmpeg-fco
python实现音乐播放器播放列表_音乐播放器播放列表 weixin_39646695
fromTkinterimport*importmp3playimporttkFileDialogimportTkinterimporttkFontimportTkinterastkclassmusicplay:def__init__(self):self.music=Noneself.play_list=[]self.trackLocations=[]self.root=tk.Tk()self.
FFMpeg打开文件报错：Invalida data found when processing input try_zp_catch
我这边出现的错误是打开mp4文件能打开，aac文件也能打开，但是打开mp3文件的时候就开始报错：Invalidadatafoundwhenprocessinginput.在我测试的过程中发现，一些项目是可以打开的，另外一些项目打不开，同样的代码在一个工程打不开，复制到另外一个工程就能打开了，我百思不得其解。后来我觉得是不是我的ffmpeg编译有问题，因为我学习过程中引入的lib包可能不都是我自己编
【音频】Qt6实现MP3播放器郭老二视频 Qt 音视频
1、简介解码MP3有很多种方法，比如：FFmpeg、GStreamer、Qt、libmpg123库等，下面介绍使用，只使用Qt的接口方法解码、播放MP3。开发配置：1）操作系统：Windows112）Qt版本：Qt6.5.13）编译器：MinGW_642、获取音频输出设备QMediaDevices用于获取媒体设备，包括音频输入、音频输出、摄像头等设备。我们可以使用QMediaDevices获取音频
stm32语音播报_TTS语音模块：XFS5152CE语音合成模块详解 weixin_39611937 stm32语音播报
TTS是TextToSpeech的缩写，即"从文本到语音"，是人机对话的一部分，让机器能够说话。语音播报功能的实现方式TTS语音模块，比如XFS5152、SYN6288等ISD4000系列语音录放芯片分段输出可以按键、UART控制的mp3解码芯片模块OTP(OneTimeProgramable)语音芯片[可定制]其中TTS语音模块使用起来最方便灵活，OTP语音芯片最简单。本文将介绍一下科大讯飞的X
QT实战---音乐播放器开发追月亮的少年 qt 网络开发语言
本次实战手把手教大家开发一个本地的音乐播放器。一、开发音乐播放器的系统分析1.1.1功能需求：音乐播放：支持常见的音频格式（如MP3,WAV,FLAC等）。播放、暂停、停止、下一首、上一首等基本控制功能。支持播放列表，用户可以添加、删除、排序曲目。用户界面：设计直观易用的图形用户界面(GUI)，包括播放控制按钮、进度条、播放列表显示等。支持音量调节、播放模式选择（单曲循环、列表循环、随机播放）。歌
【QT的音乐播放器（简单版）】神迷岛音乐播放器 QT 音乐播放器项目实现 qt mp3 c++
基于QT的音乐播放器前言一、主体效果二、主要技术点：1.mp3的ID3V2格式文件解析：作者、歌手、时长、专辑图片等1.1需要工具：1.2ID3V2文件格式1.3mp3ID3V2解析代码2.音乐列表拖拽、临界自动滚动、信息栏。2.1要实现效果：2.2QListView的样式表2.3重写QListView四个事件函数，发出需要信号，及自动滚动效果2.4关联信号实现拖拽释放，移动iterm效果3.歌词
yt-dlp 下载时需要 cookie nongcunqq 笔记 java 开发语言
下载b站歌曲yt-dlp-x--proxyhttp://127.0.0.1:1080--audio-formatmp3https://www.bilibili.com/video/BV1Zn4y1X75b解决方案，使用firefox登录相关网站yt-dlp-o"downloads/%(title)s.%(ext)s"-f"bestvideo[height<=1080]+bestaudio/best
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb