hijunmeng

ffmpeg简单分析系列----音频（audio）

文章目录

ffmpeg简单分析系列----音频（audio）
- 采样格式
- 通道布局（channel layout）
- - 常用api
  - - int64_t av_get_default_channel_layout(int nb_channels)
    - int av_get_channel_layout_nb_channels(uint64_t channel_layout)
    - int av_get_channel_layout_channel_index(uint64_t channel_layout,uint64_t channel);
- 音频解码
- libswresample
- - 音频转换
  - 音频重采样
- 相关计算
- 参考

ffmpeg简单分析系列----音频（audio）

音频有几个重要的参数：采样率（sample_rate，单位是Hz）,通道数（channels）,采样格式（sample_fmt,见AVSampleFormat，其实就是采样的精度，位数越多表示越精细，当然占用的空间也会比较大）
在ffmpeg中，音频数据的存储格式也有planar和packed之分，planar表示每个通道数据单独存储，packed表示通道数据交叉存储，在AVSampleFormat的类型末尾带P的就表示是planar格式的
比如双声道，用L表示左声道，R表示右声道，那么packed的存储为：LRLRLRLRLRLRLRLR；而planar的存储为LLLLRRRRLLLLRRRR

采样格式

采样格式定义在libavutil/samplefmt.h中

enum AVSampleFormat {
 AV_SAMPLE_FMT_NONE = -1,
 AV_SAMPLE_FMT_U8,          ///< unsigned 8 bits
 AV_SAMPLE_FMT_S16,         ///< signed 16 bits
 AV_SAMPLE_FMT_S32,         ///< signed 32 bits
 AV_SAMPLE_FMT_FLT,         ///< float
 AV_SAMPLE_FMT_DBL,         ///< double
 
  AV_SAMPLE_FMT_U8P,         ///< unsigned 8 bits, planar
  AV_SAMPLE_FMT_S16P,        ///< signed 16 bits, planar
  AV_SAMPLE_FMT_S32P,        ///< signed 32 bits, planar
  AV_SAMPLE_FMT_FLTP,        ///< float, planar
  AV_SAMPLE_FMT_DBLP,        ///< double, planar
  AV_SAMPLE_FMT_S64,         ///< signed 64 bits
  AV_SAMPLE_FMT_S64P,        ///< signed 64 bits, planar
    
  AV_SAMPLE_FMT_NB           ///< Number of sample formats. DO NOT USE if linking dynamically
    };

通道布局（channel layout）

在AVCodecContext的结构体中有channel_layout和request_channel_layout这两个参数，它们的类型是uint64_t，表示无符号64位整型
很多人对这个参数无从下手，因为不知道它表示什么，该怎么使用它
request_channel_layout表示你期待的通道布局，而channel_layout表示实际的通道布局，channel_layout是由解码器设置的
channel_layout的值转换成二进制后，有多少个1就表示多少个通道
在channel_layout.h头文件中定义了有关它的一些掩码，通过这些掩码的组合就能凑成多种通道布局，例如AV_CH_LAYOUT_STEREO是立体声（2通道），其通道的存放顺序为LEFT | RIGHT；AV_CH_LAYOUT_4POINT0是4通道，其通道的存放顺序为
LEFT | RIGHT | FRONT-CENTER | BACK-CENTER
有了channel_layout，我们就知道了通道的顺序，这样我们就可以随意取得我们指定的通道的数据
这里注意一点的是，sdl不支持音频平面格式（planar）,因此如果用sdl播放音频必须先得转成packed格式
以下是channel_layout.h的部分摘抄：

   37 /**
   38  * @defgroup channel_masks Audio channel masks
   39  *
   40  * A channel layout is a 64-bits integer with a bit set for every channel.
   41  * The number of bits set must be equal to the number of channels.
   42  * The value 0 means that the channel layout is not known.
   43  * @note this data structure is not powerful enough to handle channels
   44  * combinations that have the same channel multiple times, such as
   45  * dual-mono.
   46  *
   47  * @{
   48  */
   49 #define AV_CH_FRONT_LEFT             0x00000001
   50 #define AV_CH_FRONT_RIGHT            0x00000002
   51 #define AV_CH_FRONT_CENTER           0x00000004
   52 #define AV_CH_LOW_FREQUENCY          0x00000008
   53 #define AV_CH_BACK_LEFT              0x00000010
   54 #define AV_CH_BACK_RIGHT             0x00000020
   55 #define AV_CH_FRONT_LEFT_OF_CENTER   0x00000040
   56 #define AV_CH_FRONT_RIGHT_OF_CENTER  0x00000080
   57 #define AV_CH_BACK_CENTER            0x00000100
   58 #define AV_CH_SIDE_LEFT              0x00000200
   59 #define AV_CH_SIDE_RIGHT             0x00000400
   60 #define AV_CH_TOP_CENTER             0x00000800
   61 #define AV_CH_TOP_FRONT_LEFT         0x00001000
   62 #define AV_CH_TOP_FRONT_CENTER       0x00002000
   63 #define AV_CH_TOP_FRONT_RIGHT        0x00004000
   64 #define AV_CH_TOP_BACK_LEFT          0x00008000
   65 #define AV_CH_TOP_BACK_CENTER        0x00010000
   66 #define AV_CH_TOP_BACK_RIGHT         0x00020000
   67 #define AV_CH_STEREO_LEFT            0x20000000  ///< Stereo downmix.
   68 #define AV_CH_STEREO_RIGHT           0x40000000  ///< See AV_CH_STEREO_LEFT.
   69 #define AV_CH_WIDE_LEFT              0x0000000080000000ULL
   70 #define AV_CH_WIDE_RIGHT             0x0000000100000000ULL
   71 #define AV_CH_SURROUND_DIRECT_LEFT   0x0000000200000000ULL
   72 #define AV_CH_SURROUND_DIRECT_RIGHT  0x0000000400000000ULL
   73 #define AV_CH_LOW_FREQUENCY_2        0x0000000800000000ULL
   74 
   75 /** Channel mask value used for AVCodecContext.request_channel_layout
   76     to indicate that the user requests the channel order of the decoder output
   77     to be the native codec channel order. */
   78 #define AV_CH_LAYOUT_NATIVE          0x8000000000000000ULL
   79 
   80 /**
   81  * @}
   82  * @defgroup channel_mask_c Audio channel layouts
   83  * @{
   84  * */
   85 #define AV_CH_LAYOUT_MONO              (AV_CH_FRONT_CENTER)
   86 #define AV_CH_LAYOUT_STEREO            (AV_CH_FRONT_LEFT|AV_CH_FRONT_RIGHT)
   87 #define AV_CH_LAYOUT_2POINT1           (AV_CH_LAYOUT_STEREO|AV_CH_LOW_FREQUENCY)
   88 #define AV_CH_LAYOUT_2_1               (AV_CH_LAYOUT_STEREO|AV_CH_BACK_CENTER)
   89 #define AV_CH_LAYOUT_SURROUND          (AV_CH_LAYOUT_STEREO|AV_CH_FRONT_CENTER)
   90 #define AV_CH_LAYOUT_3POINT1           (AV_CH_LAYOUT_SURROUND|AV_CH_LOW_FREQUENCY)
   91 #define AV_CH_LAYOUT_4POINT0           (AV_CH_LAYOUT_SURROUND|AV_CH_BACK_CENTER)
   92 #define AV_CH_LAYOUT_4POINT1           (AV_CH_LAYOUT_4POINT0|AV_CH_LOW_FREQUENCY)
   93 #define AV_CH_LAYOUT_2_2               (AV_CH_LAYOUT_STEREO|AV_CH_SIDE_LEFT|AV_CH_SIDE_RIGHT)
   94 #define AV_CH_LAYOUT_QUAD              (AV_CH_LAYOUT_STEREO|AV_CH_BACK_LEFT|AV_CH_BACK_RIGHT)
   95 #define AV_CH_LAYOUT_5POINT0           (AV_CH_LAYOUT_SURROUND|AV_CH_SIDE_LEFT|AV_CH_SIDE_RIGHT)
   96 #define AV_CH_LAYOUT_5POINT1           (AV_CH_LAYOUT_5POINT0|AV_CH_LOW_FREQUENCY)
   97 #define AV_CH_LAYOUT_5POINT0_BACK      (AV_CH_LAYOUT_SURROUND|AV_CH_BACK_LEFT|AV_CH_BACK_RIGHT)
   98 #define AV_CH_LAYOUT_5POINT1_BACK      (AV_CH_LAYOUT_5POINT0_BACK|AV_CH_LOW_FREQUENCY)
   99 #define AV_CH_LAYOUT_6POINT0           (AV_CH_LAYOUT_5POINT0|AV_CH_BACK_CENTER)
  100 #define AV_CH_LAYOUT_6POINT0_FRONT     (AV_CH_LAYOUT_2_2|AV_CH_FRONT_LEFT_OF_CENTER|AV_CH_FRONT_RIGHT_OF_CENTER)
  101 #define AV_CH_LAYOUT_HEXAGONAL         (AV_CH_LAYOUT_5POINT0_BACK|AV_CH_BACK_CENTER)
  102 #define AV_CH_LAYOUT_6POINT1           (AV_CH_LAYOUT_5POINT1|AV_CH_BACK_CENTER)
  103 #define AV_CH_LAYOUT_6POINT1_BACK      (AV_CH_LAYOUT_5POINT1_BACK|AV_CH_BACK_CENTER)
  104 #define AV_CH_LAYOUT_6POINT1_FRONT     (AV_CH_LAYOUT_6POINT0_FRONT|AV_CH_LOW_FREQUENCY)
  105 #define AV_CH_LAYOUT_7POINT0           (AV_CH_LAYOUT_5POINT0|AV_CH_BACK_LEFT|AV_CH_BACK_RIGHT)
  106 #define AV_CH_LAYOUT_7POINT0_FRONT     (AV_CH_LAYOUT_5POINT0|AV_CH_FRONT_LEFT_OF_CENTER|AV_CH_FRONT_RIGHT_OF_CENTER)
  107 #define AV_CH_LAYOUT_7POINT1           (AV_CH_LAYOUT_5POINT1|AV_CH_BACK_LEFT|AV_CH_BACK_RIGHT)
  108 #define AV_CH_LAYOUT_7POINT1_WIDE      (AV_CH_LAYOUT_5POINT1|AV_CH_FRONT_LEFT_OF_CENTER|AV_CH_FRONT_RIGHT_OF_CENTER)
  109 #define AV_CH_LAYOUT_7POINT1_WIDE_BACK (AV_CH_LAYOUT_5POINT1_BACK|AV_CH_FRONT_LEFT_OF_CENTER|AV_CH_FRONT_RIGHT_OF_CENTER)
  110 #define AV_CH_LAYOUT_OCTAGONAL         (AV_CH_LAYOUT_5POINT0|AV_CH_BACK_LEFT|AV_CH_BACK_CENTER|AV_CH_BACK_RIGHT)
  111 #define AV_CH_LAYOUT_HEXADECAGONAL     (AV_CH_LAYOUT_OCTAGONAL|AV_CH_WIDE_LEFT|AV_CH_WIDE_RIGHT|AV_CH_TOP_BACK_LEFT|AV_CH_TOP_BACK_RIGHT|AV_CH_TOP_BACK_CENTER|AV_CH_TOP_FRONT_CENTER|AV_CH_TOP_FRONT_LEFT|AV_CH_TOP_FRONT_RIGHT)
  112 #define AV_CH_LAYOUT_STEREO_DOWNMIX    (AV_CH_STEREO_LEFT|AV_CH_STEREO_RIGHT)

常用api

int64_t av_get_default_channel_layout(int nb_channels)

这个函数可以根据通道的个数获得默认的channel_layout

int av_get_channel_layout_nb_channels(uint64_t channel_layout)

根据通道布局获得对应的通道数

int av_get_channel_layout_channel_index(uint64_t channel_layout,uint64_t channel);

获得单通道在通道布局中的下标，注意channel必须是单通道的，比如获得AV_CH_BACK_CENTER在AV_CH_LAYOUT_4POINT0中的下标，可以得到结果为3；
根据这个下标就可以取到对应通道的数据了

音频解码

这里有个官方例子：FFmpeg: decode_audio.c
以下是跟音频相关的常用参数

typedef struct AVCodecContext {

/* audio only */
int sample_rate; ///< samples per second
int channels;    ///< number of audio channels

/**
* audio sample format
* - encoding: Set by user.
* - decoding: Set by libavcodec.
*/
 enum AVSampleFormat sample_fmt;  ///< sample format

 /* The following data should not be initialized. */
 /**
 * Number of samples per channel in an audio frame.
 *
 * - encoding: set by libavcodec in avcodec_open2(). Each submitted frame
 *   except the last must contain exactly frame_size samples per channel.
 *   May be 0 when the codec has AV_CODEC_CAP_VARIABLE_FRAME_SIZE set, then the
 *   frame size is not restricted.
 * - decoding: may be set by some decoders to indicate constant frame size
 */
int frame_size;

/**
  * Audio cutoff bandwidth (0 means "automatic")
  * - encoding: Set by user.
  * - decoding: unused
   */
   int cutoff;
  
   /**
 * Audio channel layout.
 * - encoding: set by user.
 * - decoding: set by user, may be overwritten by libavcodec.
  */
       uint64_t channel_layout;
 /**
   * Request decoder to use this channel layout if it can (0 for default)
    * - encoding: unused
    * - decoding: Set by user.
    */
   uint64_t request_channel_layout;
    /**
    * Type of service that the audio stream conveys.
     * - encoding: Set by user.
     * - decoding: Set by libavcodec.
     */
    enum AVAudioServiceType audio_service_type;
   
   /**
    * desired sample format
   * - encoding: Not used.
   * - decoding: Set by user.
   * Decoder will decode to this format if it can.
   */
  enum AVSampleFormat request_sample_fmt;
}

其中frame_size的意思就是一个packet中的采样数，比如采样率是48000,frame_size=1152,则表示每秒有48000次采样，而每个packet有1152次采样，因此一个packet的时间是1152/48000 * 1000 = 24毫秒
channel_layout是声道布局，表示多声道的个数和顺序，有了这个顺序才能顺利取到需要的数据

libswresample

libswresample主要是用于音频的重采样和格式转换的,包含如下功能：
- 采样频率转换：对音频的采样频率进行转换的处理，例如把音频从一个高的44100Hz的采样频率转换到8000Hz；从高采样频率到低采样频率的音频转换是一个有损的过程
- 声道格式转换：对音频的声道格式进行转换的处理，例如立体声转换为单声道；当输入通道不能映射到输出流时，这个过程是有损的，因为它涉及不同的增益因素和混合。
- 采样格式转换：对音频的样本格式进行转换的处理，例如把s16（AV_SAMPLE_FMT_S16）的PCM数据转换为s8格式或者f32的PCM数据；此外提供了Packed和Planar包装格式之间相互转换的功能
当音频的采样率与播放器的采样率不一致时，那么想在播放器正常播放，就需要对音频进行重采样，否则可能会出现音频变速的问题

音频转换

音频转换一般就是指planar和packed的互转，或者声道之间的转换
当我们解码后的音频数据是planar的，而我们的播放器却只支持packed的，那么我们就需要将planar转为packed,例如是双声道的话就是要将原本为LLLLRRRR的数据变为LRLRLRLR,知道这个原理后，其实两个for循环就能搞定这次转换，如下

 data_size = av_get_bytes_per_sample(dec_ctx->sample_fmt);
 for (i = 0; i < frame->nb_samples; i++)
     for (ch = 0; ch < dec_ctx->channels; ch++)
         fwrite(frame->data[ch] + data_size*i, 1, data_size, outfile);

以上只是为了更好的理解转换过程，实际上ffmpeg已经提供了相关的接口来帮助我们转换，如非特别需求，建议还是使用ffmpeg提供的转换接口
在ffmpeg中，转换主要包含3个步骤：
1 实例化SwrContext
2 计算转换后的sample个数
3 调用 swr_convert进行转换

转换的参考代码如下，主要的api都在libswresample/swresample.h

uint8_t **input;
int in_samples;

//第一种方式创建SwrContext
//SwrContext *swr = swr_alloc();
// av_opt_set_channel_layout(swr, "in_channel_layout",  AV_CH_LAYOUT_5POINT1, 0);
// av_opt_set_channel_layout(swr, "out_channel_layout", AV_CH_LAYOUT_STEREO,  0);
// av_opt_set_int(swr, "in_sample_rate",     48000,                0);
// av_opt_set_int(swr, "out_sample_rate",    44100,                0);
// av_opt_set_sample_fmt(swr, "in_sample_fmt",  AV_SAMPLE_FMT_FLTP, 0);
// av_opt_set_sample_fmt(swr, "out_sample_fmt", AV_SAMPLE_FMT_S32,  0);

//第二种方式创建SwrContext，以下代码作用等同于上面的
SwrContext *swr = swr_alloc_set_opts(NULL,  // we're allocating a new context
                         AV_CH_LAYOUT_STEREO,  // out_ch_layout
                         AV_SAMPLE_FMT_S32,    // out_sample_fmt
                         44100,                // out_sample_rate
                         AV_CH_LAYOUT_5POINT1, // in_ch_layout
                         AV_SAMPLE_FMT_FLTP,   // in_sample_fmt
                         48000,                // in_sample_rate
                         0,                    // log_offset
                         NULL);                // log_ctx


//在得到SwrContext后就要进行初始化 ，如果SwrContext的参数有任何变化，则必须再次调用以下初始化函数
swr_init(swr)；

//这里演示修改了第三个参数为AV_SAMPLE_FMT_S16，则需要再次调用swr_init
swr = swr_alloc_set_opts(swr,  
                         AV_CH_LAYOUT_STEREO,  // out_ch_layout
                         AV_SAMPLE_FMT_S16,    // out_sample_fmt
                         44100,                // out_sample_rate
                         AV_CH_LAYOUT_5POINT1, // in_ch_layout
                         AV_SAMPLE_FMT_FLTP,   // in_sample_fmt
                         48000,                // in_sample_rate
                         0,                    // log_offset
                         NULL);                // log_ctx
                         
swr_init(swr)；//再次调用

//计算转换后的采样数samples,计算公式为 in_samples*out_sample_rate=out_samples*in_sample_rate
//该运算在数学上等价于a * b / c，最后一个参数可以支持多种取舍
int out_samples = av_rescale_rnd(swr_get_delay(swr, //获取下一个输入样本相对于下一个输出样本将经历的延迟
												48000)//输入采样率 
									+in_samples, 
                                     44100, //输出采样率
                                     48000, //输入采样率
                                     AV_ROUND_UP);//表示向上取整，如3/2=2

//根据转换后的音频参数分配一块缓冲来存储数据
uint8_t *  output[8];//用于存储转换后的数据
//分配一个样本缓冲区，并相应地填充数据指针和行大小
//可以使用av_freep（＆output [0]）释放分配的样本缓冲区
  av_samples_alloc(&output,//[out]
    				 NULL, //[out]
    				 2, //通道数
    				 out_samples,//采样数
                     AV_SAMPLE_FMT_S16, //采样格式
                     0);//对齐，0--默认，1--不对齐

 out_samples = swr_convert(swr, 
   						      &output, //转换后的数据
   						      out_samples,
                              input, //要转换的数据
                              in_samples);

if(swr_get_out_samples(swr,0)>0){//表示有缓冲数据
//通过设置in和in_count为0将缓存中的全部处理完毕，这通常是最后一步，如果没有这步，则可能最后的音频数据会存在缓冲中没有全部转换出来
  out_samples = swr_convert(swr, 
   						      &output, 
   						      out_samples,
                              NULL, 
                              0);
}
                             
swr_free(&swr)；//最后释放

swr_convert()在转换过程中如果输入采样数大于输出采样数，那么超出的部分会被Swresample缓存起来，因此输出采样数这个参数要根据输入采样数和已经存在的缓存进行计算，否则可能会导致缓存的采样数越来越多，内存一直在上涨；当in和in_count都为0时，就表示要把缓存中数据都输出出来了
swr_get_out_samples()函数的意思是获得下一个输出样本缓冲的数量，相同的输入返回值并不是一样的，这取决于内部的缓存采样数的多少；我们知道，swr_convert在调用后，如果输入的采样数比输出的采样数大，那么Swresample便会对超出的那部分进行缓存，如果输入一直比输出大，那么内存就会一直上涨，为此，我们需要swr_get_out_samples这个函数让我们得知输出应该为多大才能把缓冲里的数据也带走，比如Swresample里已经有10个采样数的缓存了，此时输入如果为100个采样数，那么我们希望输出为110（这是在不改变采样率的情况下），这样就能把所有数据都输出，缓存也清空了，就不会引起内存上涨，那么怎么得到这个110呢，通过swr_get_out_samples（swr,100）=110；如果swr_get_out_samples（swr,0）就表示获得Swresample已经缓存的采样数；最后总结一下，swr_get_out_samples就是根据你的输入采样数，得到应该取走的输出采样数，如果输入采样数为0，那么就能得到已经缓存的采样数，得到这个输出采样数后，我们才知道应该通过av_samples_alloc为输出样本分配多大的缓存空间
swr_get_delay()这个暂时也没搞懂

音频重采样

https://blog.csdn.net/eydwyz/article/details/78748312 ffmpeg解码音频数据时，进行重采样（即改变文件原有的采样率）_Python_eydwyz的专栏-CSDN博客

参考

https://blog.csdn.net/qq_18998145/article/details/97394595 ffmpeg音频存储格式packed和planar_LIEY-CSDN博客
https://www.cnblogs.com/wangguchangqing/p/5851490.html FFmpeg学习4：音频格式转换 - Brook_icv - 博客园
https://blog.csdn.net/eydwyz/article/details/78748241 (25条消息)FFmpeg关于nb_smples,frame_size以及profile的解释_eydwyz的专栏-CSDN博客
https://blog.csdn.net/eydwyz/article/details/78748312 ffmpeg解码音频数据时，进行重采样（即改变文件原有的采样率）_Python_eydwyz的专栏-CSDN博客
https://www.jianshu.com/p/bf5e54f553a4 FFmpeg音频重采样API(libswresample) - 简书

华为机试HJ16：购物单系统的动态规划设计思路剖析Java最优解代码 _JC_Chris 华为动态规划 java 算法数据结构
0.写在前面“华为机试HJ16：购物单”是一道“物品间有依赖关系”的【01背包问题】，属于经典dp问题的变形。对于基础薄弱的同学来说，本题的思维难度不低，建议先了解“普通01背包问题”的基本求解思路——bilibili辅助学习视频（预计学习时间15min）1.题目描述王强决定把年终奖用于购物，他把想买的物品分为两类：主件与附件，附件是从属于某个主件的，下表就是一些主件与附件的例子：主件附件电脑打印
搭载热成像的无人机安防救援大有前途 weixin_33958585 人工智能前端 ViewUI
经过几十年的发展，红外热成像技术已经广泛应用于军事、医疗、工业生产、消防等领域，更是在近几年开启了民用化的发展趋势。对于安防而言，热成像技术的出现，为视频监控在光线不足时增加了夜视和透视的功能，在整个安防行业的发展历程中起到至关重要的作用。随着技术的不断革新，现如今，热成像技术也正在不断朝着新应用、新领域发展，今天我们来聊聊热成像技术与无人机和智能化的结合所迸发出的火花。热成像技术与无人机和智能化
红外热成像拥抱无人机迸发安防救援新活力 weixin_34244102 人工智能前端 ViewUI
经过几十年的发展，红外热成像技术已经广泛应用于军事、医疗、工业生产、消防等领域，更是在近几年开启了民用化的发展趋势。对于安防而言，热成像技术的出现，为视频监控在光线不足时增加了夜视和透视的功能，在整个安防行业的发展历程中起到至关重要的作用。随着技术的不断革新，现如今，热成像技术也正在不断朝着新应用、新领域发展，今天我们来聊聊热成像技术与无人机和智能化的结合所迸发出的火花。自然界中一切物体，只要温度
JVM --- 类的生命周期 Wangwq. 八股文 JVM
一、类的生命周期加载-----》校验-----》准备-----》解析-----》初始化-----》使用-----》卸载二、类加载过程1、加载（1）主要工作：通过类的全限定名来获取定义此类的二进制字节流。将这个类字节流代表的静态存储结构转换为方法区的运行时数据结构。在堆中生成了一个代表此类的java.lang.Class对象，作为访问这些方法区的数据入口。（2）支持的两种类加载器：引导类加载器用户（
nodejs应用ogg转换mp3格式热情仔 js ffmpeg ogg
首先你要安装ffmpeg三选一npminstallffmpegcnpminstallffmpegyarninstallffmpeg看下目录constffmpeg=require('ffmpeg')constfs=require("fs");constpath=require('path');//先读取所有的ogg文件constfiles=fs.readdirSync("./ogg");letcou
基于YOLOv8+PyQt5的密集人群计数检测系统人工智能教学实践 YOLO qt 目标检测
基于YOLOv8+PyQt5的密集人群计数检测系统是一个结合了目标检测算法与图形用户界面的项目，以下是相关介绍：【毕业设计参考】基于yolov8+pyqt5的密集人群计数检测系统.zip资源-CSDN文库系统概述该系统旨在实时分析某一区域内的人群数量与分布情况，将YOLOv8算法的高效目标检测能力与PyQt5框架的简洁直观界面相结合，能够实时捕获视频流，通过YOLOv8进行人群检测，并在用户界面中
光纤FPV无人机技术详解无人机技术圈无人机技术无人机
1.技术基础与原理光纤FPV（FirstPersonView，第一人称视角）无人机技术，是将光纤通信技术与无人机技术相结合的一项创新技术。该技术通过光纤作为高速、低延迟的数据传输媒介，实现了无人机拍摄的高清视频信号实时回传至地面控制站，为飞行员提供身临其境的飞行体验。光纤传输以其超大带宽、超强抗干扰性和极低延迟的特性，极大地提升了FPV无人机的性能和应用范围。1、无人机类型：电动多旋翼；1、最大飞
ssh创建密钥ansible批量分发 liujiangxu linux ssh linux
ssh-keygen命令用于为“ssh”生成、管理和转换认证密钥，它支持RSA和DSA两种认证密钥SSH密钥默认保留在~/.ssh目录中id_rsa：私钥文件id_rsa.pub：公钥文件known_hosts：ssh访问不同的主机会将公钥记录到此文件，每次访问会核对密钥创建ssh密钥[root@ceshi-128~]#ssh-keygen-trsaGeneratingpublic/private
服务器中的流量主要是指什么？ wanhengidc 服务器运维流量
服务器流量就是指服务器在单位时间内所传输的数据量，服务器流量在互联网中起着十分重要的作用，一般会被用来处理网站的访问请求，当用户在网站中浏览网页和视频时，服务器会接收到用户的请求，同时会返回网站的内容。服务器流量能够决定服务器可以处理的用户访问量和反应速度，服务器中的高流量则表示着可以同时处理多种用户请求，还可以保证网站正常运行和响应用户请求。服务器流量也是评估服务器性能的重要参考指标之一，管理员
利用jQuery实现h5播放器播放组件我是真的不会前端 html5 jquery javascript 前端
播放组件介绍首先会H5播放组件其实自带videoaudio标签，只需要引入添加属性就可以自动在网页上播放，同样，vue和react也有相应的播放插件。比如vue-video-player和reactnative的播放组件这里提供一个npm地址https://www.npmjs.com/package/vue-video-playerhttps://www.npmjs.com/package/rea
web自动化——前端知识大哥喝阔落前端自动化运维
是HTML中的一个元素，用于在当前网页中嵌入另一个网页或文档。它就像一个“窗口”，可以在页面中显示其他内容。主要特点：嵌入外部内容：可以在网页中嵌入其他网页、视频、地图等。独立上下文：嵌入的内容与主页面相互独立，拥有自己的JavaScript和CSS环境。可定制：可以通过属性调整大小、边框等。常用属性：src：指定要嵌入内容的URL。width和height：设置iframe的宽度和高度。fram
【软件测试】冒烟测试详解测试杂货铺 python 软件测试自动化测试测试工具职场和发展程序人生压力测试
视频学习：文末有免费的配套视频可观看点击文末小卡片，免费获取软件测试全套资料，资料在手，涨薪更快冒烟测试介绍冒烟测试一词，来源于电路板测试：电路板拼接或组装完成后，进行通电测试，如果冒烟，则说明存在缺陷。而软件应用中，对其的定义为：在软件开发过程中的一种针对软件版本包的快速基本功能验证策略，是对软件基本功能进行确认验证的手段，并非深入测试。通过冒烟测试，可以快速判断提测软件包是否具有可测性，也可以
为AI聊天工具添加一个知识系统之73 详细设计之14 正则表达式之1 一水鉴天智能制造人工语言软件智能网络人工智能
本文要点要点今天讨论“当代符号学的正则表达式：StringProcessor”。StringProcessor被视为当代符号学的正则表达式，表达的是思维的纯粹形式（逻辑表示无关，语言表达无关，程序实现无关）。StringProcessor自带投影规则-关注空性中心（符号学立场），它内嵌转换规则-隐藏共性内核（建筑术视角）和外挂映射规则-悬置个性外壳（诠释学观点）。正则表达式的三方智能合约：字母转换
为AI聊天工具添加一个知识系统之72 详细设计之13 图灵机一水鉴天软件智能人工语言智能制造人工智能
本文要点要点实际上是要设计一个图灵机，利用λ转换规则和λ演算来定义StringProcessor的发生产规则的转换功能。三种文法型运行图灵机来处理不同的串---符号串，数字串和文字串一个StrIngProcessor，图灵机（利用λ转换规则和λ演算来定义StringProcessor的发生产规则的转换功能），三种串(字符/数字/文字)，三种语法公式（term/atom/formula），三种文法型
【计算机组成原理】带符号整数的表示——补码与反码蒙奇D索大保姆级教学计算机组成原理(CO)408 改行学it 笔记经验分享考研
反码与补码导读一、补码1.1原码转补码1.2补码转原码二、反码三、原码、补码、反码的相互转换结语导读大家好，很高兴又和大家见面啦！！！在上一篇内容中我们介绍了有符号整数的原码形式，有符号整数的原码表示法中，我们需要了解以下内容：机器数最高位为符号位——0为正，1为负；除最高位以外的二进制位为数值位原码形式的取值范围：−(2n−1−1)～2n−1−1-(2^{n-1}-1)～2^{n-1}-1−(2
系统设计面试题慢慢慢时光面试准备面试系统设计
比较开放，需要灵活应对，列出基本的一些思路。文章目录**设计一个短网址服务**：如何将长网址转换为短网址，并支持短网址的生成、存储、解析和重定向等功能**设计一个分布式文件系统**：考虑如何实现文件的存储、访问、备份、容错等功能，以及如何处理大规模数据和高并发访问。**设计一个聊天系统**：包括消息的发送、接收、存储、展示等功能，以及如何处理实时通信、离线消息、群聊等需求设计一个推荐系统：根据用户
JVM学习总结——十一、JVM的JIT 技术分子深入理解Java虚拟机 jvm
JIT的全称是Justintimecompilation，中文称之为即时编译。JIT编译器作用当虚拟机发现某个方法或代码块运行特别频繁时，就会把这些代码认定为HotSpotCode热点代码，为了提高热点代码的执行效率，在运行时，虚拟机将会把这些代码编译成与本地平台相关的机器码，并进行各层次的优化。为什么引入JIT?通常Javac将程序源码编译，转换成java字节码，JVM通过解释字节码将其翻译成相
探索人工智能在计算机视觉领域的创新应用与挑战戒了9 人工智能学习方法
一、引言1.1研究背景与意义在科技飞速发展的当下，人工智能（ArtificialIntelligence,AI）已然成为引领新一轮科技革命和产业变革的重要驱动力。作为AI领域的关键分支，计算机视觉（ComputerVision,CV）致力于让计算机具备像人类一样理解和解析图像、视频等视觉信息的能力，近年来取得了令人瞩目的进展。二者的深度融合，更是为众多领域带来了前所未有的变革与机遇。从技术发展历程
【Java Web】JSON 以及 JSON 转换一二¬ #Java Web java json
JSON（JavaScriptObjectNotation）一种灵活、高效、轻量级的数据交换格式，广泛应用于各种数据交换和存储场景。基本特点1、简单易用：JSON格式非常简单，易于理解和使用。2、轻量级：相比XML等其他数据格式，JSON占用的空间更小，传输效率更高。3、跨平台：JSON是一种纯文本格式，可以轻松地在不同的系统和编程语言之间交换数据。4、可读性强：JSON格式的数据结构清晰，易于阅
Java学习day002 Java程序设计环境（下载安装JDK、使用命令行工具、使用集成开发环境、运行图形化应用程序） Z zehao Java基础学习 java 后端
使用的教材是java核心技术卷1，我将跟着这本书的章节同时配合视频资源来进行学习基础java知识。day002Java程序设计环境（下载安装JDK、使用命令行工具、使用集成开发环境、运行图形化应用程序）第一部分安装java开发工具包下载JDK要想下载Java开发工具包，可以访问Oracle网站：www.oracle.com/technetwork/java/javase/downloads,在得到
ES6——Set集合和Map集合练习题阿常11 es6 前端 ecmascript
根据前一篇文章，让ai给我们出下面的练习题：Set练习题创建一个Set并添加数字1到10，然后将其转换为数组并打印。编写一个函数，接收一个数组作为参数，返回一个新的数组，新数组只包含原数组中唯一的元素（去重）。创建一个Set，添加多个元素，然后使用delete方法移除特定元素，打印剩余元素的数量。使用for...of循环遍历一个Set，打印每个元素。将一个数组转换为Set，然后添加一个新元素，再转
JavaFX - 文本遗憾皆是温柔 JavaFX学习区学习 java 开发语言 ide
JavaFX应用程序可以包含许多元素，包括各种媒体，如图像、视频、GIF和所有维度的形状、文本等。这是为了提高应用程序的用户体验质量。所有这些元素都由JavaFX场景图上的节点表示。在本章中，我们将学习如何使用JavaFX在应用程序上显示Text节点。JavaFXText节点JavaFX中的文本节点由名为Text的类表示，该类属于包javafx.scene.text。此类包含多个属性，用于在Jav
参考图像分割Referring Image Segmentation（RIS）和开放词汇语义分割Open Vocabulary Semantic Segmentation 余弦的倒数深度学习 CV 笔记计算机视觉深度学习
一、参考图像分割基本概念：ReferringImageSegmentation（RIS）是一种图像分割技术，旨在根据自然语言表达来标记图像或视频中表示对象实例的像素。也就是根据自然语言描述来实现图像分割。旨在根据自然语言表达来标记图像或视频中的特定区域。在给定描述区域的自然语言文本的情况下，RIS需要在图像中找到相应的区域。这个任务是众所周知的具有挑战性的视觉和语言任务之一。RIS需要收集目标区域
【机器学习】自定义数据集使用tensorflow框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测加德霍克 tensorflow 逻辑回归人工智能 python 作业
一、使用tensorflow框架实现逻辑回归1.数据部分：首先自定义了一个简单的数据集，特征X是100个随机样本，每个样本一个特征，目标值y基于线性关系并添加了噪声。tensorflow框架不需要numpy数组转换为相应的张量，可以直接在模型中使用数据集。2.模型定义部分：方案1：model=tf.keras.Sequential([tf.keras.layers.Dense(1,input_sh
openWRT高大全版x86固件By eSir PlayGround [2024V1] 大叔是90后大叔 Linux 软路由 Openwrt 软路由
2024年最新openWRT高大全版x86固件ByeSirPlayGround[2024V1]包含镜像文件和转换后的ESXI虚拟机文件安装教程参考软路由安装openwrt
当在树莓派上运行 OpenCV 摄像头代码时出现摄像头打不开李宇杰28 opencv 开发语言
当在树莓派上运行OpenCV摄像头代码时出现“libv4l2:erroropeningvideodevice”报错，通常表示在打开视频设备（即摄像头）时遇到了问题。以下是一些可能的原因及解决办法：1.摄像头连接问题物理连接检查：首先确保摄像头与树莓派的物理连接是稳固的。对于树莓派摄像头模块（如官方的CSI摄像头），要检查连接线是否正确插入到树莓派对应的接口上，并且没有松动或损坏。如果是通过USB接
碰一碰发视频怎么做的？操作流程详深度解析 hy14762_ 人工智能用户运营流量运营新媒体运营
NFC碰一碰发视频，是一种结合了NFC技术、短视频矩阵及AI智能算法的创新宣传方式。此方式旨在为商家提供一种高效且便捷的AI打卡手段，通过这种新型的互动体验，用户能够享受高效打卡新奇感受。商家需开通并登录碰一碰发视频服务后台，设置信息、创建短视频库、文案库、话题库、图片库等。一般像餐饮就建议拍摄门头、菜品、环境、员工工作场景等，并上传至素材库。具体流程包括前期准备和触发发布两部分：前期准备需要创建
Python 录音转文字 @小张不嚣张 python 开发语言
在Python中,可以使用第三方库来实现录音文件转文字的功能。一个常用的库是speech_recognition。importspeech_recognitionassr#创建语音识别器r=sr.Recognizer()#从录音文件读取音频withsr.AudioFile('audio_file.wav')assource:audio_data=r.record(source)#使用GoogleS
python如何实现音频转文本(使用百度语音转文本库) xiaojiawen python 开发语言
1pipinstallBaidu-Aip2在百度开放平台上注册账号，并在控制台中创建应用，选择短语音转文本应用，有几万次的免费配额，超过次数需要付费(价格贵)，如图是我自己的注意事项：1，音频文件不能是mp3文件，需要将mp3文件转为无损音乐格式：如flac，wav，pcm等等2，音频文件需要控制在60s以内，如果大于60s，则会报文本超过限制的错误importosfromaipimportAip
视频网站服务器为什么需要使用负载均衡？ wanhengidc 服务器负载均衡运维
随着视频网站等娱乐活动的逐渐增加，进行使用的用户数量也在不断上升，大量的用户会给视频网站行业带来一定的访问压力，需要处理大量的媒体资料，比如上传视频图片和数据保存发布等内容，会消耗大量的带宽资源，增加服务器的负载力。所以，视频网站服务器一般会使用负载均衡技术来减轻一定的压力，下面小编就来具体介绍一下服务器使用负载均衡的原因都有哪些？负载均衡技术会将大量的访问请求分散到多个服务器上，当大量的用户同时
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象

ffmpeg简单分析系列----音频（audio）

文章目录

ffmpeg简单分析系列----音频（audio）

采样格式

通道布局（channel layout）

常用api

int64_t av_get_default_channel_layout(int nb_channels)

int av_get_channel_layout_nb_channels(uint64_t channel_layout)

int av_get_channel_layout_channel_index(uint64_t channel_layout,uint64_t channel);

音频解码

libswresample

音频转换

音频重采样

相关计算

参考

你可能感兴趣的:(ffmpeg,视频,audio,ffmpeg,音频转换)