weixin_30765505

ffmpeg文档17-视频编码器

17 视频编码器

介绍一些当前有效的视频编码器

libtheora

libtheora的封装

编译需要头和库文件，还需要利用--enable-libtheora在配置中允许

更多信息参考http://www.theora.org/

libtheora选项

下面是映射给libtheora的全局选项，它们对品质和码率产生影响。

b

对CBR（固定码率编码）设置码率，单位bit/s，在VBR（动态码率编码）模式下本选项被忽略。
flags

设置是否允许qscale标志（恒定质量模式——VBR模式下）在pass1和pass2`（2次编码方式）
g

设置GOP尺寸
global_quality

设置全局质量，在 lambda工具集中是一个整数单位的倍数

仅在VBR模式中，同时允许了 +qscale。这个值会除以`FF_QP2LAMBDA转换为QP,范围为[0 - 10]，再乘以6.3得到本地有效libtheora范围[0-63]，越大质量越高
q

仅作VBR模式下，设置为非负数。作为双精度浮点质量单位值，用于转换计算QP

值范围为 [0-10] ，再乘以 6.3 将获得libtheora有效质量参数，范围[0-63]

这个选项仅用于ffmpeg命令行工具，库接口使用global_quality

libtheora例子

使用最大恒定质量（VBR）编码:

ffmpeg -i INPUT -codec:v libtheora -q:v 10 OUTPUT.ogg
使用CBR 1000 kbps编码 Theora视频流:

ffmpeg -i INPUT -codec:v libtheora -b:v 1000k OUTPUT.ogg

libvpx

VP8/VP9格式支持，通过libvpx

编译需要头和库文件，还需要利用--enable-libvpx在配置中允许

libvpx选项

下面的选项被libvpx封装支持，部分等效的vpxenc-XXX类型的选项或者值列在括号中。

为了减少文件复制，只有私有的选项和一些需要特别注明（注意）的记录在这里，其他的请参考[10 编码]章节

为了了解更多关于libvpx的选项，可以在命令行中使用ffmpeg -h encoder=libvpx或者ffmpeg -h encoder=libvpx-vp9或vpxenc --help来获取。进一步信息可以在libvpx API文档中获取。

b (target-bitrate)

设置码率，单位bits/注意FFmpeg中b选项的单位是bits/s，而在vpxenc中目标码率单位是kilobits/s。
g (kf-max-dist)
keyint_min (kf-min-dist)
qmin (min-q)
qmax (max-q)
bufsize (buf-sz, buf-optimal-sz)

设置码率控制缓冲区大小(单位bits)。注意在vpxenc中是指定为多少milliseconds（毫秒），这个封装库通过下面的公式进行转换： buf-sz = bufsize * 1000 / bitrate, buf-optimal-sz = bufsize * 1000 / bitrate * 5 / 6.
rc_init_occupancy (buf-initial-sz)

设置解码开始前需要加载到RC的预加载数, 注意vpxenc中指定多少 milliseconds（毫秒），这个封装库按下面公式转换: rc_init_occupancy * 1000 / bitrate.
undershoot-pct

设置数据下冲（min）的目标比特率
overshoot-pct

设置数据上冲(max)目标比特率
skip_threshold (drop-frame)
qcomp (bias-pct)
maxrate (maxsection-pct)

设置GOP最大比特率，单位 bits/s ，注意vpxenc描述这个为目标码率，这个封装中按如下公式计算： (maxrate * 100 / bitrate).
minrate (minsection-pct)

设置GOP最小比特率，单位 bits/s ，注意vpxenc描述这个为目标码率，这个封装中按如下公式计算： (minrate * 100 / bitrate).
minrate, maxrate, b end-usage=cbr

(minrate == maxrate == bitrate).
crf (end-usage=cq, cq-level)

quality, deadline (deadline)

‘best’

  使用最优质量期限，不是非常慢，这个选项指定可以有不低于`good`的输出质量（稍微慢一些）。

‘good’

  使用高质量期限，它在速度、质量，以及CPU使用间进行均衡。

‘realtime’

  使用实时质量期限

speed, cpu-used (cpu-used)

设置质量/速度比，高的参数值将加大编码质量成本
nr (noise-sensitivity)
static-thresh

设置一个变化阀值，低于它将被编码器跳过
slices (token-parts)

注意，FFmpeg指定的是切片分区总数，而vpxenc中是标记部分的log2值
max-intra-rate

设置最大I帧比特率作为目标比特率的百分比，0表示不限
force_key_frames

VPX_EFLAG_FORCE_KF

Alternate reference frame related

auto-alt-ref

  启用备用参考帧，只在2次编码的pass2起效

arnr-max-frames

  设置altref降噪的最大帧数

arnr-type

  设置altref降噪参考过滤类型: backward, forward, centered.

arnr-strength

  设置altref降噪滤波强度

rc-lookahead, lag-in-frames (lag-in-frames)

  设置向前参考帧码率控制

error-resilient

允许错误弹性

VP9-specific options

lossless

  允许lossless（无损）模式

tile-columns

  设置采用的tile columns数，**注意**这里参数是log2(tile_columns)值，例如 8 tile columns要设置 tile-columns 选项值为3.

tile-rows

  设置采用的tile rows数， **注意**这里参数是log2(tile_rows). 例如 4 tile rows要设置 tile-rows 选项为2.

frame-parallel

  允许并行可译特性

aq-mode

  设置自适应量化模式： (0:关闭 (默认), 1: 方差 2: 复合, 3: 循环刷新).

libwebp

WebP图片编码封装

liebwebp是google提高的对于WebP图像格式的编码器，它提供任意有损/无损编码模式。有损图像本质上是对VP8框架的封装。无损图像由google单独编码器支持。

libwebp 像素格式

当前libwebp只支持YUV420的有损图像和RGB无损。两种模式都支持透明通道。因为API限制了进行RGB有损和YUV420无损编码时像素格式会自动转换使用libwebp库中要求的格式（暨无损用RGB，有损用YUV420）。所以这样做无意义，只是提供了接口。

libwebp选项

-lossless boolean

允许/禁止无损编码，默认为0（禁止）
-compression_level integer

对于有损，设置质量/速度比，高的值表示获取高质量（同样尺寸）需要更多编码成本（时间）。对于无损，是尺寸/速度比，高的值意味要获取小的尺寸需要更多的成本。更具体的说，就是它控制了额外算法和压缩工具的使用，这些工具的组合使用将影响编码质量/效率。它映射到libwebp选项，有效范围是0-6，默认为4
-qscale float

对于有损编码，控制品质，范围0-100。对于无损编码，控制资源和时间花费在压缩更多。默认值为75.注意使用livavcodec时它对应于global_quality*FF_QP2LAMBDA.

-preset type

选取预置选项。提供一些常规可用设置：

none

  不采用预置

default

  默认预置

picture

  数码图片，例如人像拍摄、室内拍摄、

photo

  室外图像，自然光 lighting

drawing

  手绘或者画线，具有高对比度的细节

icon

  小尺寸彩色图像

text

  文本之类的

libx264,libx264rgb

x264 H.264/MPEG-4 AVC 编码器封装

编译需要头和库文件，还需要利用--enable-libx264在配置中允许

libx264提供一些令人印象深刻的特性，包括8x8和4x4自适应空间变化，自适应B帧，CAVLC/CABAC 熵编码，交织（MBAFF），无损模式，物理优化细节保留（自适应量化、psy-RD，psy-trellis）等等

大多数libx264编码器选项均是映射值ffmpeg全局编码选项，仅有少量的是私有的，他们通过libx264中函数x264_param_parse, x264opts和x264-params提供的单个选项或key=value序列的多个选项

参考 http://www.videolan.org/developers/x264.html以了解更多x264项目内容。

libx264rgb和libx264类似，只是一个是编码RGB像素格式，一个是针对YUV像素格式的。

支持的像素格式

x264支持8 到 10 bit的颜色空间。确切的颜色深度在x264配置时设置，在一个特定编译版本的FFmpeg中只支持一种颜色深度，换句话就是不同位深需要多个版本的ffmpeg x264.

libx264 libx264rgb 选项

下面的选项被libx264（libx264rgb）封装支持，所有的等效 x264-XXX形式的选项和值都列在括号中。

这里只列出了需要特别说明或者私有的选项，其他选项参考[10 编码选项]部分。

为了更多的了解关于libx264的选项，可以使用x264 --full-help（需要x264命令行工具）或者参考libx264文档。

b (bitrate)

设置码率，单位bits/s，注意FFmpeg的码率单位是bits/s,而x264中码率单位是kilobits/s.
bf (bframes)
g (keyint)
qmin (qpmin)

最小量化尺度
qmax (qpmax)

最大量化尺度
qdiff (qpstep)

量化尺度最大差值
qblur (qblur)

模糊量化曲线
qcomp (qcomp)

量化曲线压缩因子
refs (ref)

每一帧可以使用参考帧数，范围0-16.
sc_threshold (scenecut)

设置场景变化检测阈值
trellis (trellis)

执行网格量化以提高效率。默认情况下启用。
nr (nr)
me_range (merange)

像素运动最大搜索范围

me_method (me)

设置运动估计方法。按速度递减顺序可能值：

‘dia (dia)’
‘epzs (dia)’

  半径为1菱形搜索 (fastest). ‘epzs’是‘dia’的别名

‘hex (hex)’

  半径为2的正六边形搜索。

‘umh (umh)’

  多层次六边形搜索。

‘esa (esa)’

  穷举搜索。

‘tesa (tesa)’

  Hadamard(阿达玛)穷举搜索（最慢）。

subq (subme)

亚像素运动估计方法。
b_strategy (b-adapt)

自适应B帧布局决策算法。仅第一次使用。
keyint_min (min-keyint)

最小 GOP 尺寸

coder

设置熵编码器，可能值:

‘ac’

  允许CABAC.

‘vlc’

  允许CAVLC而且禁止 CABAC. 它类似于x264中的`--no-cabac`

cmp

设置全像素运动估计比较算法，可能值:

‘chroma’

  允许chroma

‘sad’

  忽略chroma，其等效于 x264中的`--no-chroma-me`

threads (threads)

编码线程数

thread_type

设置多线程技术，可能值:

‘slice’

  切片多线程，它等效于x264中的`--sliced-threads`

‘frame’

  基于帧的多线程

flags

设置编码标志，它和-cgop配合可以用来关闭GOP或者打开GOP，类似于x264中的--open-gop
rc_init_occupancy (vbv-init)
preset (preset)

设置编码预置
tune (tune)

设置编码参数整定
profile (profile)

设置配置文件的限制。
fastfirstpass

参数为1则当第一次编码（pass1）允许快速设置，参数为0，表示禁止快速设置（等效于x264的--slow-firstpass）
crf (crf)

设为质量恒定模式（类VBR）
crf_max (crf-max)

CRF模式下，防止VBV降低质量超越的阀值
qp (qp)

设定量化率控制方法参数。
aq-mode (aq-mode)

设置AQ方法，可能值

‘none (0)’
```
  禁止.
```
‘variance (1)’
```
  方差AQ (复杂蒙版).
```
‘autovariance (2)’
```
  自动方差AQ (实验). 
```
aq-strength (aq-strength)

设置AQ强度，减少阻塞平面和纹理区域模糊。
psy

为1表示使用视觉优化。为0则禁用（等效 x264的--no-psy）
psy-rd (psy-rd)

在psy-rd：psy-trellis中设置视觉优化强度
rc-lookahead (rc-lookahead)

设置向前预测参考帧数.
weightb

为1设置帧加权预测，否则为0表示禁止（等效于x264的--no-weightb）
weightp (weightp)

设置P帧加权预测法，可能值:

‘none (0)’
```
  禁止 
```
‘simple (1)’
```
  使用加权参考 
```
‘smart (2)’
```
  使加权文献和重复 
```
ssim (ssim)

允许在编码结束后技术输出SSIM
intra-refresh (intra-refresh)

为1表示使用周期内刷新代替IDR帧设置
avcintra-class (class)

配置编码器生成AVC-Intra，有效值50，100，200
bluray-compat (bluray-compat)

配置兼容蓝光标准，是 "bluray-compat=1 force-cfr=1"的简写
b-bias (b-bias)

设置B帧如何被影响
b-pyramid (b-pyramid)

设置保持一些B帧作为参考集的方法，允许值:

‘none (none)’
```
  禁用. 
```
‘strict (strict)’
```
  严格的分层金字塔 
```
‘normal (normal)’
```
  Non-strict (非蓝光兼容). 
```
mixed-refs

为1表示每个分区使用一个参考，而不是每个宏块一个参考，否则为0，其等效于x264的 --no-mixed-refs
8x8dct

为1指采用自适应空间变换矩阵大小 (8x8变换) ，否则为0，等效于x264的--no-8x8dct
fast-pskip

为1表示早期跳过检查。等效于x264的--no-fast-pskip
aud (aud)

为1启用访问单元分隔设置
mbtree

为1表示允许使用宏块树，否则（为0）等效于x264的--no-mbtree
deblock (deblock)

设置环路滤波参数，参数型为alpha:beta
cplxblur (cplxblur)

QP波动减少（压缩前曲线压缩）

partitions (partitions)

设置分区规格，参考后面逗号分隔的列表，可能值有:

‘p8x8’

  8x8 P帧 分区

‘p4x4’

  4x4 P帧 分区 .

‘b8x8’

  4x4 B帧分区

‘i8x8’

  8x8 I帧分区.

‘i4x4’

  4x4 I帧分区 (‘p4x4’的前提是‘p8x8’也被设置，允许‘i8x8’ 则需要设置了8x8dct被允许)

‘none (none)’

  不考虑分区

‘all (all)’

  考虑所有可能分区

direct-pred (direct)

设置直接MV预测模式，可能值:

‘none (none)’
```
  禁止MV预测 
```
‘spatial (spatial)’
```
  使空间预测
```
‘temporal (temporal)’
```
  使时间的预测
```
‘auto (auto)’
```
  自动识别 
```
slice-max-size (slice-max-size)

设置每个分片的字节大小限制，单位字节，如果不设置但RTP载荷设置了就使用RTP载荷
stats (stats)

设置多次编码的文件名称
nal-hrd (nal-hrd)

设置HRD信息信号 (要求vbv-bufsize被设置). 可能值:

‘none (none)’
```
  禁用HRD信息信号
```
‘vbr (vbr)’
```
  可变比特率
```
‘cbr (cbr)’
```
  固定比特率 (MP4容器不允许). 
```
x264opts (N.A.)

设置任意的x264选项，参看x264 --fullhelp 以获取列表

参数是一个由':'分隔的key=value序列。对于filter和psy-rd选项，也是有":"被','代替作为分隔符。

例如，要指定使用libx264编码：

ffmpeg -i foo.mpg -vcodec libx264 -x264opts keyint=123:min-keyint=20 -an out.mkv
x264-params (N.A.)

使用 : 分隔的 key=value 参数覆盖x264配置，

这个选项类似x264opts，但其兼容Libav

例如:

ffmpeg -i INPUT -c:v libx264 -x264-params level=30:bframes=0:weightp=0:
cabac=0:ref=1:vbv-maxrate=768:vbv-bufsize=2000:analyse=all:me=umh:
no-fast-pskip=1:subq=6:8x8dct=0:trellis=0 OUTPUT

此外编码ffpresets还支持一些通用的选项，可以参考前述[ 预置 ]相关文档。

libx265

x265 H.265/HEVC 编码器封装

编译需要头和库文件，还需要利用--enable-libx265在配置中允许

libx265选项

preset

设置x265预置
tune

设置x265可调参数
x265-params

使用':'分隔的key=value列表进行选项设置，参考 x265 --help 获取支持的选项

例如采用libx265,并利用-x265-params进行选项设置:

ffmpeg -i input -c:v libx265 -x265-params crf=26:psy-rd=1 output.mp4

libxvid

Xvid MPEG-4 Part 2 封装

编译需要livxvidcore头和library库文件，还需要利用--enable-libxvid --enable-gpl在配置中允许

当前原生的mpeg4编码器支持MPEG-4 Part 2格式，所以不一定需要这个库了。

libxvid选项

下面选项是libxvid封装支持的选项，其中部分只列出，而没有文档介绍是因为其同[10 编码选项]中通用选项一致，其它没有列出的通用选项则在库中无效。

b
g
qmin
qmax
mpeg_quant
threads
bf
b_qfactor
b_qoffset

flags

设置编码标志，可能值:

‘mv4’

  对宏块使用4个运动检测

‘aic’

  允许高品质AC预测

‘gray’

  只编码灰度

‘gmc’

  全局运动补偿(GMC).

‘qpel’

  1/4像素运动补偿

‘cgop’

  关闭GOP.

‘global_header’

  在每个关键帧放置全局头extradata

trellis

me_method

设置运动估计方法.按速度降低，质量增加排列的可能值:

‘zero’

  不使用运动估计方法 (默认).

‘phods’
‘x1’
‘log’

  启用16x16块和16x16块半像素细化进行菱形区域搜索， ‘x1’和‘log’是‘phods’别名

‘epzs’

  允许前述所有值，再加上8x8菱形区域搜索，8x8半像素细化，并在色度平面进行运动估计

‘full’

  允许所有的 16x16和8x8 区域搜索

mbd

设置宏块选择算法，依质量提高的可能值:

‘simple’

  使用宏块比较函数算法 (默认).

‘bits’

  允许16x16块半像素和1/4像素细化失真估计

‘rd’

  允许上述所有可能值，再加上8x8块半像素和1/4像素细化失真估计，并采用方形图案失真估计进行搜索。

lumi_aq

为1允许lumi遮蔽自适应量化，默认为0 (禁止).
variance_aq

为1允许方差的自适应量化,默认为0 (禁止).

如果结合lumi_aq,由此产生的质量不会比任何一个单独规定。换句话说，所得到的质量会差于单独使用任何一个选项的效果。

ssim

设置结构信息（SSIM）显示方法。可能的值：

‘off’

  禁止SSIM信息

‘avg’

  在编码后输出平均SSIM。格式为：

  Average SSIM: %f

  对那些不熟悉C的的用户，f表示浮点数或者小数 (例如 0.939232)

‘frame’

  在编码过程中输出每帧SSIM，并且在编码结束后输出平均SSIM，每帧信息格式为：

         SSIM: avg: %1.3f min: %1.3f max: %1.3f

  对那些不熟悉C的的用户，%1.3f表示3位小数的浮点数(例如0.932).

ssim_acc

设置SSIM精度。可用的选项参数是在0-4范围的整数，而0给出了最准确的结果和计算速度最快的4。

mpeg2

MPEG-2编码器

mpeg2选项

seq_disp_ext integer

指定是否写一个 sequence_display_extension到输出

-1
auto

  自动检测是否写，是默认值，如果数据被写入不同于默认或指定的值则判断是否写

0
never

  从不写

1
always

  一直写

png

png图像编码器

png选项

dpi integer

设置像素的物理密度，每英寸点数，没有默认设置

dpm integer

设置像素的物理密度，每米点数，没有默认设置

ProRes

Apple ProRes编码器

FFmpeg包含2种ProRes编码器，prores-aw和prores-ks。它们可以由-vcodec选项指定

prores-ks私有选项

profile integer

选择ProRes属性（预置）配置来编码，可能值：

‘proxy’
‘lt’
‘standard’
‘hq’
‘4444’
quant_mat integer

选择的量化矩阵,可能值：

‘auto’
‘default’
‘proxy’
‘lt’
‘standard’
‘hq’

如果选择auto, 匹配属性的量化矩阵会被选中，如果没有设置，则选择最高质量的量化矩阵
bits_per_mb integer

分配的宏块位，不同的属性在200-2400间，最大值为8000
mbs_per_slice integer

每个切片中宏块数（1-8），默认为8，几乎是所有情况下最好值
vendor string

重写4字节的供应商ID。例如apl0这个自定义供应商ID会被认为是由苹果编码器产生。
alpha_bits integer

指定alpha分量的比特数。可能的值是0，8和16。用0禁用alpha平面编码

速度考虑

在默认操作模式下，编码器以高质量为目的（即在不产生超过要求的帧数据限定下，使输出质量尽可能好）。这种情况下帧内很多小的细节是很难压缩的，编码器将花更多的时间为每个片寻找合适的量化。

所以设置更高的bits_per_mb限额将提高速度。

要获取最快的编码速度，则设置qscale参数（4为推荐值）和不设置帧数据大小限制。

转载于:https://www.cnblogs.com/xdsnet/p/5196517.html

你可能感兴趣的:(ffmpeg,人工智能)

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
windows下python opencv ffmpeg读取摄像头实现rtsp推流拉流图像处理大大大大大牛啊 opencv实战代码讲解视觉图像项目 windows python opencv
windows下pythonopencvffmpeg读取摄像头实现rtsp推流拉流整体流程1.下载所需文件1.1下载rtsp推流服务器1.2下载ffmpeg2.开启RTSP服务器3.opencv读取摄像头并调用ffmpeg进行推流4.opencv进行拉流5.opencv异步拉流整体流程1.下载所需文件1.1下载rtsp推流服务器下载RTSP服务器下载页面https://github.com/blu
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
pyhon+ffmpeg 常用音视频处理命令不再游移 ffmpeg 音视频 python
FFmpeg是多媒体领域的万能工具。只要涉及音视频领域的处理，基本上没有它做不了的事情！通俗点讲，从视频录制、视频编辑再到播放，它都能做！前段时间做了个短视频自动化脚本项目，需要自动处理音视频（包括一些合成、拼接、转场、调色等等），当时做的时候找各种命令还是很痛苦的，因此对用到的所有处理命令做了个汇总，方便以后使用。目录一、获取音频时长二、获取视频信息三、获取视频时长四、多个视频合并五、视频提取视
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
bat+ffmpeg批处理图片，图片批量转码张雨zy 音视频 ffmpeg
直接在cmd中输入//批量转码文件for%ain("*.png")doffmpeg-i"%a"-fs1024k"%~na.webp"//删除所有pngdel*.png@echooff表示执行了这条命令后关闭所有命令(包括本身这条命令)的回显。而echooff命令则表示关闭其他所有命令(不包括本身这条命令)的回显，@的作用就是关闭紧跟其后的一条命令的回显脚本完整代码写入脚本中后，需要多加一个%，例如
ffmpeg批量将tif文件转成jpeg格式 winfredzhang 图像工具 ffmpeg tif jpeg 转换
1、cmd2、切换到安装ffmpeg的路径。3、输入命令：ffmpeg-start_number001-i"D:\ocr\%03d.tif"-start_number001-pix_fmtyuv420p-qscale:v1"D:\ocr\%03d.jpg"结果。
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
使用ffmpeg将pcm格式音频转化为mp3格式音频布丁小站 ffmpeg pcm 音视频
voidAudioCode::ENcode(AVCodecContext*cdc_ctx,AVFrame*frame,AVPacket*pkt){intret=0;/*sendtheframeforencoding*/ret=avcodec_send_frame(cdc_ctx,frame);if(ret=0){ret=avcodec_receive_packet(cdc_ctx,pkt);if(
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL