山河已无恙

基于 Wav2Lip-GFPGAN 深度学习模型的数字人Demo

写在前面

工作中遇到简单整理
博文为 Wav2Lip-GFPGAN 环境搭建运行的 Demo
理解不足小伙伴帮忙指正

对每个人而言，真正的职责只有一个：找到自我。然后在心中坚守其一生，全心全意，永不停息。所有其它的路都是不完整的，是人的逃避方式，是对大众理想的懦弱回归，是随波逐流，是对内心的恐惧 ——赫尔曼·黑塞《德米安》

Demo简单介绍

Wav2Lip-GAN

Wav2Lip-GAN 是一种基于生成对抗网络（GAN）的语音到唇形的转换模型。https://github.com/Rudrabha/Wav2Lip

基本原理是使用语音信号和人脸图像来训练一个生成器网络，该网络可以将输入的语音信号转换为对应的唇形。

该模型包括两个子网络：

一个是语音识别网络，用于将语音信号转换为文本；
另一个是唇形生成网络，用于将文本和人脸图像作为输入，生成对应的唇形。

两个网络通过GAN框架进行训练，以使生成的唇形尽可能地逼真。在测试阶段，给定一个语音信号和一个人脸图像，该模型可以生成一个与语音信号相对应的唇形序列，从而实现语音到唇形的转换。

GFPGAN

腾讯 GFPGAN 是一种基于生成对抗网络（GAN）的图像超分辨率模型。https://github.com/TencentARC/GFPGAN

基本原理是使用低分辨率的图像作为输入，通过生成器网络将其转换为高分辨率的图像。

该模型包括两个子网络：

一个是生成器网络，用于将低分辨率图像转换为高分辨率图像；
另一个是判别器网络，用于评估生成的图像是否逼真。

两个网络通过GAN框架进行训练，以使生成的图像尽可能地接近真实图像。在测试阶段，给定一个低分辨率的图像，该模型可以生成一个与之对应的高分辨率图像。腾讯GFPGAN采用了一些创新的技术，如渐进式训练、自适应实例归一化等，使得其在图像超分辨率任务中表现出色。

Demo 来自下面的项目完成，小伙伴可以直接参考。作者提供了一个ipynb Demo GitHub\Wav2Lip-GFPGAN\Wav2Lip-GFPGAN.ipynb,有基础小伙伴按照步骤即可完成，下面的就不需要看了

https://github.com/ajay-sainy/Wav2Lip-GFPGAN/

有困难的小伙伴可以克隆下面的这个，fork 了上面的项目，提供了当前搭建环境步骤，需要的素材脚本：

https://github.com/LIRUILONGS/Wav2Lip-GFPGAN_Python_Demo

涉及到的模型和安装包下载

Wav2Lip

可以在项目中看到下载路径: https://github.com/Rudrabha/Wav2Lip

Wav2Lip：https://iiitaphyd-my.sharepoint.com/:u:/g/personal/radrabha_m_research_iiit_ac_in/Eb3LEzbfuKlJiR600lQWRxgBIY27JZg80f7V9jtMfbNDaQ?e=TBFBVW

Wav2Lip + GAN　：https://iiitaphyd-my.sharepoint.com/:u:/g/personal/radrabha_m_research_iiit_ac_in/EdjI7bZlgApMqsVoEUUXpLsBxqXbn5z8VTmoxp55YNDcIA?e=n9ljGW

ffmpeg: https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-essentials.7z ,Linux 环境直接用包管理工具安装即可

ffmpeg 装完之后 win系统需要配置环境变量，这里不多讲。

GFPGAN

GFPGANv1.3.pth:https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.3.pth

parsing_parsenet.pth:https://github.com/xinntao/facexlib/releases/download/v0.2.2/parsing_parsenet.pth

detection_Resnet50_Final.pth:https://github.com/xinntao/facexlib/releases/download/v0.1.0/detection_Resnet50_Final.pth

环境安装

wav2lip 环境

当前系统环境为 window11,Anaconda3 使用CPU 跑，虚拟环境创建

C:\Users\liruilong>conda create -n wav2lip python=3.8
C:\Users\liruilong>conda info --envs
# conda environments:
#
base                  *  C:\ProgramData\Anaconda3
myenv                    C:\Users\liruilong\AppData\Local\conda\conda\envs\myenv
wav2lip                  C:\Users\liruilong\AppData\Local\conda\conda\envs\wav2lip

切换虚拟环境的时候，报错了

C:\Users\liruilong>conda activate wav2lip
.....

后来在Anaconda Prompt (Anaconda3) 可以正常执行

(base) C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN>conda activate wav2lip

(wav2lip) C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN>conda list
.....

安装 requirements.txt 中的依赖库，直接安装报错了

(wav2lip) C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN>pip install -r requirements.txt   -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
Looking in indexes: http://pypi.douban.com/simple/

需要添加 --use-pep517

(wav2lip) C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN>pip install -r requirements.txt   -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com  --use-pep517
Looking in indexes: http://pypi.douban.com/simple/

检测 wav2lip 环境运行Demo 测试一下，当前项目预留了一些素材，这里使用模型wav2lip.pth

(wav2lip) C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN>python .\Wav2Lip-master\inference.py --checkpoint_path .\Wav2Lip-master\checkpoints\wav2lip.pth --face .\inputs\kim_7s_raw.mp4 --audio .\inputs\kim_audio.mp3 --outfile result.mp4
Using cpu for inference.
Reading video frames...
Number of frames available for inference: 223
Extracting raw audio...
...................................
[libx264 @ 0000022caf538200] Weighted P-Frames: Y:1.2% UV:1.2%
[libx264 @ 0000022caf538200] ref P L0: 68.7%  8.6% 16.2%  6.4%
[libx264 @ 0000022caf538200] ref B L0: 75.0% 20.2%  4.8%
[libx264 @ 0000022caf538200] ref B L1: 94.9%  5.1%
[libx264 @ 0000022caf538200] kb/s:1433.66
[aac @ 0000022caf528940] Qavg: 237.868

运行完会在当前目录生成 result.mp4 文件

https://www.bilibili.com/video/BV1fX4y187jW/

然后用模型wav2lip_gan.pth 在试下

(wav2lip) C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN>python .\Wav2Lip-master\inference.py --checkpoint_path  .\inputs\wav2lip_gan.pth --face .\inputs\kim_7s_raw.mp4 --audio .\inputs\kim_audio.mp3 --outfile result.mp4
Using cpu for inference.

https://www.bilibili.com/video/BV1Vo4y1T7F2/

这里 wav2lip 环境已经安装完成

GFPGAN 环境

准备一个新的音视频，使用 wav2lip_gan 生成，准备GFPGAN 环境

(wav2lip) C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN>python .\Wav2Lip-master\inference.py --checkpoint_path  .\inputs\wav2lip_gan.pth --face .\inputs\demo.mp4 --audio .\inputs\demo_5_y.mp3 --outfile result.mp4
Using cpu for inference.
Reading video frames...
Number of frames available for inference: 2116
Extracting raw audio..
。。。。。。。。。。。。。。。。。。。。。
[libx264 @ 000001ba2a798d80] i8 v,h,dc,ddl,ddr,vr,hd,vl,hu: 18% 18% 48%  3%  2%  2%  2%  3%  3%
[libx264 @ 000001ba2a798d80] i4 v,h,dc,ddl,ddr,vr,hd,vl,hu: 23% 22% 17%  6%  6%  6%  6%  7%  8%
[libx264 @ 000001ba2a798d80] i8c dc,h,v,p: 49% 20% 22%  8%
[libx264 @ 000001ba2a798d80] Weighted P-Frames: Y:0.0% UV:0.0%
[libx264 @ 000001ba2a798d80] ref P L0: 80.9% 10.0%  6.6%  2.5%
[libx264 @ 000001ba2a798d80] ref B L0: 87.8% 10.5%  1.7%
[libx264 @ 000001ba2a798d80] ref B L1: 98.7%  1.3%
[libx264 @ 000001ba2a798d80] kb/s:703.37
[aac @ 000001ba2a79a780] Qavg: 170.234

(wav2lip) C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN>

https://www.bilibili.com/video/BV1cX4y1h7k8/

创建一个结果文件夹

PS C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN> mkdir results


    目录: C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN


Mode                 LastWriteTime         Length Name
----                 -------------         ------ ----
d-----          2023/6/9      7:14                results


PS C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN>

需要把上面生成的文件移到这个文件夹里面，然后执行下面的脚本

# day1.py

wav2lipFolderName = 'Wav2Lip-master'
gfpganFolderName = 'GFPGAN-master'
wav2lipPath =  '.\\' + wav2lipFolderName
gfpganPath = '.\\' + gfpganFolderName
outputPath = ".\\results"

import cv2
from tqdm import tqdm
from os import path

import os

# 上一步生成的视频
inputVideoPath = outputPath+'\\result.mp4'
# 中间数据
unProcessedFramesFolderPath = outputPath+'\\frames'

if not os.path.exists(unProcessedFramesFolderPath):
  os.makedirs(unProcessedFramesFolderPath)

vidcap = cv2.VideoCapture(inputVideoPath)
numberOfFrames = int(vidcap.get(cv2.CAP_PROP_FRAME_COUNT))
fps = vidcap.get(cv2.CAP_PROP_FPS)
print("FPS: ", fps, "Frames: ", numberOfFrames)

for frameNumber in tqdm(range(numberOfFrames)):
    _,image = vidcap.read()
    cv2.imwrite(path.join(unProcessedFramesFolderPath, str(frameNumber).zfill(4)+'.jpg'), image)

print("unProcessedFramesFolderPath:",unProcessedFramesFolderPath)
print("inputVideoPath:",inputVideoPath)

作用是将wav2lip处理的视频按帧数逐帧读取，将每一帧保存为 JPEG 格式的图片，并将这些图片保存到指定的文件夹 unProcessedFramesFolderPath 中

(wav2lip) C:\Users\liruilong\Documents\GitHub\Wav2Lip-GFPGAN>python day1.py
FPS:  25.0 Frames:  1793
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1793/1793 [00:10<00:00, 166.99it/s]
unProcessedFramesFolderPath:  
inputVideoPath: .\results\result.mp4

(wav2lip) C:\Users\liruilong\Documents\GitHub\Wav2Lip-GFPGAN>

之后会在 .\results\frames 看到切好的照片

现在准备 GFPGAN-master 的环境

(wav2lip) C:\Users\liruilong\Documents\GitHub\Wav2Lip-GFPGAN\GFPGAN-master>pip install -r requirements.txt -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com --use-pep517
Looking in indexes: http://pypi.douban.com/simple/
..........
Installing collected packages: numpy, scikit-image
  Attempting uninstall: numpy
    Found existing installation: numpy 1.23.5
    Uninstalling numpy-1.23.5:
      Successfully uninstalled numpy-1.23.5
  Attempting uninstall: scikit-image
    Found existing installation: scikit-image 0.20.0
    Uninstalling scikit-image-0.20.0:
      Successfully uninstalled scikit-image-0.20.0
Successfully installed numpy-1.20.3 scikit-image-0.19.3

(wav2lip) C:\Users\liruilong\Documents\GitHub\Wav2Lip-GFPGAN\GFPGAN-master>

GFPGANv1.3.pth 模型放到 /experiments/pretrained_models 目录下

(wav2lip) C:\Users\liruilong\Documents\GitHub\Wav2Lip-GFPGAN\GFPGAN-master>mkdir -p .\\experiments\pretrained_models

(wav2lip) C:\Users\liruilong\Documents\GitHub\Wav2Lip-GFPGAN\GFPGAN-master>cd  .\\experiments\pretrained_models

确认模型

    目录: C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN\GFPGAN-master\experiments\pretrained_models


Mode                 LastWriteTime         Length Name
----                 -------------         ------ ----
-a----          2023/6/7      1:43      348632874 GFPGANv1.3.pth

之后执行下面的命令

python inference_gfpgan.py -i $unProcessedFramesFolderPath -o $outputPath -v 1.3 -s 2 --only_center_face --bg_upsampler None

替换对应的变量，如果模型无法下载，需要把前面下载的放到指定位置

(wav2lip) C:\Users\liruilong\Documents\GitHub\Wav2Lip-GFPGAN\GFPGAN-master>python inference_gfpgan.py -i ..\results\frames -o ..\results -v 1.3 -s 2 --only_center_face --bg_upsampler None
C:\Users\liruilong\AppData\Local\conda\conda\envs\wav2lip\lib\site-packages\torchvision\transforms\functional_tensor.py:5: UserWarning: The torchvision.transforms.functional_tensor module is deprecated in 0.15 and will be **removed in 0.17**. Please don't rely on it. You probably just need to use APIs in torchvision.transforms.functional or in torchvision.transforms.v2.functional.
  warnings.warn(
C:\Users\liruilong\AppData\Local\conda\conda\envs\wav2lip\lib\site-packages\torchvision\models\_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
C:\Users\liruilong\AppData\Local\conda\conda\envs\wav2lip\lib\site-packages\torchvision\models\_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=None`.
  warnings.warn(msg)
Downloading: "https://github.com/xinntao/facexlib/releases/download/v0.1.0/detection_Resnet50_Final.pth" to C:\Users\liruilong\AppData\Local\conda\conda\envs\wav2lip\lib\site-packages\facexlib\weights\detection_Resnet50_Final.pth

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 104M/104M [00:06<00:00, 16.1MB/s]
Downloading: "https://github.com/xinntao/facexlib/releases/download/v0.2.2/parsing_parsenet.pth" to C:\Users\liruilong\AppData\Local\conda\conda\envs\wav2lip\lib\site-packages\facexlib\weights\parsing_parsenet.pth

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 81.4M/81.4M [00:05<00:00, 14.8MB/s]
0it [00:00, ?it/s]
  warnings.warn(msg)
  0%|                                                                                                                                                                                  | 0/1793 [00:00<?, ?it/s]Processing 0000.jpg ...
  0%|                                                                                                                                                                        | 1/1793 [00:06<3:18:38,  6.65s/it]Processing 0001.jpg ...
  0%|▏                                                                                                                                                                       | 2/1793 [00:13<3:18:06,  6.64s/it]P
...............................
(wav2lip) C:\Users\liruilong\Documents\GitHub\Wav2Lip-GFPGAN\GFPGAN-master>

OK 跑完之后，需要用处理的图片合成视频，执行下面的脚本



import os


outputPath = ".\\results"

restoredFramesPath = outputPath + '\\restored_imgs\\'
processedVideoOutputPath = outputPath

dir_list = os.listdir(restoredFramesPath)
dir_list.sort()

import cv2
import numpy as np

batch = 0
batchSize = 300
from tqdm import tqdm
for i in tqdm(range(0, len(dir_list), batchSize)):
  img_array = []
  start, end = i, i+batchSize
  print("processing ", start, end)
  for filename in  tqdm(dir_list[start:end]):
      filename = restoredFramesPath+filename;
      img = cv2.imread(filename)
      if img is None:
        continue
      height, width, layers = img.shape
      size = (width,height)
      img_array.append(img)


  out = cv2.VideoWriter(processedVideoOutputPath+'\\batch_'+str(batch).zfill(4)+'.avi',cv2.VideoWriter_fourcc(*'DIVX'), 30, size)
  batch = batch + 1
 
  for i in range(len(img_array)):
    out.write(img_array[i])
  out.release()

concatTextFilePath = outputPath + "\\concat.txt"
concatTextFile=open(concatTextFilePath,"w")
for ips in range(batch):
  concatTextFile.write("file batch_" + str(ips).zfill(4) + ".avi\n")
concatTextFile.close()

concatedVideoOutputPath = outputPath + "\\concated_output.avi"
print("concatedVideoOutputPath:",concatedVideoOutputPath)

finalProcessedOuputVideo = processedVideoOutputPath+'\\final_with_audio.avi'
print("finalProcessedOuputVideo:",finalProcessedOuputVideo)
# ffmpeg -y -f concat -i {concatTextFilePath} -c copy {concatedVideoOutputPath} 

#ffmpeg -y -i {concatedVideoOutputPath} -i {inputAudioPath} -map 0 -map 1:a -c:v copy -shortest {finalProcessedOuputVideo}

#from google.colab import files
#files.download(finalProcessedOuputVideo)

(wav2lip) C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN>python day2.py
  0%|                                                                                                                                                                                     | 0/6 [00:00<?, ?it/s]processing  0 300

  0%|                                                                                                                                                                                   | 0/300 [00:00<?, ?it/s]
  4%|██████▏                                                                                                                                                                  | 11/300 [00:00<00:02, 107.59it/s]
  7%|███████████▊                                                                                                                                                             | 21/300 [00:00<00:02, 104.49it/s]
 11%|██████████████████
 ...................
 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 293/293 [00:02<00:00, 107.10it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:25<00:00,  4.26s/it]
concatedVideoOutputPath: .\results\concated_output.avi
finalProcessedOuputVideo: .\results\final_with_audio.avi

(wav2lip) C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN>

使用 ffmpeg 合并视频

PS C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN> cd .\results\
PS C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN\results> ffmpeg -y -f concat -i .\concat.txt  -c copy .\concated_output.avi
.....................
frame= 1793 fps=0.0 q=-1.0 Lsize=   24625kB time=00:00:59.76 bitrate=3375.3kbits/s speed=1.76e+03x
video:24577kB audio:0kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.197566%
PS C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN\results> ls


    目录: C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN\results


Mode                 LastWriteTime         Length Name
----                 -------------         ------ ----
d-----          2023/6/9      7:25                frames
d-----          2023/6/9     11:03                restored_imgs
-a----          2023/6/9     11:42        4231050 batch_0000.avi
-a----          2023/6/9     11:42        4274254 batch_0001.avi
-a----          2023/6/9     11:42        4281898 batch_0002.avi
-a----          2023/6/9     11:42        4165970 batch_0003.avi
-a----          2023/6/9     11:42        4222324 batch_0004.avi
-a----          2023/6/9     11:42        4069836 batch_0005.avi
-a----          2023/6/9     11:42            126 concat.txt
-a----          2023/6/9     11:52       25216450 concated_output.avi
-a----          2023/6/9      7:22        7515594 result.mp4

使用 ffmpeg 合并视频和音频

PS C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN\results> ffmpeg -y -i .\concated_output.avi -i ..\inputs\demo_5_y.mp3  -map 0 -map 1:a -c:v copy -shortest  .\final_with_audio.avi
ffmpeg version git-2020-08-31-4a11a6f Copyright (c) 2000-2020 the FFmpeg developers
........
frame= 1793 fps=699 q=-1.0 Lsize=   25618kB time=00:00:59.76 bitrate=3511.2kbits/s speed=23.3x
video:24577kB audio:934kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.417315%
PS C:\Users\山河已无恙\Documents\GitHub\Wav2Lip-GFPGAN\results>

生成结果

https://www.bilibili.com/video/BV1914y1U7dH/

关于 Demo 和小伙伴分享到这里

博文部分内容参考

https://github.com/ajay-sainy/Wav2Lip-GFPGAN

你可能感兴趣的:(AI认知HarmonyOS笔记,深度学习,人工智能,Wav2Lip-GFPGAN,数字人)

C#用递归的方法复制指定文件夹下所有文件(包括子文件夹)到指定位置未来无限 C#语言 c#递归的方法复制文件到另一个路径包含子文件覆盖
publicpartialclassForm1:Form{publicForm1(){InitializeComponent();}//////实现复制整个文件夹到另一个路径，如果存在此文件夹，便覆盖/////////publicstaticvoidCopyDir(stringsrcPath,stringaimPath){try{//检查目标目录是否以目录分割字符结束如果不是则添加if(aimPa
DDD 分层架构实战指南：从项目结构到落地挑战
一、项目结构详解（以电商订单系统为例）src/main/java├──com.example│├──common#通用工具类、基础异常、常量│├──order#订单限界上下文（模块示例）││├──interfaces#用户接口层│││├──controller#HTTP/RESTAPI│││├──rpc#Dubbo/gRPC接口│││└──consumer#消息队列消费者（如Kafka监听）││├
Open AI在AI人工智能领域的技术安全防护体系 AI智能探索者 AI Agent 智能体开发实战人工智能安全网络 ai
OpenAI在AI人工智能领域的技术安全防护体系关键词：OpenAI、AI安全、技术防护、伦理框架、模型对齐、数据隐私、对抗攻击摘要：本文将深入探讨OpenAI在人工智能领域构建的多层次技术安全防护体系。我们将从基础概念出发，逐步解析OpenAI如何通过技术创新和系统设计来确保AI系统的安全性、可靠性和可控性。文章将涵盖从数据安全到模型对齐，从伦理框架到实际防护技术的全方位内容，帮助读者全面理解现
十年磨一剑，笔耕不辍：我的创作之路与质量工程情怀 blues_C 创作纪念日
十年磨一剑，笔耕不辍：我的创作之路与质量工程情怀前言机缘：从实战沉淀到知识共享收获：从数字增长到精神富足日常：创作，已是生活的一部分憧憬：深耕质量，智创未来前言时光荏苒，转眼间我的技术博客也迎来了又一个重要的里程碑。回首这些年与代码、与测试、与技术文字为伴的日子，心中充满了感慨与感恩。感谢CSDN这个平台，也感谢每一位阅读、点赞、评论和支持我的读者朋友。正是这份互动与认可，让我在这条创作之路上乐此
揭秘自然语言处理在AI人工智能领域的奥秘 AI智能探索者 AI Agent 智能体开发实战人工智能自然语言处理 easyui ai
揭秘自然语言处理在AI人工智能领域的奥秘关键词：自然语言处理、AI人工智能、语言理解、语言生成、语义分析摘要：本文深入探讨了自然语言处理（NLP）在AI人工智能领域的奥秘。首先介绍了自然语言处理的背景，包括目的、预期读者、文档结构和相关术语。接着阐述了自然语言处理的核心概念与联系，通过文本示意图和Mermaid流程图进行展示。详细讲解了核心算法原理和具体操作步骤，并用Python源代码进行阐述。分
003-128 最长连续序列 Ernest_NEU 算法 leetcode
题目我的思考+word题解题解题解思路classSolution{publicintlongestConsecutive(int[]nums){SetnumSet=newHashSet<>();for(intnum:nums){numSet.add(num);}intmaxLength=0;for(intnum:numSet){if(!numSet.contains(num-1)){intcurN
Android之提示Failed to load WebView provider: No WebView installed 码莎拉蒂 . Andriod 积累 Android Failed to load WebView No WebView installed
1问题FatalException:android.util.AndroidRuntimeException:android.webkit.WebViewFactory$MissingWebViewPackageException:FailedtoloadWebViewprovider:NoWebViewinstalledatandroid.webkit.WebViewFactory.getPro
数字ic后端设计从入门到精通9（含fusion compiler, tcl教学）setup time, hold time check lib/report详解 soulermax 单片机嵌入式硬件
checklib标准单元库中建立时间和保持时间约束的check格式用于数字IC设计中的静态时序分析（STA）。它定义了如何用表格形式表达触发器等顺序单元在不同输入信号和时钟转换速率下的建立和保持时间。（对应工艺角的lib文件）示例结构pin(D){direction:input;...timing(){related_pin:"CK";timing_type:"setup_rising";rise
数字ic后端设计从入门到精通8（含fusion compiler, tcl教学）ULVTLL、LVT、ULVT详解及应用 soulermax 硬件架构
LVTvsULVTvsULVTLL：从PPA、成本的角度出发比较维度LVTULVTULVTLL阈值电压(Vth)中等低极低但经过优化减少泄漏开关速度中等快略慢于ULVT但优于LVT驱动能力较低高较高，略低于ULVT漏电流较低高显著低于ULVT动态功耗中等低低静态功耗低高低面积小小略大（因需额外技术减少泄漏）延迟中等到高低略高于ULVT但低于LVT适用场景常规路径关键路径对功耗敏感的关键路径成本相对
数字IC后端流程简述 roc-ever 芯片数字ic
1.设计输入目标：接收前端设计（如RTL代码和约束文件）的输出。工具：前端设计工具（如SynopsysDesignCompiler或CadenceGenus）。步骤：确保前端设计的RTL代码经过综合并生成了门级网表（Netlist）。收集约束文件（Constraints），如时序约束（SDC文件）、功率约束等。2.综合（Synthesis）目标：将高层次的RTL代码转化为门级网表。工具：Synop
【Power Compiler手册】6.反标翻转活动 QRBQ94 数字IC低功耗设计数字IC 低功耗设计 Power Compiler saif
5.反标翻转活动可以对设计中的切换活动进行反标，以生成准确的功耗计算。有关不同类型切换活动信息以及如何在门级设计上进行反标的信息，请参阅以下主题：反标切换活动的类型使用RTLSAIF文件反标切换活动使用门级SAIF文件反标切换活动
【软件工程】Waitress + Nginx 部署 Python Web 服务 meisongqing nginx python WEB
下面是完整的Windows系统部署方案，使用Waitress作为WSGI服务器运行Python后端，Nginx作为反向代理同时提供前端服务：项目结构text复制下载myapp/├──backend/#Python后端│├──app.py#Flask应用入口│├──requirements.txt#Python依赖│└──api/#API模块├──frontend/#前端文件│├──index.ht
2025年 Java 面试八股文（20w字）持续学习多模态大模型 java
目录第一章-Java基础篇1、你是怎样理解OOP面向对象???难度系数：?2、重载与重写区别???难度系数：?3、接口与抽象类的区别???难度系数：?4、深拷贝与浅拷贝的理解???难度系数：?5、sleep和wait区别???难度系数：?6、什么是自动拆装箱?int和Integer有什么区别???难度系数：?7、==和equals区别???难度系数：?8、String能被继承吗为什么用final修
【LangChain编程：从入门到实践】AI 大模型检索增强生成 RAG 实践 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LangChain编程：从入门到实践-AI大模型检索增强生成RAG实践关键词：LangChain,RAG,大语言模型,检索增强生成,向量数据库,嵌入模型,提示工程1.背景介绍在人工智能和自然语言处理领域,大语言模型(LargeLanguageModels,LLMs)的出现无疑是一个重大突破。像GPT-3、GPT-4这样的模型展现出了惊人的语言理解和生成能力,为各种应用场景带来了无限可能。然而,这些
基于深度学习的线上问诊系统设计与实现（Python+Django+MySQL）神经网络15044 深度学习算法神经网络 python 深度学习 django 机器学习人工智能算法目标检测
基于深度学习的线上问诊系统设计与实现（Python+Django+MySQL）一、系统概述本系统结合YOLOv8目标检测和ResNet50图像分类算法，构建了一个智能线上问诊平台。系统支持用户上传医学影像（皮肤照片/X光片），自动分析并生成诊断报告，同时提供医生审核功能。二、技术栈后端框架：Django4.2数据库：MySQL8.0深度学习：YOLOv8：皮肤病变区域检测ResNet50：肺炎X光
热更新调试鸿蒙版flutter代码步骤(harmonyos next flutter debug) chenbin___ harmonyos flutter 华为
调试鸿蒙版flutter代码步骤1、VsCode中终端运行flutterbuildhap--debug2、DevEco启动调试模式3、返回VsCode如下图1步骤启动运行和调试4、选择鸿蒙真机调试如下图2步骤5、修改flutter代码保存后，VsCode使用F5运行代码，或者点击如下图3步骤6、在VsCode中flutter代码打断点，可以正常调试代码
HarmonyOS 创建 createAudioCapturer 时候报错误码 6800301 chenbin___ harmonyos
一、错误码6800301的信息错误码6800301，表示包含参数校验异常、权限校验异常、系统处理异常（具体错误查看系统日志）。本人遇到的问题是，申请了麦克风权限，但是未弹出提示用户授权，所以权限校验失败了。二、配置权限src/main/module.json5文件中配置如下内容"requestPermissions":[{"name":"ohos.permission.MICROPHONE","r
数字后端中的PDC check是什么？ Reese_Reese 后端概念梳理数字后端 ICC2
在数字后端设计（PhysicalDesignClosure）中，PDC（PhysicalDesignConstraints）check是确保芯片物理实现符合设计约束的关键验证步骤，主要针对布局布线后的物理设计规则和约束一致性进行检查。以下是其核心要点：1.PDCcheck的定义与目的作用：验证物理设计（如布局、时钟树、布线）是否满足用户定义的约束文件（如SDC、UPF）以及工艺厂提供的物理规则（如
Web性能测试常用指标（转自百度AI） chenbin___ typescript html5 javascript
Web性能测试常用指标Web性能测试涉及多个维度的指标，主要分为前端页面性能指标和后端服务性能指标两大类，以下为关键指标详解：一、前端页面性能指标通过浏览器开发者工具（如ChromeDevTools）或专用工具（如Lighthouse）监测：首次内容绘制（FirstContentfulPaint,FCP）浏览器首次渲染文本/图像的时间，反映初始加载速度。目标值：≤1.8秒1最大内容绘制（Large
免费AI助手工具深度测评：Claude4本地化部署与实战应用指南 yangshuo1281 人工智能
免费AI助手工具深度测评：Claude4本地化部署与实战应用指南AI无限对话免费Rovo工具Claude4碾压cursor和augment前言在AI工具日益普及的今天，大多数高质量的AI助手都需要付费订阅或有使用限制。然而，最近发现了一款基于Claude4的免费AI助手工具，仅69MB大小却功能强大，支持本地文件的增删改查操作。本文将通过实际测试，详细分析这款工具的功能特性、使用方法以及在实际开发
风车OVF 1.2：AI开发环境完全指南 - 打造Linux下的Augment与Cursor一站式解决方案 yangshuo1281 augment cursor linux 人工智能 linux 运维
风车OVF1.2：AI开发环境完全指南-打造Linux下的Augment与Cursor一站式解决方案一站式AI续杯|cursor|augment|linux|OVF|虚拟机前言在AI辅助编程工具快速发展的今天，Augment和Cursor已成为开发者不可或缺的编程助手。然而，Windows环境下的限制和复杂配置往往让用户望而却步。本文将详细介绍风车OVF1.2虚拟机系统，这是一个专为AI开发优化的
苹果端Cursor免费额度与模型受限终极解决方案 yangshuo1281 mac 服务器运维
苹果端Cursor免费额度与模型受限终极解决方案作者：https://xoxome.online苹果端cursor终极免费版限制解决方案|白嫖|续杯|免费|ForMac前言在AI辅助开发领域，Cursor因其强大的AI对话与代码生成能力受到苹果用户青睐。但不少开发者在使用免费账号时，会遇到如下技术难题：免费额度用尽，无法继续体验高级模型（如cloud3.5、gemini2.5pro）新账号/新环境
mac安装linux时触控板不能用,苹果笔记本安装Win10触摸板右键无法使用的处理方法... 旁间拓式
一位用户反馈自己在苹果笔记本MacBookair上安装了Windows10系统，可是后面发现触摸板右键根本无法使用，这是怎么回事呢？其实，这个是和苹果笔记本安装win7时的设置一样的，我们需要在BootCamp中进行设置。接下来，就随小编一起看看具体方法吧！方法如下：1、首先你确定已经安装过BootCamp,如果没有去苹果官方下载相应版本BootCamp下载(注意按机型下载)。如果已经安装过，那么
数据类型：String 绵阳的脑内SSD #redis ------redis分专栏数据库 redis
String目录SetGetMsetMgetIncrIncrbySubstrGetrangeSetrangeString是字符串类型，redis给我们提供了String类型的value，但是内部的实现一共有三种：int、embstr、raw；三种的不同之处在于当value长度较小的时候使用embstr和int，当value长度较大的时候使用raw；另外，当value长度较小的时候，如果是一个数字，
python里面的全局变量和局部变量的区别（很好的一篇文章，找不到出处，原作者看到请联系，我会署上名字） scuter_yu 全局变量与局部变量的区别 python
python中，对于变量作用域的规定有些不一样。在诸如C/C++、java等编程语言中，默认在函数的内部是可以直接访问在函数外定义的全局变量的，但是这一点在python中就会有问题，下面是一个例子。[plain]viewplaincopy在CODE上查看代码片派生到我的代码片test.py:#!/usr/bin/pythonCOUNT=1deffunc():COUNT=COUNT+1func()P
mac 触控板右键安果移不动 #mac
不知道你的APPLE笔记本是那个型号的，目前有两种情况~~~1，触摸板有按键的，这个就是两个手指头放在触摸板上，然后不离开的情况下再按下触摸板按键，就是右键了~~~~~2，新款没有按键，整个触摸板可以按下去的~~~~原理相同，只不过两个手指头同时把触摸板按下去就成了~~~~
解决Ubuntu18.04触摸板右键不能用的问题 AmelieXiao ubuntu
参考：https://blog.csdn.net/qq_45807032/article/details/112795223Ubuntu18.04中关于触摸板的操作是和mac中的一样的，即双指单击为右键操作。而并不是机器失灵的缘故。触摸板模式共有4种，分别为’default’、‘none’、‘areas’、‘fingers’。可用如下方式查看：gsettingsrangeorg.gnome.des
第九章：LeRobot自定义硬件集成指南贾全实战具身智能机器人算法机器人学习人工智能机器学习
引言在前面的章节中，我们学习了如何使用LeRobot进行模仿学习、仿真实验以及摄像头配置。然而，真正的机器人研究往往需要使用自定义的硬件平台。每个研究团队或开发者可能都有自己独特的机器人设计，如何将这些自定义硬件无缝集成到LeRobot生态系统中，是实现高效机器人学习的关键。本章将详细介绍LeRobot的硬件集成框架，帮助读者掌握如何将自己的机器人硬件接入LeRobot系统。通过学习本章内容，你将
Augment-VIP项目在MacOS系统上的兼容性问题分析与解决方案余俏荟Janet
Augment-VIP项目在MacOS系统上的兼容性问题分析与解决方案augment-vipRemoveaugmentcodefreetrialaccountlimit.SupportsallOSesandallIDEs(IntelliJ,VSCode,allJetbrainsIDEs,allVSCodeforkslikeCursor,etc!)项目地址:https://gitcode.com/g
访问http请求， webservice接口报错证书问题 chang3247 http java ssl
javax.net.ssl.SSLHandshakeException:sun.security.validator.ValidatorException:PKIXpathbuildingfailed:sun.security.provider.certpath.SunCertPathBuilderException:unabletofindvalidcertificationpathtorequ
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地