VCED项目安装踩坑指南(DataWhale11月组队学习)

项目开源地址:

GitHub - datawhalechina/vced: VCED 可以通过你的文字描述来自动识别视频中相符合的片段进行视频剪辑。该项目基于跨模态搜索与向量检索技术搭建,通过前后端分离的模式,帮助你快速的接触新一代搜索技术。


首先是第一部分的准备工作

1、对于Windows系统,首先根据项目指引,安装wsl2:

详情见:安装 WSL | Microsoft Learn

注意:需要具备Windows 10 版本 2004 及更高版本或 Windows 11

如果出现raw.githubusercontent.com无法访问的问题,详情见:

解决raw.githubusercontent.com无法访问的问题_哇咔君i的博客-CSDN博客

2、由于wsl2默认安装在C盘上,对于分区内存不够的小伙伴来说,首先就是要将其移动到其他盘上。

详情见:wsl的安装及迁移至其他盘_缄默0603的博客-CSDN博客

注意:有时候导入过程中会卡主,只要Ctrl+C终止,多尝试几次即可(时间超过2~3分钟没反应就可以考虑终止重试)

3、安装好wsl2后,在虚拟机上安装Python3.9环境

详情见:更新 Ubuntu 系统的 Python 版本 - 腾讯云开发者社区-腾讯云 (tencent.com)

注意:文中方法1并不稳定,建议采用方法二,下载压缩包安装

注意:安装好Python3.9后,后续运行Python文件一律使用命令:"python3.9 xxx.py"的格式,以防止启动虚拟机中其他版本

注意:这一步不可跳过,安装其他版本的Python后续会出现很多报错

注意:可以进行软件列表的更新:

sudo apt-get update

但尽量不要进行软件包的更新,包更新可能会导致后续操作时个别包版本高于需要的版本,我们可以在报错版本较低时安装特定版本的包,因此尽量不要执行以下命令

sudo apt-get upgrade

4、安装好Python后,接下来进行rust的安装

详情见:ubuntu rust_如何在Ubuntu Linux上安装Rust_cunchi4221的博客-CSDN博客

注意:无脑复制前面安装部分的命令即可

5、接下来安装ffmpeg

详情见:在Ubuntu上安装FFmpeg - 知乎 (zhihu.com)

6、然后按照DataWhale开源项目中的命令安装Clip

pip install git+https://github.com/openai/CLIP.git

注意:由于github连接很不稳定,因此需要多次尝试,偶尔会成功。

(可以使用国内镜像,但有时效果并不明显)

7、克隆项目源码

git clone https://github.com/datawhalechina/vced.git

注意:同样会出现网络问题,使用国内镜像或重试

8、进入server文件夹安装依赖

# 进入 server 文件夹
cd vced/code/service
# 安装相关依赖
pip install -r requirements.txt
# 启动服务端
python3.9 app.py

如果出现以下界面说明启动成功

VCED项目安装踩坑指南(DataWhale11月组队学习)_第1张图片

注意:启动.py文件后不要退出,重新打开一个wsl2终端

注意:如果这一步出现问题,考虑以下几个方面:python版本是否正确,是否通过python3.9启动;是否进入了正确的文件夹;更新pip包;权限不足,进入虚拟机的root模式尝试;其他问题具体见报错

9、在新打开的终端内,启动web

# 进入 web 文件夹
cd vced/code/web
# 安装相关依赖
pip install -r requirements.txt
# 启动服务端
streamlit run app.py

如果出现以下界面说明启动成功

VCED项目安装踩坑指南(DataWhale11月组队学习)_第2张图片

回车即可在网页打开应用界面

VCED项目安装踩坑指南(DataWhale11月组队学习)_第3张图片

上传视频和关键词即可体验相关功能

注意:上传视频要小于200MB,不然会报很多错


然后我们进入第二阶段的学习

学习任务:vced/jina.md at main · datawhalechina/vced · GitHub

10、接下来安装jina

在新打开的终端内输入

pip install jina

运行以下命令启动 grpc 服务:

cd jina_demo
jina flow --uses toy.yml

成功界面如下

VCED项目安装踩坑指南(DataWhale11月组队学习)_第4张图片

注意:不要关闭已经打开的3个终端

11、重新打开一个新的终端,进入jina文件夹,运行测试文件

cd vced/code/jina_demo
python3.9 client.py

出现以下字段说明成功

12、待更新

参考资料:本文主要参考DataWhale开源项目:GitHub - datawhalechina/vced: VCED 可以通过你的文字描述来自动识别视频中相符合的片段进行视频剪辑。该项目基于跨模态搜索与向量检索技术搭建,通过前后端分离的模式,帮助你快速的接触新一代搜索技术。

以及文中的链接,感谢开源社区及程序员小伙伴们的帮助

你可能感兴趣的:(深度学习,人工智能)