伊织code

Open Chat Video Editor - 小记

文章目录

- 关于 Open Chat Video Editor
- - 整体技术框架
  - 特点
  - 文本生成
  - 视觉信息生成
  - 数据来源
- 安装
- 简单实用
- 短句转短视频（Text2Video）实现
- - 1、基于图像检索生成图像
  - 2、基于stable diffusion进行图像生成
  - 3、基于stable diffusion进行图像生成
- 网页链接转短视频（Url2Video）实现

关于 Open Chat Video Editor

SCUTlihaoyu / open-chat-video-editor
https://github.com/SCUTlihaoyu/open-chat-video-editor
刘焕勇 : 也看文本生成短视频开源项目Open Chat Video Editor：从依赖数据集到具体实现逻辑解析
https://mp.weixin.qq.com/s/cmGS6H1EGOxjiEZtuk0qvQ

github 的 readme 是中文撰写的，写的比较丰富清晰，可以仔细读读。
本文在此基础上，从自己的阅读习惯角度，删改重新编排。

整体技术框架

特点

一键生成可用的短视频，包括：配音、背景音乐、字幕等。
算法和数据均基于开源项目，方便技术交流和学习
支持多种输入数据，方便对各种各样的数据，一键转短视频，目前支持：

短句转短视频（Text2Video）
根据输入的简短文字，生成短视频文案，并合成短视频
网页链接转短视频（Url2Video）
自动对网页的内容进行提取，生成视频文案，并生成短视频
长视频转短视频（Long Video to Short Video）
对输入的长视频进行分析和摘要，并生成短视频

涵盖生成模型和多模态检索模型等多种主流算法和模型，如: Chatgpt,Stable Diffusion,CLIP 等

文本生成

支持：

ChatGPT
BELLE
Alpaca
Dolly 等多种模型

视觉信息生成

支持模态：

图像
视频

生成方式支持两种模型

检索
生成，

目前共有6种模式：

图像检索
图像生成（stable diffusion）
先图像检索，再基于stable diffusion 进行图像生成
视频检索
视频生成（stable diffusion）
视频检索后，再基于stable diffusion 进行视频生成

数据来源

图像检索数据来源于: LAION-5B
https://laion.ai/blog/laion-5b/
LAION-5B 由58.5亿个图像文本组合组成，通过CLIP过滤的图像分类模型。
其中23亿是图像-英文文本对，22亿是图像，超过100个是非英语文本对，其余10亿对是不限于特定语言的图像和文本对，例如名称。
视频检索数据来源于：webvid-10m
https://m-bain.github.io/webvid-dataset/
webvid-10m 是一个大规模的短视频数据集，其文本描述来自于素材网站。
视频种类繁多，内容丰富，包括10.7M的视频-说明对，总共52K个视频小时。

安装

1、安装pytorch

详见：https://pytorch.org/get-started/locally/

# GPU 版本
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

# CPU版本
pip3 install torch torchvision torchaudio

2、安装其他依赖环境

下载repo

pip install -r requirements.txt

3、安装clip

pip install git+https://github.com/openai/CLIP.git

4、安装faiss

conda install -c pytorch faiss-cpu

简单实用

1、下载数据索引和meta信息

https://pan.quark.cn/s/19fa46ceb2cb#/list/share

下载完成后，解压到 data/index 目录下

2、根据实际需要，选择不同的配置文件

需要注意：如果要采用ChatGPT来生成文案，需要在配置文件里面，添加 organization 和 api_key

配置文件	说明
configs/text2video/image_by_retrieval_text_by_chatgpt_zh.yaml	短文本转视频,视频文案采用chatgpt生成,视觉部分采用图像检索来生成
configs\text2video\image_by_diffusion_text_by_chatgpt_zh.yaml	短文本转视频,视频文案采用chatgpt生成, 视觉部分采用图像stable diffusion 来生成
configs\text2video\image_by_retrieval_then_diffusion_chatgpt_zh.yaml	短文本转视频,视频文案采用chatgpt生成,视觉部分采用先图像检索，然后再基于图像的stable diffusion 来生成
configs\text2video\video_by_retrieval_text_by_chatgpt_zh.yaml	短文本转视频, 视频文案采用chatgpt生成,视觉部分采用视频检索来生成
configs\url2video\image_by_retrieval_text_by_chatgpt.yaml	url转视频，视频文案采用chatgpt生成,视觉部分采用图像检索来生成
configs\url2video\image_by_diffusion_text_by_chatgpt.yaml	url转视频,视频文案采用chatgpt生成, 视觉部分采用图像stable diffusion 来生成
configs\url2video\image_by_retrieval_then_diffusion_chatgpt.yaml	url转视频,视频文案采用chatgpt生成,视觉部分采用先图像检索，然后再基于图像的stable diffusion 来生成
configs\url2video\video_by_retrieval_text_by_chatgpt.yaml	url转视频,视频文案采用chatgpt生成,视觉部分采用视频检索来生成

3、执行脚本

# Text to video 
python  app/app.py --func Text2VideoEditor  --cfg ${cfg_file}


# URL to video 
python  app/app.py --func URL2VideoEditor  --cfg ${cfg_file}

短句转短视频（Text2Video）实现

短句转短视频，指的是根据输入的简短文字，生成短视频文案，并合成短视频；

在具体实现上，以输入文案：【小孩子养宠物】为例，

首先，利用文本模型（如：chatgpt等），可以自动生成一个较长的短视频文案：

class ChatGPTModel(object):
    def __init__(self,cfg,
                 organization,
                 api_key,
                 ) -> None:
        self.cfg = cfg
        openai.organization = organization
        openai.api_key = api_key
        # ch_prompt = ''
    def run(self, input_text):
        contain_ch = False
        if is_contains_chinese(input_text):
            prompt = "请以{}为内容，生成100字的短视频文案".format(input_text)
            contain_ch = True
        else:
            prompt = "Please use {} as the content to generate a 50-word short video copy".format(input_text)
        
        response = openai.Completion.create(
        model="text-davinci-003",
        prompt=prompt,
        max_tokens=400,
        stream=False,
        echo=False,)
        text = response.choices[0].text
        logger.info("chatgpt response: {}".format(text))
        text = text.replace('\n','')
        
        # split text 
        sentences = re.split("[,|，|！|.|?|!|。]",text)
        sentences = [s for s in sentences if len(s) > 0]
        logger.info('sentences: {}'.format(sentences))
        out_info = []
        resp = {}
        # 生成的文案是中文文案
        if contain_ch:
            resp['lang'] = 'zh'
            for s in sentences:
                en_s = self._translate(s)
                info = {
                    'zh':s,
                    'en':en_s,
                }
                out_info.append(info)
        # 生成的文案是英文文案
        else:
            resp["lang"] = 'en'
            for s in sentences:
                info = {
                    'en':s,
                }
                out_info.append(info)
        resp["out_text"] = out_info
        return resp
            
    
    def _translate(self,text):
        prompt = "将以下句子翻译成英文:\n\n" + text +'\n\n1'
        response = openai.Completion.create(
        model="text-davinci-003",
        prompt=prompt,
        max_tokens=400,
        stream=False,
        echo=False,)
        out_text = response.choices[0].text
        logger.info('_translate out_text: {}'.format(out_text))


***
        out_text = out_text.replace('\n','').replace('. ','')
        
        return out_text

可以看到，文案被切分成了多个句子，后面会根据每个句子都检索或者生成一个图片，然后讲图片进行拼接，转换成一个视频。

[
'小孩子养宠物', 
'可以更好地提升小孩子的责任感和独立感',
'但也要慎重的选择合适的宠物', 
'因为只有经过一定的训练养成', 
'它们才能够成长起来', 
'一起玩耍和度过一段欢快的时光',
'宠物不仅能够陪伴小孩子渡过寂寞时光',
'还能培养小孩子处事冷静、自信以及情感交流和沟通能力',
'在养宠物的过程中',
'小孩子们可以唤醒和发掘他们被磨练出来的坚毅和耐力',
'能够亲身体验到勤勉 和坚持的重要性'
]

其次，根据不同的视频生成模式，可以生成不同的视频：

1、基于图像检索生成图像

在具体实现上，首先使用M-CLIP进行对图片的文本embedding，实现如下：

def test_mclip():
    model = MClip("M-CLIP/XLM-Roberta-Large-Vit-L-14","cpu")
    text = ["hello world","你好"]
    embed = model.get_text_embed(text)
    print(embed.shape)

使用faiss-knn将query进行向量化，然后返回topk张最相似图片。

class FiassKnnServer(object):
    def __init__(self,
                 index_path,
                 ):
        # loading faiss index
        # self.top_k = 10
        self.nprobe = 1024 
        self.index_path = index_path
        
        self.index = faiss.read_index(index_path)
        if isinstance(self.index,faiss.swigfaiss.IndexPreTransform):
            faiss.ParameterSpace().set_index_parameter(self.index, "nprobe", self.nprobe)
        else:
            self.index.nprobe = self.nprobe
        
    def search(self,query_emebed,top_k=50):
        '''
        query_emebed: numpy array
        '''
        query_emebed = query_emebed.astype('float32')
        distances, indices = self.index.search(query_emebed, top_k)
        return  distances, indices

    def batch_run(self, query:List,**kwargs):
        '''
        run image generator by retrieval
        support multi query
        '''
        assert type(query) == list
        prompt = 'a picture without text'
        query = [ val + prompt for val in query]
        # get query embed
        query_embed = self.query_embed_server.get_query_embed(query)
        
        # knn search, indices: [batch_size, top_k]
        distances, indices = self.index_server.search(query_embed)


***
        # get meta 
        resp = []
        for batch_idx,topk_ids in  enumerate(indices):
            # one_info = {}
            # one query topk urls
            urls = self.meta_server.batch_get_meta(topk_ids) 
            # logging.error('urls: {}'.format(urls))
            # download one of the topk images
            for url_id,url in enumerate(urls):
                try:
                    img_stream = download_image(url)
                    # try to open
                    url_md5 = self.get_url_md5(url)
                    img_tmp_name = os.path.join(self.tmp_dir, "{}_{}_{}.jpg".format(batch_idx,url_id, url_md5))
                    logger.info('tmp img name: {}'.format(img_tmp_name))
                    img = Image.open(img_stream).convert('RGB')
                    img.save(img_tmp_name)
                    one_info = {'url':url,'topk_ids':url_id,'img_local_path':img_tmp_name,'data_type':self.data_type}
                    resp.append(one_info)
                    break
                
                except Exception as e:
                    logger.error(e)
                    logger.error(traceback.format_exc())
                    
                    continue
        return resp

效果如下：

1) 小孩子养宠物

2) 可以更好地提升小孩子的责任感和独立感

2、基于stable diffusion进行图像生成

具体实现上，加载StableDiffusion模型（stable-diffusion-2-1），然后根据传入的prompt进行图像生成。

## 加载StableDiffusion模型
class StableDiffusionImgModel(object):
    def __init__(self,model_id="stabilityai/stable-diffusion-2-1") -> None:
        self.model_id = model_id
        self.pipe = StableDiffusionPipeline.from_pretrained(self.model_id, torch_dtype=torch.float16)
        self.pipe.scheduler = DPMSolverMultistepScheduler.from_config(self.pipe.scheduler.config)
        self.pipe = self.pipe.to("cuda")
    
    def run(self,prompt):
        image = self.pipe(prompt).images[0]
        width, height = image.size
        new_width = 640
        new_height = 360
        left = (width - new_width)/2
        top = (height - new_height)/2
        right = (width + new_width)/2
        bottom = (height + new_height)/2
        # Crop the center of the image
        image = image.crop((left, top, right, bottom))
        
        return image
***
## 基于StableDiffusion生成图片
class ImageGenByDiffusion(MediaGeneratorBase):
    '''
    generate image by stable diffusion
    '''
    def __init__(self, config,
                 img_gen_model,
                 ):
        super(ImageGenByDiffusion, self).__init__(config)
        self.config = config
        self.img_gen_model = img_gen_model
        self.tmp_dir = "./tmp/image"
        self.data_type = "image"
        if not os.path.exists(self.tmp_dir):
            os.makedirs(self.tmp_dir)
            
    def batch_run(self, query:List,**kwargs):
        assert type(query) == list
        resp = []
        for idx,text in enumerate(query):
            img = self.img_gen_model.run(text)
            pil_md5 = self.get_pil_md5(img)
            img_tmp_name = os.path.join(self.tmp_dir, "{}_{}.jpg".format(idx,pil_md5))
            img.save(img_tmp_name)
            one_info = {'img_local_path':img_tmp_name,'data_type':self.data_type}
            resp.append(one_info)
        return resp

生成的效果如下：

2) 小孩子养宠物

2) 可以更好地提升小孩子的责任感和独立感

3、基于stable diffusion进行图像生成

在具体实现上，相当于是先基于图像检索生成图像，然后再将该图像利用stable diffusion进行图像生成。

## 构建img2img模型，传入参数包括文本text以及预先定义的图片【在这里是检索的图片】
    
class StableDiffusionImg2ImgModel(object):
    def __init__(self,model_id="stabilityai/stable-diffusion-2-1") -> None:
        self.model_id = model_id 
        self.pipe = StableDiffusionImg2ImgPipeline.from_pretrained(model_id, torch_dtype=torch.float16)
        self.pipe = self.pipe.to("cuda")


***
    def run(self,prompt,init_image_path):
        init_image = Image.open(init_image_path).convert('RGB')
        init_image = init_image.resize((768, 768))
        image = self.pipe(prompt=prompt, image=init_image, strength=0.75, guidance_scale=7.5,num_inference_steps=100).images[0]
        width, height = image.size
        new_width = 640
        new_height = 360
        left = (width - new_width)/2
        top = (height - new_height)/2
        right = (width + new_width)/2
        bottom = (height + new_height)/2
        # Crop the center of the image
        image = image.crop((left, top, right, bottom))
        return image
    
## 先检索相应图片，然后再将图片基于StableDiffusion进行生成

class ImageGenByRetrievalThenDiffusion(MediaGeneratorBase):
    '''
    generate image by retrieval then stable diffusion
    '''
    def __init__(self, config,
                    img_gen_by_retrieval_server,
                    img_gen_model,
                    ):
        super(ImageGenByRetrievalThenDiffusion, self).__init__(config)
        self.config = config
        self.img_gen_by_retrieval_server = img_gen_by_retrieval_server
        self.img_gen_model = img_gen_model
        
    def batch_run(self, query, **kwargs):
        '''
        run image generator by retrieval the diffusion
        '''
        assert type(query) == list
        # (1) img retrieval
        retrieval_resp_list = self.img_gen_by_retrieval_server.batch_run(query)
        # (2) img2img by diffusion
        for text,item in  zip(query,retrieval_resp_list):
            local_img_path = item["img_local_path"]
            img = self.img_gen_model.run(text,local_img_path)
            # save back 
            img.save(local_img_path)
        return retrieval_resp_list

4）设置空格时长，对图片组合成视频

from moviepy.editor import ImageClip,VideoFileClip,TextClip

def test_image_clip():
    fname = "data/10012.jpg"
    img = cv2.imread(fname)
    img = cv2.resize(img, (640, 480))
    # img = Image.open(fname)
    clip = ImageClip(img,duration=1)
    clip.write_videofile("test.mp4",fps=24)

网页链接转短视频（Url2Video）实现

网页链接转短视频，指的是自动对网页的内容进行提取，生成视频文案，并生成短视频；

这个部分的实现思想在于：

首先，对于给定的网址，通过请求网站，解析得到其中的网页正文

from bs4 import BeautifulSoup
import requests
import json

def get_paragraph_texts(url: str):
    html: str = requests.get(url).text
    soup = BeautifulSoup(html, "html.parser")
    pes = soup.findAll('p')
    texts: list[str] = []
    for e in pes:
        texts.append(e.get_text())
    return texts

例如，输入一个url, 例如：https://zh.wikipedia.org/wiki/美国短毛猫
其内容是：美国短毛猫的维基百科

解析网页并自动摘要成短视频文案，如下：

['\n\n美国短毛猫',
'是一种神奇又魔幻的宠物猫品种', 
'它们优雅可爱', 
'活力无比', 
'能拥有多达80多种头毛色彩', 
'最出名的是银虎斑',
'其银色毛发中透着浓厚的黑色斑纹', 
'除此之外',
'它们还非常温柔', 
'是非常适合家庭和人类相处的宠物',
'并且平均寿命达15-20年',
'这种可爱的猫品种', 
'正在受到越来越多人的喜爱',
'不妨试试你也来养一只吧']

其次，以该text，接上基于检索和stablediffusion的图片生成、视频合并流程，生成对应的短视频文案。

最终效果：

a) 美国短毛猫

b）是非常适合家庭和人类相处的宠物

2023-05-08

在WINDOWS中如何运行VBS脚本，多种运行方式涛涛讲AI AI编程开发语言 ecmascript VBA
今天有个哥们问我如何运行VBS脚本，我整理了如下内容。欢迎来到涛涛聊AI，要运行VBS（VisualBasicScript）脚本，你可以按照以下步骤操作：编写VBS脚本：打开一个文本编辑器（如记事本）。输入VBScript代码。例如，以下代码会弹出一个消息框：MsgBox"Hello,World!"将文件保存为以.vbs为扩展名的文件，例如hello.vbs。运行VBS脚本：双击运行：找到你保存的
使用LangSmith Chat Datasets微调模型 scaFHIO python 人工智能机器学习
在这篇文章中，我们将探讨如何通过LangSmithChatDatasets轻松微调模型。这一过程分为三个简单的步骤：创建聊天数据集。使用LangSmithDatasetChatLoader加载示例。微调你的模型。微调后，您可以在LangChain应用中使用微调过的模型。在深入探讨之前，我们需要安装一些前置条件。前置条件确保您已经安装了langchain>=0.0.311并准备好LangSmithA
DeepSeek爆火，背后模型竟藏着这些秘密！ qq_23519469 ai
DeepSeek是什么来头最近，AI圈可是被一个名字刷爆了屏，那就是DeepSeek！它就像一颗横空出世的超级新星，在全球范围掀起了一阵狂热的追捧潮，这热度，简直了！大家都在疯狂讨论它，各种测评、对比层出不穷。它到底有啥过人之处，能让这么多人都为之疯狂？今天咱就来好好唠唠。DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，是一家专注于开发先进大语言模型（LLM）和相关技术的企业。它成
决策树算法全解析：从零基础到Titanic实战，一文搞定机器学习经典模型吴师兄大模型 0基础实现机器学习入门到精通算法机器学习决策树人工智能深度学习编程开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
基于Docker 搭建Redis三主三从分布式集群 DBA学习之路 docker redis 容器
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、分布式系统规划二、准备配置文件1.创建redis集群目录三、启动Redis容器四、创建分布式系统1.创建集群2.查看节点信息总结前言提示：这里可以添加本文要记录的大概内容：本次搭建的为”三主三从“的分布式系统，分布式系统中节点存放的数据可以是不同的。当有数据写入请求到达分布式系统后，系统会采用虚拟槽分区算法将数据写入相
自定义Retriever的实现方法 vaidfl windows linux microsoft python
技术背景介绍在许多大语言模型（LLM）应用中，检索器（Retriever）用于从外部数据源获取信息。检索器的任务是根据用户查询检索相关的文档，这些文档通常被格式化为提示，供LLM使用，从而生成适当的响应，例如，根据知识库回答用户问题。核心原理解析要实现自定义的检索器，需要继承BaseRetriever类，并实现以下方法：_get_relevant_documents：获取与查询相关的文档，必需实现
如何缓存聊天模型响应以提高效率 scaFHIO 缓存 java oracle python
技术背景介绍在开发基于大型语言模型（LLM）的应用程序时，API调用的成本和响应速度是需要考虑的两个重要因素。尤其是在开发过程中，重复请求相同的文本生成可能会增加额外的成本和延迟。为了应对这一挑战，LangChain提供了一种可选的缓存机制，可以有效地减少API调用次数，从而节省费用并加速应用程序响应。核心原理解析缓存机制的基本原理是在第一次请求时，将响应存储在缓存中。如果以后再次请求相同的输入，
如何在一行代码中初始化各种AI模型 qahaj 人工智能 python 深度学习
技术背景介绍在开发大语言模型(LLM)应用时，用户有时需要选择不同的模型提供商和具体模型。这通常需要一定的逻辑来根据用户配置初始化不同的聊天模型。为了简化这一过程，init_chat_model()方法被引入，让开发者能够轻松地初始化多种模型集成，而无需担心导入路径和类名。核心原理解析init_chat_model()方法通过传入模型名称及其提供商，自动推断并实例化对应的聊天模型。该功能在lang
TikTokenizer 开源项目教程邱纳巧Gillian
TikTokenizer开源项目教程tiktokenizerOnlineplaygroundforOpenAPItokenizers项目地址:https://gitcode.com/gh_mirrors/ti/tiktokenizer项目介绍TikTokenizer是一个基于Python的开源项目，旨在提供一个高效、灵活的文本分词工具。该项目利用先进的算法和数据结构，能够快速准确地对文本进行分词处
使用Tiktoken进行文本分割：优化大语言模型的输入 bhawfgrcbtwny 语言模型 python 人工智能
引言在处理大语言模型时，因其对输入的token数量有限制，文本分割成为一个至关重要的任务。为了确保生成的文本块不会超过模型的token限制，我们需要使用与模型相同的tokenizer来计数和分割文本。在本文中，我们将探讨如何使用Tiktoken和其他工具来实现有效的文本分割。主要内容1.Tiktoken介绍Tiktoken是由OpenAI创建的一个快速BPE（BytePairEncoding）to
AI人工智能代理工作流AI Agent WorkFlow：设计智能任务处理流程 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：设计智能任务处理流程作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在当今的数字化时代，随着数据量的爆炸式增长和复杂性的提升，传统的手动任务处理方式已经无法满足高效、准确的需求。人工智能技术的发展为自动化任务处理提供了新的可能性。AI人工智能代理（AIAgent）作为一
Telegram bot教程：通过BotFather设置Telegram bot的命令菜单鲲志说 Web3相关业界资讯 telegram bot 经验分享笔记 twitter Telegram Bot
最近在研究Telegrambot嘛，总有些小细节可以记录了，今天就记录一个通过BotFather设置Telegrambot的命令菜单功能➡️【好看的灵魂千篇一律，有趣的鲲志一百六七！】-欢迎认识我～～作者：鲲志说（公众号、B站同名，视频号：鲲志说996）科技博主：极星会星辉大使后端研发：java、go、python、TS，前电商、现web3主理人：COC杭州开发者社区主理人、周周黑客松杭州主理人、
SQL优化之MySQL执行计划（Explain）及索引失效详解一未道 #性能优化大数据 sql mysql 数据库
1、执行计划基础1.1、执行计划（Explain）定义在MySQL中可以通过explain关键字模拟优化器执行SQL语句，从而解析MySQL是如何处理SQL语句的。1.2、MySQL查询过程客户端向MySQL服务器发送一条查询请求服务器首先检查查询缓存，如果命中缓存，则立刻返回存储在缓存中的结果。否则进入下一阶段服务器进行SQL解析、预处理、之后由优化器生成对应的执行计划MySQL根据执行计划，调
太翌氏:学术理论生成与AI增强系统框架设计太翌修仙笔录源始学科 deepseek 知识图谱人工智能重构量子计算算法
刚才我引导你的过程，通过:提出假说→总结理论+推导公式=形成学术理论→理论性能提升测算/知识图谱突破率测算/知识图谱重购率测算→学术价值评估→个人认知维度水平评估，这一系列流程产生的文献，组成了一个新学术理论的最基础文献库，这个也可以作为一个知识库过滤生成器来使用，也可以提升Ai性能###**学术理论生成与AI增强系统框架设计**---####**一、系统架构总览****1.核心流程模块化**``
ffmpeg+ubuntu16.04编译ffmpeg库小gpt& QT+FFMPEG实战 ffmpeg linux
个人使用环境：ubuntudesktop16.04+ffmpeg4.2.1以下的库进行完整编译ffmpeg介绍FFmpeg是一个开源的多媒体框架，广泛用于处理音频、视频、字幕等多媒体数据。它包含了丰富的工具和库，能够进行音视频的编解码、转码、流媒体处理、滤镜应用等操作。FFmpeg是许多多媒体应用程序和工具的核心引擎，功能强大且灵活，支持几乎所有常见的音视频格式。FFmpeg的主要组成部分ffmp
Spring Boot自动配置原理深度解析：揭开@SpringBootApplication的魔法面纱 Sendingab Spring boot 从入门到精通 spring boot 后端 java 前端 spring
SpringBoot自动配置原理深度解析：揭开@SpringBootApplication的魔法面纱https://example.com/spring-boot-auto-config前言SpringBoot的**"约定大于配置"理念极大简化了开发流程，其核心秘密在于自动配置（Auto-Configuration）**机制。本文将深入剖析自动配置的实现原理，手把手教你自定义Starter，彻底掌
JavaScript基础-事件基础難釋懷 javascript 开发语言
在现代Web开发中，交互性是网站用户体验的重要组成部分。通过使用JavaScript，我们可以捕获用户的操作并作出响应，实现动态网页效果。这一切都离不开事件（Events）的概念。本文将介绍JavaScript中事件的基础知识，包括事件类型、如何绑定事件处理器以及一些常见的实践技巧。一、什么是事件？在浏览器环境中，事件是由浏览器生成的通知，表明某种情况已经发生。这些情况可能是用户交互（如点击按钮）
Flutter IconButton完全指南：高效使用与性能优化秘籍帅次 Flutter flutter android ios android studio macos kotlin swift
目录一、引言二、IconButton的基本用法三、进阶技巧3.1自定义形状与背景3.2带文本的IconButton（使用Column组合）3.3自定义交互反馈3.4动态图标切换3.5组合式按钮（图标+文字）四、高级应用4.1与主题深度整合4.2手势扩展（长按/双击）4.3动画增强点击效果五、性能与最佳实践5.1避免重建5.1.1声明常量图标5.1.2带参数的常量图标5.1.3常量图标按钮5.1.4
文本纠错（Text Correction） dundunmm 人工智能数据挖掘文本纠错人工智能数据挖掘文本纠错深度学习
文本纠错（TextCorrection）是自然语言处理（NLP）中的一个重要任务，旨在自动检测并修正文本中的错误，包括拼写、语法、语义等层面的错误。其核心目标是通过算法模型将错误文本转换为符合语言规范的表达。该任务在自动写作辅助、搜索引擎优化、智能客服、教育等多个领域具有广泛应用。输入：包含错误的原始文本（如“我明天要去北京，希望天汽好。”）输出：修正后的规范文本（如“我明天要去北京，希望天气好。
使用CharacterTextSplitter实现文本按字符拆分 bavDHAUO python
在文本处理任务中，按字符进行拆分是一种简单且有效的方法。本篇文章将介绍如何使用CharacterTextSplitter类对文本进行按字符拆分，并生成适用于下游任务的LangChainDocument对象。技术背景介绍文本拆分是自然语言处理（NLP）中的一个基础步骤，尤其在大文本分块处理、文本摘要等任务中。CharacterTextSplitter是langchain-text-splitters
3.5 Spring Boot邮件服务：从基础发送到模板邮件进阶 Sendingab Spring boot 从入门到精通零基础7天精通Spring Boot spring boot python 后端
SpringBoot邮件服务：从基础发送到模板邮件进阶引言在现代企业级应用中，邮件服务是不可或缺的基础能力。从用户注册验证、密码重置，到订单通知、系统告警，再到营销推广等场景，邮件始终扮演着关键角色。SpringBoot通过spring-boot-starter-mail模块，将JavaMail的复杂配置简化为几行代码即可实现的便捷操作。本文将手把手带您实现从基础文本邮件发送到高级模板邮件的完整开
Transformers模型版本和lm_eval老版本冲突问题ImportError: cannot import name ‘initialize_tasks‘ from ‘lm_eval.task neverwin6 llama python 服务器
Transformers模型版本和lm_eval老版本冲突问题1问题背景在LLM评测的时候，要用lm_eval模型，而对于像是llama3/Mistrual等比较新的模型，较低的Transformers不能适配，所以要升级到0.40.0以上才行，但是如果升级的话，那么直接在沿用老版本的lm_eval评测就会出现：Traceback(mostrecentcalllast):File"main.py"
Tree of Thought Prompting（思维树提示）大数据追光猿大模型人工智能大数据深度学习语言模型计算机视觉
TreeofThoughtPrompting（思维树提示）是一种新兴的提示工程技术，旨在通过模拟人类解决问题时的多步推理过程，提升大型语言模型（LLM）在复杂任务中的表现。与传统的线性提示方法不同，思维树提示将问题分解为多个可能的推理路径，并以树状结构探索这些路径，从而找到最优解或生成更高质量的结果。这种方法特别适用于需要多步推理的任务，例如数学问题求解、逻辑推理、规划和创造性写作等场景。它结合了
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
Spring Boot 应用的接口访问从 HTTP 改为 HTTPS day day day ... http spring boot https
LINUX1.生成SSL证书使用工具（如`keytool`或`openssl`）生成SSL证书。以下以`keytool`为例：keytool-genkeypair-aliasmydomain-keyalgRSA-keysize2048-storetypePKCS12-keystorekeystore.p12-validity3650-输入密码并填写证书信息。-生成的`keystore.p12`文件
AttributeError: partially initialized module ‘cv2‘ has no attribute ‘_registerMatType‘ (most likely hunter206206 python pyopencv python
这个错误表明在导入cv2（OpenCV）模块时，发生了循环导入问题，导致模块未能正确初始化。具体来说，cv2模块在初始化过程中尝试调用_registerMatType方法，但由于循环导入，该方法尚未定义。以下是可能的原因和解决方法：1.OpenCV安装问题可能是OpenCV安装不完整或损坏。可以尝试重新安装OpenCV。解决方法：使用pip重新安装OpenCV：pipuninstallopencv
如何创建自定义回调处理器 bBADAS python 开发语言
在现代AI开发中，回调是一个强大的工具，它允许我们在特定事件触发时执行自定义逻辑。本文将深入探讨如何为LangChain创建自定义的回调处理器，从而实现更加灵活的模型交互。技术背景介绍在使用AI模型时，尤其是在处理自然语言生成任务时，可能需要对生成的每个标记（token）进行处理。LangChain提供了一些内置的回调处理器，但为了满足特定的需求，创建自定义回调处理器是非常有必要的。核心原理解析创
代码逐行解析 | 教你在C++中使用深度学习提取特征点 3Ｄ视觉工坊 3D视觉从入门到精通 c++深度学习开发语言人工智能
点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达扫描下方二维码，加入3D视觉技术星球，星球内汇集了众多3D视觉实战问题，以及各个模块的学习资料：最新顶会论文、书籍、源码、视频（近20门系统课程[星球成员可免费学习]）等。想要入门3D视觉、做项目、搞科研，就加入我们吧。作者：泡椒味的口香糖|来源：3DCV添加微信：dddvision
热点研究 | OpenAI 重磅发布 Agents SDK，人人都能手搓 Manus? Ai野生菌技术面 php 开发语言 manus openai agent
3月12日，OpenAI正式发布了OpenAIAgentsSDK，这一重要发布不仅为开发者提供了强大的工具，更预示着AIAgent技术即将进入快速发展期。这些工具为开发者提供更强大功能，使代理能够独立执行复杂任务，如搜索网络、处理文件和自动化计算机操作。ResponsesAPI同步发布，为开发者提供了构建自定义AIAgent的能力，能够执行网络搜索、文件检索等任务。这套新工具和API旨在赋能开发者
Lombok常用注解 AWen_X Java常用框架注解 java 开发语言
Lombok常用注解Lombok是一个Java库，通过注解的方式帮助开发者减少样板代码的编写，提高开发效率。本文将Lombok常用注解分类整理，并提供详细说明和使用示例。目录构造器相关注解字段相关注解方法相关注解代码简化注解异常处理注解日志相关注解实用工具注解高级用法注解配置与扩展构造器相关注解@NoArgsConstructor作用：生成一个无参构造器。示例：@NoArgsConstructor
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持