SparkParis123

（四）（假视频生成）基本文本的会话头视频编辑Text-based Editing of Talking-head Video 2019

项目地址：https://www.ohadf.com/projects/text-based-editing/

效果：给定任意文本，就能随意改变一段视频里人物说的话。

Section 1：introduction

展示了基于文本的编辑结果以及以前技术的对比，主要的技术贡献：

Section 2：Related Work

面部重塑（Facial Reenactment）

视觉配音（Visual Dubbing）：

装配模型的语音动画（Speech Animation for rigged models）

基于文本的视频和音频编辑(Text-Based Video and Audio Editing)

音频合成（Audio Synthesis）

深度生成模型（Deep Generative Models）:

单目三维人脸重建（Monocular 3D Face Reconstruction）：

Section 3：Method

Method overview

3.1音素对齐（Phoneme Alignment）

3.2三维人脸跟踪与重建（3D Face Tracking and Reconstruction）

3.3 视位搜索（Viseme Search）

3.4 参数重定时和混合（ Parameter Retiming & Blending）

3.5 神经面部渲染（Neural Face Rending）:

I.训练神经面部渲染器（Training the Neural Face Renderer）

4.1.视频编辑（Video Editing）

4.2.翻译（Translation）

4.3.使用合成语音进行全句合成（Full Setence Synthesis Using Synthetic Voice）

Section 5：Evaluation analysis and Compare

Section 6：局限性和未来发展

Section 7：Conclusion

项目地址：https://www.ohadf.com/projects/text-based-editing/

paper:Text-based Editing of Talking-head Video 2019

相关解析地址：https://mp.weixin.qq.com/s/59G434OvgYR928v5qvxnaQ

效果：给定任意文本，就能随意改变一段视频里人物说的话。

编辑会话头视频以改变语音内容或删除填充词是具有挑战性的。我们提出了一种基于其转录本来编辑会话头视频的新方法，以产生真实的输出视频，其中扬声器的对话被修改，同时保持无缝的视听流[audio-visual flow]（即没有跳跃切换）。

通过音素（phonemes），视位(visemes)，3D面部姿势(3D face pose)和几何(geometry)，反射(reflectance)，表达(expression)和每帧场景照明(scene illumination per frame)自动注释输入的说话头视频。要编辑视频，用户必须仅编辑脚本，然后优化策略选择输入语料库的片段作为基础材料。对应于所选片段的注释参数被无缝地拼接在一起并用于产生中间视频表示，其中面部的下半部分用参数面部模型来呈现。最后，循环视频生成网络将该表示转换为与编辑的转录本匹配的逼真视频。

演示了各种各样的编辑，例如词的添加，删除和更改，以及令人信服的语言翻译和完整句子合成。

Section 1：introduction

方法仅接受文本作为合成的输入，建立在Kim等人的Deep Video Portraits方法的基础之上制作合成视频。

我们的方法通过无缝拼接从原始素材跟踪的不同运动片段来驱动3D模型。
基于动态编程优化来选择片段，该动态编程优化使用基于viseme的新颖相似性度量来搜索应当看起来像我们想要合成的单词的抄本中的声音序列。这些片段可以重新定时以匹配目标视位序列，并且被混合以创建无缝嘴部动作。
为了合成输出视频，我们首先创建一个合成复合视频，其中下面区域被屏蔽掉。在插入新文本的情况下，我们将边界的其余部分和背景重新定时。使用先前通过优化找到的嘴部运动，使用合成的3D人脸模型进行合成遮蔽的区域（如下图）

3D面部模型的不完整性和不完美性而缺乏真实感。例如，面部外观不完全匹配，缺少动态高频细节，并且嘴部内部不存在。尽管如此，这些数据对于新学习的循环视频生成网络来说是足够的线索，能够将它们转换为逼真的图像。新的复合表示和循环网络公式显着扩展了Kim等人的神经面部转换方法到 [2018b]基于文本的现有视频编辑。

展示了基于文本的编辑结果以及以前技术的对比，主要的技术贡献：

（1）一种基于文本的会话头视频编辑工具，除了在现有的脚本中剪切和复制粘贴外，还允许编辑插入新文本。

（2）基于动态编程的策略，适用于视频合成，根据包含输入视频中观察到的视频序列的片段组合新词

（3）一种参数混合方案，当与我们的综合管道结合使用时，即使将不同姿势和表达的片段组合在一起，也可以产生无缝的会话头

（4）一种经常性的视频生成网络，它将真实背景视频和合成渲染的下部面部的合成转换为逼真的视频

Section 2：Related Work

面部重塑（Facial Reenactment）

采用面部重演方法来显示基于文本的编辑结果，并展示如何通过神经面部渲染来解决面部重演问题

视觉配音（Visual Dubbing）：

面部重演是视觉配音的基础，因为它允许改变目标演员的表达，以匹配以不同语言说话的配音演员的动作。视觉配音方法：

（1）语音驱动（speech-driven）语言驱动的方法已被证明可以产生准确的唇同步视频（Synthesizing Obama: learning lip sync from audio），这种方法可以合成相当准确的唇形同步视频，但它需要新的音频听起来与原始扬声器类似，而我们使用基于文本的编辑来合成新视频。

本文方法优势：基于3D的方法和神经渲染器可以产生细微的现象，例如唇部滚动，并且在更一般的环境中工作

（2）绩效驱动（performance-driven）

装配模型的语音动画（Speech Animation for rigged models）

几种相关方法产生语音动画曲线，它们专为动画3D模型而设计，不适用于逼真的视频，需要角色装备和艺术家提供的装备通信。

本文方法优势：只是根据文本和主题的单眼记录来“动画”真实的人。

基于文本的视频和音频编辑(Text-Based Video and Audio Editing)

基于时间对齐的转录开发了各种音频和视频编辑工具，工具允许编辑缩短和重新安排音频播客的语音；注释带有评论反馈的视频；提供视频内容的音频描述；用于分割B-roll素材并生成讲座视频的结构化摘要等；使用由时间对齐的脚本强加的结构，根据编辑器指定的更高级别的电影习语自动编辑脚本场景的多个镜头；通过剪切，复制和粘贴脚本文本来编辑面试风格的谈话视频的工具是最接近的工作

本文方法优势：同样通过剪切，复制和粘贴文本来重新排列视频，但与以前的所有基于文本的编辑工具不同，我们只需在脚本中输入新文本即可合成新视频。

音频合成（Audio Synthesis）

基于脚本的视频编辑中，合成视频剪辑伴随着音频合成。本文方法与音频无关，可以使用各种文本到语音（TTS）方法。TTS方法分为

（1）参数方法：（parametric methods）：基于文本生成声学特征，然后从这些特征合成波形。Ref：2016. WaveNet: A generative model for raw audio.

（2）单位选择（unit selection）：是一种数据驱动的方法，通过将转录本中其他地方发现的小块音频（或单位）拼接在一起来构建新的波形。

VoCo合成音频:在现有记录中执行搜索以找到可以拼接在一起的短音频范围，使得它们在插入点周围的上下文中无缝地混合

Ref:[VoCo: text-based insertion and replacement in audio narration. AC 2017]

目前最先进的TTS方法依赖于深度学习:

ref:

2018. Natural TTS synthesis by conditioning wavenet on mel spectrogram predictions.

2016. WaveNet: A generative model for raw audio. In SSW. 125

深度生成模型（Deep Generative Models）:

研究人员提出了用于合成图像和视频的深度生成对抗网络（GAN）

方法：

（1）从零开始创建新图像（配对语料库）

Ref：2017. Photographic Image Synthesis with Cascaded Refinement Networks

（2）在输入视频上调节合成（配对语料库）：

Ref：Image-to-Image Translation with Conditional Adversarial Networks. 2017

（3）高分辨率条件视频合成（配对语料库）

Ref：2018a. Video-to-Video Synthesis. In Advances in Neural Information Processing Systems (NeurIPS)

（4）不成对的视频到视频翻译技术只需要两个训练视频（不成对）应用：人类头部的再现，头部，上半身以及整个个体显示了清晰的结果

Ref：2018. Recycle-GAN: Unsupervised Video Retargeting. In ECCV

单目三维人脸重建（Monocular 3D Face Reconstruction）：

概念：使用优化方法从单一图像重建面部几何和外观。

技术：

（1）使用参数化人脸模型作为更好地约束重建问题的先行者

（2）基于深度学习的方法来训练卷积网络直接回归模型参数

（3）Depth maps（其他方法见详细深度图）

(1)Ref：2018. Large Scale 3D Morphable Models.

(2)Ref：

2017. End-To-End 3D Face Reconstruction With Deep Neural Networks.

Unsupervised Training for 3D Morphable Model Regres- sion CVPR

2016 3D Face Reconstruction by Learning from Synthetic Data.

Regressing Robust and Discriminative 3D Morphable Models with a very Deep Neural Network. (CVPR)

(3)Ref：

2018.Self-supervised Multi-level Face Model Learning for Monocular Reconstruction at over 250 Hz.CVPR

CNN-based Real-time Dense Face Reconstruction with Inverse-rendered Photo-realistic Face Images.IEEE

2015 Real-time High-fidelity Facial Performance Capture.ACM

Section 3：Method

input：将语音记录和文本上指定的任意数量的编辑视频记录作为输入
支持三种类型的编辑操作：

添加新词：编辑在视频中的某个点添加一个或多个连续的单词（例如，因为演员跳过单词或制作人想要插入短语）。
重新排列现有单词：编辑移动视频中存在的一个或多个连续单词（例如，为了更好的单词排序而不引入跳跃切换）。
删除现有单词：编辑会从视频中删除一个或多个连续单词（例如，为了简化措辞和删除填充程序，例如“嗯”或“呃”）

Method overview

方法概述：给定输入头部视频和脚本，我们执行基于文本的编辑。我们首先将音素（Phonemes）与输入音频(input audio)对齐并跟踪每个输入帧以构建参数化头部模型。然后，对于给定的编辑操作（将蜘蛛变为狐狸），我们发现输入视频的片段与新词具有相似的视位(Viseme)。在上述情况下，我们使用毒蛇和牛来构建狐狸。我们使用来自相应视频帧的混合头部参数(blended head parameters)以及重新定时的背景序列(retimed background sequence)来生成合成图像，该合成图像用于使用我们的神经面部渲染(neural face rendering method.)方法生成逼真的帧。在最终的视频中，这位女演员似乎在说狐狸，尽管在原始录音中她从未说过这个词。

3.1音素对齐（Phoneme Alignment）

音素：感知上不同的单位，用于在特定语言中区分不用的词

方法：依赖于音素来查找视频中的片段，我们后来将这些片段组合在一起以生成新内容

计算输入视频中音素的标识（identity）和时间（time）
为将视频的语音音频分割成电话（音素的可听实现），假设我们有一个准确的文本记录，并使用P2FA方法将其与音频对齐。

每个音素具有表示音素名称，开始时间和结束时间的标签vi =（vlbl i，vin i，vout i）如果没有将输入内容作为输入的一部分，我们可以使用自动语音转录工具或众包转录服务获得它。音素的有序序列V =（v1，...，vn）

P2FA->一种音素对其工具ref:2013. Content-based tools for editing audio stories.

3.2三维人脸跟踪与重建（3D Face Tracking and Reconstruction）

为输入的会话头视频的每一帧注册3D参数面部模型。模型的参数（例如表情，头部姿势等）稍后将允许我们选择性地混合面部的不同方面（例如，从一个框架中获取表达并从另一个框架中获取姿势）。
应用了基于单眼模型的面部重建的最新研究。技术参数化刚性头部姿势T∈SE（3），面部几何形状α∈R80，面部反射率β∈R80，面部表情δ∈R64和场景照射γ∈R27。

III.模型拟合基于非线性重建能量的最小化。见ref

我们为输入视频的每帧获得257参数矢量p∈R257。

非线性重建能量的最小化-》Ref：2016. Reconstruction of Personalized 3D Face Rigs from Monocular Video. ACMTransactions

3.3 视位搜索（Viseme Search）

目标：是在视频中找到可以组合以产生W语言序列的匹配的序列序列。
匹配过程：平均来说，相同的音素在视觉上与不相同的音素相比在视觉上更相似（尽管共同发音效果）。考虑视位，视觉上彼此相似的听觉上不同的音素组，作为良好的潜在匹配。匹配过程不能指望在视频中为编辑操作中的长字或序列找到良好的连贯视位序列。相反，我们必须找到几个匹配的子序列和一种最佳组合方式。
匹配一个子序列（Matching one subsequence）

Viseme搜索和重新定时;给定查询序列W，我们将其分成所有可能的子序列，其中显示了一个（W1，W2）∈分裂（W）。每个子序列与输入视频V匹配，产生查询音素wi和输入视频音素vi之间的对应关系。我们在参数空间中重新定时以将每个vi的长度与wi匹配。

3.4 参数重定时和混合（ Parameter Retiming & Blending）

问题：视频子序列的序列V描述视频的部分以供我们组合以便创建W.我们不能直接使用对应于（V1，...，Vk）的视频帧。原因：（1）序列Vi对应于视在同一性中的W的一部分，但不是视位长度，当与语音音频结合时将产生非自然视频，（2）连续序列Vi和Vi + 1可以来自原始视频中相距很远的部分。由于姿势和姿势变化，头发移动或相机运动，受试者在这些部位可能看起来不同。连续序列之间的转换看起来不自然
解决：使用参数化人脸模型来混合不同来自不同的输入帧的属性（姿势，表达，等），并将它们混合在参数空间中。我们还选择背景序列B并将其用于姿势数据和背景图像。背景序列允许我们编辑具有头发运动和轻微相机运动的具有挑战性的视频。

（1）背景重新定时和姿势提取（Background retiming and pose extraction）

（2）子序列重定时（Subsequence retiming）

（3）参数混合（Parameter bending）:避免跳跃切割，我们对不同的参数使用不同的策略

3.5 神经面部渲染（Neural Face Rending）:

概念：采用神经面部渲染来合成与修改后的参数序列相匹配的逼真的视频头部视频。
Pre-Output：编辑的参数序列，其描述新的期望的面部运动和对应的重新定时的背景视频剪辑。
合成步骤的目标是改变重新定时的背景视频的面部运动以匹配参数序列。
做法：在重新定时的背景视频中屏蔽下脸区域，包括颈部的部分（b），并在顶部呈现具有所需面部表情的新合成下脸。这导致了复合物ri（c）的视频。最后，我们使用我们的神经面部渲染方法来弥合ri和人的真实视频片段之间的领域差距

对于每个对照框架fi（a），我们获得了3D人脸重建。重建的几何代理用于掩盖下面区域（b，左）并渲染口罩mi（b，右），其用于我们的训练重建损失。我们从参数面模型叠加下面区域以获得合成复合ri（c）。我们的表达式引导神经渲染器的目标是学习从合成复合ri到对照真实帧fi的映射。

I.训练神经面部渲染器（Training the Neural Face Renderer）

训练面部神经网络(基于GAN)
涉及生成器（RNN）

我们假设视频是由顺序过程生成的，我们通过具有共享生成器G的循环网络进行建模。实际上，我们将循环展开三次.

鉴别器（D）

我们使用空间鉴别器Ds，时间鉴别器Dt和基于对抗基于patch的鉴别器损失来训练我们的神经面部渲染网络

训练目标函数L

Lr是光度重建损失，Ls是每帧空间对抗性损失，Lt是我们基于差异图像的新颖的对抗性时间一致性损失。

网络结构（Network Architecture）

见原文相应的论文

添加音频

管道制作的视频是静音的。添加音频方法(1)使用由Mac OS X中的内置语音合成器或VoCo (2)获得表演者声音的实际记录。在这种情况下，我们重新定时生成的视频以匹配电话级别的录制。对于移动和删除编辑，我们使用原始视频中的表演者的声音。

Section 4：Result

针对各种视频展现完整方法的结果，鼓励读者在补充视频和网站中查看视频结果（带音频），结果很难从静态帧中评估。

4.1.视频编辑（Video Editing）

优势：

能够将修改后的视频片段无缝重新组合成原始的全帧视频片段，并将新片段无缝地融合到原始（更长）视频中。可以处理任意帧的镜头，并且与输入视频的分辨率和宽高比无关。
能够实现本地化编辑（即使用较少的计算），这些编辑不会改变大部分原始视频，并且可以合并到标准编辑管道中。
神经面部渲染策略可以在原始背景视频上调节视频生成，从而实现无缝合成。
这种方法使我们能够准确地再现身体运动和场景背景（图11）。

其他神经渲染方法，如Deep Video Portraits [Kim et al。 2018b]不对背景进行条件限制，因此不能保证在帧中的正确位置合成主体。

4.2.翻译（Translation）

优势：

用于视频翻译，只要源材料包含与目标语言类似的视图。
viseme搜索管道与语言无关。为了支持新语言，我们只需要一种方法将单词转换为单个音素，这些音素已经可用于许多语言。

4.3.使用合成语音进行全句合成（Full Setence Synthesis Using Synthetic Voice）

优势：

（1）可用于为助理可能制作的任何话语制作视频。我们使用原生Mac OS语音合成（补充W7）显示完整句子合成的结果。

（2）用于轻松创建具有针对不同目标受众的更细粒度内容适应的教学视频，或创建针对特定年龄组定制的讲故事视频的变体。

Section 5：Evaluation analysis and Compare

为了评估我们的方法，我们分析了产生良好结果所需的输入视频数据的内容和大小，并且我们将我们的方法与替代的会话头视频合成技术进行了比较。

5.1输入视频的大小(Size of Input Video)

5.2编辑大小（Size od Edit）

5.3参数空间混合的评估(Evaluation of Parameter Space Blending)

5.4 与MorphCut的比较：

MorphCut在第2，3，4帧的场景删除中失败，本文的方法效果比较好

5.5与面部重演技术的比较(Comparison to Facial Reenactment Techniques)

与面部重演技术相比，新技术避免了画面中出现的“鬼影”，合成画面也更加高清、稳定。

5.6 消融研究（Ablation Study）

5.7 用户研究（User Study）

Section 6：局限性和未来发展

（1）我们的综合方法需要重新定时的背景视频作为输入。

（2）目前我们的音素检索对于说出音素的情绪是不可知的。

（3）我们目前的视觉搜索旨在提高质量而非速度。我们想探索viseme搜索问题的近似解决方案，我们认为这可以允许交互式编辑操作。

（4）我们需要大约1小时的视频才能产生最佳质量的结果。为了使我们的方法更广泛适用，我们正在研究用更少的数据产生更好结果的方法。具体来说，我们正在研究在个体之间传递表达参数的方法，这将允许我们为所有编辑操作使用一个预处理数据集。

（5）下脸区域的遮挡，例如通过移动的手，干扰我们的神经面部渲染器并导致合成伪像，因为手不能可靠地重新渲染。解决这个问题还需要跟踪和合成手部动作。尽管如此，我们相信我们展示了各种引人注目的基于文本的编辑和综合结果。将来，端到端学习可用于学习从文本到视听内容的直接映射。

Section 7：Conclusion

我们提出了第一种方法，通过修改相应的记录，实现了对视频头视频的基于文本的编辑。我们的方法可以进行各种各样的编辑，例如词的添加，删除和更改，以及令人信服的语言翻译和完整的句子合成。是实现基于文本的编辑和一般视听内容合成目标的第一个重要步骤

抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
特殊的拜年飘雪的天堂
文/雪儿大年初一，家家户户没有了轰响的鞭炮声，大街上没有了人流涌动的喧闹，几乎看不到人影，变得冷冷清清。天刚亮不大会儿，村里的大喇叭响了起来：由于当前正值疾病高发期，流感流行的高峰期。同时，新型冠状病毒感染的肺炎进入第二波流行的上升期。为了自己和他人的健康安全着想，请大家尽量不要串门拜年，不要在街里走动。可以通过手机微信，视频，电话，信息拜年……今年的春节真是特别。禁止燃放鞭炮，烟花爆竹，禁止出村
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
2023-10-22 奥雷里亚诺第n
昨天在B站看到关于猫喜欢挠人的视频，视频教导说猫挠人的话就抓住它的后脖颈然后用手打打挠人的那个爪子。视频本身没什么，但评论区却炸开了锅（真是符合挑食者厌食心理）。令我印象最深刻的一个甚至上升到了关于我是谁这种终极问题。它说，猫就是畜生，它挠人就打它别惯着它，反正我六道轮回成了人就应该保持人的高贵，谁都别想来打破。我顿时汗颜，但看到下面全是类似的言论只不过后面的理由各有不同，本来想骂人的心都凉了一半
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
2019-01-19 王小康KK
姓名:王康公司:扬州市方圆建筑工程有限公司2018年3月16日～3月18日上海361期《六项精进》感谢二组学员【日精进打卡第307天】【知～学习】《六项精进》大纲3遍共862遍《大学》通篇3遍共860遍《六项精进》全书40页【经典名句】思想决定行为，行为决定习惯，习惯决定性格，性格决定命运。【行～实践】一、修身：（对自己个人）1、践行六项精进的理念。二、齐家：（对家庭和家人）1、和女朋友视频聊天。
中原焦点团队网络初中级30期阴丽丽坚持分享第三百八十八次2022.10.18分享约练次数（74）咨询师（6）来访者（53）观察者（15）阴丽丽
今天是忙碌的一天，一早起来，总想着找点把事情弄完，可总也弄不完。就这样弄着吧！孩子的事，自己的事都在那里搁置着，不想做，有点欧！今天总体还不错，只是在下午起床时走神了俩小时，也算是给自己的放松吧！今日难得1.儿子乖巧、听话，努力配合，一天下来也是忙忙碌碌，这真的很难得！2.儿子今天录的视频被班主任认可，这真的很难得3.我今天早上做核酸时，自己把教案整了一下，这真的很难得
为什么瘦子很难增胖？我的狗毛毛
我是个标准的瘦子，168，100斤。用一句通俗的话来讲，我连马甲线都瘦出来了（体脂含量比较低）。但是我反而很羡慕那些比较丰满的女人，我的理想是再增重十五斤，练成前凸后翘的魔鬼身材。为此我开始纠正自己不规律的作息，吃高热量的食物，减少运动量，能坐着绝不站着，能躺着绝不坐着。但是结果却没有丝毫变化。我一直很苦恼，直到最近在网上看到一个视频，英国的某个研究机构做了一个实验，想要知道瘦子能否在高热量的食物
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
视频号买1000个粉多少钱?视频号可以购买粉丝吗？开橱窗需要多少粉？爱吃菠萝的鱼
在视频号的发展初期，很多人都认为，视频号可以通过购买粉丝来提升用户质量。而这个说法，在我们使用视频号的过程中，发现了它是可以购买粉丝的。但是我们要知道，视频号的本质，是一款社交工具。而不是一个私域流量池。而很多人在做私域流量池的时候，就想着怎么通过购买粉丝来提升用户质量。但我觉得你真的是想多了。视频号涨粉咨询号码：1776206920517753965895视频号粉丝1000有什么好处1、视频号粉
上班族可以做线上副业兼职有哪些？盘点7个适合上班族做的副业兼职！高省APP大九
对于许多上班族来说，工资往往不能满足他们的生活需求，因此许多人开始寻找副业来增加收入。以下是一些适合普通人的副业赚钱路子，希望能给您带来一些灵感。1、做好物推荐现在很多职场人其实有大量的个人时间，只不过这些个人时间比较碎片化，他们不能够很好的利用起来，其实可以利用这些碎片化的时间去做副业，比如做好物推荐。在网上有很多的平台，比如头条抖音等等都开通了一个商品的分销功能，只要你发布相关的视频或者文章，
matlab mle 优化,MLE+: Matlab Toolbox for Integrated Modeling, Control and Optimization for Buildings... Simon Zhong matlab mle 优化
摘要：FollowingunilateralopticnervesectioninadultPVGhoodedrat,theaxonguidancecueephrin-A2isup-regulatedincaudalbutnotrostralsuperiorcolliculus(SC)andtheEphA5receptorisdown-regulatedinaxotomisedretinalgan
一分钟学会刷牙，受用终生！好易康
讲真，刷了十几二十年牙，没刷对过一次......来来来，划重点，更重要的是执行：①每天刷牙2次，②每次刷牙2~3分钟，③每3个月更换牙刷。最后，请使用正确的刷牙方法：巴氏（BASS）刷牙法undefined_腾讯视频视频来源ADA美国牙医协会巴氏刷牙法又称龈沟清扫法或水平颤动法。是由美国牙科协会推荐的一种有效去除龈缘附近及龈沟内菌斑的方法。刷牙不仅是刷牙齿，同时也要刷牙龈。因为口腔与细菌的战场就在
逻辑思维的过程与力量解晓萱
之前我对逻辑思维的了解停留在，讲话时有逻辑，辩论时条理清晰。今天看了《开讲了》里面关于大学生质疑易中天老师的视频，听到易中天老师的回答，忽然对逻辑思维有了稍微深刻的理解。图片发自App逻辑学对我们太重要了，不仅仅是学习备考，更重要的是生活和事业及交流的选择及过程。偏激的起点和性格有关，更和逻辑思维水平有关。视频里，易中天老师评价北大学生逻辑时讲到：“他的逻辑环节是没问题的，但是逻辑起点错了，所以他
4 大低成本娱乐方式: 小说, 音乐, 视频, 电子游戏穷人小水滴娱乐音视频低成本小说游戏
穷人如何获得快乐?小说,音乐,视频,游戏,本文简单盘点一下这4大低成本(安全)娱乐方式.这里是穷人小水滴,专注于穷人友好型低成本技术.(本文为58号作品.)目录1娱乐方式1.1小说(网络小说)1.2音乐1.3视频(b站)1.4游戏(电子游戏/计算机软件)2低成本:一只手机即可3总结与展望1娱乐方式这几种,也可以说是艺术的具体形式.更专业的说,(娱乐)是劳动力再生产的重要组成部分.使人放松,获得快乐
100天持续行动—Day01 Richard_DL
今天开始站着学习，发现效率大幅提升。把fast.ai的Lesson1的后半部分和Lesson2看完了。由于Keras版本和视频中的不一致，运行notebook时经常出现莫名其妙的错误，导致自己只动手实践了视频中的一小部分内容。为了赶时间，我打算先把与CNN相关的视频过一遍。然后尽快开始做自己的项目。明天继续加油，争取把Lesson3和Lesson4看完。
pyhon+ffmpeg 常用音视频处理命令不再游移 ffmpeg 音视频 python
FFmpeg是多媒体领域的万能工具。只要涉及音视频领域的处理，基本上没有它做不了的事情！通俗点讲，从视频录制、视频编辑再到播放，它都能做！前段时间做了个短视频自动化脚本项目，需要自动处理音视频（包括一些合成、拼接、转场、调色等等），当时做的时候找各种命令还是很痛苦的，因此对用到的所有处理命令做了个汇总，方便以后使用。目录一、获取音频时长二、获取视频信息三、获取视频时长四、多个视频合并五、视频提取视
抱怨很廉价，别做空想家 Fang2023
今天在整理浏览器收藏夹的时候，看到一个很多年前保存的一个网页，上面是一支央视公益广告的视频，《我创故我在》。思绪一下子回到了好几年前。还记得第一次无意中在电视上看到这支广告，喜悦之情溢于言表。抱怨很廉价，别做空想家，这句歌词尤其喜欢。听着歌曲，仿佛那时候的潮气蓬勃、意气风发，又回来了，即使此时感到疲惫。【公益】央视公益广告歌曲《我创故我在》_腾讯视频
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
斟一小组鸡血视频和自己一起成长
http://m.v.qq.com/play/play.html?coverid=&vid=c0518henl2a&ptag=2_6.0.0.14297_copy有一种努力叫做靠自己http://m.v.qq.com/play/play.html?coverid=&vid=i0547o426g4&ptag=2_6.0.0.14297_copy世界最励志短片https://v.qq.com/x/pa
程序员架构师主要是做什么_程序员架构师：职责、技能与挑战绿色小猪
免费备考资料（2024年11月软考）：历年试题+视频课合集+电子讲义点击领取>>>免费刷题：2024年11月软考备考刷题点此进入>>>程序员架构师的角色定位在软件开发领域，程序员架构师是一个至关重要的角色。他们不仅需要深入理解业务需求，还要将其转化为技术上的解决方案。程序员架构师是项目中的技术领航者，负责制定和维护软件系统的整体架构，确保系统的可扩展性、可维护性和性能。他们的工作涉及从概念化到实现
Dockerfile FROM 两个 redDelta
Docker相关视频讲解：什么是容器Docker介绍实现"DockerfileFROM两个"的步骤步骤表格步骤操作1创建一个Dockerfile文件2写入FROM指令3构建第一个镜像4创建第二个Dockerfile文件5写入FROM指令6构建第二个镜像7合并两个镜像操作步骤说明步骤1：创建一个Dockerfile文件使用任意文本编辑器创建一个名为Dockerfile的文件。登录后复制#Docker
新的一年，春节假期期间，你有没有去深度思考过自己的未来？十八点心理
新的一年，是不是应该思考些什么？是继续和亲朋好友聊聊天，还是想一条属于自己的路？我们很多人会在过年的氛围中去享受当下的一切，打打麻将、打打牌、聊聊天、侃侃大山，整个人的精神状态特别好。觉得完全有一种自我满足的状态体验。但是从另外一个层面看，看到那些厉害的人，那些对于自己人生取得巨大成就的人来说，根本没有春节休息一说，在春节时分，还在见缝插针去写点文章、录个视频、思考新一年的规划。当看到那种忙碌的身
[Swift]LeetCode767. 重构字符串 | Reorganize String weixin_30591551 swift runtime
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★➤微信公众号：山青咏芝（shanqingyongzhi）➤博客园地址：山青咏芝（https://www.cnblogs.com/strengthen/）➤GitHub地址：https://github.com/strengthen/LeetCode➤原文地址：https://www.cnblogs.com/streng
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
今天是个好日子 singing阿梅
图片发自App今日小年公历日子是20180208上午赶写一个材料，关于“四风”问题自查自纠报告，待一稿已成送交主任过目，他瞄一眼即大声反对！不顾我这厢受伤的小心脏，立马重写！吓！下午两个视频会议自从单位条件改善，会议多开了不少……贷款到期开始着急上火今日写作任务还欠奉写什么呢原本想继续写《我的2017》系列很多时候所谓意义都是总结和提炼出来的码一堆文字于他人无甚意义于己也待商榷、重估。另一方面，冥
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

（四）（假视频生成）基本文本的会话头视频编辑Text-based Editing of Talking-head Video 2019

项目地址：https://www.ohadf.com/projects/text-based-editing/

效果：给定任意文本，就能随意改变一段视频里人物说的话。

Section 1：introduction

展示了基于文本的编辑结果以及以前技术的对比，主要的技术贡献：

Section 2：Related Work

面部重塑（Facial Reenactment）

视觉配音（Visual Dubbing）：

装配模型的语音动画（Speech Animation for rigged models）

基于文本的视频和音频编辑(Text-Based Video and Audio Editing)

音频合成（Audio Synthesis）

深度生成模型（Deep Generative Models）:

单目三维人脸重建（Monocular 3D Face Reconstruction）：

Section 3：Method

Method overview

3.1音素对齐（Phoneme Alignment）

3.2三维人脸跟踪与重建（3D Face Tracking and Reconstruction）

3.3 视位搜索（Viseme Search）

3.4 参数重定时和混合（ Parameter Retiming & Blending）

3.5 神经面部渲染（Neural Face Rending）:

I.训练神经面部渲染器（Training the Neural Face Renderer）

4.1.视频编辑（Video Editing）

4.2.翻译（Translation）

4.3.使用合成语音进行全句合成（Full Setence Synthesis Using Synthetic Voice）

Section 5：Evaluation analysis and Compare

Section 6：局限性和未来发展

Section 7：Conclusion

你可能感兴趣的:(GAN,视频合成,神经网络,deepfake)