Paper_weekly

CVPR 2019 | 基于骨架表达的单张图片三维物体重建方法

现有的单视角三维物体重建方法通过采用不同的几何形状表达方式取得了不同程度的成功，但它们都难以重建出拓扑复杂的物体形状。为此，华南理工大学，香港中文大学（深圳）以及微软亚研院联合提出一种以骨架（meso-skeleton）为桥梁融合多种形状表达方式优点的深度学习算法，非常有效地解决了这一难题。

为了能够准确地抓住物体的拓扑结构，本文引入了骨架做为桥梁，因其具有保护拓扑而又易于学习的优点。为了能够从图片中准确地推断出对应物体的骨架，他们设计了一个全新的骨架合成网络架构，利用平行双分支结构分别合成曲线状和曲面状骨架。

同时，他们采用了分阶段学习的方式以融合多种形状表达方式（体素，点云，三角网格）各自的优点。图像的多阶段层级利用有助于减小各阶段学习时累计的预测误差。实验结果表明，这一方法在定量和可视化对比均优于现有的重建方法。这项工作受到会议评审者的一致好评，三位评审者均给出了强烈接（Strong Accept）的意见，已收录为 CVPR 2019 Oral 论文。

Introduction

从单张图片恢复出三维物体形状这一研究课题在许多应用中扮演着重要的角色，例如增加现实，图像编辑。但是由于物体的拓扑结构复杂多变，这一课题也颇具挑战性。目前，基于体素表达的方法受限于三维卷积网络计算和内存的限制而难以得到高分辨率的输出。基于点云表达的方法又很难生成平滑而又干净的表面。

三角网格表达对物体形状提供了一种更有效，更自然的离散化逼近方式。最近的一些方法尝试直接从输入图像中恢复物体的网格表达。这些方法本质上是在对一个给定拓扑连接关系的初始网格变形，比较有代表性的初始网格有单位平面，球。尽管它们有一定的效果，但是仍然难以恢复具有复杂拓扑结构的物体表面，例如图 1 所表示的具有细长的杆的椅子。

▲ 图1. 本文提出的方法能从单视角图像中重建完整的三维物体，而且能正确地恢复拓扑

因此，本文提出了一种基于骨架表达的分阶段学习方法，来实现从单张图片恢复物体表面网格表达，对于重构桌子椅子这些具有细长结构的物体效果尤为显著。他们引入了骨架，因其能很好地保护拓扑，而且相比于复杂的表面更易于学习。

他们的方法具体分为以下三个阶段：

第一阶段是从输入图像中学习生成骨架点云。为此他们设计了平行的双分支网络架构，被命名为 CurSkeNet 和 SurSkeNet，分别用于曲线状和曲面状骨架点云的合成。为了 CurSkeNet 和 SurSkeNet 的训练，他们针对 ShapeNet 的物体模型处理了骨架数据集来当做 ground truth 用于训练。

在第二个阶段，他们通过将合成的骨架点云体素化，然后用三维卷积网络对粗糙的骨架体素进行修复提取出一个初始网格。此处为了减小高清体素输出时的网络复杂度，采取了用全局结构引导分块体素修复的方式。

最后一个阶段使用图卷积神经网络来对前面获得的初始网格进行变形以得到最后表面网格表达。

Approach

▲ 图2. 算法流程图总览

Overview

图 2 展示了他们方法的整个流程图。输入物体的单视角图像 I , 本文的目标是重构出网格表达的完整物体形状，同时能正确地抓住三维物体的拓扑结构。为了解决这一难题，本文基于骨架表达，提出了以下分三个阶段的物体重构过程。

在第一阶段，他们采用编码器-解码器的网络结构从输入图片 I 学习出对应的骨架 K，它本质上是一个更简洁紧凑的点云表达。

在第二个阶段，他们把获得的骨架 K 先转成一个粗糙的体素表达的 Vk，然后用三维卷积神经网络对其进行修复，得到一个更精细化的体素 V。

在最后一个阶段，他们先从体素 M 中提取出一个粗糙的初始网格 Mb，然后再用图神经网络对网格的顶点位置进一步优化，得到最后的输出网格 M。每个阶段都有一个图像编码器来提取所各自需要的信息，因此输入图片 I 引导着三个阶段的学习过程。

Learning of Meso-Skeleton

CurSkeNet 和 SurSkeNet：给定输入图像 I，他们采用 ResNet-18 做为编码器将提取的特征映射成高维空间的向量，然后设计译码器同于生成骨架点云，而译码器的网络架构是基于 CurSkeNet 和 SurSkeNet 的平行双分支结构。

这样的设计方法，可使曲线状和曲面状的骨架区域的合成得以独立完成，互不干扰。SurSkeNet 通过对一些 2D 平面进行变形，来逼近曲面状骨架。CurSkeNet 对一些 1D 直线进行变形，通过实施仿射变换来形成曲线，然后学习如何将这些曲线聚集成曲线状的骨架部分。

Network Training：本文用曲线状和曲面状的骨架点云分别去训练 CurSkeNet 和 SurSkeNet，所以采用 Chamfer Distance（CD 距离）做为损失函数的一部分，其定义如下：

为了保证变形的局部一致性，防止出现过大的变形，他们还在骨架学习过程中加上了拉普拉斯平滑正则化项。它被定义为：

From Skeleton to Base Mesh

▲ 图3. 高清体素表达的骨架合成方法流程图

Sub-volume Synthesis with Global Guidance：为了保护骨架 K 所抓住的拓扑结构以及得到粗糙的初始网格，他们需要将 K 进行修复以得到一个高分辨率的体素表达。

具体地做法如下，先把骨架K体素化，得到两种分辨率下的体素表达，被记做，，分辨率为。

如图 3 所示，他们采用两个三维卷积网络用于骨架体素的全局结构和局部子块合成。全局结构合成网络用于对的修复，产生一个分辨率为的骨架体素表达。局部子块合成网络用从中均匀切割出来的子块做输入，对这些子块独立地进行修复。当修复每个子块的时候，全局网络的输出中对应的对应的子块也被一起输入，使得每个子块修复后的结果仍然保持全局一致性。

▲ 图4. (a) 输入图片(b) 学习到的骨架点云 (c) 只分子块进行修复 (d) 加上全局结构引导 (e) 加上图像的引导

Image-guided Volume Correction：为了纠正在骨架生成阶段时的预测误差，我们再次利用输入图像 I，从中学习一个低分辨率的骨架体素表达，将其集成到我们前面提到的全局结构合成网络，得到一个更准确的全局结构。这最终将有助于我们得到一个更好的修复结果 V。如图 4 所示，图像 I 的使用大大提高了修复后的骨架体素 V 的效果。

Base Mesh Extraction：得到修复后的体素 V 后，我们用 Marching Cubes 算法来产生初始网格 Mb，它仍然保留着和骨架 K 一样的拓扑结构。为了减轻后续的计算负担，我们对 Mb 进行了简化。

Mesh Refinement

▲ 图5. 三角网格变形网络

到目前为止他们获得了抓住潜在物体拓扑结构的初始网格 Mb，但是还缺乏物体表面的细节。他们利用图卷积神经网络结合输入图像对粗糙的初始网格进行变形，达到在 Mb 的表面处补充细节的目的。

图 5 所示是他们的网格变形网络。本文的图神经卷积网络由一些图卷积层组成，每个层对 Mb 的每个顶点以及其局部邻域实施空间滤波操作。图卷积层的定义如下：

与 Pixel2Mesh 类似，我们也将从图像 I 提取出来的特征结合到对应的顶点位置上来促进学习过程。关于损失函数选择，此阶段再次使用了 CD 距离来训练。同时加上了平滑正则项来规范网格变形过程。一个是 edge regularization，用于防止边长过长，避免大的变形，造成形状畸变。另外一个是 normal loss，用于保证输出物体表面的平滑。

Experiments

Single-view Reconstruction

为证明所提出方法在单视角重构这个任务上的有效性，本文挑选了 ShapeNet 中有代表性的五个物体种类（plane, bench, chair, table, firearm）来进行实验说明。

Qualitative results

▲ 图6

图 6 展示了我们方法与现有方法的视觉对比结果。可以看出，我们的方法（f）已经超过了其他方法（b-e），因为我们生成的是完整的物体形状网格表达，而且能抓住正确的拓扑结构，以及刻画更多的细节。

Quantitative Results

通过使用网格上采出具有 10000 个点的点云，本文采用 CD 和 EMD 来评估重建质量。表 1 展示了与其他方法量化对比的结果。

▲ 表1. 单视角重建方法的 CD EMD 对比结果

Generalization on real images

图 7 所示是我们的方法在三张真实图片上的重构结果。可以看到重建结果的质量与合成图片的结果十分相似。特别是图 7(a) 所示，该图片虽然与 ShapeNet 无关，但是我们仍然能将看不到的细杆很好地重构出来。这一结果也证明了我们方法优秀的泛化能力。

▲ 图7. 真实图像测试结果

Evaluation on Skeleton Inference

在这一节，我们对我们骨架学习方法的几个变种进行比较，用此来说明我们最后所选用的模型是最优的。

它们是：1）“Point-only fitting”方式直接采用PointSetGeneration 去回归骨架点坐标；2）“Line-only fitting”方式移除了我们方法中的面拟合分支，只通过对多根直线变形来逼近骨架；3）“Square-only fitting”方式则移除了线拟合分支，只通过对多个平面变形来逼近骨架；4）“Line-and-Square fitting”则是只用一个 MLP 来同时学习线和面的变形；5）“Ours w/o laplacian”代表我们的模型但没有加拉普拉斯平滑项。

Quantitative Results

▲ 表2. 骨架学习方法的CD对比结果

由表 2 可以看出我们最终的骨架学习模型比其它的几个变种方法更优。另外一个发现是我们的拉普拉斯正则化项有助于骨架预测得更加准确。

Qualitative Results

▲ 图8

图 8 用一个例子展示了这些骨架学习方法的视觉对比结果。由此图可以观察到利用双平行预测分支用于曲线状和曲面状骨架独立合成这一设计方法和拉普拉斯平滑项的有效性。

总结

从单个视角恢复一个物体的三维形状是计算机视觉领域中一项基础性而又具有挑战性的任务。本文提出的框架将这一任务分成三个阶段，它首先恢复点云表达的 3D 骨架，然后这些骨架点被转为体素表达，通过三维卷积网络合成一个更

可靠的体素用于提取粗糙的初始网格。最后，一个图神经网络被用于学习网格变形来产生表面细节。正如文中的实验所示，这一方法在可视化和量化上均优于现有其他方法。但是这也有两个将来可以改进的方向：1）如何将全部流程整合成一个端到端训练的网络；2）在骨架学习，体素生成，网格变形每个过程尝试使用对抗学习，以更一步提高最后输出结果的质量。

点击以下标题查看更多往期内容：

CVPR 2019 | 无监督领域特定单图像去模糊
图神经网络综述：模型与应用
近期值得读的10篇GAN进展论文
小样本学习（Few-shot Learning）综述
万字综述之生成对抗网络（GAN）
可逆ResNet：极致的暴力美学
小米拍照黑科技：基于NAS的图像超分辨率算法
AAAI 2019 | 基于区域分解集成的目标检测

#投稿通道#

让你的论文被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？ 答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学习心得或技术干货。我们的目的只有一个，让知识真正流动起来。

来稿标准：

• 稿件确系个人原创作品，来稿需注明作者个人信息（姓名+学校/工作单位+学历/职位+研究方向）

• 如果文章并非首发，请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发，均会添加“原创”标志

投稿邮箱：

• 投稿邮箱：[email protected]

• 所有文章配图，请单独在附件中发送

• 请留下即时联系方式（微信或手机），以便我们在编辑发布时和作者沟通

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 下载论文

Data Mesh：《华为数据之道》中的数据治理和**Data Mesh**架构的理念差异 PersistDZ 数据架构华为架构 data mesh 数据之道
《华为数据之道》中的数据治理和DataMesh架构的理念有一定的差异，尽管两者都强调如何有效管理和利用数据，但它们的侧重点、方法论和适用场景有所不同。以下是它们的异同、优劣势及适用场景的详细比较：1.数据治理与DataMesh的定义数据治理（《华为数据之道》中的数据治理）数据治理是一个全面的过程，旨在通过规范化、标准化、系统化的数据管理，使数据成为企业的核心资产。书中提出了数据治理的五化模型（标准
前端必备：Node.js中child_process模块深度解析前端没钱 NodeJs系列文档持续更新前端 node.js
文章目录一、Node.js与child_process初相识二、child_process核心方法全解析2.1spawn：强大的进程启动器2.2exec：简洁的命令执行者2.3execFile：直接执行文件的利器2.4fork：专为Node.js子进程而生三、实际场景中的应用实例3.1执行外部脚本3.2任务并行处理四、使用过程中的注意事项4.1资源管理4.2错误处理4.3安全考量五、总结与展望一、
protobuf: 通讯录2.4 yiren_liusong 笔记序列化和反序列化计算机网络 protobuf
1.proto36.map语法⽀持创建⼀个关联映射字段，也就是可以使⽤?map?类型去声明字段类型，格式为：mapmap_field=N;要注意的是：key_type是除了float和bytes类型以外的任意标量类型。value_type可以是任意类型。map字段不可以⽤repeated修饰map中存⼊的元素是⽆序的2.通讯录2.4：用map类型定义Remark(备注信息)contacts.pro
【HarmonyOS NEXT应用开发】案例65：Fabric 自定义组件开发指导青少年编程作品集 c语言 c++开发语言华为 harmonyos 华为云华为od
1.编写RN调用Fabric组件的代码编写MarqueeViewNativeComponent.tsx，注意，如果要使用Codegen，文件必须以NativeComponent命名。在文件中使用codegenNativeComponent创建MarqueeView组件，其中MarqueeViewProps里声明了src属性和onStop事件：typeOnStopEventData=Readonly
Spring Boot教程之五十七：在 Apache Kafka 上发布 JSON 消息潜洋 Java中级 Spring Boot spring boot apache kafka
SpringBoot|如何在ApacheKafka上发布JSON消息ApacheKafka是一个发布-订阅消息系统。消息队列允许您在进程、应用程序和服务器之间发送消息。在本文中，我们将了解如何在SpringBoot应用程序中向ApacheKafka发送JSON消息。为了了解如何创建SpringBoot项目，请参阅本文。JSON的全称是JavaScriptObjectNotation。JSON是一种
金融支付行业技术侧重点编程一生金融
1.合规问题第三方支付系统必须符合《非银行支付机构监督管理条例》的规定。其中，要尤其注意第18条。第十八条非银行支付机构应当具备必要和独立的业务系统、设施和技术，按照强制性国家标准以及相关网络、数据安全管理要求，确保支付业务处理的及时性、准确性和支付业务的连续性、安全性、可溯源性。非银行支付机构的业务系统及其备份应当存放在境内。我主要解释里面提到的两点:第一个是部署合规性，一个是跨国业务的合规性。
有用过kafka的延迟队列功能的人吗 xiamu_CDA kafka 分布式
有用过Kafka的延迟队列功能的人吗？在当今的数据处理和消息传递领域，ApacheKafka已经成为了一个不可或缺的工具。它以其高吞吐量、低延迟和可扩展性而闻名。然而，随着应用场景的多样化，Kafka的延迟队列功能逐渐进入了人们的视野。你有没有想过，在处理复杂业务逻辑时，Kafka的延迟队列功能能带来哪些优势？本文将深入探讨这一话题，并分享一些实际应用中的经验和最佳实践。什么是Kafka的延迟队列
机器学习——逻辑回归口_天_光健 python 机器学习逻辑回归
逻辑回归技术文档目录简介逻辑回归的基本概念逻辑回归的数学原理逻辑回归的实现步骤代码示例逻辑回归的应用逻辑回归的优化方法逻辑回归的局限性逻辑回归的扩展与变体逻辑回归与其他算法的对比总结简介逻辑回归（LogisticRegression）是一种广泛应用于分类问题的统计方法。尽管名字中有“回归”二字，但逻辑回归实际上是一种分类算法，主要用于二分类问题，但也可以通过扩展用于多分类问题。逻辑回归通过使用逻辑
一些网络问题汇总 winzap 技术心得网络 windows internet 服务器路由器 dns服务器
IP与MAC绑定的难题问：我的计算机原来采用公网固定IP地址。为了避免被他人盗用，使用“arp-sipmac”命令对MAC地址和IP地址进行了绑定。后来，由于某种原因，又使用“arp-dipmac”命令取消了绑定。然而，奇怪的是，取消绑定后，在其他计算机上仍然不能使用该IP地址，而只能在我自己的计算机上使用。需要说明的是，我的计算机并不是代理服务器。答：虽然在TCP/IP网络中，计算机往往需要设置
Harmony Next开发手册：学写一个NAPI子系统小小煤球 HarmonyOS 鸿蒙开发 OpenHarmony 鸿蒙 harmonyos 前端华为鸿蒙系统开发语言 android
此篇文章，我们主要是熟悉下NAPI框架，并一起写一个支持NAPI的子系统，这样以后当我们想在hap应用里加自己功能的时候就可以方便的添加。NAPI框架简介NAPI（NativeAPI）组件是一套对外接口基于Node.jsN-API规范开发的原生模块扩展开发框架。类似于Android的JNI，NAPI框架实现了应用层ts/ets/js语言编写的代码和OpenHarmony的native代码（c/c+
C++单例模式实现 huaichekk c++单例模式开发语言
单例模式（SingletonPattern）是软件设计模式中的一种，用于确保一个类只有一个实例，并提供一个全局访问点来获取这个实例。一、初始版本（手动创建释放）一个类只有一个实例的实现方法：隐藏构造函数，是外界无法创造对象通过类静态成员函数getInstance返回静态局部对象指针（指向堆空间的指针数据成员），确保对象生命周期和程序一致，并且在程序中唯一使用destory释放堆空间#include
CDP中的Hive3之Hive Metastore（HMS）对许 #Hive #Spark hive cdp
CDP中的Hive3之HiveMetastore（HMS）1、CDP中的HMS2、HMS表的存储（转换）3、HWC授权1、CDP中的HMSCDP中的HiveMetastore（HMS）是一种服务，用于在后端RDBMS（例如MySQL或PostgreSQL）中存储与ApacheHive和其他服务相关的元数据。Impala、Spark、Hive和其他服务共享元存储。与HMS的连接包括HiveServe
卷积神经网络（CNN）：深度学习中的核心模型任义礼智信深度学习 cnn 人工智能
引言卷积神经网络（ConvolutionalNeuralNetworks,CNNs）是深度学习领域的一种重要模型，广泛应用于图像处理、计算机视觉、自然语言处理等多个领域。CNN凭借其卓越的特征提取能力和参数共享机制，已成为计算机视觉任务中最主流的算法之一。本文将深入探讨CNN的基本原理、结构组件、应用场景及其发展方向。CNN的基本原理CNN是一种特殊的前馈神经网络（FeedforwardNeura
30.Java 多线程锁（synchronized 锁的八种情况、synchronized 锁、公平锁与非公平锁、可重入锁、死锁）我命由我12345 Java -基础入门开发语言 ide java-ee java intellij-idea intellij idea jdk
一、synchronized锁的八种情况1、情况一（1）需求一部手机，测试先是AA线程打印短信还是BB线程打印邮件（2）测试Phone资源类packagecom.my.sync;publicclassPhone{publicsynchronizedvoidsendMes(){System.out.println("method1：sendMes");}publicsynchronizedvoids
时间是什么 EdmundXjs 奇思妙想创业创新学习方法职场和发展
国际计量单位时间的方法‌目前是采用原子钟原理，1秒等于铯133原子基态两个超精细能级之间跃迁对应辐射的9192631770个周期所持续的时长。物理学上对时间的定义是：时间是物质的永恒运动、变化的持续性、顺序性的表现，包含时刻和时段两个概念。地球所处的宇宙，或许只是别人播放的一段电影，它是可以被暂停、跳转甚至直接关闭。暂停，作为宇宙内的一份子是无法感知到的，因为所能感知的一切都没有发生变化。跳转，或
22.C语言Unicode编码与多字节字符处理详解余识- C语言基础 c语言数据库
目录1.Unicode简介2.字符的表示方法3.多字节字符的表示4.宽字符5.多字节字符处理函数5.1mblen5.2wctomb5.3mbtowc()5.4wcstombs5.5mbstowcs本篇原文为：C语言Unicode编码与多字节字符处理详解。更多C++进阶、rust、python、逆向等等教程，可点击此链接查看：酷程网1.Unicode简介C语言诞生时，只考虑了英语字符，使用7位的AS
Java 8 Stream filter流式过滤器详解通关大名顶顶 Java核心教程专栏 java java实战编程软件开发程序设计程序开发计算机
引言Java8的引入给我们带来了强大的StreamAPI，它彻底改变了我们处理集合数据的方式。在日常开发中，我们经常需要对数据进行筛选、过滤和转换，而Stream的filter方法无疑是实现这些操作的绝佳利器。在本文中，我们将用生动的讲解与实际代码示例，带你全面掌握Stream的filter方法。以下是本文的精彩亮点：✨高效筛选：如何使用filter方法轻松筛选符合条件的数据。精准查找：结合fin
ARM体系与架构吃饱了好撑 arm开发架构
ARM体系与架构硬件基础ARM处理器什么是哈佛结构和冯诺依曼结构？冯诺依曼结构采用指令和数据统一编址，使用同条总线传输，CPU读取指令和数据的操作无法重叠。哈佛结构采用指令和数据独立编址，使用两条独立的总线传输，CPU读取指令和数据的操作可以重叠。利弊冯诺依曼结构主要用于通用计算机领域，需要对存储器中的代码和数据频繁的进行修改，统一编址有利于节约资源。哈佛结构主要用于嵌入式计算机，程序固化在硬件中
springmvc复习笔记漫漫逆袭路 springmvc
springmvc1:j简单的入门案例springmvc.xmlpom,xmlUTF-81.81.85.0.2.RELEASEorg.springframeworkspring-context${spring.version}org.springframeworkspring-web${spring.version}org.springframeworkspring-webmvc${spring.
OD C卷【热点网站统计】 laufing OD 算法题 C卷自定义排序
题目企业路由器的统计页面，有一个功能需要动态统计公司访问最多的网页URLtopN，设计一个算法，可以高效动态统计TopN的页面；输入描述：每一行都是一个url或者一个数字；如果是url，代表一段时间内的网页访问，如果是一个数字N，代表本次需要输出的TopN个url;输入约束：总访问网页数量小于5000个，单网页访问次数小于65535次；网页url仅由字母、数字、点组成，且长度小于等于127字节；数
Oracle SQL每日一问之ORA-01723:zero-length columns are not allowed yan han ORACLE SQL oracle sql 数据库
我：CREATETABLETABLE_1PARALLEL8ASSELECT/*+parallel(8)*/t1.emp_no,NULLemp_nameFROMtemp1t1;[AI机器人bot:]在你的SQL语句中，错误"zero-lengthcolumnsarenotallowed"可能是由于在创建表时没有为`NULLemp_name`指定数据类型。即使在`CREATETABLE...ASSEL
pytest测试框架多系统并存+yml编写测试用例实现 weixin_44872675 pytest pytest
实现一个支持多系统共存的接口测试框架，同时结合YML文件编写测试用例，需要考虑以下关键点：每个系统的独立性：各系统可以有独立的配置（如conftest.py、环境变量等）。测试用例按系统和模块组织。统一管理和执行：测试用例可以按系统、模块或标签（如优先级）动态选择执行。支持共享框架的核心逻辑（如用例执行、结果收集、上下文管理）。YML用例兼容性：每个系统的YML用例格式一致，支持用例依赖、动态参数
android直播类app开发 weixin_44693887 ffmpeg android android studio
在移动互联网时代，直播成了一种极受欢迎的互动形式，不管是娱乐、教育、还是商业等领域都有应用。而Android直播应用则是近年来备受关注的一个领域。本文将从原理和详细介绍两个方面，对Android直播类应用开发进行探讨。一、Android直播类应用的原理Android直播类应用的原理就是将视频通过摄像头采集，经过压缩编码后通过网络传输至服务器，再由服务器推流至直播平台，最终用户可以通过直播平台进行观
【机器学习：十五、神经网络的编译和训练】 KeyPan 机器学习机器学习神经网络人工智能深度学习 pytorch ubuntu linux
1.TensorFlow实现代码TensorFlow是深度学习中最为广泛使用的框架之一，提供了灵活的接口来构建、编译和训练神经网络。以下是实现神经网络的一个完整代码示例，以“手写数字识别”为例：importtensorflowastffromtensorflow.kerasimportlayers,models#加载MNIST数据集(x_train,y_train),(x_test,y_test)
【机器学习：十六、其他的激活函数】 KeyPan 机器学习机器学习人工智能算法服务器运维 ubuntu
1.Sigmoid激活函数的替代方案Sigmoid激活函数在神经网络中曾广泛使用，其数学公式为：σ(x)=11+e−x\sigma(x)=\frac{1}{1+e^{-x}}σ(x)=1+e−x1输出范围为(0,1)，适合二分类问题。但随着深度学习的发展，Sigmoid函数逐渐被替代，主要原因包括：梯度消失问题：当输入绝对值较大时，梯度趋近于零，导致权重更新困难。非零中心问题：输出值始终为正，可能
Linux驱动学习--DRM框架介绍及基于DRM框架的HDMI开发文艺小少年 linux android hdmi 驱动程序 drm
目录一、引言二、DRM框架介绍三、DRM框架的使用四、源码分析一、引言Android4开始，hdmi等视频输出框架开始由framebuffer想DRM迁移，今天我们就来简单分析下DRM框架二、DRM框架介绍DRM是一个内核级的设备驱动，具体的说是显卡驱动的一种架构源码位置因为Linuxkernel内部接口和数据结构可能随时发生变化，所以DRI模块要针对特定的内核版本进行编译。kernel2.6.2
深度学习图像算法中的网络架构：Backbone、Neck 和 Head 详解肥猪猪爸 #深度学习深度学习算法人工智能数据结构神经网络计算机视觉机器学习
深度学习已经成为图像识别领域的核心技术，特别是在目标检测、图像分割等任务中，深度神经网络的应用取得了显著进展。在这些任务的网络架构中，通常可以分为三个主要部分：Backbone、Neck和Head。这些部分在整个网络中扮演着至关重要的角色，它们各自处理不同的任务，从特征提取到最终的预测输出，形成了一个完整的图像处理流程。本文将详细介绍这三部分的作用以及它们在目标检测和图像分割中的应用，帮助大家更好
i2ctransfer 炭烤毛蛋 ---Android-------Linux----#Tools arm开发 i2c-tools
i2ctransferi2ctransfer是一个在Linux系统上通过I2C总线与设备通信的工具，它通常用于执行低级的I2C数据传输。这个命令允许用户通过I2C总线进行读取和写入操作。它是i2c-tools包的一部分，通常用于调试和与I2C设备进行交互。提示:i2c通信失败可以参考《rk3568I2C》。文章目录i2ctransfer前期准备1.i2ctransfer简述1.1`i2ctrans
python中print输出格式汇总_Python格式化字符串（格式化输出）白字不白
我们在《第一个Python程序——在屏幕上输出文本》中讲到过print()函数的用法，这只是最简单最初级的形式，print()还有很多高级的玩法，比如格式化输出，这就是本节要讲解的内容。熟悉C语言printf()函数的读者能够轻而易举学会Pythonprint()函数，它们是非常类似的。print()函数使用以%开头的转换说明符对各种类型的数据进行格式化输出，具体请看下表。表1Python转换说明
ARM架构与嵌入式系统开发全流程教程夏勇兴
本文还有配套的精品资源，点击获取简介：ARM架构因其低功耗、高性能和灵活性而广泛应用于嵌入式系统、移动设备等多种计算平台。本教程将深入介绍ARM处理器的类型，包括Cortex系列、ARMv8-A架构，以及Thumb和Thumb-2指令集。同时，涵盖ARM编程基础知识，包括汇编语言、C/C++编程和软件开发工具链，以及嵌入式系统中的应用和入门级教程，帮助初学者逐步掌握ARM处理器的工作原理和嵌入式系
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

CVPR 2019 | 基于骨架表达的单张图片三维物体重建方法

Introduction

Approach

Experiments

总结

你可能感兴趣的:(CVPR 2019 | 基于骨架表达的单张图片三维物体重建方法)