场景描述:哈佛大学的研究者,通过将 AI 技术引入建筑的设计流程,为生成建筑的图纸规划提供了更合理和多样式的选择,为人工智能在建筑设计行业的发展,带来了进一步的尝试和探索。
关键词: GANs 建筑设计 学科融合
本文转载自公众号「读芯术」 ID:AI_Discovery
撰文 | Stanislas Chaillou (哈佛设计学院)
编译 | 吴梦涵、卢佳琦
通读全文预计用时 13 分钟
GAN 生成的总体规划图
作为一门学科,人工智能已经渗透到了无数领域,可以应用到各行各业之前未能解决的挑战之上。之前有篇文章写道, AI 在建筑领域中的运用虽仍处于起步阶段,但却大有前景,甚至会重塑建筑学科。
那么,这个论断到底对不对?本文打算将 AI 应用于建筑环境之中来证实这个预言的准确性。
具体来说,我们打算将 AI 应用于建筑平面图的分析与生成。最终的目标分为三个方面:
1. 生成建筑平面图,如优化大量且高度多元的平面图设计的生成;
2. 挑选合格的建筑平面图,如提供适当的分类方法;
3. 允许用户「浏览」生成的设计选项。
我们方法主要来源于两种直觉:1. 虽然包含了标准优化技术,但是创建建筑平面图确是一项非凡的技术挑战;2. 空间设计是一个连续的过程,需要横跨不同规模(城市规模、建筑规模与单位规模)的连续设计步骤。
为了利用以上两点,我们选择了嵌入式生成对抗神经网络( Generative Adversarial Neural Networks )。该模型能让我们在所遇到的建筑平面图中捕捉到更多的复杂性,并且通过连续的步骤来解决问题以分解这些复杂性。每个步骤都对应一个给定模型,且专门针对该特定任务进行训练,整个过程最终可以证实人机交互的可能性。
平面图实际上是一个高维度问题,处于可量化技术与定性属性的交叉口。研究建筑先例往往是一个危险的过程,在分析不够严谨的情况下,忽视了现有资源数量的丰富性。我们的方法受当前数据科学方法的启发,旨在确定优质的建筑平面图。通过创建 6 个指标,我们提出了一个可捕获平面图建筑相关参数的框架。 一方面,占地、朝向、厚度与材质这三个指标可用于捕捉给定平面图风格的本质;另一方面,计划、连通性和流通性则旨在描述平面图组织的本质。
简而言之,机器曾是铅笔的延伸,如今却可用于绘制建筑知识,并通过训练来帮助我们创建可行的设计选择。
一. 框架
我们的工作处于建筑与人工智能的交汇处。前者是话题,后者是方法。两者都已简化成清晰且可操作的类别。
「建筑」在这里可理解为风格与组织的交集物。一方面,我们认为建筑物是具有文化意义的载体,通过几何学、分类学、类型学与装饰来表达某种风格——巴洛克、罗马、哥特、现代与当代,仔细研究平面图便可找到许多建筑风格;另一方面,建筑物则是工程与科学的产物,遵循严格的框架与规则——建筑规范、人体工程学、能量效率、出口与程序等——这些都可以在我们阅读平面图时找到。这种组织要求会帮助我们完成对「建筑」的定义,并且推动我们的研究。
框架矩阵
我们将会用到人工智能的两个主要研究领域—— Analytics 和生成对抗网络,以作为研究工具。
首先,我们将深入探讨「生成」这一主题。我们会使用 GANs 来将我们自己的人工智能系统运用于建筑设计之中。我们假设人工智能的使用可以增强建筑学科的实践。该领域是一个全新的领域,还处于试验阶段,并且已经得到了令人惊讶的结果。我们希望能够训练人工智能来绘制真实的建筑平面图。
然后我们会提出一个强大的分析框架来挑选与分类生成的平面图。最终,我们的目标是组织 GANs 的结果,使用户能够无缝浏览各种创建的设计选项。为此,数据科学所提供的工具的数量和普遍性将会证明我们的研究是有价值的。
通过这种双重设计,在风格与组织、挑选与生成的交叉口,我们制定了一个框架来安排建筑与人工智能的相遇。
二. 生成
设计建筑平面图是建筑实践的核心。掌握平面图的设计是该学科的黄金标准。从业者加班加点、不断尝试通过技术的手段来提高这项实践。在第一部分中,我们深入探讨了应用于平面图生成的人工智能的潜力,以进一步推动这一领域的发展。
为了解决平面图的风格与组织问题,在下文中,我们会运用框架来探讨基于人工智能的空间规划潜能。我们的目标是提供一套可靠强大的工具来证明这种方法的潜能并验证我们的假设。
存在三个方面的挑战:1. 选择正确的工具集;2. 分离正确的现象来展示给机器;3. 确保机器正确地“学习”。
人工智能与生成对抗神经网络
生成对抗神经网络( GANs )是我们选择的武器。在人工智能领域,神经网络是重要的研究领域。最近,生成对抗神经网络的出现证明了这种模型的创造能力。作为机器学习模型,GAN 能在给定的数据中学习统计重要的现象。然而,它们的结构代表着一个重大突破:GAN 由生成器与判别器这两个关键模型组成,可以利用这两个模型之间的反馈循环来提高生成相关图像的能力。判别器用于从数据中识别图像。经过适当的训练,该模型能够区分从数据集中提取出来的真实图像和数据集不熟悉的“假”图像。然而,生成器则是用于创建图像,这些图像与来自相同数据集中的图像相似。当生成器生成图像时,判别器会向它反馈其输出的质量。作为回应,生成器会采纳这些反馈,以生成更加逼真的图像。通过这个反馈循环,GAN 慢慢建立了创建相关合成图像的能力,将在数据中发现的现象考虑在内。
生成对抗神经网络的结构
呈现与学习
如果 GANs 为我们带来了巨大的机会,那么知道向它们展示什么是至关重要的。我们有机会让模型直接从建筑平面图中学习。通过格式化图像,我们可以控制模型学习的信息类型。比如,将地块形状与相关建筑占地展示给我们的模型就会得到一个新的模型,它能够根据地块的形状来创建典型的建筑占地。为了确保输出的质量,我们将运用我们的“建筑感”来组织训练集的内容:每个模型的好坏取决于建筑师所提供的数据。
A. 风格转变
现代到巴洛克风格的转变
在建筑平面图中,可以通过墙壁的形状与图形平面来判定其“风格”。典型的巴洛克教堂以厚重的柱子与圆形凹痕为特征,Mies van der Rohe 的现代别墅则以又薄又平的墙壁为特征。GAN 能够识别墙壁表面的锯齿形状。通过展示这两幅图像并且将其中一幅作为平面图线框,另一幅作为实际的墙结构,我们可以根据建筑风格建立一定数量的机器直觉。
该部分展示了模型学习巴洛克风格的成果图。我们继续风格转换,将给定建筑平面图的厚墙壁磨平(A),然后再赋予其新的墙壁风格(B)。
风格转变结果:公寓单元 现代到巴洛克风格的转变
B. 布局辅助
布局辅助 分步骤流程
在本节中,我们准备了一份多步骤的流程图,包含了绘制建筑平面图的所有必要步骤。它能根据不同建筑规模模仿建筑师绘制平面图,并且将每个步骤压缩至一个特定模型之中,用于执行给定操作。从地块到建筑占地图,从建筑占地图到标明墙壁和开窗的房间图,从房间图到精装平面图,每一步都经过精心设计、训练与测试。
生成流程 (模型 I to III)
同时,通过将整个流程分成几个单独的步骤,该系统考虑到了每个模型之间的用户干扰。通过选择与编辑模型输出,用户可以在输出进入下个模型之前控制设计过程。它的输入决定了模型的决策,从而能够实现预期的人机交互。
1. 占地
周边 | 地块 (输入)| 生成占地 (输出)
流程的第一步解决了根据给定地块几何创建适当的建筑占地图的挑战。为了训练这个模型,我们使用了波士顿建筑占地图的广泛数据库,并且创建了一系列模型,每个都能匹配某种特定的房产类型:商业房、住宅、公寓与工业房等。
每个模型都能根据给定的地块创建一组相关建筑占地图,其大小与风格都类似于训练中的类型。下图是使用住宅模型的 9 个示例:
结果: 生成占地 (住宅)
2. 房间分割与开窗
占地| 开口 & 阳台 (输入) | 计划 & 开窗 (输出)
下一步自然是建筑占地图中房间的布局了。能够分割给定的建筑平面图,并且保留有意义的衔接、正常的房间尺寸与适当的开窗是一项挑战。GANs能够迎刃而解,并且产生令人惊讶的结果。
通过使用含有大约700个带注释的建筑平面图的数据集,我们能够训练出各种模型。每个都面向特定的房间数,并且一旦用于空白的建筑占地图就能产生意想不到的相关结果。下图展示了一些典型的结果:
结果:生成计划&开窗
3. 配置家具
计划 (输入, 选项 1) | 家具位置 (输入, 选项 2)| 配置家具的单元 (输出)
最后一步将生成原理带到了最细微的层面:往空间里添加家具。为此,我们首先训练模型来一次性完成整个公寓的家具配置。
该网络能基于各个房间的计划、空间里家具的相关布置以及各个元素的大小来学习。结果如下图所示:
结果: 配置家具的单元
这些结果能让我们大致了解可能的家具布局,但是成果图的质量仍然太模糊了。为了进一步提高输出质量,我们为各个房间类型(客厅、卧室与厨房等)额外训练了一组模型。每个模型只能将平面图上的色块转变为精心绘制的家具,家具类型用颜色代码编号。各模型结果如图所示:
配置房间家具模型的结果 | 浴室 / 厨房 / 客厅 / 卧室
4. 再进一步
如果能运用技术实现标准公寓的生成,那么下一步自然是进一步挑战模型的极限。实际上,GANs 具有显著的灵活性以解决看似困难重重的问题。在建筑平面图的布局中,由于建筑占地图的大小与形状有变,人工划分与装饰空间是一个极具挑战的过程。在这种情况下,我们的模型非常“聪明”,能够适应变化的限制条件,证明如下:
GAN下的空间布局
我们可以控制建筑单元的入口和门窗,加上模型非常灵活,因此能够超越单个建筑单元,解决更大规模的空间规划问题,在下图的示例中,我们将技术应用扩展到了整个建筑物之中。
GAN生成的实验总体规划图
三.挑选合格的平面图
无法命名则增加了世界的混乱。
——Albert Camus
为了平衡我们生成建筑平面图的能力,找到适当的框架,对生成的设计选项进行组织、排序和分类至关重要。建筑平面图的好坏取决于我们对生成选项数据库的驾驭能力。通过借用建筑概念,我们希望将常见的建筑用语转化为可量化的指标。
为此我们建立了 6 个关键指标来形容建筑平面图设计的 6 个重要方面:占地、计划、朝向、厚度与质地、连通性与流通性。
6 个指标
这些指标组成了一个综合框架,可解决建筑平面图的风格与组织问题。每个指标都是一种算法,并且经过了全面测试。
A. 占地
建筑物形状是用于确定建筑物风格的最简单的也是最直观的指标。「占地」这个指标可分析建筑物平面图周边的形状,并将其转化为直方图。
该描述符号能在对建筑物形状进行编码的情况下,将建筑师口中常用的形容词——如「薄」、「笨重」与「对称」等——转化为数字信息,以便于与计算机交流关于建筑形状的信息。
占地图
从技术层面来说,该指标运用极凸性将给定轮廓转变为一组离散值(向量),然后将其与其它建筑平面图进行比较。我们运用来自平面图中心的极线阵列来提取平面图区域,这些区域由空间切片捕捉而成。如下图所示,事实证明,该方法能够取得不错的成果。该技术同样也可用来确定室内空间形状与建筑物周边的形状。
运用占地指标的典型建筑平面图 (左: query , 右: results )
B. 计划
建筑物计划,换句话说也就是所含房间的类型,是内部组织的主要驱动要素。了解这一点对我们的方法来说至关重要。为了描述房间组合,我们用颜色为给定建筑平面图的各个房间进行编码。这些颜色组合就变成了描述建筑物计划的指标。它充当模板,融合了建筑平面图的房间数量和计划质量。这一指标对人类来说看起来很直观,它也可以转换成机器能够理解的可靠的编码技术。
运用计划指标的典型建筑平面图 (左: query , 右: results)
从技术层面上来说,通过运用颜色组合,我们可以计算任意给定建筑平面图之间的计划相似性和差异性。为了可视化结果,每个平面图都既是彩色建筑平面图,又是计划的一维颜色向量。
运用计划指标的典型建筑平面图(左: query , 右: results , 底部: results’ program )
C. 朝向
平面图中墙壁朝向能够提供重要信息。它既能描述平面图的封闭性(墙壁朝向所造成空间封闭性),也能描述其风格。事实上,只需提取墙壁朝向的直方图,我们就可以运用这个指标轻松区分现代房屋与哥特式大教堂。
朝向图
从技术层面上来说,“朝向”提取了给定建筑平面图中的墙壁,沿着各个空间方向(从 0 到 360 度)来总结其长度。评估平面图总体朝向,然后得出一组数值。该指标可用于获取单个描述符号,也可当作向量来比较各个平面图。
运用朝向指标的典型建筑平面图 (左: plan, 右: orientation)
D. 厚度与材质
「厚度与材质」这个指标确定了平面图的「肥瘦」:墙壁厚度与厚度变化。在不同风格的平面图中,墙壁厚度与墙体材质差异巨大。在学院派风格的大厅中可以看见厚柱子与参差不齐的厚墙壁,但是在 Mies van der Rohe 的别墅中则只能看到呈直线型的薄墙壁。该指标能够轻松掌握这些特征(如下图所示):
厚度与材质
从技术层面上来说,该指标能分离给定平面图中的所有墙壁,并输出有关墙壁厚度的直方图。同时,该算法也可计算墙壁厚度的变化,以更好地描述墙壁材质(如平坦的墙壁与竖框)。
运用厚度与材质指标的典型建筑平面图分析(左: plan , 右: resulting diagrams )
E. 连通性
「连通性」这个指标解决了房间邻接的问题。房间之间彼此的接近程度是建筑平面图中的重要指标。另外,房间之间通过门与走廊来连接,这决定了房间之间彼此的连接。“连通性”将房间连接当作标准图表,以此来研究连接的数量和质量。
连通性与邻接矩阵
从技术层面上来说,通过平面图中的开窗,我们可以推断出房间之间现有的关系图。然后“连通性”会创建矩阵图来呈现这些连接。最终有关房间连接的图表就生成了。通过这个图表,我们可以比较不同的建筑平面图,考虑它们房间连接的相似性。
运用连通性指标的典型建筑平面图分析(左: connectivity graph , 右: plan adjacencies )
F. 流通性
建筑平面图中的流通性描述了人们在空间中的移动。通过提取流通性的骨架,换句话说也就是流通网络的线框,我们可以量化与确定人们在建筑平面图中的移动。
流通性
从技术层面上来说,「流通性」提取了给定建筑平面图的流通程度,并且沿着空间各个方向(从 0 到 360 度)来总结其长度。所得直方图评估了该流通网络形状,可用于比较不同建筑平面图的流通性。
运用流通性指标的典型建筑平面图分析 (左: circulation graph , 右: diagram )
四. 绘制与浏览
比较平面图得到的相似的平面图
回顾我们的 GAN 模型,每个模型都在生成流程的各个步骤输出了多个选项。随后,设计师需要「挑选」出心仪的选项,并且在需要的时候改进该选项,然后再进入下一步。然而,浏览生成选项实则是个既难受又耗时的过程。为此,「挑选合格的平面图」章节中所描述的 6 个指标在这儿可以发挥它们的所有潜力,补充我们的生成流程。用户可将它们用作过滤器来缩小选择范围,在几秒钟内找到相关设计选项。生成过滤器的双重性在于我们的工作价值得到了更多的证明:我们提供了一个完整的框架,并且在普通用户力所能及的范围内利用了人工智能。
一旦模型根据给定标准(占地、计划、朝向、厚度与材质、连通性与流通性)进行过滤,我们就会为用户提供一幅树状图来呈现他/她的选择。选定选项在树状图中央,周围是最接近用户选择标准的选项。然后用户可以缩小搜索范围,寻找最理想的设计选项,或是选择树状图里的其他选项,来重新计算图形。
建筑平面图的相似树状图
五. 总结
人工智能很快就会大力帮助建筑师进行日常实践了。随着这种潜能即将得到证实,我们参与了概念的验证,我们的框架提供了讨论的契机。我们邀请建筑师参与人工智能,建议数据科学家将建筑作为研究领域。但是今天我们的工作可以总结为以下四个方面:
首先,从概念上来说,我们相信设计概念的统计方法决定了人工智能在建筑方面的潜能。它的不确定性和全面性无疑为我们的领域创造了机会。依靠它们来提取重要品质,并在整个设计过程中模仿它们,而不是利用机器来优化变量,是一种范式上的转变。
其次,我们坚信,正确设计流程的能力将推动人工智能成为新的建筑工具。我们选择了 Andrew Witt 教授在 Log 中引入的「灰盒测试」,有可能会得到最佳的潜在结果。「灰盒测试」与「黑盒测试」相反,后者只允许用户提前输入信息,在流程结束时才能得到设计选项,无法控制连续的生成步骤。相反,通过将整个流程分解成单独的步骤,「灰盒测试」允许用户随时干预。对机器的严格控制是对设计过程质量的最终保证。
第三,在技术层面上,我们认为应用程序的顺序性会提高其可管理性,并且会促进其发展。能够在整个生成过程中进行干预是非常重要的:该流程的各个步骤代表着建筑专业知识的不同板块,每个模型都可以独立训练,这有利于未来的重大改进与实验。实际上,从头到尾改进整个流程可能是一项漫长而繁琐的任务,但是逐步改进却是可管理的过程,并且是在业内大多数建筑师和工程师的能力范围之内的。
最后,我们希望我们的框架能够解决模型(不管是需要训练的模型还是生成流程中的模型)的无限广度和复杂性的问题。我们相信,在诸多选项中,像我们那样处理地块-占地-房间分割等是一种可行的方法。要想概括空间规划的必要步骤,关键在于原则而非方法。随着获取建筑数据变得愈加容易,我们鼓励大家开放思想,进一步进行研究与实验。
我们并不是将人工智能视作建筑领域的新教条,而是将其看作一项充满潜力和希望的新挑战。在这里我们有可能取得丰硕的成果,这将丰富我们的实践,并且解决我们学科中的一些盲点。