Wayland旨在作为X的更简单的替代品,更易于开发和维护。
- Wayland复用了所有Linux内核的图形、输入输出技术:KMS、evdev,因此已支持的驱动可以直接拿来用。
- Wayland没有传统的Server/Client的模式,取而代之的是:Compositor/Client
- Wayland是供合成器与其客户对话的协议,以及该协议的C库实现
- Wayland合成器可以是在Linux内核模式设置和evdev输入设备上运行的独立显示服务器
Linux 本身是没有图形化界面的,所谓的图形化界面系统只不过中 Linux 下的应用程序。
- X 协议由 X server 和 X client 组成。
- X server 管理主机上与显示相关的硬件设置(如显卡、硬盘、鼠标等),它负责屏幕画面的绘制与显示,以及将输入设置(如键盘、鼠标)的动作告知 X client。
- X client (即 X 应用程序) 则主要负责事件的处理。
而且,X已经成长为合并了诸如屏幕外渲染和场景合成之类的功能,但受到X体系结构的限制,例如,composition的X实现增加了其他上下文切换,并使输入重定向之类的事情变得困难。
X的工作流程:
- 内核从输入设备获取事件,并通过evdev输入驱动程序将其发送到X。内核通过驱动设备并将不同的设备特定事件协议转换为linux evdev输入事件标准来完成所有艰苦的工作。
- X服务器确定事件影响哪个窗口,并将其发送到在该窗口上为该事件选择的客户端。X服务器实际上并不知道如何正确执行此操作,因为屏幕上的窗口位置是由合成器控制的,并且可能以X服务器无法理解的许多方式进行转换(缩小,旋转,摆动,等等)。
- 客户查看事件并决定要做什么。UI通常必须响应事件而改变-也许单击了复选框或指针输入了必须突出显示的按钮。因此,客户端将渲染请求发送回X服务器。
- X服务器接收到渲染请求后,会将其发送给驱动程序,以使其对硬件进行编程以进行渲染。X服务器还计算渲染的边界区域,并将其作为损伤事件发送到合成器。
- 损坏事件告诉合成器窗口中发生了某些更改,并且必须重新合成可见该窗口的屏幕部分。合成器负责根据其场景图和X窗口的内容渲染整个屏幕内容。但是,它必须通过X服务器来呈现它。
- X服务器从合成器接收渲染请求,然后将合成器后缓冲区复制到前缓冲区或进行页面翻转。在一般情况下,X服务器必须执行此步骤,以便它可以考虑重叠的窗口,这可能需要裁剪并确定是否可以翻页。但是,对于始终为全屏显示的合成器,这是另一个不必要的上下文切换。
如上所述,这种方法存在一些问题。X服务器没有信息来决定哪个窗口应该接收事件,它也不能将屏幕坐标转换为窗口局部坐标。即使X将屏幕的最终绘制工作移交给了合成管理器,X仍然控制着前缓冲区和模式设置。 X服务器用于处理的大多数复杂性现在都可以在内核或自包含的库中找到(KMS,evdev,mesa,fontconfig,freetype,cairo,Qt等)。
通常,X服务器现在只是一个中间人,它在应用程序和合成器之间引入了一个额外的步骤,在合成器和硬件之间引入了一个额外的步骤。
walyland工作流程
在Wayland中,合成器是显示服务器。我们将KMS和evdev的控制权转移给合成器。wayland协议允许合成器将输入事件直接发送到客户端,并让客户端将损坏事件直接发送到合成器:
- 内核获取一个事件,并将其发送到合成器。这与X情况类似,这非常好,因为我们可以重用内核中的所有输入驱动程序。
- 合成器通过其场景图进行查看,以确定应该接收该事件的窗口。场景图与屏幕上的内容相对应,并且合成器了解它可能已应用于场景图中的元素的转换。因此,合成器可以选择右窗口,并通过应用逆变换将屏幕坐标转换为窗口局部坐标。可以应用于窗口的转换类型仅限于合成器可以执行的操作,只要它可以计算输入事件的逆转换即可。
- 与X情况一样,当客户端收到事件时,它会更新UI以作为响应。但是在路途中,渲染发生在客户端中,而客户端只是向合成器发送请求以指示更新的区域。
- 合成器从其客户端收集损坏请求,然后重新合成屏幕。然后,合成器可以直接发出ioctl来调度带有KMS的翻页。
walyland渲染
在上面的概述中遗漏的细节之一是客户如何在Wayland下实际渲染。通过从图片中删除X服务器,还删除了X客户端通常呈现的机制。但是已经在X下的DRI2中使用了另一种机制:直接渲染。通过直接渲染,客户端和服务器共享视频内存缓冲区。客户端链接到诸如OpenGL之类的渲染库,该库知道如何对硬件进行编程并将其直接渲染到缓冲区中。
当合成器合成桌面时,合成器又可以获取该缓冲区并将其用作纹理。初始设置后,客户端仅需要告诉合成器要使用哪个缓冲区以及何时何地向其提供了新内容。
这为应用程序留下了两种更新窗口内容的方法:
将新内容呈现到新缓冲区中,并告知合成器使用该内容代替旧缓冲区。应用程序可以在每次需要更新窗口内容时分配一个新的缓冲区,也可以保留两个(或多个)缓冲区并在它们之间循环。缓冲区管理完全在应用程序控制之下。将新内容呈现到以前告诉合成器使用的缓冲区中。
尽管可以直接渲染到与合成器共享的缓冲区中,但这可能会与合成器竞争。合成器重新绘制桌面可能会中断重新绘制窗口内容。如果应用程序在清除窗口后但呈现内容之前被中断,则合成器将从空白缓冲区进行贴图。结果是应用程序窗口将在空白窗口或半渲染内容之间闪烁。
避免这种情况的传统方法是将新内容呈现到后台缓冲区,然后从那里复制到合成器表面。后台缓冲区可以动态分配,大小足以容纳新内容,或者应用程序可以保留缓冲区。同样,这在应用程序控制之下。
无论哪种情况,应用程序都必须告诉合成器表面的哪个区域容纳新内容。当应用程序直接呈现到共享缓冲区时,需要注意合成器存在新内容。而且,在交换缓冲区时,合成器不假定任何更改,并且需要应用程序发出请求才能重新绘制桌面。即使应用程序将新缓冲区传递给合成器,该缓冲区只有一小部分也可能会有所不同,例如闪烁的光标或微调框。
合成器的类型
合成器的类型不同,具体取决于它们在操作系统的总体体系结构中所扮演的角色。例如,系统合成器可用于引导系统,处理多用户切换,可能的控制台终端仿真器等。一个不同的合成器,一个会话合成器 将提供实际的桌面环境。不同类型的合成器可以通过多种方式共存。
系统合成器可以从早期启动一直运行到关机为止。它有效地替代了内核vt系统,并可以与系统的图形启动设置和多座支持配合使用。
系统合成器可以托管不同类型的会话合成器,并让我们在多个会话之间切换(快速用户切换或安全/个人桌面切换)。
系统合成器的Linux实现通常使用libudev,例如egl,kms,evdev和cairo。
对于全屏客户端,系统合成器可以重新编程视频扫描地址,以直接从客户端提供的缓冲区中读取。
会话合成器负责单个用户会话。如果存在系统合成器,则会话合成器将嵌套在系统合成器下运行。嵌套是可行的,因为该协议是异步的。当涉及嵌套时,往返将太昂贵。如果没有系统合成器,则会话合成器可以直接在硬件上运行。
X11允许客户端从其他客户端嵌入窗口,或者让客户端将其他客户端渲染的像素图内容复制到其窗口中。这通常用于面板中的applet,浏览器插件等。Wayland不允许直接这样做,但是客户端可以带外传送GEM缓冲区名称,例如,使用D-Bus,或在面板启动小程序时使用命令行参数。另一种选择是使用嵌套的Wayland实例。为此,Wayland服务器必须是主机应用程序链接到的库。然后,主机应用程序会将Wayland服务器套接字名称传递给嵌入式应用程序,并且需要实现Wayland合成器接口。主机应用程序将客户端表面作为其窗口的一部分进行合成,也就是说,在网页或面板中。嵌套Wayland服务器的好处在于,它提供嵌入式客户端向主机通知缓冲区更新所需的请求,以及用于转发来自主机应用程序的输入事件的机制。
这种设置的一个示例是将Flash Player嵌入为专用合成器的firefox。
Wayland协议和操作模型
Wayland协议是一种异步的面向对象的协议。所有请求都是对某个对象的方法调用。该请求包括一个对象ID,该ID唯一地标识服务器上的一个对象。每个对象都实现一个接口,并且请求包括一个操作码,该操作码标识接口中要调用的方法。
该协议是基于消息的。客户端发送到服务器的消息称为请求。从服务器到客户端的消息称为事件。一条消息包含许多参数,每个参数都有特定的类型。
此外,该协议可以指定枚举的准名称来特定数字枚举值。这些本质上仅是描述性的:在有线格式级别,枚举只是整数。但是它们还具有辅助目的,以增强类型安全性或添加用于语言绑定或其他此类代码的上下文。仅在引入这些属性之前编写的代码,在此之后仍然有效时,才支持后一种用法。换句话说,添加枚举不会破坏API。
枚举可以仅定义为一组整数,也可以定义为位域。这是通过枚举定义中的布尔值属性指定的。如果此属性为true,则打算主要使用按位操作来访问该枚举,例如,当任意多个枚举可以一起进行“或”运算时;如果为false,或者省略了属性,则枚举参数只是一系列数值。
服务器将事件发送回客户端,每个事件都是从一个对象发出的。事件可能是错误条件。事件包括对象ID和事件操作码,客户端可以从中确定事件的类型。事件是响应请求(在这种情况下,请求和事件构成往返)而生成的,或者是在服务器状态更改时自发生成的。
状态更改时发出事件。客户端必须侦听这些更改并缓存状态。不需要查询服务器状态。
服务器将广播许多全局对象的存在,而这些对象又将广播其当前状态。
连线格式
每条消息的结构都是32位字。值以主机的字节顺序表示。标题中包含2个字:
第一个字是发送者的对象ID(32位)。
第二个具有2个部分的16位。高16位是消息大小,以字节为单位,从标头开始(即最小值为8)。低位是请求/事件操作码。
有效负载描述了请求/事件参数。每个参数始终与32位对齐。在需要填充的地方,填充字节的值是不确定的。没有描述类型的前缀,但是可以从xml规范中隐式地推断出来。
参数类型的表示如下:
int,uint
该值是有符号/无符号int的32位值。
fixed
签名24.8个十进制数字。它是带符号的十进制类型,提供一个符号位,23位的整数精度和8位的十进制精度。在C API方面,这是不透明的结构,带有转换辅助函数,往返于double和int之间。
string
以无符号的32位长度开始,然后是字符串内容,包括终止空字节,然后填充到32位边界。
object
32位对象ID。
new_id
32位对象ID。根据请求,客户端确定ID。带有new_id的唯一事件是全局变量的通告,并且服务器将使用0x10000以下的ID。
array
从32位数组大小(以字节为单位)开始,然后逐字逐行排列数组内容,最后填充到32位边界。
fd
文件描述符不是存储在消息缓冲区中,而是存储在UNIX域套接字消息(msg_control)的辅助数据中。
该协议包括几个用于与服务器交互的接口。每个接口都如上所述提供请求,事件和错误(实际上只是特殊事件)。特定的合成器实现可能有自己的接口作为扩展提供,但是总有几种可能会出现。
核心接口
wl_display
核心全局对象
wl_registry
全局注册表对象
wl_callback
回调对象
wl_compositor
合成器单例
wl_shm_pool
共享内存池
wl_shm
共享内存支持
wl_buffer
wl_surface的内容
wl_data_offer
提供传输数据
wl_data_source
提供传输数据
wl_data_device
数据传输装置
wl_data_device_manager
数据传输接口
wl_shell
创建桌面样式的表面
wl_shell_surface
桌面式元数据界面
wl_surface
屏幕上的表面
wl_seat
输入设备组
wl_pointer
指针输入设备
wl_keyboard
键盘输入设备
wl_touch
触摸屏输入设备
wl_output
合成器输出区域
wl_region
区域界面
wl_subcompositor
次表面合成
wl_subsurface
wl_surface的接口
希望客户端通过wl_data_offer.accept使用其接受的mime类型调用请求来向数据发送客户端提供反馈。 如果接收方客户端不支持任何广告的mime类型,则应为接受请求提供NULL。接受请求使发送客户端接收到wl_data_source.target具有所选mime类型的事件。
拖动结束后,接收方客户端会收到一个 wl_data_device.drop事件,预计将使用该wl_data_offer.receive请求传输数据 。