Android的BUG(五)- Android跨进程使用GraphicBuffer的野指针问题

之前在调试flash 11在ICS上的使用效果时(这个版本使用的是surfaceView,市场上下的,基本上都是用nativeWindow了),发现一个bug,bug的现象如图1所示(访问http://www.qiaqiafood.com,页面主体是一个flash):

Android的BUG(五)- Android跨进程使用GraphicBuffer的野指针问题_第1张图片

图1:错误的图片

Android的BUG(五)- Android跨进程使用GraphicBuffer的野指针问题_第2张图片

图2:正常的图片

Webpage加载时,没有问题,但当将网页上下拖动后,就出现如图1所示的黑色区域,且图像显示的层叠关系也不正常。

该问题则追踪过程不细说,也花了好久。对这个问题:

1. 通过dump framebuffer的数据:

$adb shell cat/dev/graphics/fb0 > framebuffer.bin
 查看结果,framebuffer中确实是花的,和屏幕上表现的一致,这不意外

2. 接上hierarchyviewer,分析framebuffer,却发现这是好的

3. 通过screencap -p /sdcard/screenshot.png 发现也是好的


 有现象和重现方法,接下来分析原因了。

从现象上看,这个问题是与画图,也就是surfaceFlinger有关的。查看surfaceFlinger的状态:

#dumpsys SurfaceFlinger

重点关注下BrowserActivity:

+ Layer 0x95cc0(com.android.browser/com.android.browser.BrowserActivity)
     z=    21025, pos=(0,0),size=(1024, 600), isOpaque=0, needsDithering=0, invalidate=0, alpha=0xff,flags=0x00000000, tr=[1.00, 0.00][0.00, 1.00]
     client=0x918a8, identity=40
     format= 1, activeBuffer=[1024x 600:1024, 1], transform-hint=0x00, queued-frames=0
           mBufferCount=2, mSynchronousMode=1, default-size=[1024x600],mPixelFormat=1, mTexName=3
           current: {crop=[0,0,-1,-1], transform=0x00, current=1}
           next   : {crop=[0,0,-1,-1],transform=0x00, FIFO(0)={}}
            [00] state=FREE    ,crop=[0,0,-1,-1], transform=0x00, timestamp=16875976105982, 0x919b0 [1024x600:1024,  1]
           >[01] state=QUEUED  ,crop=[0,0,-1,-1], transform=0x00, timestamp=16877388086666, 0x8b6a0 [1024x600:1024,  1]
 Region transparentRegion (this=0x95e60, count=1)
   [  0, 211, 1014, 715]
 Region transparentRegionScreen (this=0x95cf4, count=1)
   [  0, 211, 1014, 715]
  RegionvisibleRegionScreen (this=0x95cd0, count=2)
   [  0,   0, 1024, 211]
   [1014, 211, 1024, 552]
 
仔细分析输出内容,可以发现一个问题:browser的区域是有一个透明区域:

[  0,211, 1014, 715]

这个区域把整个activity(对应的surface),划分为两个可见区域:

   [  0,   0, 1024, 211]

   [1014, 211, 1024, 552]

Scroll一下browser的页面,再查看BrowserActivity的状态,两次一样,这个透明区域的位置坐标竟然没有随着scroll跟着改变

顺着surfaceView的创建和render过程,发现问题了:

Android将surfaceView(一般的Game, video及browserplugin会使用的一种view)在其layout的区域,会设成transparent(也就是挖洞), 但是其设置只是在attachWindow的时候做的。这样造成的问题是:transparent的区域是固定的,当一个页面scroll的时候,不会更新这个transparent区域的boundary,最终给hwComposer合成的boundary,和scroll之后,surface的内容对不上,造成hwcomposer合错

知道问题后,解决方法也可以知道了。

常规做法:让每次layout的遍历viewHierarchy时都做transparent的重置, 但这个影响面太大且较复杂(还没找到可行的修改方法)

workaround做法:给hwComposer的composer区域,不考虑transparent区域即可 (目前测试,还没看到会造成系统有什么不好的的影响),让它把surface的区域全部拿去计算(理论上效率可能有影响,但没观测出来影响)

修改方法,注释掉[email protected]中对visibleRegionScreen的赋值:

   hwcl->visibleRegionScreen.rects =
           reinterpret_cast<hwc_rect_t const *>(
                   visibleRegionScreen.getArray(
                           &hwcl->visibleRegionScreen.numRects));
 
至于hierarchyviewer和screencap得到的screenshot为何是好的呢?这里可以看看screenshot的实现(在surfaceFlinger中),这个screenshot和framebuffer的合成还不是一回事,screenshot没有用到hwcomposer,只是通过openGL将各个layer直接draw到FBO中,这里就没有挖洞的区域了,实际计算的区域和workaround后差不太多了。

 

另外还有两个问题:

1. 在scroll 窗口和初次加载flash(会比网页慢), flash内容盖住navigation bar的问题, 如图

   Android的BUG(五)- Android跨进程使用GraphicBuffer的野指针问题_第3张图片

    图3:surfaceView overlap BrowserActivity

2. 网页Scroll的时候,flash内容的scroll和browser内容不同步的问题,不同步的区域会留有黑框。

 覆盖的问题,由于surfaceView默认是放在browser的surface前面的,这个无解,要解只能将surfaceView放在borwser的后面(前面说过,由于surface有实现挖洞(transparent)的功能,实际上放在后面也是可以解决的)


而不同步的问题,参看今年的google IO关于webview的介绍,这个在surfaceView上应该是无解了,Google的解决方法,是使用Hardware Accelerated,通过clipLayer/mediaLayer的方式 (openGL的纹理贴图)。相信webview插件往后都不会用surfaceView实现了吧。

 

不过近期,我在某超大型跨国公司的同事,也碰到类似问题,现象几乎一样,也是跨进程使用Surface引起的这个问题。查看Android的release更新,4.0,4.1和4.2都没有修复这个问题

你可能感兴趣的:(Android的BUG(五)- Android跨进程使用GraphicBuffer的野指针问题)