Windbg 调试 SOS 版本问题

为什么80%的码农都做不了架构师?>>>   hot3.png

程序发生了崩溃,我抓了一个mini Dump,Mini dump 有一个优点就是非常的小。比full dump 要小很多。

复制代码
0:020> .loadby sos clr                       //首先加载sos 0:020> !threads The version of SOS does not match the version of CLR you are debugging. Please

load the matching version of SOS for the version of CLR you are debugging. CLR Version: 4.0.30319.1008 SOS Version: 4.0.30319.1022


0:020> .cordll -ve -u -l

CLRDLL: C:\Windows\Microsoft.NET\Framework64\v4.0.30319\mscordacwks.dll:4.0.30319.1022 f:8 doesn't match desired version 4.0.30319.1008 f:8 CLRDLL: Loaded DLL c:\symbols\mscordacwks_AMD64_AMD64_4.0.30319.1008.dll\517A18FF965000\mscordacwks_AMD64_AMD64_4.0.30319.1008.dll

CLR DLL status: Loaded DLL c:\symbols\mscordacwks_AMD64_AMD64_4.0.30319.1008.dll\517A18FF965000\mscordacwks_AMD64_AMD64_4.0.30319.1008.dll

还有一种错误:


If you are debugging a minidump, you need to make sure that your executable
path is pointing to clr.dll as well.
The version of SOS does not match the version of CLR you are debugging. Please
load the matching version of SOS for the version of CLR you are debugging.
CLR Version: 4.0.30319.1026
SOS Version: 4.0.30319.34209
Failed to load data access DLL, 0x80004005
Verify that 1) you have a recent build of the debugger (6.2.14 or newer)
2) the file mscordacwks.dll that matches your version of clr.dll is 
in the version directory or on the symbol path
3) or, if you are debugging a dump file, verify that the file 
mscordacwks___.dll is on your symbol path.
4) you are debugging on supported cross platform architecture as 
the dump file. For example, an ARM dump file must be debugged
on an X86 or an ARM machine; an AMD64 dump file must be
debugged on an AMD64 machine.

复制代码

 

 

.cordll –ve –u –l (小写的L ) 这个命令是控制调试和控制CLR的命令,-ve是显示详细信息,-u 卸载模块,-l (小写的L) 是加载模块,上面这个命令就是卸载CLR 调试模块,然后再加载CLR调试模块,并显示详细信息。

这个命令提示我的mscordacwks.dll 版本不对。然后有提示从 C:\symbols 加载了  mscordacwks___.dll 这个文件。

我windbg的符号文件路径的设置是:

srv*c:\symbols*http://msdl.microsoft.com/download/symbols

通过windbg的快捷键 Ctrl+S 可以设置符号文件的路径。

 

虽然看似上面的mscodacwks.dll 加载了,但是运行命令还是报错:

复制代码
0:033> !clrstack

The version of SOS does not match the version of CLR you are debugging.  Please

load the matching version of SOS for the version of CLR you are debugging.

CLR Version: 4.0.30319.1008 SOS Version: 4.0.30319.1022 OS Thread Id: 0x6e54 (33)

Child SP         IP               Call Site

000000000540a968 000007fefaab8e4f [PrestubMethodFrame: 000000000540a968] Unknown MethodDesc (Module 000007ff00a613b0, mdToken 060000aa)

000000000540a9d0 000007ff00b829fd Unknown MethodDesc (Module 000007ff00a613b0, mdToken 06000096)
复制代码

CLR.dll 是一个原生C++ Win32 Native code 编写的托管代码运行时,它是托管代码的运行环境,它从我们.net编写的生成的dll中抽取IL中间代码和元数据,通过JIT即时编译来生成内存中的原生native Code. Windbg是一个针对原生Native code 的调试器。那在原生调试器和托管代码世界之间,我们需要一座“桥梁”这就是SOS.dll。但是CLR的内部数据结构可能是要不断变化的,这时如果有一个针对调试器的一个抽象层就非常重要,调试器通过一个抽象层来访问CLR的内部数据结构。mscordacwks.dll  就是这样一个抽象层 ( Data-Access-Component  (DAC) ),它实现了让调试器SOS.dll 以比较稳定的接口来访问CLR内部不断的数据结构的目的。但CLR和SOS.dll 以及 mscordacwkd.dll 还是耦合的非常紧密的,以至乎 他们的版本必须一致才可以正常工作。

 

一般,我们的机器上安装好.net 运行时后,都有 clr.dll ,sos.dll 和mscordacwk.dll 三个版本一致的dll。

一般在调试dump文件才会出现这类不匹配的错误。因为如果是调试一个活生生的进程,调试器能自动的从.net Framework的安装目录来找到正确的mscordacwks.dll。

可以尝试

!sym noisy                                                               //显示详细信息

.symfix+ c:\symbols                                              //强制下载symbols

.reload /f;                                                                // Force reloading symbols 强制加载符号文件

.cordll -ve -u –l                                                         //重新加载调试DLL,这是加载DLL,不是符号

 

上面的命令试了后也可能不起作用。

遇到这种问题,你需要到抓取dump文件的机器上,把 mscordacwks.dll   和Sos.dll 拷贝下来,如果是别人传给你dump,则最好让他将这3个文件一起拷贝给你。拿到DLL后,确认版本正确后,改为类似一下的名字:

mscordacwks_AMD64_AMD64_4.0.30319.1008.dll

 

AMD64 这个字符串对应的是CPU架构信息,因为AMD公司先做出64位架构,Intel公司虽然也有自己的64位架构,但好像没有流行开,他还是沿用了AMD兼容的64位。而这个AMD64的遗留名字就一直使用下来了。

 

文件重命名后,可以放到windbg的exe目录下,与windbg.exe 同一个目录,也可以放到一个指定的目录下。

然后运行:

.cordll -u -ve -lp  c:\clr1008    // C盘有个clr1008文件夹,我从那里加载调试DLL,-lp 指定目录

.cordll -ve -u –l                           //从默认路径加载调试DLL。

 

 

如果遇到如下错误:

CLR DLL status: ERROR: Unable to load DLL mscordacwks_AMD64_x86_4.0.30319.1008.dll,

或者

CLRDLL: ERROR: DLL C:\Windows\Microsoft.NET\Framework\v4.0.30319\mscordacwks.dll init failure, Win32 error 0n87

CLR DLL status: ERROR: DLL C:\Windows\Microsoft.NET\Framework\ v4.0.30319\mscordacwks.dll init failure, Win32 error 0n87

说明 32位、64位这个搞错了。

你可能抓了一个32位进程的dump。64位系统上的任务管理器中,32位进程的名字类似:w3wp.exe*32,后面带一个 *32 字样,它们是运行在WoW64模式下的。同时你用了一个64位的windbg调试器在尝试调试这个dump。Dump分析必须32、64严格区分开,64位系统抓64位进程dump,用64位windbg来分析。64位系统抓32位进程dump,用32位windbg来分析。

 

还有 第三种方法,自己去获取匹配版本的关键dll。 Mscordacwk 全名是指Ms-core-Data-Access-Component (DAC) -Work.dll,是sos 访问clr数据需要的一个核心dll。

用“sos 4.0.30319.1008 ” 去网上搜索找到对应的 微软补丁包:

例如,我找到了这样一个网站: http://www.mskbfiles.com/sos.dll.php

我要的版本他这里列出来了:

Sos.dll version 4.0.30319.1008:

  • 2835393 MS13-052: Description of the security update for the .NET Framework 4 on Windows XP, Windows Server 2003, Windows Vista, Windows Server 2008, Windows 7, and Windows Server 2008 R2: July 9, 2013 Q2835393 KB2835393

点击这个链接进去,找到“下载信息”

下载信息

此更新可从 Microsoft 下载中心下载:

http://www.microsoft.com/zh-cn/download/details.aspx?id=39418, 点击这个链接去下载补丁文件

 

我的dump文件是运行在X64系统上的,那我就下载了“NDP40-KB2835393-x64.exe”。

下载这个文件,它是一个子解压的exe文件,可以用 WinRAR 或 7-Zip 打开,打开后在目录里找到 *.msp 结尾的文件,右键菜单继续打开,然后找到 *.cab文件,选中 *.cab 文件,通过右键菜单继续打开,查找里面的 sos_dll_amd64,mscordacwks_dll_am64,clr_dll_amd64文件,把他们导出到普通文件夹下,重新命名为 sos.dll,mscordacwks.dll,clr.dll,然后查看版本是不是 4.0.30319.1008。如果不是这个版本继续在 *cab 里面找dll,应该是能找到正确的文件版本。                   

Windbg 调试 SOS 版本问题_第1张图片

我就通过这种方法找到了对应 我需要的三个正确版本的dll文件。把他们放在一个clr1008的文件夹下,然后把clr1008 放与windbg.exe 同一级的目录下。这样加载敲命令就方便多了。

Windbg 调试 SOS 版本问题_第2张图片

 

我已经将文件版本保存好后,我重新加载sos.dll

复制代码
0:033> .load clr1008\sos.dll 0:033> .chain

Extension DLL search Path:

    D:\Users\Downloads\windbg\WINXP;....              //环境变量的 PATH 值  Extension DLL chain:

    clr1008\sos.dll: image 4.0.30319.1008, API 1.0.0, built Fri Apr 26 14:21:22 2013 [path: D:\Users \Downloads\windbg\clr1008\sos.dll] C:\Windows\Microsoft.NET\Framework64\v4.0.30319\sos: [path: C:\Windows\Microsoft.NET\Framework64\v4.0.30319\sos.dll] [path: D:\Users \Downloads\windbg\dbghelp.dll] ....
复制代码

我现在有2个sos.dll, 我需要把默认路径下的卸载掉

0:033> .unload C:\Windows\Microsoft.NET\Framework64\v4.0.30319\sos

Unloading C:\Windows\Microsoft.NET\Framework64\v4.0.30319\sos extension DLL 0:033> .setdll clr1008\sos.dll

这两个命令的作用是1)卸载dll,2)设置默认dll。

然后加载调试DLL:

0:020> .cordll -u -ve -lp clr1008

CLRDLL: Loaded DLL clr1008\mscordacwks.dll

CLR DLL status: Loaded DLL clr1008\mscordacwks.dll

 

如果无法正确加载PDB文件,就无法正确的显示堆栈Stack信息,问题:

复制代码
0:024> !clrstack PDB symbol for clr.dll not loaded OS Thread Id: 0x8158 (24)

Unable to walk the managed stack. The current thread is likely not a

managed thread. You can run !threads to get a list of managed threads in 0:024> kb //stack 信息无法正确显示

RetAddr           : Args to Child         : Call Site

000007fe`f9b1c841 : 00000000`77359b6e ... : clr+0x1fde45 00000000`77359b6e : 00000000`00000000 ... : clr+0x1c841

000007fe`f9cfba57 : 00000000`02340850 ... : ntdll!RtlLookupFunctionTable+0xaa 00000000`02340850 : 00000001`0000001f ...: clr+0x1fba57 0:024> .exepath+ clr1008  //+ 是表示附加 Executable image search path is: clr1008

Expanded Executable image search path is: clr1008 0:024> .reload  //必须Reload

.............. 0:024> kb  //之后的堆栈信息已经能正确显示了

RetAddr           : Args to Child        : Call Site

000007fe`f9cfba57 : 00000000`02340850 ... : clr!SVR::gc_heap::mark_object_simple1+0xbd6

000007fe`f9cf9aa9 : 00000000`02340850 ... : clr!SVR::gc_heap::mark_object_simple+0x4d7

000007fe`f9b8cf6e : 00000001`c0e4fbc8 ... : clr!SVR::GCHeap::Promote+0x161

000007fe`f9b8ec95 : 00000000`0475dd90 ... : clr!GcEnumObject+0x37

000007fe`f9b8e585 : ffffffff`00000000 ... : clr!GcInfoDecoder::EnumerateLiveSlots+0x5dd
复制代码

 

必须保证exepath指向正确的路径,默认指向的是.net Framework的安装目录,但我现在需要的是1008版本的clr.dl路径,所以需要将exepath 额外加上一个路径。

If you are debugging a minidump, you need to make sure that your executable
path is pointing to clr.dll as well.

 

在没有将clr1008目录下的clr.dll 加载到exepath时,下面的输出是这样的:

复制代码
0:000> !EEVersion 4.0.30319.1022 free

Workstation mode

SOS Version: 4.0.30319.1022 retail build 0:000> lmv m clr

start             end                 module name

000007fe`f77f0000 000007fe`f8155000   clr        (pdb symbols)          c:\symbols\clr.pdb\14AD6AF3D1B64799A5908CBBBA0E9C482\clr.pdb

    Loaded symbol image file: clr.dll

    Image path: C:\Windows\Microsoft.NET\Framework64\v4.0.30319\clr.dll

    Image name: clr.dll

    Timestamp:        Wed Jan 08 14:28:31 2014 (52CCF00F)

    CheckSum:         0096784D

    ImageSize: 00965000 File version: 4.0.30319.1022 Product version: 4.0.30319.1022 File flags: 8 (Mask 3F) Private

    File OS: 4 Unknown Win32

    File type: 2.0 Dll

    File date: 00000000.00000000 Translations: 0409.04b0

    CompanyName:      Microsoft Corporation

    ProductName:      Microsoft® .NET Framework

    InternalName:     clr.dll

    OriginalFilename: clr.dll

    ProductVersion: 4.0.30319.1022 FileVersion: 4.0.30319.1022 (RTMGDR.030319-1000)
复制代码

 

在将clr1008目录下的clr.dll 附加到 exepath后,命令输出如下:

复制代码
0:020> lmv m clr

start             end                 module name

000007fe`f9b00000 000007fe`fa465000   clr        (pdb symbols)          c:\symbols\clr.pdb\118B3CCCBA4A4A709B496CFB294BF5162\clr.pdb

    Loaded symbol image file: clr.dll Mapped memory image file: clr1008\clr.dll Image path: C:\Windows\Microsoft.NET\Framework64\v4.0.30319\clr.dll

    Image name: clr.dll

    Timestamp:        Fri Apr 26 14:04:47 2013 (517A18FF)

    CheckSum:         0095CE19

    ImageSize: 00965000 File version: 4.0.30319.1008 Product version: 4.0.30319.1008 File flags: 8 (Mask 3F) Private

    File OS: 4 Unknown Win32

    File type: 2.0 Dll

    File date: 00000000.00000000 Translations: 0409.04b0

    CompanyName:      Microsoft Corporation

    ProductName:      Microsoft® .NET Framework

    InternalName:     clr.dll

    OriginalFilename: clr.dll

    ProductVersion: 4.0.30319.1008 FileVersion: 4.0.30319.1008 (RTMGDR.030319-1000) 
复制代码

 

可以看到 pdb 符号文件已经有了,而且有了一个Mapped memory image file: clr1008\clr.dll 这一项。而且我的symbol path下缓存的clr.pdb文件也已经对应到正确的版本了。

 

额外的:

lm 可以检查你的.net 程序是否运行在 .net 4或.net 2,还是混合着 4.0 和 2.0, 就是通过 查看输出内容是否 包含 clr, mscorwk, mscorsrv 这些模块,4.0 的核心dll 是clr.dll。2.0 的核心dll是 mscorwks.dll 或者mscorsrv.dll。下面只有clr 模块,说明只工作在.net 4.0下。

复制代码
0:000> lm

start             end                 module name

…… 00000000`77530000 00000000`7764f000   kernel32   (pdb symbols) 00000000`77650000 00000000`7774a000   user32     (pdb symbols) 00000000`77750000 00000000`778f9000   ntdll      (export symbols)       

000007fe`f24e0000 000007fe`f2653000   clrjit     (pdb symbols)            

000007fe`f77f0000 000007fe`f8155000 clr  (pdb symbols)
复制代码

 

 

在这里补充一点:这篇文章是将windbg如何去正确加载 sos.dll,同时有可能需要去正确加载 clr.dll 这个exe 可执行路径。如果使用DebugDiag这类自动化工具,因为自动化工具没有可以配置去哪个路径加载exe可执行路径。需要在环境变量里设置这些参数:

_NT_EXECUTABLE_IMAGE_PATH = c:\clr1008

例如我这里就设置了这样一个环境变量,让DebugDiag 启动分析时,知道去这里找正确的clr版本。参见:http://msdn.microsoft.com/en-us/library/windows/hardware/hh439335(v=vs.85).aspx

 

 

参考资料:

http://blogs.msdn.com/b/dougste/archive/2009/02/18/failed-to-load-data-access-dll-0x80004005-or-what-is-mscordacwks-dll.aspx

http://stackoverflow.com/questions/23636764/clr-dll-exception-causes-the-iis-crashed

http://stackoverflow.com/questions/7430769/what-to-do-with-the-version-of-sos-does-not-match-the-version-of-clr-you-are-de

http://voneinem-windbg.blogspot.com/2007/10/failed-to-load-data-access-dll.html

http://blogs.msdn.com/b/tess/archive/2008/05/13/failed-to-start-stack-walk-80004005-following-frames-may-be-wrong-and-other-errors-you-may-see-in-windbg.aspx

 

 

转载于:https://my.oschina.net/potixi/blog/504459

你可能感兴趣的:(Windbg 调试 SOS 版本问题)