奇怪的master_peer启动问题

阅读更多

这几天在suse10下面配置oracle的enterprise manager的时候,master peer起不来,在rhel3下面一点问题都没有
起来的时候出错:

  1. stat:/opt/oracle/product/9.2.0/network/snmp/peer # ./master_peer CONFIG.master NOV   
  2. Setup select/poll problem: Bad file descriptor   
  3. ./master_peer: error processing configuration   
  4. *** glibc detected *** ./master_peer: double free or corruption (fasttop): 0x0807d948 ***   
  5. ======= Backtrace: =========   
  6. /lib/libc.so.6[0xb7e40cb1]   
  7. /lib/libc.so.6(__libc_free+0x84)[0xb7e42314]   
  8. ./master_peer[0x805cd09]   
  9. ./master_peer[0x804e120]   
  10. ./master_peer[0x804b275]   
  11. /lib/libc.so.6(__libc_start_main+0xdc)[0xb7df287c]   
  12. ./master_peer(_IO_getc+0x41)[0x8048dc1]   
  13. ======= Memory map: ========   
  14. 08048000-08066000 r-xp 00000000 68:03 97956      /opt/oracle/product/9.2.0/network/snmp/peer/master_peer   
  15. 08066000-08067000 rwxp 0001d000 68:03 97956      /opt/oracle/product/9.2.0/network/snmp/peer/master_peer   
  16. 08067000-0809e000 rwxp 08067000 00:00 0          [heap]   
  17. b7b9c000-b7bd1000 r-xs 00000000 68:02 1183412    /var/run/nscd/dbVtklvZ (deleted)   
  18. b7bd1000-b7bd9000 r-xp 00000000 68:02 738756     /lib/libnss_files-2.4.so   
  19. b7bd9000-b7bdb000 rwxp 00007000 68:02 738756     /lib/libnss_files-2.4.so   
  20. b7c00000-b7c21000 rwxp b7c00000 00:00 0    
  21. b7c21000-b7d00000 ---p b7c21000 00:00 0    
  22. b7dd1000-b7ddb000 r-xp 00000000 68:02 738781     /lib/libgcc_s.so.1  
  23. b7ddb000-b7ddc000 rwxp 00009000 68:02 738781     /lib/libgcc_s.so.1  
  24. b7ddc000-b7ddd000 rwxp b7ddc000 00:00 0    
  25. b7ddd000-b7ef8000 r-xp 00000000 68:02 738739     /lib/libc-2.4.so   
  26. b7ef8000-b7efa000 r-xp 0011a000 68:02 738739     /lib/libc-2.4.so   
  27. b7efa000-b7efc000 rwxp 0011c000 68:02 738739     /lib/libc-2.4.so   
  28. b7efc000-b7eff000 rwxp b7efc000 00:00 0    
  29. b7f0b000-b7f0c000 rwxp b7f0b000 00:00 0    
  30. b7f0c000-b7f26000 r-xp 00000000 68:02 738732     /lib/ld-2.4.so   
  31. b7f26000-b7f28000 rwxp 0001a000 68:02 738732     /lib/ld-2.4.so   
  32. bff5e000-bff73000 rwxp bff5e000 00:00 0          [stack]   
  33. ffffe000-fffff000 ---p 00000000 00:00 0          [vdso]   
  34. Aborted (core dumped)   
  35. stat:/opt/oracle/product/9.2.0/network/snmp/peer #    

查看core文件

  1. stat:/opt/oracle/product/9.2.0/network/snmp/peer # gdb master_peer core   
  2. GNU gdb 6.6  
  3. Copyright (C) 2006 Free Software Foundation, Inc.   
  4. GDB is free software, covered by the GNU General Public License, and you are   
  5. welcome to change it and/or distribute copies of it under certain conditions.   
  6. Type "show copying" to see the conditions.   
  7. There is absolutely no warranty for GDB.  Type "show warranty" for details.   
  8. This GDB was configured as "i586-suse-linux"...   
  9. Using host libthread_db library "/lib/libthread_db.so.1".   
  10.   
  11. warning: Can't read pathname for load map: Input/output error.   
  12. Reading symbols from /lib/libc.so.6...done.   
  13. Loaded symbols for /lib/libc.so.6  
  14. Reading symbols from /lib/ld-linux.so.2...done.   
  15. Loaded symbols for /lib/ld-linux.so.2  
  16. Reading symbols from /lib/libnss_files.so.2...done.   
  17. Loaded symbols for /lib/libnss_files.so.2  
  18. Reading symbols from /lib/libgcc_s.so.1...done.   
  19. Loaded symbols for /lib/libgcc_s.so.1  
  20. Core was generated by `./master_peer CONFIG.master NOV'.   
  21. Program terminated with signal 6, Aborted.   
  22. #0  0xffffe410 in __kernel_vsyscall ()   
  23. (gdb) where   
  24. #0  0xffffe410 in __kernel_vsyscall ()   
  25. #1  0xb7e058d0 in raise () from /lib/libc.so.6  
  26. #2  0xb7e06ff3 in abort () from /lib/libc.so.6  
  27. #3  0xb7e3b32b in __libc_message () from /lib/libc.so.6  
  28. #4  0xb7e40cb1 in malloc_printerr () from /lib/libc.so.6  
  29. #5  0xb7e42314 in free () from /lib/libc.so.6  
  30. #6  0x0805cd09 in mgmt_term_env ()   
  31. #7  0x0804e120 in agent_shutdown ()   
  32. #8  0x0804b275 in main ()   
  33. (gdb)    

进程起来的时候怎么调用了agent_shutdown 函数?

master_peer.out显示错误:

  • Setup select/poll problem: Bad file descriptor   
  • ./master_peer: error processing configuration
  • 在metalink下找到一个文章,需要设置把ulimit -n 2048,尝试设置成2048,还是不行,实在没办法,推出crt登陆,直接进root下,再尝试启动master_peer,居然起来了

    观察了一下,直接进root的时候ulimit -n的值是1024,而进oracle后再su到root的话,ulimit -n的值是65536,原来问题真的出在open files上面,metalink还是对的,只是suse10下面要设置1024才行,rhel3上面设置成8192都没问题

    是跟操作系统内核还是什么有关?这个open files参数起什么影响?

    你可能感兴趣的:(Oracle,XP,Linux,SuSE)