在Linux 2.6下使用ACE根据地址解析主机名的时候,发现一个BUG。
解析用的ACE函数是ACE_INET_Addr::get_host_name,查看源码发现,这个函数最终调用了glibc2中的gethostbyaddr_r函数。在OS_NS_netdb.inl文件中128~141行:
# elif defined (__GLIBC__) // GNU C library has a different signature ACE_OS::memset (buffer, 0, sizeof (ACE_HOSTENT_DATA)); //FUZZ: disable check_for_lack_ACE_OS if (::gethostbyaddr_r ((char *) addr, length, type, result, buffer, sizeof (ACE_HOSTENT_DATA), &result, h_errnop) == 0) return result;
上面的问题在于,gethostbyaddr_r这个函数出错时,返回值也可能为0。所以,根据返回值为0判断成功是不对的。判断是否执行成功,需要判断错误号“*h_errnop”的值是否为0,
例如,我测试执行的时候,就发现*h_errnop==1(即HOST_NOT_FOUND),返回值=0的情况。
不过,这个问题最终根源更可能是glibc2的实现错误。因为,在linux文档中,虽然没有找到关于gethostbyaddr_r返回值的表述,但有关于gethostbyname_r 和gethostbyname2_r 的返回值描述,其中提到:“These return 0 on success and non-zero on error.”
而且,从这个函数设计的角度来说,出错时返回值也不应该为0。
先记下来再说。
---------------
补充:
又查看了glibc2.1.12的源码,调用路径为:
__gethostbyaddr_r --> __gethostbyaddr2_r --> __nss_hostname_digits_dots
当*h_errnop == HOST_NOT_FOUND时,返回值为errno,但此时*h_errnop != errno,因此BUG应该在这里。
注:h_errnop是为了函数可重入而引入代替errno的。