纯真ip库

http://blog.csdn.net/clin003/archive/2007/08/14/1743157.aspx

 

利用 QQWry.Dat 实现 IP 地址高效检索(PHP)
根据 LumaQQ 开发者文档中的纯真 IP 数据库格式详解,我编写了一个 PHP 的查询 IP 所在地区信息的类。在编写过程中发现纯真 IP 数据库格式详解中关于记录区的描述不是很全面,不过出入也不是很大,所以我没必要再写一份纯真 IP 数据库的格式说明了,大家感兴趣的话,读一读下面的代码应该就能看出来了。代码中加了很详细的注释,应该很容易读懂的。

在创建这个类的一个实例后,实例中就保存了打开的文件指针和一些查询需要的信息,每次查询时不需要重新打开文件,直到页面执行结束后,打开的文件才会自动关闭。这样。在一个页面内进行多次查询时,效率是很高的。并且此类不仅可以直接查询 IP,还可以自动将域名解析为 IP 进行查询。

下面是程序代码:

 

Java代码   收藏代码
  1. <?php  
  2. /** 
  3.  * IP 地理位置查询类 
  4.  * 
  5.  * @author 马秉尧 
  6.  * @version 1.5 
  7.  * @copyright 2005 CoolCode.CN 
  8.  */  
  9. class IpLocation {  
  10.     /** 
  11.      * QQWry.Dat文件指针 
  12.      * 
  13.      * @var resource 
  14.      */  
  15.     var $fp;  
  16.   
  17.     /** 
  18.      * 第一条IP记录的偏移地址 
  19.      * 
  20.      * @var int 
  21.      */  
  22.     var $firstip;  
  23.   
  24.     /** 
  25.      * 最后一条IP记录的偏移地址 
  26.      * 
  27.      * @var int 
  28.      */  
  29.     var $lastip;  
  30.   
  31.     /** 
  32.      * IP记录的总条数(不包含版本信息记录) 
  33.      * 
  34.      * @var int 
  35.      */  
  36.     var $totalip;  
  37.   
  38.     /** 
  39.      * 返回读取的长整型数 
  40.      * 
  41.      * @access private 
  42.      * @return int 
  43.      */  
  44.     function getlong() {  
  45.         //将读取的little-endian编码的4个字节转化为长整型数  
  46.         $result = unpack('Vlong', fread($this->fp, 4));  
  47.         return $result['long'];  
  48.     }  
  49.   
  50.     /** 
  51.      * 返回读取的3个字节的长整型数 
  52.      * 
  53.      * @access private 
  54.      * @return int 
  55.      */  
  56.     function getlong3() {  
  57.         //将读取的little-endian编码的3个字节转化为长整型数  
  58.         $result = unpack('Vlong', fread($this->fp, 3).chr(0));  
  59.         return $result['long'];  
  60.     }  
  61.   
  62.     /** 
  63.      * 返回压缩后可进行比较的IP地址 
  64.      * 
  65.      * @access private 
  66.      * @param string $ip 
  67.      * @return string 
  68.      */  
  69.     function packip($ip) {  
  70.         // 将IP地址转化为长整型数,如果在PHP5中,IP地址错误,则返回False,  
  71.         // 这时intval将Flase转化为整数-1,之后压缩成big-endian编码的字符串  
  72.         return pack('N', intval(ip2long($ip)));  
  73.     }  
  74.   
  75.     /** 
  76.      * 返回读取的字符串 
  77.      * 
  78.      * @access private 
  79.      * @param string $data 
  80.      * @return string 
  81.      */  
  82.     function getstring($data = "") {  
  83.         $char = fread($this->fp, 1);  
  84.         while (ord($char) > 0) {        // 字符串按照C格式保存,以�结束  
  85.             $data .= $char;             // 将读取的字符连接到给定字符串之后  
  86.             $char = fread($this->fp, 1);  
  87.         }  
  88.         return $data;  
  89.     }  
  90.   
  91.     /** 
  92.      * 返回地区信息 
  93.      * 
  94.      * @access private 
  95.      * @return string 
  96.      */  
  97.     function getarea() {  
  98.         $byte = fread($this->fp, 1);    // 标志字节  
  99.         switch (ord($byte)) {  
  100.             case 0:                     // 没有区域信息  
  101.                 $area = "";  
  102.                 break;  
  103.             case 1:  
  104.             case 2:                     // 标志字节为1或2,表示区域信息被重定向  
  105.                 fseek($this->fp, $this->getlong3());  
  106.                 $area = $this->getstring();  
  107.                 break;  
  108.             default:                    // 否则,表示区域信息没有被重定向  
  109.                 $area = $this->getstring($byte);  
  110.                 break;  
  111.         }  
  112.         return $area;  
  113.     }  
  114.   
  115.     /** 
  116.      * 根据所给 IP 地址或域名返回所在地区信息 
  117.      * 
  118.      * @access public 
  119.      * @param string $ip 
  120.      * @return array 
  121.      */  
  122.     function getlocation($ip) {  
  123.         if (!$this->fp) return null;            // 如果数据文件没有被正确打开,则直接返回空  
  124.         $location['ip'] = gethostbyname($ip);   // 将输入的域名转化为IP地址  
  125.         $ip = $this->packip($location['ip']);   // 将输入的IP地址转化为可比较的IP地址  
  126.                                                 // 不合法的IP地址会被转化为255.255.255.255  
  127.         // 对分搜索  
  128.         $l = 0;                         // 搜索的下边界  
  129.         $u = $this->totalip;            // 搜索的上边界  
  130.         $findip = $this->lastip;        // 如果没有找到就返回最后一条IP记录(QQWry.Dat的版本信息)  
  131.         while ($l <= $u) {              // 当上边界小于下边界时,查找失败  
  132.             $i = floor(($l + $u) / 2);  // 计算近似中间记录  
  133.             fseek($this->fp, $this->firstip + $i * 7);  
  134.             $beginip = strrev(fread($this->fp, 4));     // 获取中间记录的开始IP地址  
  135.             // strrev函数在这里的作用是将little-endian的压缩IP地址转化为big-endian的格式  
  136.             // 以便用于比较,后面相同。  
  137.             if ($ip < $beginip) {       // 用户的IP小于中间记录的开始IP地址时  
  138.                 $u = $i - 1;            // 将搜索的上边界修改为中间记录减一  
  139.             }  
  140.             else {  
  141.                 fseek($this->fp, $this->getlong3());  
  142.                 $endip = strrev(fread($this->fp, 4));   // 获取中间记录的结束IP地址  
  143.                 if ($ip > $endip) {     // 用户的IP大于中间记录的结束IP地址时  
  144.                     $l = $i + 1;        // 将搜索的下边界修改为中间记录加一  
  145.                 }  
  146.                 else {                  // 用户的IP在中间记录的IP范围内时  
  147.                     $findip = $this->firstip + $i * 7;  
  148.                     break;              // 则表示找到结果,退出循环  
  149.                 }  
  150.             }  
  151.         }  
  152.   
  153.         //获取查找到的IP地理位置信息  
  154.         fseek($this->fp, $findip);  
  155.         $location['beginip'] = long2ip($this->getlong());   // 用户IP所在范围的开始地址  
  156.         $offset = $this->getlong3();  
  157.         fseek($this->fp, $offset);  
  158.         $location['endip'] = long2ip($this->getlong());     // 用户IP所在范围的结束地址  
  159.         $byte = fread($this->fp, 1);    // 标志字节  
  160.         switch (ord($byte)) {  
  161.             case 1:                     // 标志字节为1,表示国家和区域信息都被同时重定向  
  162.                 $countryOffset = $this->getlong3();         // 重定向地址  
  163.                 fseek($this->fp, $countryOffset);  
  164.                 $byte = fread($this->fp, 1);    // 标志字节  
  165.                 switch (ord($byte)) {  
  166.                     case 2:             // 标志字节为2,表示国家信息又被重定向  
  167.                         fseek($this->fp, $this->getlong3());  
  168.                         $location['country'] = $this->getstring();  
  169.                         fseek($this->fp, $countryOffset + 4);  
  170.                         $location['area'] = $this->getarea();  
  171.                         break;  
  172.                     default:            // 否则,表示国家信息没有被重定向  
  173.                         $location['country'] = $this->getstring($byte);  
  174.                         $location['area'] = $this->getarea();  
  175.                         break;  
  176.                 }  
  177.                 break;  
  178.             case 2:                     // 标志字节为2,表示国家信息被重定向  
  179.                 fseek($this->fp, $this->getlong3());  
  180.                 $location['country'] = $this->getstring();  
  181.                 fseek($this->fp, $offset + 8);  
  182.                 $location['area'] = $this->getarea();  
  183.                 break;  
  184.             default:                    // 否则,表示国家信息没有被重定向  
  185.                 $location['country'] = $this->getstring($byte);  
  186.                 $location['area'] = $this->getarea();  
  187.                 break;  
  188.         }  
  189.         if ($location['country'] == " CZ88.NET") {  // CZ88.NET表示没有有效信息  
  190.             $location['country'] = "未知";  
  191.         }  
  192.         if ($location['area'] == " CZ88.NET") {  
  193.             $location['area'] = "";  
  194.         }  
  195.         return $location;  
  196.     }  
  197.   
  198.     /** 
  199.      * 构造函数,打开 QQWry.Dat 文件并初始化类中的信息 
  200.      * 
  201.      * @param string $filename 
  202.      * @return IpLocation 
  203.      */  
  204.     function IpLocation($filename = "QQWry.Dat") {  
  205.         $this->fp = 0;  
  206.         if (($this->fp = @fopen($filename, 'rb')) !== false) {  
  207.             $this->firstip = $this->getlong();  
  208.             $this->lastip = $this->getlong();  
  209.             $this->totalip = ($this->lastip - $this->firstip) / 7;  
  210.             //注册析构函数,使其在程序执行结束时执行  
  211.             register_shutdown_function(array(&$this, '_IpLocation'));  
  212.         }  
  213.     }  
  214.   
  215.     /** 
  216.      * 析构函数,用于在页面执行结束后自动关闭打开的文件。 
  217.      * 
  218.      */  
  219.     function _IpLocation() {  
  220.         if ($this->fp) {  
  221.             fclose($this->fp);  
  222.         }  
  223.         $this->fp = 0;  
  224.     }  
  225. }  
  226. ?>  

 

Java代码   收藏代码
  1. Discuz  5.0 不在使用自己的IP数据,而是使用纯真IP的数据格式, 存取纯真IP数据库稍微有点麻烦,它的存储格式比较特殊也很有趣,具体的格式分析参考下面两个链接,其他语言实现参考文章末的链接。  
  2.   
  3. 《纯真IP数据库格式详解》  
  4. 链接一:http://blog.csdn.Net/heiyeshuwu/archive/2006/05/12/725675.aspx  
  5. 链接二:http://lumaqq.Linuxsir.org/article/qqwry_format_detail.html  
  6.   
  7. 纯真IP数据库官网:http://www.cz88.Net/ip/  
  8. 纯真IP数据库下载:http://update.cz88.Net/soft/qqwry.rar  
  9.   
  10.    
  11.   
  12. 以下函数conrvertip()位于 Discuz!5_GBK/upload/include/misc.func.Php 路径中,有兴趣可以具体去阅读分析。(下面代码我做了简单的修改,更便于阅读,核心没有修改)  
  13.   
  14.   
  15. <?  
  16. //===================================  
  17. //  
  18. // 功能:IP地址获取真实地址函数  
  19. // 参数:$ip - IP地址  
  20. // 作者:[Discuz!] (C) Comsenz Inc.  
  21. //  
  22. //===================================  
  23. function convertip($ip) {  
  24.     //IP数据文件路径  
  25.     $dat_path = 'QQWry.Dat';  
  26.   
  27.     //检查IP地址  
  28.     if(!preg_match("/^d{1,3}.d{1,3}.d{1,3}.d{1,3}$/", $ip)) {  
  29.         return 'IP Address Error';  
  30.     }  
  31.     //打开IP数据文件  
  32.     if(!$fd = @fopen($dat_path, 'rb')){  
  33.         return 'IP date file not exists or access denied';  
  34.     }  
  35.   
  36.     //分解IP进行运算,得出整形数  
  37.     $ip = explode('.', $ip);  
  38.     $ipNum = $ip[0] * 16777216 + $ip[1] * 65536 + $ip[2] * 256 + $ip[3];  
  39.   
  40.     //获取IP数据索引开始和结束位置  
  41.     $DataBegin = fread($fd, 4);  
  42.     $DataEnd = fread($fd, 4);  
  43.     $ipbegin = implode('', unpack('L', $DataBegin));  
  44.     if($ipbegin < 0) $ipbegin += pow(2, 32);  
  45.     $ipend = implode('', unpack('L', $DataEnd));  
  46.     if($ipend < 0) $ipend += pow(2, 32);  
  47.     $ipAllNum = ($ipend - $ipbegin) / 7 + 1;  
  48.      
  49.     $BeginNum = 0;  
  50.     $EndNum = $ipAllNum;  
  51.   
  52.     //使用二分查找法从索引记录中搜索匹配的IP记录  
  53.     while($ip1num>$ipNum || $ip2num<$ipNum) {  
  54.         $Middle= intval(($EndNum + $BeginNum) / 2);  
  55.   
  56.         //偏移指针到索引位置读取4个字节  
  57.         fseek($fd, $ipbegin + 7 * $Middle);  
  58.         $ipData1 = fread($fd, 4);  
  59.         if(strlen($ipData1) < 4) {  
  60.             fclose($fd);  
  61.             return 'System Error';  
  62.         }  
  63.         //提取出来的数据转换成长整形,如果数据是负数则加上2的32次幂  
  64.         $ip1num = implode('', unpack('L', $ipData1));  
  65.         if($ip1num < 0) $ip1num += pow(2, 32);  
  66.          
  67.         //提取的长整型数大于我们IP地址则修改结束位置进行下一次循环  
  68.         if($ip1num > $ipNum) {  
  69.             $EndNum = $Middle;  
  70.             continue;  
  71.         }  
  72.          
  73.         //取完上一个索引后取下一个索引  
  74.         $DataSeek = fread($fd, 3);  
  75.         if(strlen($DataSeek) < 3) {  
  76.             fclose($fd);  
  77.             return 'System Error';  
  78.         }  
  79.         $DataSeek = implode('', unpack('L', $DataSeek.chr(0)));  
  80.         fseek($fd, $DataSeek);  
  81.         $ipData2 = fread($fd, 4);  
  82.         if(strlen($ipData2) < 4) {  
  83.             fclose($fd);  
  84.             return 'System Error';  
  85.         }  
  86.         $ip2num = implode('', unpack('L', $ipData2));  
  87.         if($ip2num < 0) $ip2num += pow(2, 32);  
  88.   
  89.         //没找到提示未知  
  90.         if($ip2num < $ipNum) {  
  91.             if($Middle == $BeginNum) {  
  92.                 fclose($fd);  
  93.                 return 'Unknown';  
  94.             }  
  95.             $BeginNum = $Middle;  
  96.         }  
  97.     }  
  98.   
  99.     //下面的代码读晕了,没读明白,有兴趣的慢慢读  
  100.     $ipFlag = fread($fd, 1);  
  101.     if($ipFlag == chr(1)) {  
  102.         $ipSeek = fread($fd, 3);  
  103.         if(strlen($ipSeek) < 3) {  
  104.             fclose($fd);  
  105.             return 'System Error';  
  106.         }  
  107.         $ipSeek = implode('', unpack('L', $ipSeek.chr(0)));  
  108.         fseek($fd, $ipSeek);  
  109.         $ipFlag = fread($fd, 1);  
  110.     }  
  111.   
  112.     if($ipFlag == chr(2)) {  
  113.         $AddrSeek = fread($fd, 3);  
  114.         if(strlen($AddrSeek) < 3) {  
  115.             fclose($fd);  
  116.             return 'System Error';  
  117.         }  
  118.         $ipFlag = fread($fd, 1);  
  119.         if($ipFlag == chr(2)) {  
  120.             $AddrSeek2 = fread($fd, 3);  
  121.             if(strlen($AddrSeek2) < 3) {  
  122.                 fclose($fd);  
  123.                 return 'System Error';  
  124.             }  
  125.             $AddrSeek2 = implode('', unpack('L', $AddrSeek2.chr(0)));  
  126.             fseek($fd, $AddrSeek2);  
  127.         } else {  
  128.             fseek($fd, -1, SEEK_CUR);  
  129.         }  
  130.   
  131.         while(($char = fread($fd, 1)) != chr(0))  
  132.             $ipAddr2 .= $char;  
  133.   
  134.         $AddrSeek = implode('', unpack('L', $AddrSeek.chr(0)));  
  135.         fseek($fd, $AddrSeek);  
  136.   
  137.         while(($char = fread($fd, 1)) != chr(0))  
  138.             $ipAddr1 .= $char;  
  139.     } else {  
  140.         fseek($fd, -1, SEEK_CUR);  
  141.         while(($char = fread($fd, 1)) != chr(0))  
  142.             $ipAddr1 .= $char;  
  143.   
  144.         $ipFlag = fread($fd, 1);  
  145.         if($ipFlag == chr(2)) {  
  146.             $AddrSeek2 = fread($fd, 3);  
  147.             if(strlen($AddrSeek2) < 3) {  
  148.                 fclose($fd);  
  149.                 return 'System Error';  
  150.             }  
  151.             $AddrSeek2 = implode('', unpack('L', $AddrSeek2.chr(0)));  
  152.             fseek($fd, $AddrSeek2);  
  153.         } else {  
  154.             fseek($fd, -1, SEEK_CUR);  
  155.         }  
  156.         while(($char = fread($fd, 1)) != chr(0)){  
  157.             $ipAddr2 .= $char;  
  158.         }  
  159.     }  
  160.     fclose($fd);  
  161.   
  162.     //最后做相应的替换操作后返回结果  
  163.     if(preg_match('/http/i', $ipAddr2)) {  
  164.         $ipAddr2 = '';  
  165.     }  
  166.     $ipaddr = "$ipAddr1 $ipAddr2";  
  167.     $ipaddr = preg_replace('/CZ88.Net/is', '', $ipaddr);  
  168.     $ipaddr = preg_replace('/^s*/is', '', $ipaddr);  
  169.     $ipaddr = preg_replace('/s*$/is', '', $ipaddr);  
  170.     if(preg_match('/http/i', $ipaddr) || $ipaddr == '') {  
  171.         $ipaddr = 'Unknown';  
  172.     }  
  173.   
  174.     return $ipaddr;  
  175. }  
  176.   
  177.   
  178. //========================  
  179. //  
  180. //  调用举例(速度很快)  
  181. //  
  182. //========================  
  183.   
  184. echo convertip('219.238.235.10');  
  185. //输出: 北京市 电信通  
  186.   
  187. echo convertip('23.56.82.12');  
  188. //输出:IANA  
  189.   
  190. echo convertip('250.69.52.0');  
  191. //输出:IANA保留地址  
  192.   
  193. echo convertip('238.69.52.0');  
  194. //输出:IANA保留地址 用于多点传送  
  195.   
  196. echo convertip('192.168.0.1');  
  197. //输出:局域网 对方和您在同一内部网  
  198.   
  199. echo convertip('255.255.255.255');  
  200. //输出:纯真网络 2006年11月20日IP数据  
  201.   
  202. ?>  

 

附:(相应其他实现程序)

Php) "  href= " http : // www.coolcode.cn/?p=16" rel=bookmark>利用 QQWry.Dat 实现 IP 地址高效检索(Php)(作者: andot)

数据库(QQWry . Dat)查询 C源码 "  href= " http : // www.douzi.org/wp/index.Php/articles/71" rel=bookmark>纯真IP数据库(QQWry.Dat)查询 C源码 (作者:Windix)

你可能感兴趣的:(IP)