php新手实战:自定义书源下载api

网上有很多第三方小说网站提供小说下载,而下载的过程无非就是搜索书籍,然后找到下载链接点击下载即可。只是类似这种“良心”的小说网站实在是太少。大多数仅支持在线阅读。而如今,我却要利用这种为数不多的“良心”小说站点提供的书源来作为自己的书源接口。真是....让人唏嘘啊。希望大家还是抱着学习的心态来。本次主要是分享这种二次简易包装接口的方法。从而管中窥豹,举一反三。

tips:本次分享主要以学习交流为主,尊重书籍正版授权。

1.书源网站  

这次示范的网站为一个第三方小说站点。通过站内搜索返回的内容知道返回的是html内容。当然,如果是直接返回json数据的话我也就没必要写这篇博文了。不过返回的html也是有操作空间的。

php新手实战:自定义书源下载api_第1张图片

2.解析网页构建接口

先看本地php运行效果吧。单php文件:index.php

php新手实战:自定义书源下载api_第2张图片

主要用到了php的DOMDocument和DOMXPath来解析网页内容,然后构建json数据返回。具体的代码中已做注释。闲话少叙,直接上代码。

 $_GET['book'], // 第一个参数及其值
    'searchtype' => 'articlename' // 第二个参数及其值
);
curl_setopt($ch, CURLOPT_POST, true); // 设置为 POST 请求
curl_setopt($ch, CURLOPT_POSTFIELDS, $postData); // 设置 POST 参数

// 执行 cURL 请求并获取响应
$response = curl_exec($ch);

// 检查是否有错误发生
if (curl_errno($ch)) {
    echo 'cURL Error: ' . curl_error($ch);
    exit;
}

// 关闭 cURL 句柄
curl_close($ch);

// 输出响应内容
// echo $response;

// 创建一个 DOMDocument 对象
$dom = new DOMDocument();
$html = $response;
// 禁用标准的 libxml 错误,并启用用户错误处理
$libxml_previous_state = libxml_use_internal_errors(true);
// 解析
$dom->loadHTML($html);
// 清空 libxml 错误缓冲
libxml_clear_errors();
// 还原之前设置
libxml_use_internal_errors($libxml_previous_state);

 $xpath = new DOMXPath($dom);
 $autherElements =$xpath->query('//tr/td[contains(@class, "even")][2]');
 $links = $xpath->query('//td[contains(@class, "even")]/a');
// 创建一个数组来存储结果对象
$resultArray = array();

// 遍历查询结果并将 href 属性和文本值组成数组对象
foreach ($links as $index => $anchor) {
    $href = $anchor->getAttribute('href');
    $bookId = extractBookId($href);
    // 获取对应书的作者名
    $autherElement = $autherElements->item($index);
    $auther = $autherElement ? $autherElement->nodeValue : '';
    
    $resultArray[] = array(
        'href' => $href,
        'text' => $anchor->nodeValue,
        'bookid' => 'http://txt.aixiashu.info/modules/article/txtarticle.php?id='.$bookId,
        'auther' => $auther
    );
}

// 将数组转换为 JSON 格式
$jsonArray = json_encode($resultArray);

// 输出 JSON 数组
echo $jsonArray;


// 从 href 地址中提取 bookid 的函数
function extractBookId($href) {
    $pattern = '/\/(\d+)\/$/';
    preg_match($pattern, $href, $matches);
    return isset($matches[1]) ? $matches[1] : null;
}

?>

将该php文件放到php站点运行,就相当于提供了一个书源查询下载的接口。怎么样,是不是很简单。这种利用第三方的接口二次“包装”作为自定义使用接口。我只能说,香是真滴香。但是,不道德。所以,只是提供给大家这种写自用接口的思路。不推荐使用哈。 

你可能感兴趣的:(工具,php,php,开发语言)