实例演示php采集新浪sina首页的新闻

为什么80%的码农都做不了架构师?>>>   hot3.png

今天我来实例演示一下用php怎样抓取sina首页的新闻。 博客文章已经全部迁到这里了,欢迎访问! 先贴上我的效果图: 实例演示php采集新浪sina首页的新闻_第1张图片

如上图:显示的是新浪sina首页的新闻|财经模块。

下面介绍我的实现过程。

用到的函数主要有file_get_contents,preg_match等。

过程也非常简单。


$file=file_get_contents('http://www.sina.com.cn/');
preg_match('/([\s\S]*)<\/head>/',$file,$head);
print_r($head[0]);
echo '
'; preg_match('/
([\s\S]*) <\/span>/',$file,$body); print_r($body[1]); echo ''; echo '
';

看到没有,就是简单的几步,就实现了效果。如果对样式有不满意的地方,可以再自行修改。


总结:


博客文章已经全部迁到这里了,欢迎访问!

1:我们使用preg_match正则匹配要抓取模块的div,然后再输出就行了。


2:这个例子比较简单,当遇到稍微复杂一点的需求的时候,告诉大家一个调式的好办法。


比如说上面的例子当中你想要看看head部分究竟输出的是什么,可以使用htmlspecialchars函数,来防止转义:htmlspecialchars($head[0]), 这样输出的就是正则匹配的head部分的代码,方便你的查看和调式。

博客文章已经全部迁到这里了,欢迎访问!

转载于:https://my.oschina.net/justdo/blog/95414

你可能感兴趣的:(实例演示php采集新浪sina首页的新闻)