PHP爬虫：百万级别知乎用户数据爬取与说明

发布时间：2016-10-29 12:13:52 所属栏目：PHP教程来源：Hector

导读：副标题#e# 这次抓取了110万的用户数据，数据分析结果如下：开发前的准备安装Linux系统（Ubuntu14.04），在VMWare虚拟机下安装一个Ubuntu；安装PHP5.6或以上版本；安装MySQL5.5或以上版本；安装curl、pcntl扩展。使用PHP的curl扩展抓取页面数据 PHP的c

因为想知道每个进程花费的时间是多少，因此写个函数统计脚本执行时间：

function microtime_float() 
{ 
     list($u_sec, $sec) = explode(' ', microtime()); 
     return (floatval($u_sec) + floatval($sec)); 
} 
 
$start_time = microtime_float(); 
 
//do something 
usleep(100); 
 
$end_time = microtime_float(); 
$total_time = $end_time - $start_time; 
 
$time_cost = sprintf("%.10f", $total_time); 
 
echo "program cost total " . $time_cost . "sn";

若文中有不正确的地方，望各位指出以便改正。

代码托管地址：https://github.com/HectorHu/zhihuSpider

（编辑：PHP编程网 - 黄冈站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

8/8

首页

php将12小时制转换成2	PHP递归调用数组值并用
php生成随机密码的几种	php使用CURL伪造IP和来