大马资讯论坛 - 马来西亚中文资讯平台

 找回密码
 注册
搜索
打印 上一主题 下一主题

[教学] PHP可以用CURL來達成此Multi-Threading多线程的效果

[复制链接]
跳转到指定楼层
1#
发表于 2013-8-3 23:54:15 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
PHP 使用CURL 同步抓取多个网页,一点也不会lag,很好的范例。
帮你的server减少了许多负担哦。

程式(async.php)
  1. <?php
  2. function async_get_url($url_array, $wait_usec = 0)
  3. {
  4.     if (!is_array($url_array))
  5.         return false;

  6.     $wait_usec = intval($wait_usec);

  7.     $data    = array();
  8.     $handle  = array();
  9.     $running = 0;

  10.     $mh = curl_multi_init(); // multi curl handler

  11.     $i = 0;
  12.     foreach($url_array as $url) {
  13.         $ch = curl_init();

  14.         curl_setopt($ch, CURLOPT_URL, $url);
  15.         curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); // return don't print
  16.         curl_setopt($ch, CURLOPT_TIMEOUT, 30);
  17.         curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)');
  18.         curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); // 302 redirect
  19.         curl_setopt($ch, CURLOPT_MAXREDIRS, 7);

  20.         curl_multi_add_handle($mh, $ch); // 把 curl resource 放進 multi curl handler 裡

  21.         $handle[$i++] = $ch;
  22.     }

  23.     /* 執行 */
  24.     /* 此種做法會造成 CPU loading 過重 (CPU 100%)
  25.     do {
  26.         curl_multi_exec($mh, $running);

  27.         if ($wait_usec > 0) // 每個 connect 要間隔多久
  28.             usleep($wait_usec); // 250000 = 0.25 sec
  29.     } while ($running > 0);
  30.     */

  31.     /* 此做法就可以避免掉 CPU loading 100% 的問題 */
  32.     do {
  33.         $mrc = curl_multi_exec($mh, $active);
  34.     } while ($mrc == CURLM_CALL_MULTI_PERFORM);

  35.     while ($active and $mrc == CURLM_OK) {
  36.         if (curl_multi_select($mh) != -1) {
  37.             do {
  38.                 $mrc = curl_multi_exec($mh, $active);
  39.             } while ($mrc == CURLM_CALL_MULTI_PERFORM);
  40.         }
  41.     }

  42.     /* 讀取資料 */
  43.     foreach($handle as $i => $ch) {
  44.         $content  = curl_multi_getcontent($ch);
  45.         $data[$i] = (curl_errno($ch) == 0) ? $content : false;
  46.     }

  47.     /* 移除 handle*/
  48.     foreach($handle as $ch) {
  49.         curl_multi_remove_handle($mh, $ch);
  50.     }

  51.     curl_multi_close($mh);

  52.     return $data;
  53. }
  54. ?>
复制代码
使用方法

  1. <?php
  2. $urls = array('http://example1.com', 'http://example2.com');
  3. print_r(async_get_url($urls)); // [0] => example1, [1] => example2
  4. ?>
复制代码

手机版|大马资讯论坛  

GMT+8, 2024-12-1 14:29 , Processed in 0.071033 second(s), 11 queries , File On.

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表