只是一个快速的问题。
在循环中使用 PDO::fetchAll() 和 PDO::fetch() 之间是否存在性能差异(对于大型结果集)?
我正在获取用户定义类的对象,如果这有什么不同的话。
我最初未受过教育的假设是 fetchAll 可能更快,因为 PDO 可以在一个语句中执行多个操作,而 mysql_query 只能执行一个。但是,我对 PDO 的内部工作原理知之甚少,文档也没有说明这一点,以及 fetchAll() 是否只是转储到数组中的 PHP 端循环。
有什么帮助吗?
带有 200k 随机记录的小基准测试。正如预期的那样,fetchAll 方法更快,但需要更多内存。
- Result :
- fetchAll : 0.35965991020203s, 100249408b
- fetch : 0.39197015762329s, 440b
使用的基准代码:
- <?php
- // First benchmark : speed
- $dbh = new PDO('mysql:dbname=testage;dbhost=localhost', 'root', '');
- $dbh->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);
- $sql = 'SELECT * FROM test_table WHERE 1';
- $stmt = $dbh->query($sql);
- $data = array();
- $start_all = microtime(true);
- $data = $stmt->fetchAll();
- $end_all = microtime(true);
-
- $stmt = $dbh->query($sql);
- $data = array();
- $start_one = microtime(true);
- while($data = $stmt->fetch()){}
- $end_one = microtime(true);
-
- // Second benchmark : memory usage
- $stmt = $dbh->query($sql);
- $data = array();
- $memory_start_all = memory_get_usage();
- $data = $stmt->fetchAll();
- $memory_end_all = memory_get_usage();
-
- $stmt = $dbh->query($sql);
- $data = array();
- $memory_end_one = 0;
- $memory_start_one = memory_get_usage();
- while($data = $stmt->fetch()){
- $memory_end_one = max($memory_end_one, memory_get_usage());
- }
-
- echo 'Result :
- fetchAll : ' . ($end_all - $start_all) . 's, ' . ($memory_end_all - $memory_start_all) . 'b
- fetch : ' . ($end_one - $start_one) . 's, ' . ($memory_end_one - $memory_start_one) . 'b
';
我发现几乎总是正确的关于 PHP 的一件事是,您自己实现的函数几乎总是比 PHP 等效的要慢。这是因为当用 PHP 实现某些东西时,它没有 C 所具有的所有编译时优化(PHP 是用它编写的),并且 PHP 函数调用的开销很高。
@Arkh
- // $data in this case is an array of rows;
-
- $data = $stmt->fetchAll();
-
-
- // $data in this case is just one row after each loop;
-
- while($data = $stmt->fetch()){}
-
-
- // Try using
-
- $i = 0;
-
- while($data[$i++] = $stmt->fetch()){}
内存差异应该可以忽略不计
出于非常简单的原因,所有测量“内存占用”的基准实际上都是不正确的。
默认情况下,PDO 确实会将所有内容加载到内存中,并且它不关心您是否使用 fetch 或 fetchAll。要真正获得无缓冲查询的好处,您应该指示 PDO 使用无缓冲查询:
$db->setAttribute(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, false);
在这种情况下,您会看到脚本的内存占用有巨大差异
正如 Mihai Stancu 所说,尽管 fetchAll 胜过 fetch + while,但几乎没有内存差异。
- Result :
- fetchAll : 0.160676956177s, 118539304b
- fetch : 0.121752023697s, 118544392b
我在正确运行时得到了上面的结果:
- $i = 0;
- while($data[$i++] = $stmt->fetch()){
- //
- }
所以 fetchAll 消耗的内存更少,但是 fetch + while 更快!:)
但是,如果您将获取的数据存储在一个数组中,那么内存使用量肯定是相等的吗?
- <?php
- define('DB_HOST', 'localhost');
- define('DB_USER', 'root');
- define('DB_PASS', '');
- // database to use
- define('DB', 'test');
- try
- {
- $dbh = new \PDO('mysql:dbname='. DB .';host='. DB_HOST, DB_USER, DB_PASS); $dbh->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);
- $sql = 'SELECT * FROM users WHERE 1';
- $stmt = $dbh->query($sql);
- $data = array();
- $start_all = microtime(true);
- $data = $stmt->fetchAll();
- $end_all = microtime(true);
-
- $stmt = $dbh->query($sql);
- $data = array();
- $start_one = microtime(true);
- while($data = $stmt->fetch()){}
- $end_one = microtime(true);
-
- // Second benchmark : memory usage
- $stmt = $dbh->query($sql);
- $data = array();
- $memory_start_all = memory_get_usage();
- $data = $stmt->fetchAll();
- $memory_end_all = memory_get_usage();
-
- $stmt = $dbh->query($sql);
- $data = array();
- $memory_end_one = 0;
- $memory_start_one = memory_get_usage();
- while($data[] = $stmt->fetch()){
- $memory_end_one = max($memory_end_one, memory_get_usage());
- }
-
- echo 'Result :
- fetchAll : ' . ($end_all - $start_all) . 's, ' . ($memory_end_all - $memory_start_all) . 'b
- fetch : ' . ($end_one - $start_one) . 's, ' . ($memory_end_one - $memory_start_one) . 'b
'; - }
- catch ( PDOException $e )
- {
- echo $e->getMessage();
- }
- ?>
-
- Result :
- fetchAll : 2.6941299438477E-5s, 9824b
- fetch : 1.5974044799805E-5s, 9824b
我知道这是一个老话题,但我遇到了同样的问题。在运行了我自己的简单“基准”并阅读了其他人在这里写的内容后,我得出的结论是,这不是一门精确的科学,虽然人们应该努力编写高质量、轻量级的代码,但一开始就浪费太多时间是没有意义的的项目。
我的建议是:通过运行代码(测试版?)一段时间来收集数据,然后开始优化。
在我的简单基准测试(仅测试执行时间)中,我得到的结果在 5% 和 50% 之间变化。我在同一个脚本中运行这两个选项,但是当我首先运行 fetch + 时,它比 fetchall 更快,反之亦然。(我知道我应该单独运行它们,然后几百次得到中位数和平均值,然后进行比较,但是 - 正如我在开始时所说的 - 我得出结论,就我而言,现在开始这样做还为时过早。)