PHP: Warum count() im Schleifenkopf langsam ist und … [UPDATE]

Veröffentlicht am 16. August 2010 um 23:41 by Fabian Martin Permalink

In den Kommentaren des ursprünglichen Artikels wurde zu Recht beanstandet, das der Vergleich zwischen for und foreach, so wie er dort beschrieben war, nicht richtig ist, da bei foreach Werte abgefragt werden, die bei den for Schleifen fehlten. Dieser korrigierte Artikel, behebt den Fehler.

Der Artikel wurde zusätzlich mit einem Kommentar zum Thema Optimierung versehen.

Vor ein paar Tagen berichtete ragtek davon, dass count() im Schleifenkopf unschön und ineffizient ist. Beidem kann ich nur zustimmen.

Aber warum ist das so?

Die Erklärung dazu ist einfach. Bei jedem Durchlauf wird count() aufgerufen und darüber die Anzahl der Elemente ermittelt. Überprüfen kann man das Verhalten mit einem kleinen Code Snippet:

<?php
class ArrayTest implements Countable
{
	public $intCountCall = 0;

	public function count()
	{
		$this->intCountCall++;
		return 100000;
	}
}

$objArrayTest = new ArrayTest();
for ($intI = 0; $intI < count($objArrayTest); $intI++)
{

}
echo($objArrayTest->intCountCall . " Aufrufe von count()");

Ergebnis:

100001 Aufrufe von count()

Bei näherer Betrachtung scheint es also logisch, dass diese Variante langsamer ist, als wenn man count() einmal aufruft und den Wert zwischenspeichert.

Ist foreach schneller?
In den Kommentaren wird erwähnt, dass die Verwendung von for und count() unnötig ist, da es ja foreach gibt. Aber ist es auch schneller?

Schauen wir uns erst einmal zwei for Schleifen mit count() und, der Vollständigkeit wegen, eine while Schleife mit list() und each() an.

<?php
$arrTest = range(1, 100000);

$intStart = microtime(true);
for ($intI = 0; $intI < count($arrTest); $intI++)
{
	$intKey = $intI;
	$mixValue = $arrTest[$intI];
}
echo(microtime(true) - $intStart . " Sekunden\n");

// ------------------------------------------------

$intStart = microtime(true);
$intCount = count($arrTest);
for ($intI = 0; $intI < $intCount; $intI++)
{
	$intKey = $intI;
	$mixValue = $arrTest[$intI];
}
echo(microtime(true) - $intStart . " Sekunden\n");

// ------------------------------------------------

$intStart = microtime(true);
reset($arrTest);
while (list($intKey, $mixValue) = each($arrTest))
{
	// Schlüssel und Wert müssen nicht extra ermittelt werden
}
echo(microtime(true) - $intStart . " Sekunden\n");

Die beiden ersten Schleifen tun dasselbe, jedoch mit dem Unterschied, dass bei der Zweiten der Wert von count() zwischengespeichert wird. Die while Schleife nutzt ein Konstrukt, das aus PHP3 bestens bekannt sein dürfte.

Ergebnis:

0.03216814994812 Sekunden
0.016403913497925 Sekunden
0.067880868911743 Sekunden

Das Ergebnis ist so, wie wir es erwartet haben. Die zweite for Schleife ist fast doppelt so schnell, als die erste Variante. Die while Schleife liegt mit dem zwei- bis vierfachen der Zeit abgeschlagen auf dem letzten Platz.

Im Code wird der Umstand berücksichtigt, das der Index im Bereich von 0 bis 99999 liegt. Bei einem assoziativen Array, oder einem Array mit Lücken im Index, könnte die Ermittlung von Schlüssel und Wert so aussehen:

	$arrCurrent = array_slice($arrTest, $intI, 1, true);
	$intKey = key($arrCurrent);
	$mixValue = current($arrCurrent);
	// Alternativ:
	// $intKey = key($arrNext);
	// $mixValue = current($arrNext);
	// next($arrNext);

Diese Konstruktion sorgt natürlich für weitere Verzögerungen, die while besser abschneiden lassen.

Nun machen wir das Gleiche mit einem foreach:

<?php
$arrTest = range(1, 100000);

$intStart = microtime(true);
foreach ($arrTest as $intKey => $mixValue)
{
	// Schlüssel und Wert müssen nicht extra ermittelt werden
}
echo(microtime(true) - $intStart . " Sekunden\n");

Ergebnis:

0.0097959041595459 Sekunden

Im Endergebnis haben wir mit foreach eine bessere Zeit erreicht, als mit einem for oder einer while Konstrukt.

Aber warum?
Lassen wir unser Array mit foreach durchlaufen, werden verschiedene Aktionen ausgeführt. Das Ganze lässt sich am besten mit dem folgendem Code Snippet zeigen:

<?php
class ArrayTest implements Iterator
{
	private $intPosition = 0;
	private $arrData = array();

	public $intRewindCounter = 0;
	public $intCurrentCounter = 0;
	public $intKeyCounter = 0;
	public $intNextCounter = 0;
	public $intValidCounter = 0;

	public function __construct()
	{
		$this->intPosition = 0;
		$this->arrData = range(1, 100000);
	}

	function rewind()
	{
		$this->intRewindCounter++;
		$this->intPosition = 0;
	}

	function current()
	{
		$this->intCurrentCounter++;
		return $this->arrData[$this->intPosition];
	}

	function key()
	{
		$this->intKeyCounter++;
		return $this->intPosition;
	}

	function next()
	{
		$this->intNextCounter++;
		++$this->intPosition;
	}

	function valid()
	{
		$this->intValidCounter++;
		return isset($this->arrData[$this->intPosition]);
	}
}
$objArrayTest = new ArrayTest();

$intStart = microtime(true);
foreach ($objArrayTest as $intKey => $mixValue)
{

}

echo(microtime(true) - $intStart . " Sekunden\n");
echo($objArrayTest->intRewindCounter . "x Rewind\n");
echo($objArrayTest->intCurrentCounter . "x Current\n");
echo($objArrayTest->intKeyCounter . "x Key\n");
echo($objArrayTest->intNextCounter . "x Next\n");
echo($objArrayTest->intValidCounter . "x Valid\n");

Ergebnis:

0.22693490982056 Sekunden
1x Rewind
100000x Current
100000x Key
100000x Next
100001x Valid

Wie wir sehen, werden bei jedem Durchlauf die folgenden vier Aktionen durchgeführt (in dieser Reihenfolge):

  1. Der Zeiger wird auf den nächsten (next) bzw. den ersten (rewind) Wert im Array gesetzt
  2. Es wird geprüft ob wir an einer gültigen Position sind (valid)
  3. Der Wert wird abgerufen (current)
  4. Der Schlüssel wird abgerufen (key, sofern er im foreach angefragt wird)

An dieser Stelle erscheint es eigenartig, dass ein foreach schneller ist, als ein for oder while, denn es werden mehr Aktionen ausgeführt.

Warum es schneller ist, lässt sich jedoch wie folgt erklären: Die Logik vom foreach liegt im C-Code von PHP verankert und kann beim Durchlauf direkt auf die verschiedenen Speicherbereiche des Arrays zugreifen. Eine Möglichkeit die uns in PHP nicht zur Verfügung steht. Wir sind auf PHP Funktionen angewiesen, und die sind, in Zusammenarbeit mit unserem eigenen PHP Code, langsamer als im Kern verankerte Algorithmen.

Was ist die richtige Schleife?
Welche Schleife am Ende zum Einsatz kommt, muss jeder für sich entscheiden. Für jede Konstruktion gibt es Einsatzmöglichkeiten (auch für ein count() im Schleifenkopf). Will man ein Array von vorn bis hinten durchlaufen, sollte aber foreach die erste Wahl sein.

Kommentar zum Thema Optimierung:
Ob es bei einem Projekt Sinn macht, auf solche Feinheiten zu achten, möchte ich nicht weiter diskutieren. Es definitiv ein Thema, bei dem jeder seine eigenen Erfahrungen machen muss.

Wer aber schon ein paar Jahre im Geschäft ist, wird sicherlich einmal ein Projekt erlebt haben, bei dem die finanzielle Planung an der Realität vorbeiging und man auf einmal mehr Nutzer verwalten musste, als ursprünglich geplant waren. Wo man eigentlich noch einen zweiten oder dritten Server gebrauchen könnte, aber die finanziellen Mittel fehlen.

Das sind dann die Momente, bei denen man erst richtig darüber nachdenkt, an welchen Stellen man Schleifen sparen oder Code optimieren kann. Wie man aus zwei Schleifen eine bekommt oder ob die while Konstruktion, die man schon seit PHP3 nutzt, wirklich die beste Wahl ist.
Es ist der Punkt, an dem man sich über jede Zehntel Sekunde freut, und sei sie auch nur dadurch gekommen, das man eine Schleife durch eine andere, effizientere getauscht hat.

Jede Optimierung macht Sinn. Denn ist der Server erst einmal ausgelastet, kann jede Schleife und jeder Funktionsaufruf wertvolle Zeit kosten. Zeit die der Nutzer selten gewillt ist zu warten.

Ähnliche Artikel:

  1. PHP: Warum count() im Schleifenkopf langsam ist und foreach auch
  2. PHP: Algorithmus-Wettbewerb: Spielplan errechnen
  3. String, Float, Int und Object in Array casten

Ein Kommentar zu “PHP: Warum count() im Schleifenkopf langsam ist und … [UPDATE]”

  1. Catweazle sagt:

    Vielen Dank für das Update :)

Hinterlasse eine Antwort