Autor: Thorsten Martin
Präzisere Preisbestimmung von Objekten

Machine Learning verbessert Mietpreisvorhersage um bis zu 30 Prozent

Zurück zur Übersicht
2018-01-31

Mietpreise spielen beim Einschätzen der Rentabilität einer Immobilieninvestition eine große Rolle. Derzeit berechnen Investoren Mietpreise normalerweise aus öffentlichen Angeboten aus der Umgebung des Objektes, für das sie sich interessieren. Diese Art der Mietpreisermittlung bezeichnen wir als „Comparables“. Diese gängige Praxis führt aber häufig zu unpräzisen Ergebnissen, da Angebotsmieten stark nach Fläche, Baujahr und Zustand des Objektes variieren. Zudem stehen diese Faktoren in einem komplexen Zusammenhang mit der Lage des Objektes, wie zum Beispiel Anbindung, Grünflächen oder städtischer Infrastruktur. Hinzu kommt, dass in der näheren Umgebung keine vergleichbaren Angebote verfügbar sein können. Verlassen sich Investoren also nur auf aggregierte Durchschnitte bzw. Angebote aus der Umgebung, kann es bei der Ermittlung von marktüblichen Preisen zu Fehlkalkulationen kommen. Eine Unterschätzung des Mietpreispotentials kann dazu führen, dass Mieteinnahmen zu gering angesetzt werden, was die erwartete Rendite schmälert und dass eigentlich solide Objekte für die Investition nicht in Betracht gezogen werden. Maschinenlernalgorithmen helfen dabei, die marktübliche Ermittlung von Preisen im Vergleich zu Comparables zu präzisieren. Im Unterschied zu diesen sind Maschinenlernalgorithmen in der Lage, den Einfluss von Objekt- und Umgebungsvariablen sowie deren komplexe Interaktion auf die Mieten zu berücksichtigen.

Methodik

Als Datengrundlage für die Studie der 21st Real Estate GmbH wird die Fläche Deutschlands in ein System aus über 55 Millionen Analysekacheln aufgeteilt aus denen 1,1 Millionen Ergebniskacheln generiert werden, die in Städten eine Größe von 200 × 200 Metern messen. Die Informationen aus diesen Kacheln werden mit unserer Datenbank aus über 40 Millionen Angeboten angereichert.

Der in der Studie verwendete Maschinenlernalgorithmus ist das sogenannte Random-Forest-Modell. Hierbei handelt es sich um einen Regressionsbaumansatz, bei dem Beobachtungen anhand von Einflussgrößen und Interaktionen zwischen diesen in homogene Untergruppen aufgeteilt werden. Diese Untergruppen werden immer feiner, bis entweder alle Beobachtungen denselben Wert haben oder nur fünf Beobachtungen in der Untergruppe verbleiben. Regressionsbäume können damit komplexe Zusammenhänge abbilden.

Bei den Comparables werden die nächstgelegenen Angebote als Referenzbasis verwendet. Hierzu werden alle Angebote einer Stadt auf Kacheln (200 × 200 Meter) umgelegt und Durchschnittspreise pro Kachel berechnet. Ungesehene Objekte werden nun mit einem durch fußläufige Erreichbarkeit gewichteten Durchschnitt aller Kachelpreise in der nächsten Umgebung bewertet. Dabei werden Parameter wie die optimale Anzahl an Nachbarkacheln vorher optimiert.

Der folgende Graph veranschaulicht die Verteilung des Schätzfehlers der Mieten für alle individuellen Angebote vom ersten Quartal 2017 bis einschließlich dem dritten Quartal 2017 in ausgewählten Städten. Sowohl die Comparables als auch der Maschinenlernalgorithmus haben eine Verteilung die sich im Nullbereich zuspitzt, was einer fehlerlosen Schätzung entspricht. Im Vergleich zu Comparables ist die Verteilung des Machine Learning-Fehlers jedoch wesentlich stärker um den Nullbereich konzentriert. Damit generiert der Maschinenlernalgorithmus Fehler mit einer konsistent niedrigeren Wahrscheinlichkeit.

Ergebnis

Die Studie zeigt, dass Mieten in A-Städten durchschnittlich um 25 Prozent genauer ermittelt werden, wenn Sie mithilfe von Maschinenlernalgorithmen anstatt mit lokalen Umgebungsdurchschnitten bestimmt werden. Der durchschnittliche absolute Schätzfehler liegt dabei bei 0,97 Euro pro Quadratmeter. So schätzt der Algorithmus Mietpreise in München um 18,4 Prozent genauer ein als ein herkömmliches Vergleichswertverfahren. In Hamburg ist die Performance mit Machine Learning sogar um 28 Prozent genauer. In B-Städten performt der gewählte Maschinenlernalgorithmus sogar um 32 Prozent besser als Comparables mit einem durchschnittlichen absoluten Fehler von 0,48 Euro pro Quadratmeter. Hierbei ist der Maschinenlernalgorithmus für Leipzig mit 47,4 Prozent doppelt so genau als die Schätzung über Umgebungsmieten. Für Bochum, die Stadt mit der geringsten Verbesserung, ist das Machine Learning immer noch um 20 Prozent genauer. Mit einem durchschnittlichen absoluten Fehler von 0,55 Euro pro Quadratmeter verbessert der Maschinenlernalgorithmus die Ermittlung von Mieten in C-Städten um 28 Prozent. Unsere Untersuchungen haben ergeben, dass Maschinenlernalgorithmen besonderes dann genauer als Comparables arbeiten, wenn die Charakteristika von Objekten (Baujahr, Fläche, Zustand) eine starke regionale Heterogenität aufweisen. Ferner steigt die Genauigkeit mit der Anzahl der zur Verfügung stehenden Objekte sowie der Streuung der Mieten.

Machine Learning ermöglicht eine präzisere Preisbestimmung von Objekten und somit eine verlässlichere Ermittlung von Renditezielen. Das Risiko von Leerstand oder einer zu geringen Rendite durch falsche Mietpreiserwartungen werden minimiert und Fehlinvestitionen vermieden.

Die vollständige Studie erhalten Sie gern auf Anfrage unter presse@21re.de