Ein entscheidendes Merkmal des Ansatzes ist der automatisierte Modellierungs-
prozess. Die kombinatorische Vielfalt der möglichen Modellvarianten (bei 30
Inputfaktoren können ca. 536 Mio. unterschiedliche Modelle gebildet werden)
erfordert einen maschinellen Prozess zum Finden der besten, d.h. fehlerminimierten
Modelle. Bildlich gesprochen geht es um einen Suchprozess in einem
vieldimensionalen Datenraum. Die entwickelte Modellierungsengine durchsucht
diesen Datenraum in einem automatisierten, evolutionären Lernprozess. Die Ziele
dieses Prozesses sind das Finden von Modellen, die
e móglichst wenig Vorhersagefehler machen]
e und móglichst wenig relevante Faktoren verwenden.
Der oben abgebildete Bildschirm zeigt den laufenden Verbesserungsprozess in der
Modellierung. Die x-Achse zeigt die Anzahl durchgerechneter Modelle, die y-Achse
reprasentiert den Fehlerscore. Je náher die rote Linie der x-Achse kommt, desto
weniger Fehler macht das gefundene Modell.
Für die Modellierung der DJ-Vorhersage wird ein Set von Modellen erstellt. Diese
unterscheiden sich in differenzierten Betrachtungsweisen durch:
Variation der verwendeten Inputdaten;
Variation des historischen Betrachtungszeitraums;
Variation von unterschiedlichen Alpha-Beta-Fehlerverhiltnissen;
Etc.
Das Durchrechnen all dieser Modellvarianten ist rechenintensiv. Deshalb wurde
die Anwendung technisch gridfähig gemacht. Das bedeutet, dass der
Modellierungsprozess auf freie Rechnerressourcen in einem Netz verteilt wird. Damit
können brachliegende, ungenutzte Rechnerressourcen (und die gibt es praktisch
überall) direkt zur Verbesserung und Beschleunigung der Vorhersagen genutzt
werden.
43