Modelldiagnostik für Zähldatenzeitreihen

Projektpartner:

 

 
Zweijähriges Projekt, gefördert durch die Deutsche Forschungsgemeinschaft (DFG) – Projektnummer 437270842.

Projektziele:

Zeitreihen aus Zähldaten sind in den verschiedensten Situationen mit wirtschaftswissenschaftlichem Kontext anzutreffen und können vielfältige Formen hinsichtlich ihrer Abhängigkeitsstruktur oder Randverteilung aufweisen. Da klassische Modelle für reellwertige Zeitreihen den diskreten Charakter von Zähldaten nicht bewahren können, gibt es ein sehr großes Portfolio an speziell für Zähldatenzeitreihen entwickelten Modellen. Eine adäquate Modellierung des Zähldatenprozesses ist wichtig, um Vorhersagen treffen zu können, den weiteren Verlauf der Zeitreihe zu überwachen, um strukturelle Änderungen schnellstmöglich aufzudecken, oder schlicht um ein besseres Verständnis des betrachteten Zählphänomens zu erlangen.

Das geplante Forschungsvorhaben zur Modelldiagnostik für Zähldatenzeitreihen umfasst dabei drei zentrale Schritte im Rahmen des Modellbildungsprozesses: Modellidentifikation, Modellauswahl und Modellvalidierung. Während Verfahren zur Modelldiagnostik reellwertiger (stetiger) Zeitreihen seit Langem und in großer Zahl vorliegen, steckt die Thematik im Hinblick auf die diskretwertigen Zähldatenzeitreihen noch in den Kinderschuhen. Von den bis dato bekannten Verfahren sind einige nur in rudimentärer Form vorhanden (etwa als heuristische Anwendungsempfehlungen), und konkretere, theoretisch fundierte Verfahren sind meist an restriktive Modellannahmen geknüpft oder beziehen sich auf isolierte Charakteristika wie etwa das Dispersionsverhalten. Entsprechende Aussagen gelten auch für Anpassungstests: Während es zahlreiche Anpassungstests für stetige Zeitreihen gibt, die nicht nur auf bestimmte Modelle, sondern auch auf ganze Modellklassen testen können, sind die bisher vorliegenden Anpassungstests nur eingeschränkt, etwa unter zusätzlichen parametrischen Annahmen, einsetzbar.

Das geplante Forschungsvorhaben weist zwei komplementäre Stoßrichtungen zur Modelldiagnostik in Zähldatenzeitreihen auf. Zum einen sollen parametrische Verfahren zur Modelldiagnostik für Zähldatenzeitreihen entwickelt werden, die vielfältige Verteilungscharakteristika und/oder Abhängigkeitsmuster miteinbeziehen. Auch sollen für reellwertige Zeitreihen erprobte diagnostische Werkzeuge etwa durch geeignete parametrische Bootstrap-Implementierungen auch für Zähldatenzeitreihen anwendbar gemacht werden. Zum anderen sollen auf gemeinsamen Verteilungen basierende Anpassungstests entwickelt werden, die in der Lage sind konsistent zwischen verschiedenen Modellklassen zu unterscheiden. Zu deren Implementierung, aber auch um eine breitere Anwendung der zuvor angeführten diagnostischen Werkzeuge zu ermöglichen, sollen für Zähldatenzeitreihen geeignete semi-parametrische Bootstrap-Verfahren hergeleitet und für die Modelldiagnostik verwendet werden. Für alle vorgeschlagenen Verfahren werden Performanz und Anwendbarkeit eingehend untersucht, sowohl durch umfassende, vergleichende Simulationsstudien wie auch durch Anwendung auf in den Wirtschaftswissenschaften relevante, reale Datenbeispiele.

Projektlaufzeit:

Oktober 2020 – September 2022.

Projektresultate:

  • Die ersten zu entwickelnden parametrischen Verfahren zur Modelldiagnostik beziehen sich auf Zähldatenzeitreihen mit einer Poisson-Randverteilung. Ziel ist es, statistische Testverfahren zu entwickeln, welche die Stein-Chen-Identität verwenden. Als vorbereitende Arbeit hierzu wurde folgender Artikel verfasst:
     
    Weiß, C.H., Aleksandrov, B. (2020):
    Computing (Bivariate) Poisson Moments using Stein–Chen Identities.
    Accepted for publication in The American Statistician.
     
    Abstract: The (bivariate) Poisson distribution is the most common distribution for (bivariate) count random variables. The univariate Poisson distribution is characterized by the famous Stein–Chen identity. We demonstrate that this identity allows to derive even sophisticated moment expressions in such a simple way that the corresponding computations can be presented in an introductory Statistics class. Then, we newly derive different types of Stein–Chen identity for the bivariate Poisson distribution. These are shown to be very useful for computing joint moments, again in a surprisingly simple way. We also explain how to extend our results to the general multivariate case.
     
  • Aleksandrov, B., Weiß, C.H., Jentsch, C. (2020):
    Goodness-of-Fit Tests for Poisson Count Time Series based on the Stein–Chen Identity.
    Working paper, in preparation.
     
    Abstract: To test the null hypothesis of a Poisson marginal distribution, test statistics based on the Stein–Chen identity are proposed. For a wide class of Poisson count time series, the asymptotic distribution of different types of Stein–Chen statistics is derived, also if multiple statistics are jointly applied. The performance of the tests is analyzed with simulations, as well as the question which Stein–Chen functions should be used for which alternative. Illustrative data examples are presented, and possible extensions of the novel Stein–Chen approach are discussed as well.
     
  • wird fortgesetzt!

 

 
Einjähriges Projekt, gefördert durch die Interne Forschungsförderung (IFF2018) der HSU Hamburg.

 

Projektziele:

Das IFF-Projekt befasst sich mit der Modelldiagnostik für Zähldatenzeitreihen, siehe auch das folgende Poster für Hintergrundinformationen. Ziele des Projekts sind eine Untersuchung von Anwendbarkeit und Performanz vorhandener diagnostischer Werkzeuge sowie die Entwicklung neuartiger Diagnoseverfahren. Hierzu sollen zunächst exemplarisch die sog. Pearson-Residuen eingehend analysiert und theoretisch fundiert werden. Dabei sollen für möglichst verschiedene Modellklassen analytische Ausdrücke für die asymptotische Verteilung von Mittelwert und Varianz der Pearson-Residuen gefunden werden, was wiederum neuartige Signifikanztests ermöglicht; die Performanz der entwickelten Tests soll dann mittels Simulationen untersucht und alle Ergebnisse in einem Arbeitspapier zusammengefasst werden.

Parallel dazu soll während der IFF-Phase ein bei der DFG zu beantragendes weiterführendes Projekt ausführlich vorbereitet werden. Dazu zählen die Vorbereitung von Ansätzen für neue diagnostische Tests sowie das Design der angestrebten Simulationsstudien. Einen weiteren Schwerpunkt stellt das Thema Bootstrap dar: für existierende Goodness-of-Fit-, Dispersions- und Nullinflationstests sind Untersuchungen nur innerhalb spezieller Modellfamilien möglich, da die jeweilige asymptotische Verteilung der Teststatistiken auf ebendiesen Modellannahmen beruht. Ein geeigneter Bootstrap-Ansatz würde die Chance bieten, die Tests auch auf andere Modellfamilien zu übertragen; aber wann ist dies möglich, und welche Performanz ergibt sich? Während der IFF-Phase soll ein Plan erarbeitet werden, wie welche Bootstrap-Verfahren zur Modelldiagnostik für Zähldatenzeitreihen entwickelt werden könnten.

Projektlaufzeit:

Juli 2018 – Juni 2019.

Publikationen:

 

 

HSU

Letzte Änderung: 12. Februar 2021