Modelldiagnostik für Zähldatenzeitreihen

Projektpartner:

 

 
Zweijähriges Projekt, gefördert durch die Deutsche Forschungsgemeinschaft (DFG) – Projektnummer 437270842.

Projektziele:

Zeitreihen aus Zähldaten sind in den verschiedensten Situationen mit wirtschaftswissenschaftlichem Kontext anzutreffen und können vielfältige Formen hinsichtlich ihrer Abhängigkeitsstruktur oder Randverteilung aufweisen. Da klassische Modelle für reellwertige Zeitreihen den diskreten Charakter von Zähldaten nicht bewahren können, gibt es ein sehr großes Portfolio an speziell für Zähldatenzeitreihen entwickelten Modellen. Eine adäquate Modellierung des Zähldatenprozesses ist wichtig, um Vorhersagen treffen zu können, den weiteren Verlauf der Zeitreihe zu überwachen, um strukturelle Änderungen schnellstmöglich aufzudecken, oder schlicht um ein besseres Verständnis des betrachteten Zählphänomens zu erlangen.

Das geplante Forschungsvorhaben zur Modelldiagnostik für Zähldatenzeitreihen umfasst dabei drei zentrale Schritte im Rahmen des Modellbildungsprozesses: Modellidentifikation, Modellauswahl und Modellvalidierung. Während Verfahren zur Modelldiagnostik reellwertiger (stetiger) Zeitreihen seit Langem und in großer Zahl vorliegen, steckt die Thematik im Hinblick auf die diskretwertigen Zähldatenzeitreihen noch in den Kinderschuhen. Von den bis dato bekannten Verfahren sind einige nur in rudimentärer Form vorhanden (etwa als heuristische Anwendungsempfehlungen), und konkretere, theoretisch fundierte Verfahren sind meist an restriktive Modellannahmen geknüpft oder beziehen sich auf isolierte Charakteristika wie etwa das Dispersionsverhalten. Entsprechende Aussagen gelten auch für Anpassungstests: Während es zahlreiche Anpassungstests für stetige Zeitreihen gibt, die nicht nur auf bestimmte Modelle, sondern auch auf ganze Modellklassen testen können, sind die bisher vorliegenden Anpassungstests nur eingeschränkt, etwa unter zusätzlichen parametrischen Annahmen, einsetzbar.

Das geplante Forschungsvorhaben weist zwei komplementäre Stoßrichtungen zur Modelldiagnostik in Zähldatenzeitreihen auf. Zum einen sollen parametrische Verfahren zur Modelldiagnostik für Zähldatenzeitreihen entwickelt werden, die vielfältige Verteilungscharakteristika und/oder Abhängigkeitsmuster miteinbeziehen. Auch sollen für reellwertige Zeitreihen erprobte diagnostische Werkzeuge etwa durch geeignete parametrische Bootstrap-Implementierungen auch für Zähldatenzeitreihen anwendbar gemacht werden. Zum anderen sollen auf gemeinsamen Verteilungen basierende Anpassungstests entwickelt werden, die in der Lage sind konsistent zwischen verschiedenen Modellklassen zu unterscheiden. Zu deren Implementierung, aber auch um eine breitere Anwendung der zuvor angeführten diagnostischen Werkzeuge zu ermöglichen, sollen für Zähldatenzeitreihen geeignete semi-parametrische Bootstrap-Verfahren hergeleitet und für die Modelldiagnostik verwendet werden. Für alle vorgeschlagenen Verfahren werden Performanz und Anwendbarkeit eingehend untersucht, sowohl durch umfassende, vergleichende Simulationsstudien wie auch durch Anwendung auf in den Wirtschaftswissenschaften relevante, reale Datenbeispiele.

Projektlaufzeit:

Oktober 2020 – September 2022.

Projektresultate:

  • Die ersten zu entwickelnden parametrischen Verfahren zur Modelldiagnostik beziehen sich auf Zähldatenzeitreihen mit einer Poisson-Randverteilung. Ziel ist es, statistische Testverfahren zu entwickeln, welche die Stein-Chen-Identität verwenden. Als vorbereitende Arbeit hierzu wurde folgender Artikel verfasst:
     
    Weiß, C.H., Aleksandrov, B. (2022):
    Computing (Bivariate) Poisson Moments using Stein–Chen Identities.
    The American Statistician 76(1), pp. 10-15.
     
    Abstract: The (bivariate) Poisson distribution is the most common distribution for (bivariate) count random variables. The univariate Poisson distribution is characterized by the famous Stein–Chen identity. We demonstrate that this identity allows to derive even sophisticated moment expressions in such a simple way that the corresponding computations can be presented in an introductory Statistics class. Then, we newly derive different types of Stein–Chen identity for the bivariate Poisson distribution. These are shown to be very useful for computing joint moments, again in a surprisingly simple way. We also explain how to extend our results to the general multivariate case.
     
  • Aleksandrov, B., Weiß, C.H., Jentsch, C. (2022):
    Goodness-of-Fit Tests for Poisson Count Time Series based on the Stein–Chen Identity.
    Statistica Neerlandica 76(1), pp. 35-64 (open access).
     
    Abstract: To test the null hypothesis of a Poisson marginal distribution, test statistics based on the Stein–Chen identity are proposed. For a wide class of Poisson count time series, the asymptotic distribution of different types of Stein–Chen statistics is derived, also if multiple statistics are jointly applied. The performance of the tests is analyzed with simulations, as well as the question which Stein–Chen functions should be used for which alternative. Illustrative data examples are presented, and possible extensions of the novel Stein–Chen approach are discussed as well.
     
  • Aleksandrov, B., Weiß, C.H., Jentsch, C., Faymonville, M. (2021):
    Novel Goodness-of-Fit Tests for Binomial Count Time Series.
    Working paper, in preparation.
     
    Abstract: For testing the null hypothesis of a marginal binomial distribution of bounded count data, we derive novel and flexible goodness-of-fit (GoF) tests. We propose two general approaches to construct moment-based test statistics. The first one relies on properties of higher-order factorial moments, while the second one uses a so-called Stein identity being satisfied under the null. For a broad class of stationary time series processes of bounded counts with joint bivariate binomial distributions of lagged time series values, we derive the limiting distributions of the proposed GoF-test statistics. Among others, our setup covers the binomial autoregressive model, but includes also other binomial time series obtained, e.g., by superpositioning independent binary time series. The test performance under the null and under different alternatives is investigated in simulations. A data example of price stability counts is used to illustrate the application of the novel GoF-tests.
     
  • wird fortgesetzt!

 

 
Einjähriges Projekt, gefördert durch die Interne Forschungsförderung (IFF2018) der HSU Hamburg.

 

Projektresultate:

Die IFF-Förderung des Projektes „Modelldiagnostik für Zähldatenzeitreihen“ ermöglichte die Zwischenfinanzierung einer wissenschaftlichen Mitarbeiterstelle, welche mit einem Nachwuchswissenschaftler besetzt wurde. Im Rahmen dieser Förderung wurden für spezielle Arten von Zähldatenprozess, einen sog. Poisson-INAR(1)- und Poisson-INARCH(1)-Prozess, analytische Ausdrücke für die asymptotische Verteilung von Quadratmittel und Varianz der Pearson-Residuen hergeleitet, was wiederum neuartige Signifikanztests ermöglichte. Die Performanz der entwickelten Tests wurde mittels Simulationen untersucht und alle Ergebnisse gemeinsam mit dem geförderten Nachwuchswissenschaftler in dem Manuskript „Testing the Dispersion Structure of Count Time Series Using Pearson Residuals“ zusammengefasst. Das Manuskript wurde von den „AStA Advances in Statistical Analysis“ zur Veröffentlichung angenommen.

Mithilfe der durch die IFF finanzierten Stelle konnte ein inhaltlich wesentlich erweiterter Projektantrag unter dem gleichlautenden Titel „Modelldiagnostik für Zähldatenzeitreihen“ erarbeitet werden, der in wesentlichen Punkten auf den Inhalten des Antrags der IFF basiert. Der Projektantrag (Sachbeihilfe) wurde am 20.12.2019 von der Deutschen Forschungsgemeinschaft (DFG) bewilligt.

Einen Überblick über das IFF-Projekt bietet folgendes Poster.

Projektlaufzeit:

Juli 2018 – Juni 2019.

Publikationen:

 

 

HSU

Letzte Änderung: 4. Februar 2022