In einem linearen Regressionsmodel, in dem der bedingte Erwartungswert einer zu erklärenden Variablen y als lineare Funktion eines Vektors von erklärenden Variablen x spezifiert wird, also E(y|x) = xθ, ist die Unkorreliertheit der Regressoren in der Regel, für eine Reihe von bedingten Verteilungen von y gegeben x, eine notwendige und hinreichende Bedingung für eine Punktidentifikation des Parametervektors θ. Somit können die wahren Parameter anhand einer ausreichend großen Anzahl an Beobachtungen bestimmt werden.

Sind y oder x jedoch nicht genau gemessen, sondern, zum Beispiel, nur in Intervallen (häufig sind dies Variablen wie Alter, Einkommen, oder Schulbildung), dann ist eine Punktidentifikation in der Regel nicht mehr möglich: Unabhängig von der Anzahl verfügbarer Beobachtungen existiert eine Parametermenge, die die Beobachtungen erklären kann. Diese Menge ist die identifizierte Menge, und ein Parametervektor (genau wie das Modell) wird als partiell identifiziert bezeichnet. Die Problemstellung des Forschenden ist damit die Schätzung der identifizierten Menge anhand von Daten.

Die Literatur zu partiell identifizierten Modellen ist in den letzten zehn Jahren stark fortgeschritten und hat insbesondere in der Industrieökonomik viele Anwendungen zur empirischen Analyse spieltheoretischer Modelle gefunden. Ein grosser Teil der Literatur ist äusserst technisch und die Details zur praktischen Anwendung der Schätzmethoden sind häufig nicht dokumentiert. So hat diese Arbeit ihren Ursprung im Versuch die illustrativen Ergebnisse des grundlegenden Beitrags von Manski und Tamer (2002), die die Identifikationsregionen für Parameter in Regressionen mit Intervaldaten über y oder x untersuchen, nachzubilden.

Während der Fokus in Manski und Tamer (2002) auf der Illustration des allgemeinen Ansatzes liegt, konzentrieren wir uns auf die Herleitung exakter Ergebnisse aus ihren zwei Monte Carlo Designs. In einem der beiden ist die identifizierte Menge ein einfaches dreidimensionales Polyeder mit sechs Eckpunkten und acht Flächen, das durch acht Ungleichungen, die Erwartungswerte beinhalten, charakterisiert ist. Die Menge kann geschätzt werden, indem wir diese Erwartungswerte durch Stichprobendurchschnitte ersetzen. Wir dokumentieren signifikante Geschwindigkeitsgewinne und eine schnellere Konvergenz hin zur wahren identifizierten Menge im Vergleich zum Algorithmus, den Manski und Tamer (2002) vorschlagen. Für das zweite Monte Carlo Design ist die identifizierte Menge komplexer, aber wir zeigen daß ein simples Polyeder eine sehr gute Annäherung ergibt.

Cerquera, Daniel, Francois Laisney und Hannes Ullrich (2012), Considerations on Partially Identified Regression Models, ZEW Discussion Paper No. 12-024, Mannheim. Download

Autoren

Cerquera, Daniel
Laisney, Francois
Ullrich, Hannes

Schlagworte

partial identification, true identified set, superset, MMD, MMM, estimation