Methodik

Dieser Atlas wertet Daten der amtlichen Steuerstatistik aus und bereitet sie datenjournalistisch auf. Diese Seite erklärt, welche Daten verwendet werden, wie die Kennzahlen berechnet sind und wo die Grenzen der Analyse liegen.

Datenquelle

Grundlage aller Berichte ist die Lohn- und Einkommensteuerstatistik 2021 des Thüringer Landesamts für Statistik (TLS). Die Daten stammen aus der Thüringer Regionaldatenbank (Örtliche Struktur) und sind öffentlich zugänglich unter statistik.thueringen.de.

Die Statistik erfasst alle Steuerpflichtigen, für die im Veranlagungsjahr 2021 eine Einkommensteuer festgesetzt wurde. Ausgewiesen werden je Gemeinde und Einkommensklasse: Anzahl der Steuerpflichtigen, Summe der Einkünfte, zu versteuerndes Einkommen sowie festgesetzte Einkommensteuer.

Einkommensklassen

Die TLS gliedert Steuerpflichtige in 13 Einkommensklassen – von „0 bis 5.000 Euro” bis „125.000 Euro und mehr”. Die Klassengrenzen sind bundeseinheitlich vorgegeben und beziehen sich auf den Gesamtbetrag der Einkünfte (§ 2 Abs. 3 EStG), nicht auf das Nettoeinkommen.

Berechnete Indikatoren

Durchschnittseinkommen

Das Durchschnittseinkommen wird als einkommensgewichtetes Mittel berechnet: Die Summe aller Einkünfte (in Tausend Euro, multipliziert mit 1.000) wird durch die Gesamtzahl der Steuerpflichtigen geteilt.

Durchschnittseinkommen = Σ Einkünfte × 1.000 / Σ Steuerpflichtige

Da die Rohdaten nur Klassensummen ausweisen, handelt es sich um einen Näherungswert.

Effektive Steuerquote

Die effektive Steuerquote beschreibt, welcher Anteil des zu versteuernden Einkommens tatsächlich als Einkommensteuer festgesetzt wurde:

Effektive Steuerquote = Σ festgesetzte Steuer / Σ zu versteuerndes Einkommen

Sie liegt typischerweise deutlich unter dem nominalen Spitzensteuersatz, weil Grundfreibetrag, Progressionsstufen und Abzüge das tatsächliche Steueraufkommen mindern.

Anteil Hochverdiener

Als Hochverdiener gelten Steuerpflichtige in den Einkommensklassen ab 70.000 Euro. Der Anteil ergibt sich als:

Hochverdieneranteil = Steuerpflichtige (≥ 70.000 €) / Steuerpflichtige (gesamt)

Die Grenze von 70.000 Euro wurde gewählt, weil sie in den TLS-Daten eine eigene Klasse bildet und im bundesdeutschen Kontext als Schwellenwert für das obere Einkommenssegment gilt.

Gini-Koeffizient

Der Gini-Koeffizient misst die Ungleichheit der Einkommensverteilung. Ein Wert von 0 bedeutet vollständige Gleichverteilung, ein Wert von 1 maximale Konzentration. Berechnet wird er über die Lorenzkurve nach der Trapezregel:

Gini = 1 − 2 × Fläche unter der Lorenzkurve

Da die Rohdaten klassenaggregiert sind, handelt es sich um eine Annäherung. Die Werte sind daher nicht direkt mit Gini-Koeffizienten aus Individualdaten vergleichbar.

Einschränkungen

Nur Steuerpflichtige erfasst. Die Statistik enthält ausschließlich Personen, für die eine Einkommensteuer festgesetzt wurde. Personen unterhalb des Grundfreibetrags sowie Beziehende von Transferleistungen ohne steuerpflichtiges Einkommen sind nicht enthalten. Die tatsächliche Einkommensverteilung der Bevölkerung ist daher ungleicher als die hier ausgewiesene.

Klassenaggregation. Alle Berechnungen beruhen auf Klassensummen, nicht auf Individualdaten. Innerhalb der Klassen wird eine gleichmäßige Verteilung unterstellt, was zu leichten Verzerrungen führen kann – insbesondere in der obersten offenen Klasse („125.000 Euro und mehr”).

Stichtagsbezug. Die Daten beziehen sich auf das Veranlagungsjahr 2021. Strukturveränderungen durch Betriebsansiedlungen, demografischen Wandel oder Lohnentwicklungen nach 2021 sind nicht abgebildet.

Gemeindegrenzen. Ausgewiesen wird der Wohnort der Steuerpflichtigen, nicht der Arbeitsort. Pendlerverflechtungen können das Bild verzerren.

Werkzeuge

Die Auswertung erfolgt in R mit den Paketen tidyverse, ggplot2, scales und here. Die Berichte werden mit Quarto erstellt und als statische Website veröffentlicht. Entwicklungsumgebung ist Positron.