Finanzamt – Qui-Quadrat: der Test, der den Zufall beim Schummeln erwischt

Chi-Quadrat-Test in der Betriebsprüfung | Wenn Statistik gegen Taxi-Unternehmen spricht.

Kurzfassung. Der Chi-Quadrat-Anpassungstest (Chi²-Test) ist in der steuerlichen Außenprüfung seit Jahren ein probates Instrument, um Auffälligkeiten in Zahlenreihen (z. B. Kassenbuchführung, Kilometerstände, Umsatzzahlen usw.) zu detektieren.

In der Praxis kann das Ergebnis ein Indiz für unvollständige oder manipulierte Aufzeichnungen sein.

Alleine gesehen reicht der Test allerdings nicht aus, die Buchhaltung des Taxi- oder Mietwagenunternehmers rechtssicher zu verwerfen und eine Schätzung nach § 162 AO (= Abgabenordnung) zu rechtfertigen.

Entscheidend ist immer der Umfang der geprüften Daten (je mehr desto besser), ergänzende Prüfungsergebnisse und die verfahrensrechtliche Einordnung der Außenprüfung.

Chi-Quadrat Test (Diagramm)

1. Was ist der Chi-Quadrat-Test?

Der Chi-Quadrat-Anpassungstest vergleicht die beobachtete Verteilung von Ziffern (z. B. der Ziffern 0 – 9 an bestimmten Stellen von Zahlenwerten) mit der erwarteten Gleichverteilung („normale Häufigkeit“). Weicht die beobachtete Verteilung statistisch signifikant ab, kann das darauf hindeuten, dass Zahlen gezielt verändert wurden, z.B. deshalb, weil „Lieblingszahlen“ öfter vorkommen als zufällig zu erwarten wäre.

Beispiel: Es werden die Tagesumsätze eines Taxi-Betriebes geprüft. Bei einem Umsatz von EUR 255,70 wird die erste Nachkommastelle auf Häufigkeit untersucht. Taucht die Ziffer 7 als erste Nachkommastelle bei einer Prüfung aller Umsätze überproportional häufig auf, würde ein Indiz dafür bestehen, dass der Umsatz von EUR 255,70 eine ausgedachte Zahl ist. Folge: Der Betriebsprüfer wird sich aufgrund des unerklärbaren Häufigkeitsmerkmals der „Sieben“ die Lohn- und Finanzbuchhaltung des steuerpflichtigen Taxi-Unternehmens genauer ansehen.

In Steuerprüfungen wird der Test häufig in Verbindung mit dem Benford’schen Gesetz diskutiert. Beide Verfahren sind Hilfsmittel zur Indizierung möglicher Manipulationen, aber keine zwingenden Alleinbeweise.

2. Rechtliche Grundlage: § 193 AO

Die Anordnung einer Außenprüfung gegenüber einem Gewerbetreibenden stützt sich auf § 193 AO. Die Vorschrift gibt der Finanzverwaltung das Recht, Prüfungen zur Feststellung steuerlich relevanter Sachverhalte durchzuführen. Ob und in welchem Umfang eine Außenprüfung angeordnet wird, ist eine Ermessensentscheidung der Behörde, die der finanzgerichtlichen Kontrolle unterliegt.

Ein evtl. angerufenes Finanzgericht prüft in der Folge, ob die gesetzlichen Grenzen einer solchen Prüfung beachtet wurden. In der Rechtsprechung hat der Bundesfinanzhof (BFH) hierzu wiederholt die Reichweite und Verhältnismäßigkeit betont. Für die Praxis der bayerischen Taxi- und Mietwagenunternehmen bedeutet das: Die Finanzverwaltung darf statistische Analyseverfahren, wie beispielsweise

  • Chi²,
  • Zeitreihen-Vergleiche,
  • Diesel- bzw. Energieplausilisierung
  • und andere
Chi-Quadrat Test (Comic)

im Rahmen der Außenprüfung einsetzen. Deren Ergebnisse müssen jedoch in eine Gesamtschau von weiteren Buchhaltungsmängeln, Verprobungen sowie steuerlich relevanten Indizien einer nichtordnungsgemäßen Buchhaltung eingebettet werden, bevor eine Verwerfung der Lohn- und Finanzbuchhaltung und eine daraus folgende Hinzuschätzung vorgenommen werden kann. Auch dies wurde vom Bundesfinanzhof entschieden.

Hinweis: „Verwerfung der Buchhaltung“ ist ein Fachbegriff aus dem Steuer- und Abgabenrecht, der vor allem im Rahmen von Betriebsprüfungen und steuerlichen Außenprüfungen relevant ist. Er bedeutet im Kern: Wenn die Buchführung des Steuerpflichtigen nicht ordnungsgemäß ist, also gegen gesetzliche Buchführungs- und Aufzeichnungspflichten (z. B. §§ 140 ff. AO, GoBD) verstößt, kann das Finanzamt die geprüfte Buchhaltung als Grundlage der Besteuerung verwerfen. Das heißt, sie wird nicht (mehr) als vertrauenswürdige Grundlage anerkannt und durch die Schätzung nach § 162 AO ersetzt (dort Abs. 1: „Soweit die Finanzbehörde die Besteuerungsgrundlagen nicht ermitteln oder berechnen kann, hat sie sie zu schätzen“). Dass diese Schätzung regelmäßig höher als die Normalbesteuerung ausfällt und teils existenzgefährdende Auswüchse annimmt, versteht sich von selbst.

3. Steuerrechtliche Rechtsprechung mit unmittelbarem Bezug zum Taxi-Gewerbe

Für die Taxi-Branche gibt es eine Reihe einschlägiger Entscheidungen, die die Anwendung statistischer Verfahren in der Außenprüfung beleuchten (sowohl FG-Beschlüsse als auch BFH-Entscheidungen):

  • BFH, Beschluss vom 14.01.2021 (STRE202150054/XB 25/20): Im Verfahren eines Taxi-Unternehmens fand der Betriebsprüfer Auffälligkeiten mittels eines Vergleichs der Erlöse mit Dieselkosten und einem Chi-Quadrat-Test. Aufgrund fehlender ordnungsgemäßer Schichtaufzeichnungen wurde eine pauschale Hinzuschätzung vorgenommen und vom BFH in der Rechtsfolge bestätigt (Verweis auf konkrete Untersuchungen und empirische Vergleichszahlen). Das Verfahren zeigt auf, dass statistische Tests Teil einer steuerlichen Gesamtprüfung werden können und insbesondere auch dürfen.
  • BFH, Beschluss vom 28.11.2012 (X B 74/11): Der BFH hat wiederholt betont, dass Schichtzettel im Taxi-Gewerbe zu den aufzubewahrenden Ursprungsaufzeichnungen gehören und dass Diskrepanzen in Aufzeichnungen erhebliche Folgen haben können. Die richterliche Beweiswürdigung hängt stark von der Sachverhaltsaufklärung ab, was insbesondere Hinzuschätzungen relevant ist.
  • FG Düsseldorf, Beschluss vom 03.06.2008 (14 V 1214/08): In diesem Verfahren wurde die Rolle des Chi-Quadrat-Tests im Taxi-Gewerbe thematisiert: das Gericht wertete das Testergebnis als ein zulässiges Indiz,  machte allerdings auch klar, dass der Test (für sich betrachtet) in der Regel nicht die alleinige Grundlage für die Verwerfung der Buchführung bilden kann.
  • FG Münster, Urteil vom 07.12.2005 (1 K 6384/03): Das Finanzgericht erkannte an, dass der Chi-Quadrat-Test die durch weitere Indizien belegbare Manipulation der Buchhaltung ergänzen kann. Gleichzeitig wurde die methodische Einordnung und die Grenzen des Tests kritisch diskutiert.

Die genannten Entscheidungen belegen, dass statistische Verfahren (vorliegend der Qui-Quadrat-Test) die Steuerprüfer-Argumen­tation unterstützen kann, aber als alleiniger Indikatoren für eine steuerliche Unzuverlässigkeit nicht ausreichend ist. Sie ersetzen insoweit nicht die Darlegung weiterer belastbarer Anknüpfungspunkte für eine Schätzung.

4. Methodische Grenzen | was Steuerberater und Prüfer beachten müssen

Aus der Literatur und der Rechtsprechung lassen sich zur Plausibilität des Chi-Quadrat-Tests eine Reihe von Einschränkungen ableiten:

  • Datenbasis: Der Chi²-Test benötigt hinreichend große und homogene Datenmengen. Bei kleinen oder strukturell heterogenen Datensätzen (verschiedene Fahrpreise, Komplexe Taxitarife, Sondervereinbarungen usw.) ist die Aussagekraft begrenzt. Siehe auch „Aktuelles zur Betriebsprüfung“ (PDF Download) unter elektronische-steuerprüfung.de.
  • Ergebnis ≠ Beweis: Ein signifikanter Chi²-Wert ist ein Indiz, aber juristisch gesehen, kein Beweis für Steuerhinterziehung. Gerichte fordern in der Regel weitere Verprobungen (z. B. Diesel-Vergleich, Branchen- und Betriebsvergleiche, Zeitreihenanalyse).
  • Verfahrensrechtliche Anforderungen: Eine Außenprüfung (umgangssprachlich häufig als „Steuerprüfung“ bezeichnet) muss verhältnismäßig und fachlich begründet sein. Der unbegrenzte Zugriff auf jedwede (= alle) digitale Daten kann rechtswidrig sein (BFH-Leitsatz zur Datenträger-Überlassung). Dies hat der BFH in einem interessanten Urteil bereits entschieden (BFH, Urteil vom 07.06.2021, Geschäftszeichen VIII R 24/18).

5. Praktische Konsequenzen für Taxi- und Mietwagenunternehmen

Für Taxi-Unternehmer und deren steuerliche Berater folgen daraus klare Handlungsempfehlungen:

  • Es sind vollständige Ursprungsaufzeichnungen zu führen: Schichtzettel müssen vorhanden sein, soweit sie erzeugt wurden. Die maschinelle Auslesbarkeit der Eichgeräte (Taxameter und Wegstreckenzähler) muss gegeben sein. Eine TSE muss nachgerüstet und der Finanzbehörde gemeldet sein. Die Frage der Ursprungsaufzeichnungen – basierende auf § 145 AO (sogenannter Geschäftsvorfall) – wurde seitens der angerufenen Finanzgerichte mehrfach betont. Aus unserer Verbandspraxis können wir berichten, dass insbesondere fehlende und/oder unvollständige Schichtzettel eines der häufigsten Eskalationsmotive bei Steuerprüfungen sind. So auch BFH im richtungsweisenden Beschluss vom 28.11.12 (X B 74/11). Sehen Sie hierzu bitte auch unsere frühere Berichterstattung.
  • Digitale Exportmöglichkeiten vorbereiten: Bei Auswertung digitaler Systeme ist steuerlich relevantes Material exportierbar bereitstellen. Unklare oder pauschal formulierte Datenträger-Anforderungen durch die Finanzbehörde können allerdings steuerrechtlich fraglich sein. Gleichwohl ist Kooperation in sachgerechtem Umfang erforderlich und wohl auch sinnvoll.
  • Wirtschaftlichkeits- und Vergleichsrechnungen im Rahmen der Beweisvorsorge nachvollziehbar dokumentieren (z. B. Erlöse in Relation zum Diesel- oder Energieverbrauch, exakte Erfassung der Absolutkilometer des Fahrzeugs usw.). Derartige Verprobungen werden in der Praxis und Rechtsprechung regelmäßig eingesetzt.

Der Chi-Quadrat-Test ist ein nützliches forensisches Instrument in der steuerlichen Außenprüfung und ein Indiz in Bezug auf die ordnungsgemäße Lohn- und Finanzbuchhaltung des Steuerpflichtigen. Die deutsche Rechtsprechung – von den Finanzgerichten bis zum BFH – zeigt eine klare Linie auf: statistische Verfahren allein genügen nicht. Die Verwerfung der Buchführung oder eine belastbare Schätzung nach § 162 AO setzt eine Gesamtwürdigung voraus, in der formelle Mängel, ergänzende Querprüfungen und die Verhältnismäßigkeit der Prüfungsanordnung zusammenwirken. Taxi-Unternehmen sollten deshalb präventiv auf vollständige Ursprungsaufzeichnungen, nachvollziehbare digitale Exporte und eine dokumentierte Betriebsvergleichs-/Wirtschaftlichkeitsrechnung setzen.

Hinweis: Die „Verprobung“ ist ein Begriff aus der steuerlichen Betriebsprüfung und beschreibt ein Plausibilitätsverfahren, mit dem die Finanzverwaltung die Richtigkeit der erklärten Einnahmen überprüft. Es handelt sich also nicht um eine klassische Buchprüfung, sondern um eine indirekte Kontrollrechnung, die darauf abzielt, Unstimmigkeiten aufzudecken. Typische Merkmale einer Verprobung sind:

  • Überprüfung und Schätzung der erklärten Umsätze anhand von Kennzahlen, Durchschnittswerten oder Erfahrungswerten
  • Quervergleich zwischen erklärten Umsätzen und anderen, schwer oder gar nicht zu manipulierbaren Daten (z. B. Laufleistung des Fahrzeugs, Personaleinsatz, Vermittlungszahlen der Taxi-Zentrale oder einer App wie Freenow, Bold und Uber usw.)
  • Hochrechnung aus Einzelbelegen, von Kontrollmaterial und branchenspezifischen Kalkulationen
  • Abgleich mit externen Daten (z. B. Fremdbetriebsdaten, Kontrollmaterial, Erfahrungswerte der Finanzbehörde, Verkehrsdaten, Branchenvergleiche)

Ziel: Die Finanzverwaltung prüft mit Hilfe des Quervergleiches, ob die erklärten Umsätze und Gewinne nachvollziehbar und wahrscheinlich sind. Ergeben sich signifikante Abweichungen, kann dies ein Indiz für nicht erklärte Einnahmen und damit Umsatzsteuerhinterziehungen sein, welche eine Schätzung nach § 162 AO auslösen.

Beispiel aus der Taxi- und Mietwagenbranche:

  • Prüfer vergleicht Kilometerstände und Fahrtenbücher mit den erklärten Umsatzerlösen
  • Aus den nachweisbar gefahrenen Kilometern und Durchschnittserlösen wird ein Soll-Umsatz errechnet (mit Einbezug des jeweiligen Taxi-Tarifes)
  • Weicht dieser deutlich vom erklärten Umsatz ab, wird kritisch nachgefragt und geprüft und erforderlichenfalls geschätzt

6. Fazit

Der Chi-Quadrat-Test (χ²-Test) ist ein statistisches Verfahren, mit dem geprüft wird, ob zwischen beobachteten Häufigkeiten und den erwarteten Häufigkeiten ein signifikanter Unterschied besteht.

Auf das Glückspiel bezogen, würde der Qui-Quadrat-Test ergeben, dass bei einem Würfel die Ziffern 1 bis 6 gleich häufig vorkommen.

Die Verteilung der Ziffern bei einem Würfel ist homogen. Genauso, wie es bei den Ziffern Ihrer Buchhaltung sein sollte.

Für den Spezialisten haben wir hier eine erschlagende Information zum Chi-Quadrat-Test bereitgestellt.

Chi-Quadrat Test Würfel

Links & Dokumente in diesem Artikel