Die Fehler 1. und 2. Art: Welche Art ist besser?

2 min read

Bedeutung der Minimierung von Fehlern abhängig vom Problem/Datensatz.

Die Fehler 1. und 2. Art: Welche Art ist besser?

Was versteht man unter einem Fehler 1. Art und einem Fehler 2. Art?

Der Fehler 1. Art gleicht einem falsch positiven Ergebnis. Der Fehler 2. Art gleicht einem negativen Ergebnis. Der Fehler 1. Art ist die Zurückweisung der in der Wirklichkeit wahren Nullhypothese. Der Fehler 2. Art ist die Annahme der in der Wirklichkeit falschen Nullhypothese. Schauen wir uns ein Beispiel für Biometrie an. Wenn wir unsere Finger nach einem biometrischen Scan scannen, besteht der Fehler 1. Art in der Möglichkeit der Zurückweisung auch bei einem autorisierten Vergleich. Der Fehler 2. Art besteht in der Möglichkeit der Annahme auch bei einem falschen/nicht autorisierten Vergleich.

Am besten wäre es, wenn keiner der beiden Fehler auftritt. Der Fehler, wenn er überhaupt besser ist, hängt von folgen Parametern ab: die Hypothese, Problemstellung und der Datensatz.

Welche Art von Fehlern ist doch besser?

Anhand der drei Szenarien versuchen wir die Bedeutung der Problemstellung und Situationen in diesem Zusammenhang darzustellen. Kehren wir aber zunächst zu dem obigen Beispiel zurück.

1. Szenario/Problemdarstellung: Bereitstellung des Zugriffs auf ein Asset nach einem biometrischen Scan.

Fehler 1. Art: Möglichkeit der Zurückweisung auch bei autorisiertem Vergleich.

Fehler 2. Art: Möglichkeit der Annahme auch bei einem nicht autorisierten Vergleich.

Bei dieser Problemdarstellung ist der Fehler 1. Art kein Problem, da wir unsere Finger erneut scannen können und dies richtig funktionieren sollte. Der Fehler 2. Art ist nicht wünschenswert, da dies bedeuten würde, dass ein nicht autorisierter Benutzer auf das Asset zugreifen kann.

2. Szenario/Problemdarstellung: Das Konstruktionsmodell eines Gebäudes ist richtig.

Der Fehler 1. Art: Es wird vorhergesagt, dass das Modell richtig ist, tatsächlich ist es aber nicht richtig.

Der Fehler 2. Art: Es wird vorhergesagt, dass das Modell falsch ist, tatsächlich ist es richtig.

Bei dieser Problemdarstellung bildet der Fehler 1. Art ein großes Risiko, da dies bedeuten kann, dass das Gebäude gebaut wird, das defekt ist, und zum Zusammenbruch des Gebäudes führen kann. Der Fehler 2. Art ist weniger schwerwiegend, da mehr Modelle untersucht werden können und ein richtiges gefunden werden kann.

3. Szenario/Problemdarstellung: Medizinische Forschungen für ein Arzneimittel, das Krebs heilt.

Der Fehler 1. Art: Es wird vorhergesagt, dass ein Heilmittel gefunden wird, tatsächlich ist dies nicht der Fall.

Der Fehler 2. Art: Es wird vorhergesagt, dass kein Heilmittel gefunden wird, tatsächlich ist dies der Fall.

Bei dieser Problemdarstellung ist der Fehler 1. Art kein Problem, da dies später durch weitere Forschungen korrigiert werden könnte. Der Fehler 2. Art ist schwerwiegender, da dies als kein Heilmittel abgelehnt werden könnte und ein Medikament Millionen von Menschenleben retten kann.

Nachdem wir diese drei Szenarien betrachtet haben, können wir folgende Schlussfolgerungen ziehen: Abhängig von der Problemstellung kann der Fehler 1. Art besser als der Fehler 2. Art sein oder umgekehrt. Die Wahrscheinlichkeit, beide Arten von Fehlern zu begehen, ist umgekehrt proportional, da die Abnahme der Fehlerrate 1. Art zur Erhöhung der Fehlerrate 2. Art führt und umgekehrt. Die Wahrscheinlichkeit, einen Fehler 1. Art zu begehen, wird Signifikanzniveau genannt und mit dem kleinen griechischen Buchstaben α abgekürzt (p-Wert, unter dem die Nullhypothese zurückgewiesen wird). Das allgemein festgesetzte α=0,05 bedeutet, dass die Nullhypothese in zirka 5% der Fälle fälschlicherweise zurückgewiesen wird. Möchten Sie die Wahrscheinlichkeit des Begehens eines Fehlers 1. Art verringern, so können Sie den Alpha-Wert (p-Wert) strenger festsetzen oder als Alternative die Stichprobengröße erhöhen.

In ähnlicher Weise sollten Sie sehr vorsichtig sein, wenn Ihr Datensatz medizinischer Natur ist. Andererseits erfordert beispielsweise Spam-Filterung einen anderen Ansatz zu diesen Fehlern.

Fazit

Je nach dem Anwendungsfall/der Problemstellung kann der Fehler 1. Art besser als der Fehler 2. Art sein oder umgekehrt. Aus technischer Hinsicht ist dies auch etwas von der Gesamtgenauigkeit des Modells abhängig. Zur Kontrolle dieser Art von Fehlern dient eine Variable alpha. Wenn die Stichprobengröße erhöht wird, kann das Risiko verringert und die Anzahl dieser Art von Fehlern geändert werden.

Wenn Sie sich mehr Klarheit über die Fehler 1. und 2. Art verschaffen möchten, so können Sie sich an das Team von AI-United.de per Mail oder Q&A wenden.

Quelle

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.