Kleines Lexikon der biometrischen Fachbegriffe
für Leser von Versuchsberichten
|
|
Von Dr. W. K. Kast
LVWO Weinsberg
E-Mail: walter.kast@lvwo.bwl.de
In den meisten Fällen sind die Versuchsergebnisse bei biologischen Materialien nicht eindeutig, da eine hohe natürliche Variabilität vorhanden ist. Um Schlüsse aus Versuchsergebnissen ziehen zu können, ist oft eine biometrische Bearbeitung der Daten erforderlich. Durch Computer sind solche Berechnungen heute sehr einfach und schnell durchzuführen. In vielen Veröffentlichungen tauchen deshalb heute Fachbegriffe aus der Biometrie auf. Die nachfolgende kurze Zusammenfassung soll biometrischen Laien die Hintergründe der wichtigsten Begriffe ohne eine mathematisch exakte Darstellung erläutern.
Fehlervarianz
|
Grenzdifferenz
|
Irrtumswahrscheinlichkeit
|
Korrelation
|
Korrelationskoeffizient
|
|
|
|
|
|
Randomisation
|
Regression
|
Signifikanz
|
Standardabweichung
|
Varianz
|
|
|
|
|
|
Varianzanalyse
|
|
|
|
|
|
ist die nach Abzug der erklärbaren, d. h. von bestimmten Einflussfaktoren verursachten --> V a r i a n z (z. B. durch Behandlungen verursachte) noch verbleibende Restvarianz. Ihre Ursachen sind sehr vielfältig. Neben Unterschieden durch Boden und Mikroklima können z. B. auch Ungenauigkeiten bei der Datenerhebung (Messung, Zählung) zur Fehlervarianz beitragen. Im Weinbau spielt die Variabilität der Einzelpflanzen (auch bei Klonen) eine wesentliche Rolle. Nur wenn die Fehlervarianz praktisch Null ist, können eindeutige Versuchsergebnisse erzielt werden. Da dies kaum der Fall ist, können die meisten wissenschaftlichen Aussagen nur mit einer gewissen ž I r r t u m s w a h r s c h e i n l i c h k e i t gemacht werden. Die Fehlervarianz wird in der --> V a r i a n z a n a l y s e ermittelt.
|
|
ist eine Zahl, die aus der --> F e h l e r v a r i a n z für eine bestimmte --> I r r t u m s w a h r s c h e i n l i c h k e i t errechnet wird. Sie dient einer groben Abschätzung, ob die Aussage richtig ist: »Zwei bestimmte Behandlungen o. ä. ergaben unterschiedliche Ergebnisse«, d. h. --> S i g n i f i k a n z besteht. Diese Werte werden meist als GD 5 % oder LSD 5 % angegeben, wobei die Zahl vor % die Irrtumswahrscheinlichkeit repräsentiert. Wenn man also annimmt, dass Unterschiede bestehen, ist die Wahrscheinlichkeit eines Irrtums kleiner als 5 % bzw. 1 %.
|
|
Da alle wichtigen Merkmale bei Pflanzen ohne exakt erklärbare Ursachen variieren ( --> F e h l e r v a r i a n z ), können in Versuchen auftretende Unterschiede reinzufällig sein. Je größer die Unterschiede sind und je geringer die Fehlervarianz ist, desto unwahrscheinlicher ist es, dass solche Unterschiede zufällig sind. Wenn Versuche mit exakter --> R a n d o m i s a t i o n durchgeführt wurden, lässt sich berechnen, wie wahrscheinlich es ist, dass bestimmte Unterschiede zufällig sind. Daraus lässt sich die --> S i g n i f i k a n z bestimmter Aussagen ableiten (siehe z. B. --> G r e n z d i f f e r e n z ).
|
|
ist ein Maß für eine Beziehung zwischen den Daten zweier verschiedener Merkmale, z. B. Korrelation zwischen Mostgewicht und Ertrag. Eine Beziehung besteht z. B., wenn mit steigendem Befall durch einen Schädling der Ertrag sinkt (negative Korrelation) oder mit steigendem Düngeraufwand der Ertrag zunimmt (positive Korrelation). Eine Korrelation ist ein Hinweis auf positive oder negative Beziehung zwischen den Daten z. B. eines Versuches, aber kein Hinweis darauf, dass ein ursächlicher Zusammenhang besteht. Ein ursächlicher Zusammenhang muss durch andere, nicht mathematische Methoden festgestellt werden. Zum Beispiel ist die Zahl der Störche in Deutschland in den letzten 100 Jahren sehr eng korreliert mit der Zahl der Kinder pro Ehepaar, beide nahmen ab. Daraus den Schluss zu ziehen, die Störche hätten etwas mit den Geburten zu tun, ist offensichtlich falsch. Der ursächliche Zusammenhang ist in diesem Fall sehr komplex. Ein Maß für die Stärke oder Klarheit der Beziehung ist der --> K o r r e l a t i o n s k o e f f i z i e n t .
|
|
ist ein Maß für die Enge, Stärke oder Klarheit einer rechnerischen Beziehung --> K o r r e l a t i o n ). Er liegt bei 0, wenn keine Beziehung zwischen zwei Markmalen vorliegt und bei +1 oder -1, wenn die Beziehung »total« ist, d. h., wenn sich das eine Merkmal (bzw. dessen Messwert) direkt aus einem anderen errechnen lässt. Bei Werten, die dazwischen liegen, besteht eine »tendenzielle« Beziehung, die umso eindeutiger ist, je näher der Wert bei 1 liegt. Bei Korrelationen bedeutet --> S i g n i f i k a n z , dass der Koeffizient mit höchstens der angegebenen --> I r r t u m s w a h r s c h e i n l i c h k e i t von 0 abweicht, d. h. wahrscheinlich eine Beziehung besteht. Der Koeffizient wird mit »r« bezeichnet (z. B. r = 0,5* bedeutet, dass eine tendenzielle Beziehung besteht, die Irrtumswahrscheinlichkeit hierfür ist kleiner als 5 %).
|
: |
Ein wichtiger Vorgang für die Beurteilung der Ergebnisse eines Versuches ist die Abtrennung der »erklärbaren« --> V a r i a n z von der
--> F e h l e r v a r i a n z (siehe --> V a r i a n z a n a l y s e ). Dies ist nur möglich, wenn systematische Einflüsse (z. B. Behandlungen) klar von zufälligen Variationsursachen getrennt werden können. Dazu ist eine Anordnung der zu prüfenden Varianten nach dem Zufallsprinzip auf dem Feld notwendig. Daraus ergibt sich ein erwünschtes Durcheinander. Jede systematische oder »gerechte« Anordnung kann Probleme bei der Auftrennung der Varianzen verursachen und macht dadurch eine exakte Beurteilung der Ergebnisse unmöglich.
|
: |
Besteht eine --> K o r r e l a t i o n zwischen zwei Merkmalen (z. B. Höhe des Schädlingsbefalls und Ertrag), so kann eine Funktion berechnet werden (Gerade oder Kurve). Diese beschreibt den Verlauf der Beziehung mit maximaler Wahrscheinlichkeit, d. h., es ist die Funktion, bei der die Abweichungen (Restvarianz, --> F e h l e r v a r i a n z ) am geringsten sind. Man kann eine solche Funktion auch als Trend auffassen. Aus den Werten des einen Merkmals (z. B. Befall eines Schädlings) kann mit Hilfe der Regressionsfunktion der Wert errechnet werden, den das zweite Merkmal (Ertrag) wahrscheinlich annehmen wird. Zum Beispiel kann der wahrscheinliche Ertragsverlust für einen bestimmten Schädlingsbefall mit Hilfe einer Befalls-Verlust-Regression errechnet werden. Ein wichtiges Maß sind die Werte für die Steigung (Steilheit, Gefälle) der Geraden oder Kurve: die Regressionskoeffizienten.
|
: |
Bedingt durch die nicht erklärbare Variation ( --> F e h l e r v a r i a n z ) können in Versuchen auftretende Unterschiede rein zufällig sein. Bei einer Signifikanzprüfung wird mit Hilfe der --> F e h l e r v a r i a n z berechnet, wie wahrscheinlich ein Irrtum bei einer bestimmten Aussage ist (z. B. Mittel wirkt/es sind Ertragsunterschiede vorhanden). In der Regel wird angegeben, ob die --> I r r t u m s w a h r s c h e i n l i c h k e i t kleiner als 5 % ist, man spricht dann von signifikant oder 1 % (= hoch signifikant). Bestehen keine signifikanten Unterschiede (nicht signifikant), so bedeutet dies nicht, dass keine Unterschiede vorhanden sind, sondern nur, dass diese Aussage mit einer Wahrscheinlichkeit von mindestens 5 % (1/20 der Fälle) falsch ist, d. h. das Ergebnis ist unklar. »Nicht signifikant« kann auch darauf beruhen, dass die Fehlervarianz relativ hoch ist, z. B. durch ungenaue Versuchsarbeiten. Irrtumswahrscheinlichkeiten von 5 % werden meist durch einen Stern »*« angegeben, 1 % durch zwei Sterne »**«, nicht signifikant wird durch »ns« markiert.
|
|
ist ein Maß für die Genauigkeit eines in einem Versuch ermittelten Wertes (Mittelwert, Regressionskoeffizient o. ä.). Jeder ermittelte Wert hat durch die --> F e h l e r v a r i a n z eine gewisse Ungenauigkeit. Die Standardabweichung ist ein Maß für die Genauigkeit des errechneten Wertes. Je höher die Standardabweichung, desto ungenauer ist der Wert. Als Symbol wird meist »s« verwendet, z. B. Mittelwert +/-s.
|
|
ist ein Maß für die Variabilität (Streuung). Alle wichtigen Merkmale von Pflanzen (z. B. Ertrag, Mostgewicht) variieren aus verschiedensten Gründen. Innerhalb einer völlig gleich bewirtschafteten Rebanlage hat z. B. jede Reihe einen anderen Ertrag. Aus diesem Grund muss ein Versuch immer mit Wiederholungen durchgeführt werden. Daraus können ein Mittelwert und aus den Abweichungen der Einzelergebnisse vom Mittelwert die Varianz berechnet werden. In der --> V a r i a n z a n a l y s e werden Teile der Gesamtvarianz bestimmten Einflussgrößen rechnerisch zugeordnet.
|
: |
Bei diesem Rechnungsverfahren wird die erklärbare Varianz (z. B. die durch die Behandlung zusätzlich entstandene) von der nicht erklärbaren Restvarianz ( --> F e h l e r v a r i a n z ) abgetrennt. Sie dient der Prüfung, ob der Einfluss einer Einflussgröße (z. B. Behandlung) signifikant ist.
|