Naives Entscheidungsmodell: Unterschied zwischen den Versionen

Aus Open Source Ecology - Germany
Zur Navigation springen Zur Suche springen
(Entscheidungsfunktion ist jetzt Wohl definiert)
Zeile 51: Zeile 51:
  
 
== Mathematische Lösung ==
 
== Mathematische Lösung ==
Nachdem alle Menschen ihre Antworten gegeben haben, können wir berechnen mit welcher Wahrscheinlichkeit deren Antwort "ja" ist:
+
Nachdem alle Menschen ihre Antworten gegeben haben, können wir berechnen mit welcher Wahrscheinlichkeit die Reailtät auch mit "ja" antwortet:
<math display="block">P(\text{richtige Antwort ja}) = P(W=ja|\bigcap_{i \in J} X_i = ja, \bigcap_{i \in J^c} X_i = nein).</math>
+
<math display="block">P(\text{richtige Antwort ja}) = P\big(W=ja|\bigcap_{i \in J} X_i = ja, \bigcap_{i \in J^c} X_i = nein\big).</math>
 
Mit Bayes Formula gilt
 
Mit Bayes Formula gilt
 
<math display="block">
 
<math display="block">
P(W=ja|\bigcap_{i \in J} X_i = ja, \bigcap_{i \in J^c} X_i = nein)
+
P\big(W=ja|\bigcap_{i \in J} X_i = ja, \bigcap_{i \in J^c} X_i = nein\big)
 
=  \frac{
 
=  \frac{
 
P(\bigcap_{i \in J} X_i = ja, \bigcap_{i \in J^c} X_i = nein|W=ja)\cdot P(W=ja)
 
P(\bigcap_{i \in J} X_i = ja, \bigcap_{i \in J^c} X_i = nein|W=ja)\cdot P(W=ja)
Zeile 63: Zeile 63:
 
</math>
 
</math>
  
Wir können überall kürzen <math>P(W=nein) = P(W=nein) = 1/2 </math>
+
Wir kürzen überall <math>P(W=nein) = P(W=nein) = 1/2 </math>, dann gilt
Dann gilt
 
  
 
<math display="block">
 
<math display="block">
Zeile 73: Zeile 72:
 
}.
 
}.
 
</math>
 
</math>
Dadurch, dass die Menschen unabhängign von einander die Etscheidungen treffen gilt:
+
Dadurch, dass die Menschen unabhängign von einander die Etscheidungen treffen, gilt:
  
 
<math display="block">
 
<math display="block">
Zeile 83: Zeile 82:
 
</math>
 
</math>
  
Jetzt setzen wird die definierte Wahrscheinlichkeiten für richtige Antworten <math> P(X_i=ja | W=ja) = P(X_i=nein | W=nein) = p_i </math> und die damit Wahrscheinlichkeiten für falschen Antworten <math> P(X_i=nein | W=ja) = P(X_i=ja | W=nein) = 1-p_i </math> und erhalten
+
Jetzt setzen wird die definierten Wahrscheinlichkeiten für richtige Antworten <math> P(X_i=ja | W=ja) = P(X_i=nein | W=nein) = p_i </math> und damit Wahrscheinlichkeiten für falsche Antworten <math> P(X_i=nein | W=ja) = P(X_i=ja | W=nein) = 1-p_i </math> ein und erhalten
  
 
<math display="block">
 
<math display="block">
Zeile 92: Zeile 91:
 
</math>
 
</math>
  
 
+
Uns interessiert, ob diese Wahrscheinlichkeit größer ist als die Wahrscheinlichkeit für eine falsche Antwort. Das ist
Uns interessiert, wenn diese Wahrscheinlichkeit größer ist als die Wahrscheinlichkeit für eine falsche Antwort. Das ist dann
 
 
<math display="block">P(\text{richtige Antwort ja})  > P(\text{falsche Antwort ja}) \Leftrightarrow P(\text{richtige Antwort ja})  > 1- P(\text{richtige Antwort ja}) \Leftrightarrow  P(\text{richtige Antwort ja})  > 1/2.</math>
 
<math display="block">P(\text{richtige Antwort ja})  > P(\text{falsche Antwort ja}) \Leftrightarrow P(\text{richtige Antwort ja})  > 1- P(\text{richtige Antwort ja}) \Leftrightarrow  P(\text{richtige Antwort ja})  > 1/2.</math>
  
Zeile 103: Zeile 101:
 
} & > 1/2 \\
 
} & > 1/2 \\
 
\Longleftrightarrow & \prod_{i \in J} p_i \prod_{i \in J^c}(1-p_i)  & > \prod_{i \in J}(1- p_i) \prod_{i \in J^c}p_i.
 
\Longleftrightarrow & \prod_{i \in J} p_i \prod_{i \in J^c}(1-p_i)  & > \prod_{i \in J}(1- p_i) \prod_{i \in J^c}p_i.
\end{array}
 
</math>
 
oder
 
<math display="block">
 
\begin{array}{rrl}
 
\Longleftrightarrow & \prod_{i \in J} \frac{p_i}{1-p_i} \prod_{i \in J^c}\frac{1-p_i}{p_i}  & > 1.
 
 
\end{array}
 
\end{array}
 
</math>
 
</math>
Zeile 115: Zeile 107:
  
 
<math display="block">
 
<math display="block">
f:(x_1,\ldots,x_n) =
+
f:(p_1,\ldots,p_n, x_1,\ldots,x_n, m) =
 
\begin{cases}
 
\begin{cases}
 
ja & \text{wenn } \prod_{i \in J} p_i \prod_{i \in J^c}(1-p_i)  > \prod_{i \in J}(1- p_i) \prod_{i \in J^c}p_i \\
 
ja & \text{wenn } \prod_{i \in J} p_i \prod_{i \in J^c}(1-p_i)  > \prod_{i \in J}(1- p_i) \prod_{i \in J^c}p_i \\
 
nein & \text{wenn } \prod_{i \in J} p_i \prod_{i \in J^c}(1-p_i) < \prod_{i \in J}(1- p_i) \prod_{i \in J^c}p_i \\
 
nein & \text{wenn } \prod_{i \in J} p_i \prod_{i \in J^c}(1-p_i) < \prod_{i \in J}(1- p_i) \prod_{i \in J^c}p_i \\
\text{eine Münze werfen} & \text{sonst}
+
m \text{(ein Münzenwurf)} & \text{sonst}.
 
\end{cases}
 
\end{cases}
 
</math>
 
</math>

Version vom 30. März 2019, 09:08 Uhr

Problem

Wie kann OSEG entscheiden ein Projekt zu unterstützen oder nicht?

Die Antwort ist doch klar: wir nutzen unser gesamtes Wissen – wir machen eine Umfrage. Nun sind nicht alle Menschen Experten in Allem. Wie machen wir diese Umfrage so geschickt, dass die Antwort möglichst richtig ist? Diese Frage möchten wir hier beantworten.

Unswer Hauptwerkzeug ist mathematische Modellierung mit sehr einfachen Modellen. Auch wenn die Realität sehr komplex ist, können wir aus einfachen Beispielen viel lernen.

Hintergrund

Diese Aufgabe entstand während des Hackathons 2019. Eine Gruppe von OSEG soll entscheiden ob OSEG ein Projekt mit offiziell unterstüzt. Moe hat ein Verfahren vorgeschlagen: Umfrage von OSEG nicht Experten, OSEG Experten und speizeillen OSEG Leuten damit alles rechtlich korrekt ist.

Ich werde hier mein naives mathematisches Modell dazu erstellen. Es ist naiv, weil ich kein Experte auf diesem Gebiet bin – welch eine Ironie 😬. Ich werde hier zuerst meine Fragen und Annahmen sammeln und dann gucken, was Profis dazu sagen.


Mathematisches Modell

Unser Problem soll möglichst einfach sein. Wir gehen von Menschen aus. Alle diese Menschen haben unterschiedlichen Wissenstand. Sie müssen eine Frage mit "ja" oder "nein" beantworten. Diese Antwort kann objektiv korrekt oder falsch sein. Wir müssen diese Antworten so schlau kombinieren, dass unser Ergebnis so korrekt wie möglich ist.

Mensch

Wir modellieren jeden Menschen durch eine Zufallsvariable , . Jeder Mensch beantwortet eine Frage mit "ja" oder "nein". Das bedeutet . Wir nehmen an, dass die Menschen, die Fragen unabhänging von einenader beantworten.

Wirklichkeit

Wir modellieren die Wirklichkeit, als eine Zufallsvariable . Sie repräsentiert die richtige Antwort "ja" oder "nein". Bevor wir Menschen fragen, haben wir überhaupt keine Ahnung, was die richtige Antwort ist, daher gilt für die Wahrscheinlichkeit .

Wissen

Jeder Mensch hat unterschiedliches Wissen. Das drücken wir durch unterschiedliche Wahrscheinlichkeiten, die richtige Antwort zu erraten

Hier haben wir gleichzeitig angenommen, dass der Mensch gleich gut eine "nein"- und eine "ja"-Antwort erraten kann.

Weil die Menschen unabhängig von einenader die Frage beantworten, gilt für jede Untermenge[1]

Entscheidung basierend auf einer Umfrage

Unsere Entscheidung ist eine Funktion .

  • Parametren
  • Sie hängt von den Menschen Entscheidungen (x_1,\ldots,x_n) "ja" oder "nein".
  • Einem Münzenwurf , wenn sie unentschieden ist.

Die Entscheidungen aller Menschen können wir mit einer Menge ausdrücken. Diese Menge enthält alle Indizes, die die Frage mit "ja" beantwortet haben. Das Komplement dieser Menge in representiert die "nein"-Entscheidungen.

Mathematische Lösung

Nachdem alle Menschen ihre Antworten gegeben haben, können wir berechnen mit welcher Wahrscheinlichkeit die Reailtät auch mit "ja" antwortet:

Mit Bayes Formula gilt

Wir kürzen überall , dann gilt

Dadurch, dass die Menschen unabhängign von einander die Etscheidungen treffen, gilt:

Jetzt setzen wird die definierten Wahrscheinlichkeiten für richtige Antworten und damit Wahrscheinlichkeiten für falsche Antworten ein und erhalten

Uns interessiert, ob diese Wahrscheinlichkeit größer ist als die Wahrscheinlichkeit für eine falsche Antwort. Das ist

Also wenn gilt

Unsere Entscheidungsfunktion ist somit:

Interpretation der Lösung

Intuitive Ergebnisse

Viele Ergebnisse aus dem Modell sind intuitiv. Das ist schön - sie zeigen, dass das Model plausibel ist. Doch vorsichtig! Vetraue nie deiner Intuition bei der Lösung der stochastischen Problemen. Stochastik ist kontraintuitiv, desswegen muss man alle Ergebnisse formal begründen. Hier sind diese Ergebnisse:

"Wenn man nur begrenze Anzahl der Personen befragen kann, frag die schlauesten Menschen."

Begründung " (TODO: noch zu definierien) ist maximal wenn maximal sind." (für alle )

"Frag soviele Menschen wie möglich".

TODO: Formale Begründung aufschreiben.

Wenig intuitive Ergebnisse

"Wer häufig daneben liegt, ist ein Experte! Fragt ihn/sie und tu das Gegenteil."

Begründung ist genau dann maximal wenn minimal ist.


"Manchmal eine Person mit viel Erfahrung weiß **weniger** als zwei Personen mit wenig Erfahrung."

"Manchmal eine Person mit viel Erfahrung weiß **mehr** als zwei Persone nmit wenig Erfahrung."

Wir nummerieren die Mensche mit 1 für viel Erfahrung und 2, 3 mit wenig Erfahrung. Wir befragen sie. Wenn 1 sagt "Ja" aber 2 und 3 sagen "nein", wir wählen "ja" nur wenn

Wenn zwei weniger Erfahrene haben gleiche Erfolgrswahrscheinlichkeiten wir wählen "Ja" nur wenn gilt:

Der Graph unten zeigt, wenn die Meinung "ja" der ersten Person, ist "gleich wichtig" als die Meinungen "nein" der anderen beiden Personen. Das sind alle Punkten unterhalb der Linie.

Indifference-plot.png

Referenzen

Youtube Kanal von Nikolai Osipov (Николай Николаевич Осипов), über kollektive Intelligenz. https://www.youtube.com/channel/UCuH_xeNX7KKIYHeZXaPO_OA

Notizen

"ja" und "nein" vs "richtig" und "falsch"

Mein erstes Modell war nicht mit "ja" und "nein" sondern mit "richtig" und "falsch". Dieses Modell verleiht dazu, eine Entscheidungsfunktion zu konstruieren die immer "richtig" ist, ohne die Antworten von Experten zu berücksichtigen. Das ist zu unrealistisch. Ich werde später mir dieses Modell nochmal ansehen und Zusammenhang zu dem "ja"-"nein"-Modell analysieren.

  1. Ich wähle eine Untermenge, weil man in Wahrscheinlichkeitstheorie zwischen einer Unabhängigkeit und einer paarweisen Unabhängigkeit unterscheiden muss. Es ist ausreichend, nurdie "ja" Antworten zu betrachten, weil es ist ein Erzeuger von der -Algebra erzeugt durch alle bedingt durch bzw. .