Problem
Wie kann OSEG entscheiden ein Projekt zu unterstützen oder nicht?
Die Antwort ist doch klar: wir nutzen unser gesamtes Wissen, wir machen eine Umfrage. Nun sind nicht alle Menschen Experten in Allem. Wie machen wir diese Umfrage so geschickt, dass die Antwort möglichst richtig ist? Diese Frage möchten wir hier beantworten.
Und wir müssen auch berücksichtigen dass diese Vorgehensweise technisch möglich ist.
Hintergrund
Diese Aufgabe entstand beim Hackathon 2019. Moe hat ein Verfahren für die Projekt Unterstützung vorgeschlagen. Ich werde hier erstmal mein naives mathematisches Modell dazu erstellen. Es ist naiv, weil ich kein Experte in diesen Aufgaben bin -- welch eine Ironie 😬. Ich werde hier zuerst meine Fragen und Annahmen sammeln und dann gucken was Profis dazu gesagt haben.
Einfaches Problem
Unser model soll zuerst möglichst einfach sein. Wir gehen von
Menschen aus. Alle diese Menschen haben unterschiedlichen Wissenstand. Sie müssen eine Frage mit "ja" oder "nein" beantworten. Diese Antwort kann objektiv korrekt oder falsch sein. Wir müssen diese Antworten so schlau kombinieren, dass unser Ergebnis so korrekt wie möglich ist.
Mathematisches Modell
Mensch
Wir modellieren jeden Menschen durch eine Zufallsvariablen
,
. Jeder Mensch beantwortet eine Frage mit "ja" oder "nein". Das bedeutet
. Um das Modell zu vereinfachen, nehmen wir an, dass die Menschen, die Fragen unabhänging von einenader beantworten.
Wirklichkeit
Wir modellieren die Wirklichkeit, als eine Zufallsvariable
. Sie repräsentiert die richtige Antwort "ja" oder "nein". Bevor wir Menschen fragen, haben wir überhaupt keine Ahnung, was die richtige Antwort ist, daher gilt für die Wahrscheinlichkeit
.
Wissen
Jeder Mensch kann unterschiedliches Wissen haben. Das Drucken wir durch unterschiedliche Wahrscheinlichkeit die richtige Antwort zu erraten.
![{\displaystyle p_{i}:=P(X_{i}=ja|W=ja):=P(X_{i}=nein|W=nein)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5c2d3868f0371815baf9350dba1f061fe618a503)
Hier haben wir gleichzeitig eine Annahme gemacht, dass der Mensch gleich gut eine "nein" und eine "ja" Antwort erraten kann.
Weil die Menschen unabhängig von einenader die Frage beantworten gilt für jede Untermengen
![{\displaystyle P(\bigcap _{i\in I}X_{i}=ja|W=ja):=\prod _{i\in I}P(X_{i}=nein|W=nein)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fc804bf425957c4c1e4506813b8d9b91b81a0863)
Entscheidung basierend auf einer Umfrage
Unsere Entscheidung ist eine Funktion
, die von den Menschen Entscheidungen abhängig ist und eine Antwort "ja" oder "nein" zurück gibt.
![{\displaystyle {\begin{array}{rcl}f:{\{ja,nein}\}^{n}&\longrightarrow &\{ja,nein\}\\(x_{1},\ldots ,x_{n})&\mapsto &f(x_{1},\ldots ,x_{n})\end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1c8d86f86ed7b416064bb23a25bb6ea487f2dd85)
Die Entscheidungen aller Menschen können wir mit einer Menge
ausdrücken. Diese Menge enthält alle Indizes, die die Frage mit "ja" beantwortet haben. Das Komplement dieser Menge
representiert die "nein"-Entscheidungen.
Mathematische Lösung
Nachdem alle Menschen ihre Antworten gegeben haben, können wir berechnen mit welcher Wahrscheinlichkeit deren Antwort "ja" ist:
![{\displaystyle P(richtigeAntwort)=P(W=ja|\bigcap _{i\in J}X_{i}=ja,\bigcap _{i\in J^{c}}X_{i}=nein).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c3ca4a300883e3a748346837c6399b863dae3149)
Mit Bayes Formula gilt
![{\displaystyle P(W=ja|\bigcap _{i\in J}X_{i}=ja,\bigcap _{i\in J^{c}}X_{i}=nein)={\frac {P(\bigcap _{i\in J}X_{i}=ja,\bigcap _{i\in J^{c}}X_{i}=nein|W=ja)\cdot P(W=ja)}{P(\bigcap _{i\in J}X_{i}=ja,\bigcap _{i\in J^{c}}X_{i}=nein|W=ja)\cdot P(W=ja)+P(\bigcap _{i\in J}X_{i}=ja,\bigcap _{i\in J^{c}}X_{i}=nein|W=nein)\cdot P(W=nein)}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b2186122d1d2e6961dbe18a73328c033274b1c1f)
Wir können überall kürzen
Dann gilt
![{\displaystyle P(W=ja|\bigcap _{i\in J}X_{i}=ja,\bigcap _{i\in J^{c}}X_{i}=nein)={\frac {P(\bigcap _{i\in J}X_{i}=ja,\bigcap _{i\in J^{c}}X_{i}=nein|W=ja)}{P(\bigcap _{i\in J}X_{i}=ja,\bigcap _{i\in J^{c}}X_{i}=nein|W=ja)+P(\bigcap _{i\in J}X_{i}=ja,\bigcap _{i\in J^{c}}X_{i}=nein|W=nein)}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/08354da6a99c27f10f61846af6aadb25a8631810)
Dadurch, dass die Menschen unabhängign von einander die Etscheidungen treffen gilt:
![{\displaystyle P(W=ja|\bigcap _{i\in J}X_{i}=ja,\bigcap _{i\in J^{c}}X_{i}=nein)={\frac {\prod _{i\in J}P(X_{i}=ja|W=ja)\prod _{i\in J^{c}}P(X_{i}=nein|W=ja)}{\prod _{i\in J}P(X_{i}=ja|W=ja)\prod _{i\in J^{c}}P(X_{i}=nein|W=ja)+\prod _{i\in J}P(X_{i}=ja|W=nein)\prod _{i\in J^{c}}P(X_{i}=nein|W=nein)}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e75c2d8ab11b52040ceab4e990fe0adec3bf3f3a)
Jetzt setzen wird die definierte Wahrscheinlichkeiten für richtige Antworten
und die damit Wahrscheinlichkeiten für falschen Antworten
und erhalten
![{\displaystyle P(W=ja|\bigcap _{i\in J}X_{i}=ja,\bigcap _{i\in J^{c}}X_{i}=nein)={\frac {\prod _{i\in J}p_{i}\prod _{i\in J^{c}}(1-p_{i})}{\prod _{i\in J}p_{i}\prod _{i\in J^{c}}(1-p_{i})+\prod _{i\in J}(1-p_{i})\prod _{i\in J^{c}}p_{i}}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bab9341447b461b8bfec8f136fdb134749e111a6)
Uns interessiert, wenn diese Wahrscheinlichkeit größer ist als die Wahrscheinlichkeit für eine falsche Antwort. Das ist dann
![{\displaystyle P({\text{ja richtige Antwort}})>P({\text{ja falsche Antwort}})\Leftrightarrow P({\text{ja richtige Antwort}})>1-P({\text{ja richtige Antwort}})\Leftrightarrow P({\text{ja richtige Antwort}})>1/2.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ee01bf3425a488c21d4095c7660a25a337cd37fe)
Also wenn gilt
![{\displaystyle {\begin{array}{rrl}&{\frac {\prod _{i\in J}p_{i}\prod _{i\in J^{c}}(1-p_{i})}{\prod _{i\in J}p_{i}\prod _{i\in J^{c}}(1-p_{i})+\prod _{i\in J}(1-p_{i})\prod _{i\in J^{c}}p_{i}}}&>1/2\\\Longleftrightarrow &\prod _{i\in J}p_{i}\prod _{i\in J^{c}}(1-p_{i})&>\prod _{i\in J}(1-p_{i})\prod _{i\in J^{c}}p_{i}.\end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d7ff45c6ff72b9d50a892cd230f5223d09036b33)
oder
![{\displaystyle {\begin{array}{rrl}\Longleftrightarrow &\prod _{i\in J}{\frac {p_{i}}{1-p_{i}}}\prod _{i\in J^{c}}{\frac {1-p_{i}}{p_{i}}}&>1.\end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/257d2a1ab5486090bc9065265d6fc4f1270ae840)
Unsere Entscheidungsfunktion ist somit:
![{\displaystyle f:(x_{1},\ldots ,x_{n})={\begin{cases}ja&{\text{wenn }}\prod _{i\in J}p_{i}\prod _{i\in J^{c}}(1-p_{i})>\prod _{i\in J}(1-p_{i})\prod _{i\in J^{c}}p_{i}\\nein&{\text{wenn }}\prod _{i\in J}p_{i}\prod _{i\in J^{c}}(1-p_{i})<\prod _{i\in J}(1-p_{i})\prod _{i\in J^{c}}p_{i}\\{\text{eine Münze werfen}}&{\text{sonst}}\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9dd5c7874f9b84e1fb52a8ada12c46ec8fade6b5)
Interpretation der Lösung
Intuitive Ergebnisse
Viele Ergebnisse aus dem Modell sind intuitiv. Das ist schön - sie zeigen, dass das Model plausibel ist. Doch vorsichtig! Vetraue nie deiner Intuition bei der Lösung der stochastischen Problemen. Stochastik ist kontraintuitiv, desswegen muss man alle Ergebnisse formal begründen. Hier sind diese Ergebnisse:
"Wenn man nur begrenze Anzahl der Personen befragen kann, frag die schlauesten Menschen."
Begründung "
(TODO: noch zu definierien) ist maximal wenn
maximal sind." (für alle
)
"Frag soviele Menschen wie möglich".
TODO: Formale Begründung aufschreiben.
Wenig intuitive Ergebnisse
"Wer häufig daneben liegt, ist ein Experte! Fragt ihn/sie und tu das Gegenteil."
Begründung
ist genau dann maximal wenn
minimal ist.
"Manchmal eine Person mit viel Erfahrung weiß **weniger** als zwei Personen mit wenig Erfahrung."
"Manchmal eine Person mit viel Erfahrung weiß **mehr** als zwei Persone nmit wenig Erfahrung."
Wir nummerieren die Mensche mit 1 für viel Erfahrung und 2, 3 mit wenig Erfahrung. Wir befragen sie. Wenn 1 sagt "Ja" aber 2 und 3 sagen "nein", wir wählen "ja" nur wenn
![{\displaystyle p_{1}\cdot (1-p_{2})\cdot (1-p_{3})>(1-p_{1})\cdot p_{2}\cdot p_{3}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2b280695c947aac17eb8ad521932b4b49364cbc5)
Wenn zwei weniger Erfahrene haben gleiche Erfolgrswahrscheinlichkeiten
wir wählen "Ja" nur wenn gilt:
![{\displaystyle {\begin{array}{rrl}&p_{1}\cdot (1-p_{2})^{2}&>(1-p_{1})\cdot p_{2}^{2}\\\Longleftrightarrow &p_{1}((1-p_{2})^{2}+p_{2}^{2})&>\cdot p_{2}^{2}\\\Longleftrightarrow &p_{1}&>{\frac {p_{2}^{2}}{(1-p_{2})^{2}+p_{2}^{2}}}.\end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e43a43c870c978e7e08f67c8b9b84d5b732de7e0)
Der Graph unten zeigt, wenn die Meinung "ja" der ersten Person, ist "gleich wichtig" als die Meinungen "nein" der anderen beiden Personen. Das sind alle Punkten unterhalb der Linie.
Notizen
"ja" und "nein" vs "richtig" und "falsch"
Mein erstes Modell war nicht mit "ja" und "nein" sondern mit "richtig" und "falsch". Dieses Modell verleiht dazu, eine Entscheidungsfunktion zu konstruieren die immer "richtig" ist, ohne die Antworten von Experten zu berücksichtigen. Das ist zu unrealistisch. Ich werde später mir dieses Modell nochmal ansehen und Zusammenhang zu dem "ja"-"nein"-Modell analysieren.