ylai schrieb am 30. März 2011 13:42
> Die Quantille weisen aber nicht darauf hin, dass man die Verteilung
> voneinander unterscheiden kann. Um genau zu sein, die 10% und
> 90%-Quantille von C++ vs Java sind praktisch identisch, bzw. bei C++
> ist die oberste 10% sogar um GBP 500 höher.
D.h. es ist dieselbe Verteilung?
> > Falls die Gehälter normalverteilt sind
>
> Und das müsste man erstmal nachweisen. Dass der Mittelwert sich
> gegenläufig zu den 10%/90%-Quantille verhält, spricht eigentlich
> stark dagegen.
Es geht ja um das mittlere Gehalt was man erzielen kann, wenn man
sich rein auf Java ODER C++ spezialisiert. Wenn das keine
Normalverteilung ist (d.h. die Gehälter bewegen sich nicht mit 95%
Wahrscheinlichkeit im Bereich +/- 2 Sigma um den Mittelwert), dann
deutet das darauf hin, dass noch ganz andere Faktoren eine Rolle
spielen. Bzw. sogar, dass die Programmiersprache für die
Gehaltsbetrachtung vollkommen irrelevant ist (wovon ich persönlich
übrigens überzeugt bin ;-)).
Denn wo sollen sonst die Häufungen am unteren bzw. oberen Ende des
Spektrums herkommen? M.E. geht das nur im Zusammenhang mit einer
fachlichen Spezialisierung, unabhängig von der Sprache... z.B. werden
Entwickler extrem sicherheitskritischer Systeme *deutlich* mehr
verdienen als Entwickler einer Wald&Wiesen Desktop Anwendung, völlig
unabhängig von der eingesetzten Sprache. Entwickler einer
shareware(ähnlichen) Anwendung werden sich eher im unteren Spektrum
bewegen, und auch mit Webanwendungen lässt sich nicht mehr so fett
verdienen.
> Gerne. Aber die Aussage, dass die Signifikanz eine Funktion von nur
> Anzahl der Gehälter ist, lässt einen nun wirklich die Haare
> herausraufen. Selbst beim t-Test ist das eine Funktion des
> Unterschieds, Varianz der Gehälter, und Größe der Stichprobe.
Das seh ich genauso...
> Und abgesehen davon war seine Aussage bezüglich die Java-Stichprobe
> und Signifikanz schon mal Blödsinn, weil selbst bei t-Test (über
> sqrt(1/n1 + 1/n2)) die statistisch schwächere Stichprobe die
> Signifikanz bestimmt. Da kann meinetwegen eine Millionen Java-Jobs
> sein, und macht das ganze kaum signifikanter.
Auch wahr, wenn die Stichprobengrößen so unterschiedlich sind, sollte
man eine (gepoolte) Stichprobe aus der größeren Stichprobenmenge
nehmen, oder gewichten.
> Die Quantille weisen aber nicht darauf hin, dass man die Verteilung
> voneinander unterscheiden kann. Um genau zu sein, die 10% und
> 90%-Quantille von C++ vs Java sind praktisch identisch, bzw. bei C++
> ist die oberste 10% sogar um GBP 500 höher.
D.h. es ist dieselbe Verteilung?
> > Falls die Gehälter normalverteilt sind
>
> Und das müsste man erstmal nachweisen. Dass der Mittelwert sich
> gegenläufig zu den 10%/90%-Quantille verhält, spricht eigentlich
> stark dagegen.
Es geht ja um das mittlere Gehalt was man erzielen kann, wenn man
sich rein auf Java ODER C++ spezialisiert. Wenn das keine
Normalverteilung ist (d.h. die Gehälter bewegen sich nicht mit 95%
Wahrscheinlichkeit im Bereich +/- 2 Sigma um den Mittelwert), dann
deutet das darauf hin, dass noch ganz andere Faktoren eine Rolle
spielen. Bzw. sogar, dass die Programmiersprache für die
Gehaltsbetrachtung vollkommen irrelevant ist (wovon ich persönlich
übrigens überzeugt bin ;-)).
Denn wo sollen sonst die Häufungen am unteren bzw. oberen Ende des
Spektrums herkommen? M.E. geht das nur im Zusammenhang mit einer
fachlichen Spezialisierung, unabhängig von der Sprache... z.B. werden
Entwickler extrem sicherheitskritischer Systeme *deutlich* mehr
verdienen als Entwickler einer Wald&Wiesen Desktop Anwendung, völlig
unabhängig von der eingesetzten Sprache. Entwickler einer
shareware(ähnlichen) Anwendung werden sich eher im unteren Spektrum
bewegen, und auch mit Webanwendungen lässt sich nicht mehr so fett
verdienen.
> Gerne. Aber die Aussage, dass die Signifikanz eine Funktion von nur
> Anzahl der Gehälter ist, lässt einen nun wirklich die Haare
> herausraufen. Selbst beim t-Test ist das eine Funktion des
> Unterschieds, Varianz der Gehälter, und Größe der Stichprobe.
Das seh ich genauso...
> Und abgesehen davon war seine Aussage bezüglich die Java-Stichprobe
> und Signifikanz schon mal Blödsinn, weil selbst bei t-Test (über
> sqrt(1/n1 + 1/n2)) die statistisch schwächere Stichprobe die
> Signifikanz bestimmt. Da kann meinetwegen eine Millionen Java-Jobs
> sein, und macht das ganze kaum signifikanter.
Auch wahr, wenn die Stichprobengrößen so unterschiedlich sind, sollte
man eine (gepoolte) Stichprobe aus der größeren Stichprobenmenge
nehmen, oder gewichten.