Páginas

jueves, 18 de abril de 2013

Errores estadisticos, enserio? // Statistical errors, Is that So?

(English version below)

Queridos lectores, acabo de leer un estudio hecho por un Doctor en no se que, investigador, etc etc... El estudio de muchos miles de datos obtenidos de varios estudios con numeros exageradamente impresionantes de 200,000 individuos encuestados y no se que mas. El estudio se trata de la correlacion entre la motivación en el trabajo y el dinero recibido de paga.... El resultado dice que no la hay, Ok, perfecto.... Tambien dice que la psicologia del dinero es mucho mas compleja... Estoy de acuerdo.

Aqui se tiene una frase que dice mucho la gente y mucha se comporta de la misma manera: "jefe, tu como que me pagas y yo como que trabajo..." 

Bueno, independientemente de que efectivamente no dice que preguntas se hicieron, mi suposición es que como en (casi) todas las estadisticas por encuestas, las preguntas no fueron las correctas.... Digo, por los resultados sospecho fuertemente que las preguntas giraron sobre: "¿te gusta tu trabajo?", "¿Estas bien con lo que te pagan?" y "¿Te gustaria ganar mas?", Vaya, dudo que hayan preguntado:
"¿Cuánto crees que vales?"
"¿Cuánto vales versus lo que te pagan?"
"¿Si hoy yo te bajo tu ingreso a la mitad, te seguiria gustando tu trabajo igual? -  ¿y si te lo duplico?"
"¿Si pudieras cambiar algo magicamente de tu trabajo, qué y porqué seria?"

Puedo apostar que la gran mayoria contestaria algo por el estilo: "me cortas mi sueldo y me voy" o "me duplicas mi sueldo, le hecho mas ganas"... Entonces, estas respuestas si dan una correlación de dinero versus felicidad. Vaya, a diferencia del que respondiera la misma pregunta: "No me importa, asi fuera cero, me quedo porque adoro mi trabajo" u "odio mi trabajo, asi me pagues 200 veces mas" o la más peligrosa de todas: "me vale". Los resultados SI tendrían una correlación, de, no sé 30, 50, 95% contestando lo primero, versus 20, 90 o 5% contestando lo segundo.

La cuarta pregunta va a evaluar a la parte ambiental y Cultural de la empresa, determinando qué y a que grado de deseo de cambio se busca. Igual, no es lo mismo: "cambiaria las lamparas", o "me gustaria tener ventana" a "cambiaria a mi jefe" u otra vez, la mas peligrosa de todas: "me vale, no me importa". En fin, nadie está al 100% satisfecho porque va en contra de nuestra naturaleza humana perfeccionista y ambiciosa. Si se esta absolutamente satisfecho a mi me da una señal de alarma de la indiferencia...Satisfecho, mas no contento, No es lo mismo.... ¿Ven?

"Estimado Doctor: si bien es cierto que el dinero no compra felicidad, prefiero llorar en mi Bentley"

Ahora bien, yo he hecho muchos estudios estadísticos y la sorpresa que yo me he llevado es de lo que pasa según quién hace el estudio. Si es el jefe o alguien de afuera, los resultados son impresionantemente diferentes.

Y queridos lectores, los que me siguen desde el principio, saben que no me voy a quedar aqui, me voy a ir a la luna extrapolando y conectando puntos aparentemente inconectables:

 En base a cientos de estudios estadísticos que he hecho o he visto, todavia me sorprendo de la facilidad con la que demasiada gente los lee al revés. "46% de la población dice... blah (+/-7% de margen y un muestreo de 50,000)" vaya, el muestreo es importante, si, si estamos hablando de Tonga, o Pitcairn... Pero ademas, ¿El margen de error? ¿Es mayoria o no? ¿Que pregunta se hizo? ¿Cual es el contexto? ¿población, que clase de población?

En México teniamos (o tenemos, no se, no veo TV) un programa que preguntaba a 100 personas que opinaban y el juego era de que habia dicho la mayoría, no importando si tuvieran la razón o no... El par de veces que me vi forzado a verlo, me sorprendió cómo a la hora de encajonar las respuestas de una forma u otra, se cambia totalmente de sentido...independientemente de la inteligencia colectiva, que es tema para otro dia.

Otro ejemplo, el par de encuestas telefónicas o en el centro comercial que por simple aburrición me he forzado a contestar, y peor cuando les contesto: "depende"... Pobres encuestadores, me devuelven unas miradas de: "muerete" y me fuerzan a contestar algo que no es completamente cierto, o no todo el tiempo, obviamente afectando la veracidad de mis respuestas... Y si afectan así mis respuestas, ¿Cuántas no?

Otro: En un estudio sobre la emisión de gases tóxicos al ambiente en Gran Bretaña se dijo que habia bajado 19% en 20 años por el cambio de uso de carbón por gas natural en sus plantas termoeléctricas... Si, seguro, pero solo midieron Subjetivamente Cada unidad de electricidad, es decir por Kilowatt. Pero si hubiesen reportado la realidad que es el TOTAL de gases emitidos, es mas de un 25% arriba por el simple hecho de que estan consumiendo mas electricidad que hace 20 años y no se han sustituido las termoeléctricas por otras formas de generación mas amigables...

Entonces, lo que le llamo yo en estadística Subjective Skew o alteración por subjetividad es el peor enemigo de la misma estadística y me aterroriza y divierte ver que la gran mayoria de analistas o estadistas no lo vean...

En mi otro post del Internet Asesino hablo de los porcentajes de libros, en donde todos se apanican por que el internet asesino ya esta por clavarle el último clavo al ataúd de la industria editorial... Resulta que efectivamente, pero solo en EUA el crecimiento en 3 años que si ha sido impresionante del 1% al 17% al 23%... pero si la curva de crecimiento sigue con esa tendencia, la realidad es que el proximo año sera 26, al siguente 27, y tal vez se estacionará sobre el 36%... Lo veo por el numero de cambio! (de 17 a 23 hay 6 puntos de diferencia, ~tres veces menos que del 1 al 17...)  En Europa hoy solo es el 2%... Y asi como que muy incultos, no, evidentemente no lo son. Eso habla del contexto que simplemente les gustan mas los libros de papel...

Que puedo yo decir, Si, claro que sintieron pasos en la azotea, pero el contexto es que se les acabo el imperio de 500 años de control de cómo se venden los libros, y el cambio es lo que les apanica, logico.

Tambien es cierto que se vuelve noticia para vender noticias, se vuelve noticia para vender ebooks "pues todo mundo ya lo hace" se vuelve noticia para crear modas o tendencias.... Aunque llegara al 50% (insisto, solo en EUA a corto plazo), sigue muy , muy lejos del 100% cosa que la realidad y si la  historia nos enseña algo, no va a llegar sospecho que por lo menos en un par de generaciones. De todas formas aunque llegara, los escritores y los lectores no iremos a ningun lado... Entonces lo importante permanece...

Otro... me puedo seguir con ejemplos porque el humano asi es, asi somos...

¿Entonces que demonios quiero decir con todo esto??? La forma de leer la estadistica como el contexto lo es todo. Mal leidas o ejecutadas resultan ser unas mentirosas (o conspiradoras, eso si no se).

--------------------------------------





Dear readers, I just read a study made by a PhD in who-cares-what, researcher, etc,etc... The study that comprised a few million data obtained from a few studies, quite impressive in fact, well over 200,000 individual surveys and what not. The study was about the correlation between job motivation and money received by it... The study concluded that there is NO correlation... Fine, perfect... It also says that money's psychology is more complex. I agree.

However, there's a phrase that is used quite a lot around here and most people behave in such manner: "Boss, You do as if you pay me, and I'll do as if I worked..."

Well, regardless that it is true that questions made in such surveys are not published in said report, I assume that as most statistics driven by surveys, questions are not well designed... I mean, by the results I highly suspect questions made were around: "Do you like your job", "are you well paid", or  "would you like to earn more?", I mean, I highly question that they'd ask something like:

"If I could lower your income Today by half, would you like your job just as much?" . "What if I double your pay?"
"If you could change something about your job like magic, what and why would that be?"

"How much are you worth?"
"How well compensated are you versus your worth?"


I BET most people would answer something like: "you cut my pay in half and I'd go" or "you double me and I'll work harder"... So, if you notice this kind of answers would give a direct job-pay correlation. Albeit the few that'd answer: "Don't matter, even if I get nothing I'd keep my job just 'cause I love doing what I do" or "even if you pay me 200 times more, I'd still hate it" or the most dangerous of all: "Don't care". Results would definitely have a correlation, of I don't know, 30, 50, 95% by the first part versus 20, 90 or 5% of the second.

The second question is going towards evaluating the business environment and culture by determining what and on which degree for a change is desired. Close but not the same: "I'd change the lamps", Ï'd like to have a window"are not the same as "I'd change my boss". Again, most dangerous is: "I don't care". Anyway, NOBODY is 100% satisified because it is our own human perfectionable and ambicious nature to never be 100% satisfied. Whomever says (s)he is completely satisfied my alarms go off warning indiference. Satisfied, not happy. Not the same, Can you see that?

"Dear Doctor researcher: albeit being true that money does not buy happiness, I'd rather cry on my Bentley"

So, I have done a quite a few statistical studies and to my surprise results vary enormously to who applies it and to whom. If it is the boss, the secretary or someone from the outside, Does matter.

My dearest readers, Who have followed me from the getgo and more to it the people that know me directly know by now that my point is not close to being made since a few unconnected dots are still at large. I still need to dig deeper to find their hidden connections.

Based on hundreds of statistical studies I've executed or seen, Still to my amusement how easy it is to read the results backwards. A couple of examples: "46% of people say... blah (+/- 7% error margin nad a sampling of 50,000) Whoa, pretty well sized sample of course... If we are talking about Tonga, or Pitcairn... Besides, What about the error margin? Is it a majority? Which question was made? Which is the context? Population, Which kind of population?

There was a gameshow a few years back that asked 100 people their opinion and the game was the player had to guess what the majority said, right or wrong was not the point. My point is besides I do not like gameshows, I was amazed as to how the questions were boxing in the answers one way or another, the sense of the answer can change dramatically... regardless of collective intelligence which may be a future topic here...

Another torturing example, The couple of telephone or mall surveys that out of sheer boredom and the girl was nice enough I was forced to answer... Worst answer possible: "depends"... Poor surveying guys, the answer with an "I'll kill you" look, and I hate to answer something that is not completely true, or not all the time, obviously affecting the outcome and truthfulness of my own answers... And if they affected my answers, How many more?

Another, In a British study about toxic fumes into the atmosphere it was said that pollution was dropped 19% in 20 years simply because of they changed from coal to methane in their thermoelectric plants. Sure, but in fact they Only measured subjectively on a per Kilowatt base. If they'd reported the whole truthful thing, They'd said: "despite a drop per kilowatt, 25% more toxic fumes were released into the atmosphere because of increased consumption of electricity"

This is what I call Subjective Skew statistic's worst hidden enemy and I am both terrified and amused to see that most analists commit the same type of  " casual mistake"...

In my other post, Internet kills I talk about book percentages, where everybody is panickingg because the internet is a killer and it is "driving the last nail to the publishing industry's coffin..." May be, but the truth is that ebook growth in the last 3 years just in the US has been quite impressive, going from 1 to 17 to 23% of total book sale revenue... but if we look closely the trend is marking a pace that next year it will be 26 then 27...  it will 'stop' at around 36%. Lets see why: the size of change! From 17 to 23 is 6 which is three times less than the year before, so the trend in growth is just a third of the year before! In Europe today it is only 2% total. And Europeans are not what we can call illiterate. It just so happens they still like paper books better.

What can I say, Of course they felt steps on the roof, but within the factual context that their 500 year controlling empire of how books are bought and sold, change is what is panicking them, and it is logical.

Another truth is that it becomes news to sell news, it is news to sell more ebooks under the "everybody is doing it", It becomes news to make and create a fashion... Even if it reached 50%, again just in the US in the short term, it is way way far off the 100% thing that in reality and if history has taught us well, it will not get there in a couple of generations at least. Still, even if that got here, we readers and writers are not going anywhere, so the important part still stands forever.

Another: ... I could go on and on and on...with examples, because that is how we humans are..

So What the $@#$ is the point then??? Reading statistics must always consider the context. Wrongly read or executed are just a bunch of liars (or conspiration, I do not know.)


1 comentario:

  1. Totalmente de acuerdo con la aseveración final, si para crear una estadística no se crea un contexto suficientemente claro para todos los que respondan, el registro estará sesgado y por ende los resultados que se arrojen serán inequivocamente dispersos. Por tanto, las decisiones que se tomen a partir de las estadísticas producidas serán subjetivas y al servicio de quien les de la interpretación que le venga en gana. El arte del buen preguntar tiene la intención primaria de obtener respuestas bien contextualizadas, por la intención de quien las formula, no tengo ningún prejuicio; es decir, yo tampoco se.

    ResponderBorrar