jueves, 17 de marzo de 2016

Pimpam, cunta Lacasitos


   En casa nun somos amigos de la tele (desque vivimos na casa de nueso enxamás la tuvimos), nin medios asemeyáos, paeznos una perda de tiempo total, y más cuando tienes munches coses que facer más prestoses que vexetar nel sofá. Poro, teníendo neños en casa, la cosa camuda enforma, pues dacuando hai que pone-yos daqué capítulu, nel ordenador, de la serie de dibuxos que s’estile nesi momentu, nun sía cosa que queden desactuallizaos respeuto a los sos amiguinos. Asina, que delles vegaes tienes que tragar con capítulos de “Peppa la gocha” (Peppa Pig) o la “Patrulla de perrinos” (Paw Patrol), otres vegaes, la rapacina prefier ver daqué videu au amuesen cómo ye esti y l’otru xuguete. Foi antiayer cuando viendo un d’estos videos, discurrí’l proyeutín que voi rellatar agora: 

¿Qué color sal más nos “Lacasitos”?

   Resulta qu’el videu enseñaba un surtidor de “Lacasitos”, una maquinina pa tener en casa, que repartía a discreición estes pastillines de chocolate cubiertes de una capina de distintos colores, de magar que vi entamar la hestoria, cayone l’alma a los pies, ¿cómo se puede facer un videu d’esto? La mio neña casó perrápido, xusto cuando m’entamaba a interesar, pues la muyer del videu proponía una carrera de “Lacasitos”, según diba sacando diba separtándolos por colores, ganaba’l color que primero llegara a 10. Quitelu, pero guardé l’enllaz, pa velo n’otru momentu, tenía por curiosidá de ver qué color ganaba, ¿habría dalgún color que fuese más común? Ya falé ehí p’atrás d’un proyeutu asemeyáu, que fici coles lletres del sopa (col sopa nun se xuega), nesti casu la color yera la variable a estudiar, que supuse que tarían igual representaos. 

   Nel videu, la paisana fizo dos carreres colos siguientes resultaos: 


   Ya ves, apaecieron en distites proporciones, algo que yera d’esperar, lo que nun daba munches pistes de cúala color yera la que más apaecía, si ye que lo había. Probé a calcular la media ente les dos partíes, y atopé esto:


   Paecía que los “Lacasitos” mariellos apaecíen menos, anque nun me fiaba, pues abultábanme pocos pa que fuese una amuesa representativa de la realidá, podía habelo sabío rápidamente si hubiese usáu un test d’análisis de frecuencies (ya falaré d’ello), pero nun tenía más que papel y el móvil, asina que pa salir de duldes decidí amosar más datos, busqué montones de “Lacasitos” nel guetador de Google, y cunté les diferentes proporciones pa caún de los colores, en delles semeyes, hasta axuntar un total 1986 (quería que fueran 2000, pero ya taba fartucu de cuntar, asina que nun busqué otra semeya más). Nestos cuasi 2000 “Lacasitos” atopé les siguientes proporciones:


   Paecen bastante asemeyaes, pero l’azul apaez más, y el marrón menos (ente un y otru hai una diferencia de 72 “Lacasitos”), asina que por más qu’amesté datos, seguía sin poder dicir si había dalgún color qu’apaecía más, pues, ¿quién me dicía qu’esa distribución nun yera debida al azar? Ye más cuasi nengún contéu dio la mesma proporción (yera nidio que diba soceder). Entós, ¿cómo facer? Depués de sieglos de desendolque de la ciencia estadística, hai munchos preseos a la nuesa disposición, que van aídanos a retrucar la entruga, yo tiré per un test d’análisis de frecuencies, que busca dicir si tán desquiñonaes de la mesma forma, o hai delles qu’apaecen más, el Test G.

*** Si nun quies lleer l’esplicación de cómo funciona’l test, sigue hasta los asteriscos siguientes***

   Con unos conceutos básicos, vamos poder entender como furrula esti test. Ye fácil caer na cuenta, qu’anque un procesu al azar tea les mesmes posibilidaes de cayer nun estáu u otru (per exemplo una moneda na cara o na cruz, o un “Lacasito” salir d’un color), na realidá esti ye pergafu de ver, pues una cosa ye la probabilidá teórica o esperada y otra la real o atopada, sicasí sedrá igual a la teórica depués d’amestar munchos datos; asina que tenemos una distribución esperada (nel nueso casu, tolos colores tienen iguales proporciones), y otra la que atopemos nel esperimentu, los test d’análisis de frecuencies lo que faen ye facer comparanza ente les dos frecuencies, y ver si estes son lo bastante grandes como pa afirmar con seguridá que son destremaes. Anque durante una llarga dómina s’usó test nomáu de χ2, y entá ye perusáu, va años que s’usa’l test nomáu G, más cenciellu d’aplicar, y que, según los estudiosos de la estadística pura, ye meyor qu’el  χ2.
Con una calculadora percenciella podemos facer esti análisis. Lo primeru ye calcular la distribución esperada, que ye’l total de datos ente’l númberu de categoríes, per exemplu 1986 ente 7 colores, o sía, 283,71 “Lacasitos” pa cada color. Los datos casen más o menos, anque hai dos, el baxu 251, y el altu, 323, que pueden facenos duldar. Pa esos ta’l test, que aplicamos cenciellamente, aplicando esta formulina pa cada color:


 au O ye la frecuencia atopada (el númberu de “Lacasitos” d’una color), y E la teórica, que calculamos (283,71). Cuando tea fechu pa tolos colores sumamos el valor de toos, y multiplicámoslu per 2. Con esto ya taría calculáu, anque si queremos ser finos podemos aplica-y un fautor de correición, dividiendo-y el valor de la resultancia d’aplicar la fórmula:


   au a ye el númberu de categoría, los 7 colores, n el total de datos, y v los graos de llibertá, a-1, o sía 6.

   Esi resultáu hai que comparalu con unes tables que calcularon los teóricos (tabla de distribución χ2, tán colingaes n’internet en milenta páxines), y que dannos el valor del que nun tenemos que pasar pa aceutar que tienen una distribución igual, asumiendo dellos percentaxes d’error que sedrán, polo normal del 5% o el 1%, y hai veces que namai s’asumen errores de 0,5% o 0,1%, cuánto más repunantes seamos más vamos poder enfotar nos nuesos, anque lo normal ye usar 5% o 1%.

********************************************
   ¿Qué pasó entós colos “Lacasitos”? Al calcular el test pal total de datos, atopé 10,622, y el valor de la tabla asumiendo un error del 5% pa 6  graos de llibertá ye 12,59, polo que al ser menor qu’el valor críticu de la tabla, podemos dicir que toles colores apaecieron na mesma proporción. Agora, entrúgueme lo siguiente, colos datos que garré primero, los del videu, ¿atoparía los mesmos resultaos? Si, atopé un valor tamién perbaxo del críticu, asina que hubiera aforrao’l tar cuntando pastillines de colores na pantalla del móvil. Ye lo que hai, como dicía mio güela “El que pol so gustu cuerre, nun cansa”.

No hay comentarios:

Publicar un comentario