“Llegará el día en el que el pensamiento estadístico será una condición tan necesaria para la convivencia eficiente como la capacidad de leer y escribir” — H.G. Wells
Modelos estadísticos
En alguna ocasión, un director de estudios en una empresa de investigación de mercados, físico de profesión y con una prepotencia digna de él mismo, me explicaba que los modelos de mercadeo y, en general, de cualquier campo son acepciones de la realidad que buscan describirla más no explicarla a cabalidad. Es así como el modelo astronómico de Tolomeo describía con gran precisión la posición de los planetas en la bóveda celeste, aunque como bien lo sabemos no era un modelo que explicara la realidad porque simplemente la tierra no es el centro del universo. Sin embargo ¿era un mal modelo? Seguramente no, el modelo lograba su función y desde un punto de vista pragmático, era lo que se tenía en esa época y funcionaba bien.
Steele compara la noción general de un modelo cualquiera con un modelo estadístico y empieza por considerar dos ejemplos concretos:
- Modelos arquitectónicos: Planos o maquetas hechos a escala que son fundamentales en la etapa de diseño y el proceso de construcción de cualquier obra.
- Modelos de ingeniería: Túneles de viento o simulación de corrientes fluviales.
Steeles piensa que un modelo debe ser visto como un mapa. Incluso el mapa más barato de una ciudad puede responder a todas las preguntas razonables que uno pueda imaginar acerca del posicionamiento de la ciudad: ¿dónde queda el aeropuerto? ¿Qué tan lejos estoy de la alcaldía? Etc. Un buen mapa turístico es capaz de ubicar sitios históricos que ni siquiera, hoy en día, existen.
Sin embargo, la construcción de un modelo estadístico requiere otro tipo de abstracciones. Los estadísticos usamos la palabra modelo de una forma bien diferente a los anteriores ejemplos, ya lo diría G.E.P Box al exclamar:
“Todos los modelos son errados, pero algunos son útiles”
Es común considerar la bondad del ajuste del modelo. Típicamente, un modelo estadístico se considera adecuado si, después de haber sido calibrado con los datos reales, cumple significativamente con los supuestos considerados en el diseño del estudio.
Podríamos objetar esta definición. En particular, parece muy ingenuo ignorar que el comportamiento de las unidades seleccionadas en la muestra, en algunas ocasiones diverge radicalmente, del comportamiento de las unidades que no están en la muestra, o que fueron seleccionadas en la muestra pero para las cuales existe ausencia de respuesta. Ahora, si el modelos falla en la incorporación de “toda la información relevante” ¿Debería ser considerado como un modelo no adecuado?
Steeles propone cambiar la popular frase bondad del ajuste (goodness of fit, por su traducción al inglés) por algo más terrenal como ajuste selectivo (fitness for purpose). Desde mi punto de vista personal, estoy de acuerdo con esta filosofía, no se puede dejar de lado que el usuario de los modelos estadísticos (o de sus primos: los modelos estocásticos o econométricos) tiene unos objetivos claros y definidos al iniciar la investigación. El estadístico debe formular el modelo que mejor ajuste consiga de manera selectiva con los objetivos de la investigación, teniendo en cuenta los fundamentos teóricos y supuestos del modelo (tarea nada fácil).
Ya lo diría Tukey cuando afirmaba
“Mantén tu mirada en la ciencia y conserva tus herramientas estadísticas muy simples”
| Print article | This entry was posted by andres on June 22, 2008 at 3:51 PM, and is filed under Marketing. Follow any responses to this post through RSS 2.0. You can leave a response or trackback from your own site. |
Share Your Opinions.
and if you want a picture to show with your comment, then get Gravatar !





about 3 years ago
En realidad todos los mapas tienen errores !!! Esto ocurre porque todos los mapas estan con cpyright y por eso cometen errores a porposito … para poder demandar despues en caso de copia
about 2 years ago
Bien, muy buena introducción, soy estudiante de estadística, en la universidad Federico Villareal, de Perú. y pues, me informo con esto, es muy bueno, gracias.
about 1 year ago
A propósito de modelos estadísticos, es habitual en cualquier libro de estadística hablar de distribuciones de probabilidad de una variable aleatoria. Se habla de sus propiedades y del cálculo de probabilidades a partir de estas distribuciones. Pero, ¿cómo se identifica para una variable concreta la distribución de probabilidad que sigue? Sabemos comprobar si la distribución propuesta es o no adecuada mediante métodos no paramétricos pero ¿cómo se inicia el estudio para identificar el modelo o modelos de partida? En el mundo de la empresa que es al que me dedico hay multitud de variables desconocidas y creo que esta parte de la estadística para los que no tenemos conocimientos demasiado técnicos se suele dejar bastante de lado. Mi inquietud también está en conocer cómo identificar distribuciones de probabilidad bidimensionales para el caso de variables aleatorias continuas. Sería un interesante tema a tratar en futuros artículos. Enhorabuena por el blog.