“Llegará el día en el que el pensamiento estadístico será una condición tan necesaria para la convivencia eficiente como la capacidad de leer y escribir” — H.G. Wells
Colombia
Guía metodológica para el diseño y análisis de encuestas en evaluación de políticas públicas
Dec 15th
Este documento hará parte de un modulo que el Departamento Nacional de Planeación editará en los próximos meses y para el cual fui muy amablemente invitado a participar. Aunque traté de plasmar los criterios más importantes, puede que algunos tópicos los haya pasado por alto, o incluso que existan errores en la escritura o la notación. Por tanto, si a usted le gusta el muestreo o siente atracción por las políticas públicas, este documento puede ser de gran utilidad para usted. De paso, si encuentra algún error, o cree que la cobertura de tópicos es insuficiente, le agradecería que lo mencionara y me lo hiciera saber para incluirlo en el documento. Se trata de una publicación que será de divulgación gratuita y que francamente pienso que nos beneficiará a todos nosotros. La verdad es que no hay mucha literatura, menos en español, mucho menos gratis, que combine el tema del muestreo y de las políticas públicas. Este modulo se lo dedico a todos los lectores, visitantes y comentaristas de este blog que representa un gran esfuerzo y una gran satisfacción.
Mi artículo de encuestas en políticas públicas
Dec 7th
El número 18 del Boletín Política Pública Hoy incluye un artículo acerca de los criterios que se deben utilizar cuando se planea hacer una encuesta probabilística en evaluciones de políticas públicas. Mediante ejemplos reales, y desde un punto de vista subjetivo y personal, introduzco cada una de las caracterizaciones más importantes que el estadístico y su equipo deben tener en cuenta al momento de planear una encuesta en este contexto.
Sin ninguna, fórmula matemática y con mucha carreta para que genere una mayor comprensión, este artículo coadyuvará en la estandarización de las buenas prácticas que se deben generar desde nuestro gremio. El artículo lo pueden descargar acá.
Si las elecciones fueran hoy… Parody no gana
Oct 19th
Claro, suponiendo mil cosas que no necesariamente se cumplen. Según este artículo, la intención de voto para la alcaldía de Bogotá está repartida de la siguiente manera: <<Petro, del movimiento independiente Progresistas, se ubicó con 24% en el primer lugar de las preferencias de los electores, según un muestreo realizado por la firma Gallup Colombia. Peñalosa, que se postula por el Partido Verde y el Partido Social de Unidad Nacional (Partido de La U), se situó segundo con 21%, de acuerdo con el sondeo divulgado por el diario El Espectador. En el tercer lugar se ubicó la ex senadora Gina Parody, con 18%.>>
Si asumimos una distribución previa no informativa (Dirichlett con parámetros constantes e iguales y cercanos a la unidad), se tienen las siguientes estimaciones posteriores, en las cuales no involucré a los restantes candidatos porque no tuve tiempo de buscar la información.
|
Candidato |
Estimación |
Límite inferior |
Límite superior |
|
Parody |
29% |
24% |
33% |
|
Peñalosa |
33% |
28% |
38% |
|
Petro |
38% |
33% |
43% |
La anterior tabla da un resumen de la distribución posterior de la intención de voto para los anteriores candidatos. De alguna forma u otra, observando con detenimiento los límites de credibilidad, es posible concluir que… cualquier cosa podría pasar. Sin embargo, es claro que la menor opción la tiene Gina Parody. La siguiente figura da cuenta de la distribución posterior para cada candidato y es posible observar que efectivamente hay un empate técnico puesto que hay traslape entre las densidades poblacionales.

Bajo este escenario, la probabilidad posterior de que Gina Parody le gane a Peñalosa es de tan solo 0.126. La probabilidad posterior de que Parody le gane a Petro es aún más baja, 0.011. Por último la probabilidad posterior de que Peñalosa le gane a Petro es de 0.1286.

Por otro lado, acudiendo a la encuesta de Datexco y suponiendo que no se inventaron la mitad de las encuestas (no lo digo yo, lo dicen las denuncias suscitadas acá). Entonces, es posible utilizar esta información para crear un escenario más preciso incluyéndola a manera de información previa informativa. Puesto que, si observó bien en la tabla de estimaciones, existe mucha variabilidad en la distribución posterior y eso explica por qué los intervalos de credibilidad son tan anchos. La información de la encuesta de Datexco dice así: << En tanto, otra encuesta de la firma Datexco también divulgada el viernes y contratada por el diario El Tiempo, ubicó primero a Peñalosa, con 20,9%; segundo a Petro, con 16,4%, y tercera a Parody, con 14,1%. >>
Si asumimos una distribución previa informativa (Dirichlett con parámetros desiguales y relacionados con la intención de voto en la encuesta de Datexco), se tienen las siguientes estimaciones posteriores:
|
Candidato |
Estimación |
Límite inferior |
Límite superior |
|
Parody |
28% |
24% |
31% |
|
Peñalosa |
37% |
33% |
40% |
|
Petro |
35% |
31% |
38% |
Este escenario es un poco más claro, con menos variabilidad, puesto que la distribución posterior ha recogido los efectos de la distribución previa. Sin emabargo, aunque es má claro estadísticamente, no lo es políticamente. Bueno, dependiendo de la filiación política de cada quién. Por lo menos, a mí me parece un mal escenario. Puesto que yo voy a votar por … En fin, esto sea como sea, el siguiente gráfico muestra un panorámica más clara de la intención de voto posterior.

También es posible calcular la probabilidad posterior de que Parody le gane a Peñalosa, ese valor es de 0.00104. Muy pequeño. La probabilidad posterior de que Parody venza a Petro es de 0.00784. Y la probabilidad posterior de que Peñalosa obtenga una victoria sobre Petro es de 0.72. Bueno, como dicen por ahí, la verdadera encuesta es el día de las elecciones. Bla, bla, bla… Por supuesto, si salen más encuestas, haré más predicciones chimbas. No con el fin de predecir nada, sino con el de realizar un análisis de sensibilidad sobre las propuestas en las distribuciones previas. Estén sintonizados con el blog ese día de las elecciones. Con cada reporte de la registraduría estaré realizando una nueva estimación. Esto con el fin de cotejar el poder del enfoque bayesiano que permitiría proclamar al ganador con antelación al conteo total.
Por otro lado, quisiera saber cuál es la técnica súper avanzada para afirmar que hay un empate técnico. Dicen los gerentes de las encuestadoras que hay un empate técnico entre Peñalosa y Petro. Esta conclusión la realizan al sumar y restar el error de muestreo a las estimaciones puntuales. Pero bueno, desde mi humilde punto de vista, creo que falta multiplicar el error estándar (si es que es el error del que se está hablando) por un percentil relacionado con una distribución que dé cuenta del modelo probabilístico detrás del cálculo. Ahora, ese error de muestreo ¿qué es? ¿Cómo es posible hablar de error de muestreo cuando no hay ningún muestreo por detrás? Yo conozco las respuestas a esas preguntas, pero no creo que los gerentes de esas firmas lo sepan y por tanto el engañador ignorante engaña al más ignorante. Podemos estar haciendo negocios sucios… En fin, para no dejarlos preocupados, sí es posible hablar de error incluso cuando no hay ningún muestreo probabilístico. ¿Los dejé peor de asustados?
Por último… 1) Piense su voto… no se deje influenciar por propuestas populistas que ya mucho daño le hicieron a la ciudad. 2) Ayude a pensar en cómo hacemos para enseñarles a los ignorantes colombianos, en materia de estadística, cómo se interpreta un error y con qué cuidado se deberían interpretar estos resultados electorales. Mire que los ignorantes son muchos y que si lográramos permear los medios de comunicación con este mensaje, le haríamos un bien al pueblo a la hora de elegir. Además muchos se interesarían más por la estadística.
¿Cuál será mi próxima parada?
Oct 18th
Acabo de hacer una lectura rápida del último número de AMSTAT NEWS y hay un artículo muy interesante en donde varios estadísticos responden un chismografo (que en Colombia es una suerte de preguntas con el objetivo único de curiosear la vida de los demás). En este mismo instante estoy leyendo las respuestas de algunos personajes y lo que voy a hacer, aunque puede parecer impersonal, es constestar esas preguntas con el ánimo de hacer un balance de mi corta carrera profesional. Además, le insto a que se anime y responda también este chismografo.
¿Qué o quién lo inspiró a estudiar estadística?
Lamentablemente no fue un alguien que me inspiró a estudiar estadística. Esto fue un gran accidente, que de planeado no tuvo nada (me voy a permitir afirmar que fue una Diosalidad: una casualidad guiada por Dios). Como para muchas personas en Colombia, el único lugar dónde es posible tener una educación buena y no tan costosa es la universidad pública. Yo había presentado un examen de admisión a Ingeniería Industrial y afortunadamente no pasé. Luego, pensé: <<si quiero estudiar, debo enfocarme. ¿Para qué soy bueno?>> La respuesta era fácil, yo era bueno para los números. Así que, después de meditarlo un poco y teniendo en cuenta que alguien de mi colegio había sido admitido a la carrera de estadística en la Universidad Nacional, pues me aventuré, sin tener idea que esa decisión cambiaría mi vida por siempre.
Aunque, una mejor pregunta sería ¿quién lo inspiró a estudiar? La respuesta es muy sencilla, mi abuela Lola. Es como mi mamá, ella me crió porque mi mamá biológica falleció cuando yo tenía dos años. Ella todos los días ponía en mí el deseo de vivir y de no dejarme de las circunstancias.
¿Cuál es la parte más excitante de su trabajo?
Por un lado mi pasión siempre ha sido enseñar. Se me da y punto. Me gusta interactuar con las personas y qué mejor manera de hacerlo que siendo profesor. Ésta es una tarea muy difícil, más en una universidad privada en donde la educación es un servició más y en donde los evaluadores de la labor docente son los alumnos. Así que, en mi trabajo en la Universidad Santo Tomás, la parte más excitante es ser mejor docente de lo que fueron mis docentes. Y vaya docentes que he tenido. Algunos muy buenos, otros que podrían mejorar algunas cosas. La Universidad Nacional, al igual que cualquier otra universidad en el mundo, tiene una gama de excelentes maestros, no todos ellos excelentes personas. Así que cada clase es una única oportunidad de ser mejor profesor que mis mejores profesores y también es una oportunidad de no cometer los errores que mis profesores cometieron conmigo. ¿Por qué mis mejores profesores fueron mis mejores profesores? En realidad, no lo fueron por su gran conocimiento. Lo fueron porque me impregnaron algo de su particular forma de enfrentar la vida. ¿Por qué mis peores profesores fueron mis peores profesores? En realidad, no lo fueron por su escaso conocimiento. Lo fueron por su triste forma de enfrentar la vida. A diferencia de algunas otras profesiones, cuando uno es profesor, la materia prima son personas. Lamentablemente yo tuve algunos profesores y profesoras que no trabajaban (o trabajan) con personas sino con cerebros. Al igual que yo, mis estudiantes tienen dificultades no solamente con el muestreo, sino con la vida. Por eso me gusta la USTA, cuya impronta institucional es criar personas más allá de buenos profesionales. Si usted es profesor (tal vez si fue mi profesor) le doy un pedazo de consejo: <<Cada vez que interactúe con un alumno, piense que está interactuando con una persona con alma, con emociones y sentimientos. No se vea a usted mismo reflejado en ese alumno porque entonces estropeará su labor docente.>> Y es que yo pienso que los profesores malos son malos porque ven el triste reflejo de ellos en la cara de sus alumnos.
Por otro lado, trabajo como investigador en la USTA. Este oficio no se compara un ápice al de profesor. Así que no lo voy a comentar. Por otro lado soy consultor y lo excitante es que me pagan por hacer lo que yo haría gratis. Por último, soy auditor y lo excitante es que estoy creando cultura estadística entre estadísticos en las dependencias públicas. Es cierto, así como lo lee, cultura estadística dentro del gremio. Eso es muy excitante porque forja mi carácter y además da claridad a los procesos estadísticos en el sector gubernamental.
Nombre algunas habilidades necesarias para realizar su trabajo
Por encima de todo la comunicación oral y escrita.
Nombre una habilidad que le gustaría aprender para hacer un mejor trabajo
Me gustaría aprender a tener más disciplina. Me gustaría a utilizar mejor el idioma. Como escritor de libros esto es fundamental.
¿Tuvo un mentor? Si fue así, ¿cuál fue su mejor consejo?
Sin duda. Mi tío Oscar que siempre vio en mí a un ganador. Y aún hoy sigue viendo en mí a un ganador. Mi familia toda me apoyo y les digo que los amo (a los miembros de mi familia). En la cuestión académica mi gran mentor ausente es Leonardo Bautista. Desde el principio nos la llevamos muy bien. Murió muy rápido pero dejó en mí algo de su pasión por el muestreo. Jorge Ortiz me dio un consejo que no tengo cómo agradecer y me auguró mejores éxitos en la USTA que en otros lados. Humberto Mayorga me dijo que yo tenía el factor X del muestreo. Leonardo Trujillo y Pedro Silva han tomado un gran riesgo conmigo al aceptarme como alumno de tesis de doctorado. Leonardo Trujillo me respondía muy amablemente todos los correos que yo le enviaba cuando él estaba en UK. Pero sobre todo mi esposa ha sido mi más fiel apoyo. Como sabe de todo entonces ella me explica las muchas cosas que no entiendo.
Nombre dos blogs o libros que recomendaría a otros
Me gusta leer a John Cook en su blog The Endeavour y me gusta leer Rblogs porque a veces se escriben post de hágalo usted mismo con R, sobre cosas que ni idea en estadística. Los libros infaltables son Statistical Design for Researches de Leslie Kish y uno muy bonito que se llama The Lady Tasting Tea que relata la historia de la estadística de forma muy amena y a manera de chisme.
¿Qué aviso les daría a los jóvenes que están empezando sus carreras?
Que si no les gusta ser profesor que no se metan en eso. Es un buen consejo porque muchos estadísticos en Colombia terminan dictando cátedras en universidades y si la pasión de dictar clase no está en ellos pueden frustarse ellos e imponer una imagen aburrida de la estadística entre sus alumnos.
¿Qué le gusta hacer en su tiempo libre?
Patinar. Gastar tiempo con mis amigos. Estar con Lucas (mi hijo) y dormir junto a él.
Estadística en los estrados judiciales
Oct 10th
Ya en otra ocasión había advertido de la excelente labor que realizó el Colombiano Daniel Guzmán al testificar en un juicio en contra de algunos oficiales de la Policía Nacional de Guatemala por la desaparición de Edgar García, un líder estudiantil. El resultado de esta influyente declaración de Daniel, fue una pena máxima de 40 años de cárcel contra los agentes involucrados. Pues bien, fue muy grato para mí saber que la revista CHANCE ha publicado en su último número un vasto artículo escrito por Daniel en el que relata con pelos y señales cómo fue todo el proceso. Realmente vale la pena leerlo porque la forma en que lo escribe Daniel hace que la lectura sea muy entretenida. Felicitaciones a Daniel y esperemos que sus técnicas estadísticas sirvan algún día para esclarecer las actividades delictivas que han suscitado miles de desapariciones en Colombia. Esto lo digo a título personal, porque mi familia y yo hemos sido víctimas de este insuceso y por supuesto, entenderán mi emoción al saber que hay personas cercanas por ahí, trabajando e influyendo en los estrados judiciales para evitar la impunidad. Y lo mejor de todo el armamento y la munición estadística de Daniel fue el muestreo. Claro, no faltan los jueces que impiden que la ciencia tenga lugar en las decisiones judiciales.
Lo anterior lo digo porque hace pocos días un juez inglés tumbó la regla de Bayes como evidencia en cualquier clase de juicio criminal. Así es, se trata de un juicio por asesinato en el que el presunto asesino habría dejado en la escena del crimen las huellas de sus tennis Nike, que coincidencialmente eran idénticas a un par encontradas en su casa (la casa del sindicado). El teorema de Bayes habría entrado en acción al intentar calcular la probabilidad de coincidencia de las huellas con los tennis del acusado. Para esto, es necesario tener certeza acercad del número de existencias de esta clase específica de tennis. Como el abogado no pudo demostrar por qué se usan estimaciones gruesas en los cálculos, entonces el juez decidió no tener en cuenta al teorema de Bayes como evidencia contra el presunto asesino. Más aún, ordeno que para cualquier caso de estas características criminales en el Reino Unido, el teorema de Bayes no deberá ser tenido en cuenta. Y pues bien, tumbaron a Bayes.
Eso me hace pensar que aquellos que quieren tomarse un tinto y tumbar el muestreo posiblemente lo logren… Nooo, qué va, con tipos tan duros como Daniel y el reconocimiento que ha tenido les va a quedar muy difícil !!!
Y ahora con qué ganas… (Datexco denunciado)
Sep 26th

¿Ahora con qué ganas voy a hacer el análisis bayesiano electoral con las últimas denuncias que se han suscrito a la encuestadora Datexco? En mis pocos años de vida, no he sabido de otra empresa tan cuestionada en el ámbito de las encuestas como Datexco (no es la primera vez que se rumora de sus malas prácticas). Yo no sé si sea cierto ese rumor, pero lo que sí sé es Datexco debería aclarar su situación. El presidente de esta firma en respuesta a las declaraciones de sus antiguos gerentes ha expresado su inconformidad y ha salido, como en su momento hizo el ex-alcalde Samuel Moreno (hoy en prisión preventiva), con un comunicado de prensa que señala que va a tomar acciones penales contra los ex-empleados de su compañía.
Sea que los ex-empleados de Datexco estén o no calumniando a esta empresa, su presidente – además de salir con amenazas de denuncias – debería aclarar la situación.
En fin, qué mal que esto pase. Yo doy fe de que muchas encuestadoras en Colombia hacen muy bien su trabajo. Son firmas que se esfuerzan en conseguir las entrevistas y que tienen muchos filtros de supervisión para que haya total transparencia en la recolección de la información. Incluso, aunque tal vez algunos de mis lectores no lo sepan, muchas firmas encuestadoras tienen procesos de selección probabilística (sí, con base en un diseño de muestreo) muy bien estructurado. Lo sé de primera mano pues yo audito y califico algunos procesos que llegan en forma de licitación.
Oración a la patria
Sep 10th
Esto me llena de orgullo… Con este blog estoy aportando un poco de lo que Colombia me ha dado… No es la gran cosa, pero me siento bien porque sé que a varios les ha ayudado. Y usted ¿está haciendo algo por Colombia?
Colombia patria mía,
te llevo con amor en mi corazón,
Creo en tu destino,
Y espero verte siempre grande respetada y libre.En ti amo todo lo que me es querido,
Tus glorias, tu hermosura,
Mi hogar, las tumbas de mis mayores,
Mis creencias, el fruto de mis esfuerzos,
Y la realización de mis sueños.Ser hijo tuyo,
Es la mayor de mis glorias,
Y mi ambición más grande,
Es la de llevar con honor
El título de Colombiano,
Y llegado el caso morir por defenderte.





Comentarios