Escribiendo documentos con contenido estadístico

 

En estos últimos días he estado entre publicaciones y ediciones y volúmenes con contenido estadístico. Me he asombrado de lo buenos que somos en matería de demostración de teoremas y colorarios. Sin embargo existe una gran deficiencia, de parte nuestra, al intentar comunicar los resultados de nuestros trabajos de investigación.

Haciendo clíc acá encontrara un documento de 10 páginas que he escrito, para mí mismo, con el objetivo de recordarme las pautas que se deben seguir al momento de escribir. Espero que este documento abra una discusión enriquecedora sobre este importante aspecto.

Nueva revista de estadística

La facultad de Estadística de la universidad Santo Tomás en Colombia se complace en presentar ante la comunidad académica nacional e internacional (compuesta por docentes, decanos de facultades y departamentos, estudiantes, egresados, integrantes y directores de grupos de investigación), ante el sector público gubernamental como principal usuario de las estadísticas oficiales (con instituciones de planeación estratégica nacional, políticas públicas, institutos nacionales de estadística, bancos centrales, ministerios de desarrollo, entre otros) y ante el sector privado empresarial en cada uno de sus frentes como impulsador y beneficiario de las técnicas estadísticas una nueva publicación seriada semestral llamada Comunicaciones en Estadística.

 

Esta revista tiene como objetivo propiciar y facilitar el proceso de comunicación de diferentes metodologías, prácticas y procesos referentes al campo estadístico teórico y/o aplicado. Para la publicación de artículos sometidos a esta revista, se tendrán en cuenta:

  • Originalidad en el contenido de nuevas perspectivas del quehacer diario en materia de técnicas estadísticas.
  • Robustez en la divulgación enfocada a la discusión de métodos o conceptos y su aplicación en la vida real.
  • Nivel de disertación mediante cartas al editor remitidas por lectores que planteen discusiones teóricas y/o aplicadas acerca de los artículos publicados por este medio.

Los autores que estén intereados en publicar artículos en esta revista se podrán comunicar con el decano de la facultad de Estadística, Dr. Sander Rangel, al siguiente correo electrónico:

sander.rangel@gmail.com

 

Esperamos que la comunidad académica nacional e internacional apoye esta iniciativa.

Estadísticos abroad…

 

No había podido actualizar este impopular blog pues me encontraba fuera de la ciudad. En mi viaje a la costa caribe colombiana encontré una increíble belleza geográfica y me enorgullecí de haber nacido en este país tan hermoso. Colombia es un país de contrastes pues en los más lindos paisajes es posible encontrar las más deplorables condiciones de vida. Me entristecí al ver cómo al pie de la hermosura de la creación conviven la pobreza y la ignorancia.

Mientras viajaba compré un ejemplar de la revista PODER 360º y me encontré con un interesante artículo acerca de los cerebros colombianos fugados en el exterior.

Mi sorpresa fue grande al comprender que los Latinoamericanos podemos marcar la pauta en investigación en las mejores universidades del mundo. Mi sorpresa fue aún mayor cuando me di cuenta que entre las eminencias colombianas en el exterior habían dos estadísticos graduados en la Universidad Nacional de Colombia.

Las razones de la migración son variadas, entre ellas están la falta de oportunidades en materia de investigación y el mal pago en las universidades. Mientras leía los logros de mis colegas y al mismo tiempo la miseria de mi país, pensé, reflexioné y dudé.

¿Vale la pena quedarse a vivir en un país tercermundista que no ofrece oportunidades de investigación, en donde no pagan bien y en el que toca hacer hasta lo imposible por ganarse el pan de cada día dignamente? Comprendí y entendí perfectamente que quienes se fueron tomaron una decisión sabia, una decisión muy difícil y seguramente, la más acertada.

Sin embargo, no todos queremos migrar a otro país y esa es una decisión tan acertada como la que tomaron mis colegas del artículo. Quiero quedarme para compartir con mis compatriotas la transformación cultural que nos permita premiar cada vez más al investigador, quiero quedarme para experimentar el cambio del que voy a ser parte. Un cambio positivo en el que se dignificará la posición de profesor universitario. Quiero quedarme para disfrutar del desarrollo de mi país y voy a quedarme para poner mi grano de arena en este proceso del que Colombia está urgida y el cual no sería posible si unos valientes no se hubieran ido de su terruño para decirle al mundo que los Colombianos somos algo más que productores de coca.

He aquí el perfil de los valientes del artículo de la revista. Sin embargo estoy seguro de que al menos unos cuantos lectores también están viviendo esa aventura del estadístico estudiando, enseñando o investigando en otro país. A todos ellos un gran abrazo y la invitación a dejar el nombre de Colombia, nuestro país, en lo más alto.

 

Álvaro Muñoz

Profesor. Departamento de Epidemiología. Escuela de Salud Pública. Director del Centro Coordinador de Estadística en Epidemiología. The Johns Hopkins University, Baltimore, MD.
Matemático de la Universidad Nacional de Colombia, 1973. Maestría y Doctorado en Estadística. Stanford University, 1977 y 1980. Lugar y año de nacimiento: Medellín.

Con un extenso trabajo en bioestadística y epidemiología que incluye más de 240 artículos especializados, innumerables conferencias y cursos dictados en Estados Unidos, Asia, Europa y América Latina, realiza desde 1986 estudios observacionales de cohorte relacionados con la identificación de factores que contribuyen al desarrollo del VIH-Sida y a enfermedades renales.

Dos de sus estudios, todavía en desarrollo, están contribuyendo significativamente al conocimiento de la historia natural del VIH-Sida y han sentado guías para el tratamiento y uso de terapias en pacientes infectados con el virus con posibilidades de desarrollar neumonía.

Después de cinco años en la Escuela de Medicina de Harvard se vinculó a la Johns Hopkins en 1986. Ha ejercido varios cargos directivos y de asesoría entre los que se cuentan: Director de la Sección de Epidemiología de la Asociación Americana de Estadística entre 1994 y 1996; miembro del Comité de Seguridad de Desarrollo de Vacunas de Merck y, en la actualidad, consultor de Pfizer Inc. para la evaluación de medicamentos para el VIH-Sida.

Adriana Pérez Medina

Profesora Asociada. Departamento de Bioinformática y Bioestadística. Facultad de Salud Pública y Ciencias de la Información. University of Louisville. Louisville, KY. USA- Estadística. Universidad Nacional de Colombia, 1991. Maestría y Doctorado en Bioestadística. Tulane University, 1994 y 1995. Lugar de nacimiento: Bogotá.

Está vinculada a la Universidad de Louisville desde el año pasado, luego de haber trabajado en las universidades Nacional y Javeriana, y en University of Texas at Houston de 2001 a 2006. Con énfasis en bioestadística, su trabajo de investigación incluye diseño, conducción y análisis de ensayos clínicos multicéntricos, modelos de error de medición y métodos estadísticos en investigación epidemiológica. Ha participado en proyectos de cáncer de estómago y seno, cuidado intensivo, asma, obesidad, enfermedad cardiovascular en adolescentes, diabetes, salud materna y reproductiva, salud de adolescentes y depresión, entre otros. 

Con una extensa bibliografía que incluye artículos, capítulos en libros, conferencias e informes de investigación, es miembro activo de varios comités editoriales y recibe fondos de investigación de los Institutos Nacionales de Salud (NIH), la Asociación Americana de Estadística (ASA), la Fundación Nacional para la Ciencia (NSF), y el Departamento de Defensa (DOD) de Estados Unidos, entre otros.

MacGyver estadístico

Estoy en desacuerdo con la siguiente frase que me encontré navegando en el blog de un tipo que trabaja con aprendizaje de máquinas.

Si yo tuviera un MacGyver del análisis de datos y todo lo que él tuviera a mano fuera solamente una prueba t y una regresión, entonces probablemente él estaría en la capacidad de realizar el 99.9% de los análisis que nosotros hacemos y que son realmente útiles.

Tal vez, mi percepción del tema esté errada y el contexto en que se cito la frase no haya sido claro para mí. Sin embargo, aunque la regresión y las pruebas t son herramientas fundamentales en las aplicaciones estadísticas, se está dejando de lado el desarrollo de más de ocho décadas. Ya no estamos en los tiempos de Sir. Ronald, y los modelos a los que antes estábamos restringidos por cuestiones computacionales van dando paso a una nueva variedad de técnicas y algoritmos estadísticos. Creo firmemente que los modelos multinivel, la inferencia bayesiana, los modelos no para-métricos (entiéndase distribution free) y aún los modelos de estructura jerárquica más básicos van acortando aún más la brecha existente entre el cielo (los datos tomados en el estado de la naturaleza) y la tierra (la percepción racional del investigador respecto a un fenómeno).

Eficiencia del PPT

La regla de oro de una buena muestra reza que para que la inferencia basada en el diseño de muestreo arroje estimaciones que sean (abusando del lenguaje) de varianza mínima e insesgadas, las probabilidades de inclusión (o selección, según sea el caso) que arroje el diseño de muestreo utilizado deben ser directamente proporcionales a los valores que toma la característica de interés en la población.

En 1954, Des Raj demostró que: Si x es la información auxiliar utilizada en la etapa de diseño, la resta de la varianza de la estrategia de muestreo aleatoria simple con reemplazo con la varianza de la estrategia PPT da como resultado una expresión directamente proporcional a la covarianza entre (x, y^2/x).

Este resultado condiciona el comportamiento estructural de la información auxiliar que debe cumplir dos condiciones para que la eficiencia de la estrategia PPT sea mayor que la del diseño aleatorio simple con reemplazo.

  • En primer lugar, el resultado indica que para que la estrategia de muestreo PPT sea más eficiente en términos de varianza que la estrategia de muestreo MRAS, además de que las probabilidades de selección de los individuos sean proporcionales a los valores que toma la información auxiliar, es necesario que la correlación entre (x, y^2/x)
    debe ser positiva (lo cual es obvio dada la definición de correlación). Sin embargo, nótese que si la razón entre y y x es contante para todos los elementos, entonces esta correlación es igual a la correlación existente entre (x, y). Por tanto, una condición necesaria para que el diseño PPT sea más eficiente que el diseño de muestreo aleatorio simple con reemplazo es que exista una correlación positiva entre la característica de interés y la información auxiliar; pero, una condición suficiente para la optimalidad del diseño PPT, es que la razón entre (x/y) sea constante.
  • Segundo, Lehtonen (2004) muestra que la eficiencia del diseño de muestreo PPT está directamente relacionada con un modelo de regresión simple con intercepto. Concluye que para que el diseño de muestreo PPT sea más eficiente, el intercepto debe ser una cantidad pequeña. Es decir, que la línea de regresión ajuste cerca del origen. Como corolario del resultado, se tiene que incluso si la correlación entre la característica de interés y la información auxiliar fuera perfecta e igual a uno, entonces no habría ningún término de error en la regresión, pero aún así si el intercepto fuera grande entonces la estrategia de muestreo PPT podría arrojar una eficiencia menor.

Por supuesto, la eficiencia de cualquier diseño de muestreo dependerá del parámetro que se quiera estimar, no es lo mismo estimar promedios que razones o que funciones de distribución. Está claro que bajo una buena planeación del diseño de muestreo, el PPT funciona mejor para totales que para razones. De hecho, cuando se utiliza el PPT para estimar una razón entre dos variables, es necesario encontrar una variable correlacionada con la transformada de Taylor (tarea ardua y confusa). Que, para los conocedores del tema, se trata de encontrar una variable correlacionada con cero.