TEORÍA Y PRAXIS DE MODELOS GENERALIZADOS: INFIRIENDO PATRONES CON EL PAQUETE ESTADÍSTICO R

1) Distribuciones transformaciones y funciones de vínculo con las principales familias (Gaussiana Poisson Binomial).



2) Análisis de supuestos canónicos: exploración de los residuos de los modelos linealidad de efectos multicolinearidad de variables (índices VIF) puntos influyentes y perdidos sobredispersión.



3) Poder explicativo y predictivo de los modelos: devianza explicada magnitud de efectos parciales validación cruzada.



4) Robustez de los resultados: estimas robustas parametrización por re-muestreo con reemplazo de los datos originales (bootstrapping)



5) Diferentes aproximaciones para la estima de significación. Correcciones “quasi” teniendo en cuenta la sobredispersión. Generación de hipótesis nulas a partir de los propios datos.



6) Significación vs. fuerza de la evidencia basada en el criterio de información de Akaike. Comparación rigurosa de modelos competidores. Inferencia multimodelos.



7) Trabajando con conteos: regresiones de Poisson.



8) Variables respuesta nominales: regresiones lógit logística y multinomiales ordinales (proportional odds regression). Diagramas ROC y criterio AUC.



9) Distribuciones “aumentadas” de ceros: binomial negativa; hurdle regression.



10) Cuando las relaciones entre las variables predictoras y la respuesta no son lineales: transformaciones polinomiales (centrado de variables); modelos generalizados aditivos (GAM); funciones de suavizado LOESS y splines (cubic y thin plate).



11) ¿Y si las variables predictoras muestran un elevado grado de asociación?: regresión PLS (Partial Least Squares) trabajando con distribuciones Gaussianas Poisson Binomiales y Multinomiales Ordinales.



Desarrollo del curso:

Se pondrá el énfasis en los aspectos teóricos de los modelos generalizados que permitan una buena praxis en la inferencia estadística orientada a la obtención de patrones y al test de hipótesis utilizando herramientas de regresión. Debe tenerse en cuenta que el curso va dirigido a investigadores y personal científico-técnico con una amplia experiencia previa con la estadística en disciplinas relacionadas con recursos-ciencias naturales. Esto es el curso puede considerarse como “avanzado”.



Todo el desarrollo práctico del curso se efectuará usando el entorno de trabajo R utilizando más de una decena de paquetes disponibles ampliamente contrastados (nlme pscl mgcv MuMIN car MASS lmtest momments sándwich robust robustbase ROCR boot cvTools plsdepot plsRglm). No obstante el curso no es “sobre R”. Los paquetes y el entorno R son la herramienta con la que los asistentes al curso se familiarizarán y acabarán pudiendo utilizar de modo rutinario pero R no es en sí mismo la meta docente y académica del curso. Los conocimientos impartidos podrán ser aplicados trabajando con cualquier otra plataforma de análisis estadístico (SAS SPSS GRETL STATISTICA etc).



No es necesario tener conocimientos previos de R pero es muy recomendable tener cierta experiencia previa. Además de la presentación teórica de los aspectos del curso el profesor irá mostrando el uso de R según se vayan introduciendo las diferentes técnicas de regresión. Previamente al inicio del curso se enviarán a los alumnos instrucciones y archivos para su instalación. La parte teórica y demostrativa utilizando R tendrá una duración de 24 horas repartidas en 7 días.



Otra parte del curso tendrá una fuerte componente práctica que será restringida a los primeros 18 alumnos matriculados debido a limitaciones logísticas de disponibilidad de espacio. En esta parte exclusivamente práctica los alumnos deberán acudir al curso con su ordenador portátil.

Las sesiones prácticas tendrán lugar los martes 17 y 24 y los jueves 19 y 26 de marzo 15:30 a 19:30 h y añadirán 16 horas más a las 24 horas del curso (4 días x 4 horas).



Los candidatos deberán enviar a la Secretaría de la Sociedad de amigos del Museo con el objeto de hacer una selección previa de los participantes una página donde expongan los motivos por los que se desea realizar este seminario así como una síntesis del trabajo de investigación o técnico que se está desarrollando junto a su correo electrónico.

* se tendrá en cuenta el orden de llegada de las candidaturas.



Para el módulo práctico los alumnos traerán su ordenador personal.HORARIO MÓDULO PRÁCTICO:

Los días 17 19 24 y 26 de MARZO de 15:30 a 19:30 horas

914111328 ext 1117





Profesor de Investigación. Departamento de Biogeografía y Cambio Global. Museo Nacional de Ciencias Naturales - CSIC

Fecha

  • Lunes, 16 Marzo 2015

Ubicación

Salón de Actos y Sala de Juntas del Museo Nacional de Ciencias NaturalesJosé Gutiérrez Abascal 228006 Madrid

Plazas

Módulo teórico 30 plazas. Módulo práctico 18 plazas

Tarifas

Módulo teórico 240 €. Teórico+ práctico 340 €.

Inscripción