aumentar disminuir original

Análisis estadísticos de datos en un entorno R

CUPO COMPLETO

(curso a dictarse en el marco del Doctorado en Mejoramiento Genético)

Profesor a cargo:

Teresa Boca

DESTINATARIOS

Profesionales de carreras afines o interesados en la temática.

REQUISITOS

Título universitario o de nivel superior no universitario de cuatro años de duración como mínimo. Conocimientos básicos de estadística.

Objetivos

El curso Análisis estadísticos de datos en un entorno R tiene como objetivo principal proporcionar los elementos para trabajar con el entorno de programación, con énfasis en el ámbito de la estadística y biometría aplicada al mejoramiento genético.

Hacer énfasis en la utilización de este lenguaje de forma tal que los doctorandos cuenten con los conocimientos y herramientas suficientes para aplicar los análisis específicos del área incluidos en los principales objetos del lenguaje R.

Trabajar en la manipulación interna de datos y también en la utilización de este programa vinculado con otros (SAS, Infostat, Excel, etc.) particularmente en la importación y exportación de información.

Ofrecer además un conjunto de material docente y bibliografía especifica que pretende que el doctorando pueda profundizar temas de forma autónoma y encontrar las herramientas específicas para su temática de estudio.

Programa

Clase 1. Introducción al manejo de R y elementos de estadística

Introducción al manejo de R: Instalación de R y Rstudio. Uso de R. Obtención de R.Uso de editores externos. RStudio. Ayuda en R. Material de apoyo online. Lectura de datos. Externos. Características básicas del lenguaje en R. Tipos de datos. Funciones Matemáticas. Lectura de datos externos. Paquetes (Packages). Parámetros a estimar.

Clase 2: Herramientas de cálculo organización de la información usando herramientas graficas

Comandos de Bajo Nivel. Parámetros Ventanas Gráficas. Funciones Interactivas. Gráficos con lattice: barchart densityplot histogram dotplot bwplot stripplot xyplot levelplot contourplot. Gráficos con ggplot2: gráficos básicos, geoms; ejes y leyendas, Facetting Facetting: labels

Clase3 Análisis de Varianza y diseños experimentales

Diseño de Experimentos Modelos Estadísticos en R. Análisis de varianza de Diseños Completamente Aleatorizado. Análisis de supuestos. Prueba de comparaciones múltiples. Análisis de varianza de Diseño en Bloques Completos Aleatorizados. Análisis Factorial. La interacción entre factores.

Clase 4 Modelos de regresión simple

Análisis de regresión Modelo. Estimación de parámetros por el método de mínimos cuadrados. Supuestos del modelo Inferencia estadística. Estimación de parámetros. Intervalo de confianza. Diagnóstico de datos influyentes

Clase 5 Regresión lineal múltiple

Variables explicativas cualitativas y cuantitativas. Regresión con datos categóricos. Multicolinealidad. Sumas de cuadrados tipo II y tipo III Métodos de Selección de Variables. Toma de decisión: modelo óptimo.

Clase 6 Supuestos del ANOVA y alternativas de análisis frente al incumplimiento.

Transformaciones, prueba de Box Cox Homogeneidad de varianzas e independencia entre observaciones. Modelado de la varianza de error con heterocedasticidad y autocorrelación.

Clase 7.Modelo lineal generalizado

Modelo de Regresión Logística Modelo Lineal Generalizado función de enlace Normal Binomial Poisson. Criterios bayesianos de selección de modelos (AIC, BIC)

Clase 8 Modelos Mixtos

Alternativas para la estructura de la componente aleatoria. Aplicación de modelos mixtos para mediciones repetidas en el tiempo. Diseños anidados. Componentes de varianza.

Bibliografía Obligatoria

Ahumada, J. A. (2003). R para Principiantes. University of Hawaii.

https://cran.r-project.org/doc/contrib/rdebuts_es.pdf

Devore Jay L. (2003) Probabilidad y estadística para ingeniería y ciencias. 5ta. edición. International Thomson Editores, S. A.

https://books.google.es/books?hl=es&lr=&id=-DazQgzN6zwC&oi=fnd&pg=PA1&dq=estadistica+inferencial&ots=sqos6Td4UI&sig=7ch_PEUtmaaNyZkP05HF8yl_pxk#v=onepage&q=estadistica%20inferencial&f=false

Faraway, J. J. (2002). Practical regression and ANOVA using R.

http://www.mathstat.ualberta.ca/~wiens/stat568/misc%20resources/Faraway-PRA.pdf

Steel, R. G. y J. H. Torrie. 1985. Bioestadística: Principios y Procedimientos. Segunda Edición. McGraw-Hill.

https://clea.edu.mx/biblioteca/Steel%20Robert%20G%20-%20Bioestadistica%20Principios%20Y%20Procedimientos%202ed.pdf

Modalidad de evaluación

Se evaluarán de los trabajos prácticos y el examen final.

Modalidad de dictado: Virtual

Carga horaria: 40 horas

Cronograma: 5, 12, 19, 26 de junio y 3 de julio

Teóricos: de 10 a 13 H.

Actividades prácticas: 14.30 a 17 H.

Las actividades se desarrollaran a través de clases virtuales via Meet y actividades a realizar en la Plataforma Educación Digital.

 

Arancel:

Profesionales en general: $8000

Docentes, No docentes y graduados UNNOBA: $ 6500