Table of Contents
- Software
- DataFrame
- Aprendiendo Plot
- Aprendiendo GGPLOT2
- Usando Boxplots
-
Ejemplo 1
- Encabezado
- llamando mis librerias
- Cargar los datos
- Gráfica de consumo de combustible vs potencia
- Grafica de # de Cilindros vs consumo
- Analisis de Variables continuas multivariadas con BoxPlot y plotly
- Analisis de Variables continuas multivariadas con BoxPlot y jitter
- Analisis de Variables continuas multivariadas con BoxPlot facet
- medida de cuantiles
- Software
- Familia de productos IRIS
- Cargar Librerias
-
Boxplot de especies longitud del petalo
- Boxplot de especies ancho del sepalo
- Relacion entre Longitud y Ancho del Petalo
- Relacion entre ancho del Sepalo y ancho del Petalo
- Relacion entre longitud del Petalo y longitud del Sepalo
- Calculo de la Matriz de Distancias Euclidianas
- Calcula el dendograma de la matriz de distancias
- Gráfica del Dendograma
- Creo el dataframe con los cluster
- Graficar los clusters librerias
- Introducción a Power Bl
Software
DataFrame
Presentación teórica : Introducción al Análisis Multivariado
Un data frame en R es una estructura de datos muy utilizada para almacenar datos tabulares. Cada fila representa una observación y cada columna una variable. Aquí te dejo algunos conceptos básicos y ejemplos para trabajar con data frames en R:
DataFrames introducción : GRAPHICAL METHODS Prezi
Crear un Data Frame
Puedes crear un data frame utilizando la función data.frame()
. Por ejemplo:
Acceder a los Datos
Para acceder a los datos de un data frame, puedes usar el signo $
o corchetes []
:
Añadir Filas y Columnas
Puedes añadir nuevas filas con rbind()
y nuevas columnas con cbind()
:
Filtrar y Ordenar Datos
Para filtrar y ordenar datos, puedes usar funciones como subset()
y order()
:
Aprendiendo Plot
La función plot()
en R es una herramienta muy versátil para crear gráficos.
Veamos sus usos y cómo configurarla:
Usos Básicos de plot()
La función plot()
se puede utilizar para crear diferentes tipos de gráficos dependiendo de los datos que le pases. Aquí tienes algunos ejemplos básicos:
Gráfico de Dispersión
Gráfico de Líneas
Configuración de plot()
Puedes personalizar tus gráficos utilizando varios argumentos dentro de la función plot()
. Aquí tienes algunos de los más comunes:
Tipos de Gráficos (type
)
"p"
: Puntos (por defecto)"l"
: Líneas"b"
: Puntos y líneas"o"
: Líneas y puntos superpuestos"h"
: Barras verticales"s"
: Escalones
Colores y Símbolos
col
: Color de los puntos o líneaspch
: Tipo de símbolo para los puntos (1 a 25)cex
: Tamaño de los puntos
Ejes y Títulos
xlab
yylab
: Etiquetas de los ejesmain
: Título del gráficosub
: Subtítulo del gráfico
Líneas y Leyendas
Puedes añadir líneas adicionales y leyendas a tus gráficos:
Recursos Adicionales
Aprendiendo GGPLOT2
¿Qué es ggplot2?
ggplot2 es un paquete de R para la creación de gráficos de manera declarativa, basado en la “Gramática de los Gráficos” (The Grammar of Graphics).
Esto significa que puedes construir gráficos complejos a partir de componentes simples y reutilizables.
Con ggplot2, defines cómo los datos se mapean a las estéticas (como el color, la forma y el tamaño) y qué elementos gráficos (como puntos, líneas y barras) se deben usar para representar esos datos
Instalación
Para instalar ggplot2, puedes usar:
Ejemplos de Aplicación con la Base cars
La base de datos cars
en R contiene datos sobre la velocidad y la distancia de frenado de automóviles.
1. Gráfico de Dispersión
Un gráfico de dispersión muestra la relación entre dos variables cuantitativas.
2. Gráfico de Líneas
Un gráfico de líneas es útil para mostrar tendencias a lo largo de un rango continuo.
3. Gráfico de Barras
Aunque los gráficos de barras son más comunes para datos categóricos, también se pueden usar para mostrar la frecuencia de valores discretos.
Recursos Adicionales
Usando Boxplots
¿Qué es un Boxplot?
Un boxplot (o diagrama de caja y bigotes) es una representación gráfica que resume la distribución de un conjunto de datos numéricos a través de sus cuartiles.
Es una herramienta muy útil en el análisis exploratorio de datos porque permite identificar rápidamente la mediana, la dispersión, la asimetría y los valores atípicos (outliers) de los datos1.
Los boxplots son herramientas poderosas para el análisis exploratorio de datos, permitiéndote visualizar rápidamente la distribución y detectar posibles problemas en tus datos.
Componentes de un Boxplot
- Caja: Representa el rango intercuartílico (IQR), que es la distancia entre el primer cuartil (Q1, 25%) y el tercer cuartil (Q3, 75%).
- Línea dentro de la caja: Indica la mediana (Q2, 50%).
- Bigotes: Se extienden desde los cuartiles hasta el valor máximo y mínimo dentro de 1.5 veces el IQR.
- Puntos fuera de los bigotes: Representan los valores atípicos.
Importancia en el Análisis de Datos
- Identificación de Outliers: Los boxplots permiten detectar valores atípicos que pueden influir en el análisis.
- Comparación de Distribuciones: Facilitan la comparación de la distribución de datos entre diferentes grupos.
- Visualización de la Dispersión: Muestran la variabilidad de los datos y la presencia de asimetrías.
Ejemplos con mtcars
en R
La base de datos mtcars
contiene datos sobre diferentes modelos de automóviles, incluyendo variables como el consumo de combustible, la cilindrada, la potencia, etc. Aquí te dejo algunos ejemplos de cómo crear boxplots con esta base de datos usando R.
1. Boxplot de una Variable
2. Boxplot por Grupo
3. Boxplot con Personalización
Recursos Adicionales
1: R CODER 2: Datamentor
Ejemplo 1
Encabezado
llamando mis librerias
Cargar los datos
Gráfica de consumo de combustible vs potencia
Grafica de # de Cilindros vs consumo
Analisis de Variables continuas multivariadas con BoxPlot y plotly
Analisis de Variables continuas multivariadas con BoxPlot y jitter
Analisis de Variables continuas multivariadas con BoxPlot facet
medida de cuantiles
Software
Software del Curso Análisis de Datos para la Investigación
Importante se deben instalar TODOS en INGLES !!
y seleccionar descarga DIRECTA
Familia de productos IRIS
Cargar Librerias
Cargar Base de Datos iris
##Exploracion inical
Boxplot de especies longitud del petalo
Boxplot de especies ancho del sepalo
Relacion entre Longitud y Ancho del Petalo
La grafica nos muestra que la especie setosa tiene una longitud del petalo mas corta y un ancho de petalo un poco mas bajo, la relacion entre el ancho de su petalo y la longitud de su petalo se muestra mas consistente en las especies Versicolor y Virginica.
Relacion entre ancho del Sepalo y ancho del Petalo
La grafica nos muestra que los puntos estan dispersos, no se observa una relacion lineal entre las variables.Los valores para la especie Setosa indican un ancho de sepalo mas bajo y un ancho de petalos reducido permitiendo que sea mas facil diferenciarla.Las especies Versicolor y Virginica no muestran patrones claros, lo que sugiere que el ancho del sepalo y del petalo no son caracteristicas suficentemente determinantes para poder distinguirlas. Los puntos no siguen una linea recta ni curva, reforzando que no existe correlacion entre estas dos variables.
Relacion entre longitud del Petalo y longitud del Sepalo
La grafica nos muestra que la longitud del petalo y la longitud del sepalo están positivamente correlacionadas, especialmente para Versicolor y Virginica. Sin embargo, Setosa se diferencia al tener tamaños mucho más pequeños en comparación con las otras especies. La linea de ajuste nos permite ver la relacion positiva, y su pendiente indica que a medida que el sépalo se alarga, también lo hace el pétalo.