DataFrame
Presentación teórica : Introducción al Análisis Multivariado
Un data frame en R es una estructura de datos muy utilizada para almacenar datos tabulares. Cada fila representa una observación y cada columna una variable. Aquí te dejo algunos conceptos básicos y ejemplos para trabajar con data frames en R:
DataFrames introducción : GRAPHICAL METHODS Prezi
Crear un Data Frame
Puedes crear un data frame utilizando la función data.frame(). Por ejemplo:
# Definir vectores
nombre <- c("Ana", "Luis", "Carlos")
edad <- c(23, 34, 28)
ciudad <- c("Madrid", "Barcelona", "Valencia")
# Crear el data frame
df <- data.frame(nombre, edad, ciudad)
print(df)
str(df)
Acceder a los Datos
Para acceder a los datos de un data frame, puedes usar el signo $ o corchetes []:
# Acceder a una columna
df$nombre
# Acceder a una fila
df[1, ]
# Acceder a un valor específico
df[1, 2]
Añadir Filas y Columnas
Puedes añadir nuevas filas con rbind() y nuevas columnas con cbind():
# Añadir una nueva columna
df$salario <- c(30000, 40000, 35000)
# Añadir una nueva fila
nueva_fila <- data.frame(nombre = "María", edad = 30, ciudad = "Sevilla", salario = 32000)
df <- rbind(df, nueva_fila)
Filtrar y Ordenar Datos
Para filtrar y ordenar datos, puedes usar funciones como subset() y order():
# Filtrar datos
df_filtrado <- subset(df, edad > 25)
# Ordenar datos
df_ordenado <- df[order(df$edad), ]