DataFrame

Presentación teórica : Introducción al Análisis Multivariado

Un data frame en R es una estructura de datos muy utilizada para almacenar datos tabulares. Cada fila representa una observación y cada columna una variable. Aquí te dejo algunos conceptos básicos y ejemplos para trabajar con data frames en R:

DataFrames introducción : GRAPHICAL METHODS Prezi

Crear un Data Frame

Puedes crear un data frame utilizando la función data.frame(). Por ejemplo:

Figure 2.1. Vectores
# Definir vectores
nombre <- c("Ana", "Luis", "Carlos")
edad <- c(23, 34, 28)
ciudad <- c("Madrid", "Barcelona", "Valencia")

# Crear el data frame
df <- data.frame(nombre, edad, ciudad)
print(df)
str(df)

Acceder a los Datos

Para acceder a los datos de un data frame, puedes usar el signo $ o corchetes []:

Figure 2.2. Acceso a variables
# Acceder a una columna
df$nombre

# Acceder a una fila
df[1, ]

# Acceder a un valor específico
df[1, 2]

Añadir Filas y Columnas

Puedes añadir nuevas filas con rbind() y nuevas columnas con cbind():

Figure 2.3. Nueva columna o Fila
# Añadir una nueva columna
df$salario <- c(30000, 40000, 35000)

# Añadir una nueva fila
nueva_fila <- data.frame(nombre = "María", edad = 30, ciudad = "Sevilla", salario = 32000)
df <- rbind(df, nueva_fila)

Filtrar y Ordenar Datos

Para filtrar y ordenar datos, puedes usar funciones como subset() y order():

Figure 2.4. Filtros en Dataframe
# Filtrar datos
df_filtrado <- subset(df, edad > 25)

# Ordenar datos
df_ordenado <- df[order(df$edad), ]