Funções no R

As funções são a base de uma linguagem de programação. Assim como uma função matemática, na computação uma função recebe um conjunto de dados, processa esses dados e retorna um resultado.

Uma função y=2x recebe como input um valor e dá como resultado o dobro desse valor.

A função y=sen(x) recebe como input um determinado valor numérico e dá como resultado o seno desse valor.

A linguagem R tem inúmeras funções estatísticas que executam os inúmeros cálculos matemáticos necessários para resolvermos problemas estatísticos, desde os mais básicos até os mais complexos, facilitando bastante o ensino e a aprendizagem da estatística.

Argumentos de uma função

Toda função no R tem a seguinte estrutura: nome(argumentos). Ou seja, o nome da função, entre parênteses, os argumentos da função. Observe que não há espaços entre o nome da função e os parênteses com os argumentos.

Denominam-se argumentos de uma função os dados que são inseridos na função para o cálculo desejado. Vejamos como exemplo função para extrair a raiz quadrada de um número: sqrt().

O nome da função é sqrt, é uma abreviação de square root, ou raiz quadrada. Entre parênteses colocamos os argumentos, nesse caso, o número que desejamos que seja extraída a raiz quadrada. Portanto, para obter a raiz quadrada de 225 basta usar a função sqrt() com o argumento 225:

1 > sqrt(225)
2 [1] 15

Uma função pode ter mais de um argumento, o que é o mais comum na verdade. E alguns argumentos servem para indicar como a função deve se comportar. Uma função fundamental do R é a que lê os arquivos com dados, para que possamos fazer nossos cálculos. Um argumento dessa função é o nome do arquivo, outros argumentos são: se esse arquivo contém cabeçalho, se os dados estão separados por vírgula ou ponto e vírgula, se o decimal é uma vírgula ou um ponto etc. Para usar essa função devemos informar todos esses argumentos.

No exemplo abaixo, mostramos a função read.csv( ) e como essa função pode ser usada para ler um arquivo chamado resultados.csv, que contem cabeçalhos, cujos dados estão separados por vírgulas e cujos valores decimais são separados por um ponto:

1 read.csv(file ="resultados.csv",
2          header = TRUE, 
3          sep = ",",    
4          dec = ".")

na.rm = TRUE

Um argumento importante de muitas funções é o na.rm = TRUE. a expressão na.rm é uma abreviação de REMOVE NOT AVAILABLE DATA, ou seja, remova os dados faltantes. Ao indicarmos que esse argumento é verdadeiro (TRUE), o R irá desconsiderar dados em branco ou faltantes ao fazer os cálculos. Sem esse argumento, frequentemente os cálculos não são realizados.

Algumas funções matemáticas comuns:

função ação
sqrt() calcula a raiz quadrada
log() calcula o logaritmo natural
abs() retorna o valor absoluto

Algumas funções estatísticas comuns:

função ação
mean() calcula a média de um conjunto de valores
median() calcula a mediana de um conjunto de valores
sum() calcula a soma de um conjunto de valores
min() retorna o valo mínimo de um conjunto de valores
max() retorna o valor máximo de um conjunto de valores
var() calcula a variância de um conjunto de valores
sd() calcula o desvio padrão de um conjunto de valores