Funções no R
As funções são a base de uma linguagem de programação. Assim como uma função matemática, na computação uma função recebe um conjunto de dados, processa esses dados e retorna um resultado.
Uma função y=2x recebe como input um valor e dá como resultado o dobro desse valor.
A função y=sen(x) recebe como input um determinado valor numérico e dá como resultado o seno desse valor.
A linguagem R tem inúmeras funções estatísticas que executam os inúmeros cálculos matemáticos necessários para resolvermos problemas estatísticos, desde os mais básicos até os mais complexos, facilitando bastante o ensino e a aprendizagem da estatística.
Argumentos de uma função
Toda função no R tem a seguinte estrutura: nome(argumentos). Ou seja, o nome da função, entre parênteses, os argumentos da função. Observe que não há espaços entre o nome da função e os parênteses com os argumentos.
Denominam-se argumentos de uma função os dados que são inseridos na função para o cálculo desejado. Vejamos como exemplo função para extrair a raiz quadrada de um número: sqrt().
O nome da função é sqrt, é uma abreviação de square root, ou raiz quadrada. Entre parênteses colocamos os argumentos, nesse caso, o número que desejamos que seja extraída a raiz quadrada. Portanto, para obter a raiz quadrada de 225 basta usar a função sqrt() com o argumento 225:
1 > sqrt(225)
2 [1] 15
Uma função pode ter mais de um argumento, o que é o mais comum na verdade. E alguns argumentos servem para indicar como a função deve se comportar. Uma função fundamental do R é a que lê os arquivos com dados, para que possamos fazer nossos cálculos. Um argumento dessa função é o nome do arquivo, outros argumentos são: se esse arquivo contém cabeçalho, se os dados estão separados por vírgula ou ponto e vírgula, se o decimal é uma vírgula ou um ponto etc. Para usar essa função devemos informar todos esses argumentos.
No exemplo abaixo, mostramos a função read.csv( ) e como essa função pode ser usada para ler um arquivo chamado resultados.csv, que contem cabeçalhos, cujos dados estão separados por vírgulas e cujos valores decimais são separados por um ponto:
1 read.csv(file ="resultados.csv",
2 header = TRUE,
3 sep = ",",
4 dec = ".")
na.rm = TRUE
Um argumento importante de muitas funções é o na.rm = TRUE. a expressão na.rm é uma abreviação de REMOVE NOT AVAILABLE DATA, ou seja, remova os dados faltantes. Ao indicarmos que esse argumento é verdadeiro (TRUE), o R irá desconsiderar dados em branco ou faltantes ao fazer os cálculos. Sem esse argumento, frequentemente os cálculos não são realizados.
Algumas funções matemáticas comuns:
| função | ação |
|---|---|
sqrt() |
calcula a raiz quadrada |
log() |
calcula o logaritmo natural |
abs() |
retorna o valor absoluto |
Algumas funções estatísticas comuns:
| função | ação |
|---|---|
mean() |
calcula a média de um conjunto de valores |
median() |
calcula a mediana de um conjunto de valores |
sum() |
calcula a soma de um conjunto de valores |
min() |
retorna o valo mínimo de um conjunto de valores |
max() |
retorna o valor máximo de um conjunto de valores |
var() |
calcula a variância de um conjunto de valores |
sd() |
calcula o desvio padrão de um conjunto de valores |