Variáveis no R

Objetos no R

“Everything that exists is an object” “Everything that happens is a function”
John Chambers, Creator of the S programming language

O R é uma linguagem de programação de alto nível e como tal, usa do conceito de objetos. As linguagens de programação desse tipo são chamadas de linguagens orientadas a objetos. Essa abstração simplifica muito a programação e torna muito mais fácil resolver problemas complexos. Os objetos mais comuns do R são chamados de variáveis.

Variáveis no R

Uma variável é um objeto que armazena dados, tais como valores numéricos, datas, caracteres, palavras, valores lógicos (veremos isso adiante) etc.

Operador de Atribuição

Para armazenar um dado numa variável usamos um operador especial, denominado de operador de atribuição:

1  <-

O operador de atribuição serve para atribuirmos um dado a um objeto e tem a forma de uma seta para esquerda, formada pelo sinal de menor imediatamente seguida do sinal de menos <-.

Isso forma uma seta, indicando que o resultado da operação será colocado no objeto à esquerda da seta.

1 > x  <-  2
2 > y  <-  3
3 > z <- "Maria"

Observe que ao criar uma variável para armazenar uma palavra ou um caractere, é necessário colocar essa palavra entre aspas. O R entende que está entre aspas é uma palavra ou um texto e não um número.

Operadores Aritméticos

Os operadores mais comuns do R são os aritméticos:

operador ação
+ somar
- subtrair
/ dividir
* multiplicar
^ elevar à uma potência

Veja nos exemplos abaixo algumas operações matemáticas simples:

1 > x <-  2
2 > y <-  3
3 > z <-  (x + y)^2

Precedência de Operações

Assim como na matemática, também no R existem regras de precedência de operações com um detalhe: os parênteses sempre tem preferência, ou precedência, sendo usados para colocarmos as operações na ordem desejada. ou seja, as operações entre parênteses tem prioridade sobre outras operações. Veja o exemplo abaixo

1 < 4 * 3 + 2
2 [1] 14
3 
4 > (4 * 3) + 2
5 [1] 14
6 
7 > 4 * (3 + 2)
8 [1] 20

Comentários no R

Um outro símbolo importante no R é o hashtag #. Esse símbolo indica que o texto a seguir é um comentário, ou seja, é um texto para ser lido por humanos e que o computador simplesmente ignora.

1 # atribuindo o valor de 30 (anos) a variável idade
2 > idade <- 30 
3 
4 # Calculando a idade em meses e armazenando 
5 # esse novo dado na variável idade.meses
6 > idade.meses  <- 30 * 12

Estilos de nomeação de variáveis e objetos

Como você deve ter notado, variáveis devem ter nomes fáceis de serem compreendidos, nomes que mostrem o que significam. Se uma variável serve para armazenar a glicemia é mais adequado que essa variável seja denominada glicemia do que apenas x. Por outro lado, devemos usar nomes sucintos e evitar nomes grandes, glicemia é mais apropriado do que niveis.de.glicose.dos.pacientes, que é demasiadamente extenso.

Nomes compostos

Entretanto, quando houver necessidade de usar nomes compostos, o modo adequado é usar um ponto separando as palavras, tais como: glico.fem ou idade.media.

Evite usar o underline em variáveis, a separação de palavras pelo o underline é geralmente usado para nomear arquivos tais como: research_results_fase_1.csv.

Evite usar maiúsculas para separar as palavras de uma variável, pois esse estilo geralmente é usado para nomear funções, tal como em “solveEquation”. Veja que as palavras são separadas pelo uso de uma maiúscula no início das palavras, exceto a primeira. Esse modo criar nomes é geralmente usado para nomearmos funções, portanto, vamos evitar fazer isso ao criarmos nomes de variáveis.

Regras para criação de nomes de objetos

Além dessa dica, existem regras formais para criar nomes de variáveis:

1. O nome de uma variável deve SEMPRE começar com uma letra

2. O nome de uma variável NÃO pode começar com números ou caracteres especiais

3. O nome de uma variável NÃO pode conter espaços

4. O nome de uma variável NÃO pode conter caracteres com acentos gramaticais.

Case Sensitive

Um ponto importante: o R é case sensitive, ou seja, maiúsculas e minúsculas são considerados caracteres diferentes: portanto as variáveis idade e Idade são diferentes. A dica é evitar usar maiúsculas em nomes de variáveis, para não criar confusão.

Vetores no R

Vetores são objetos fundamentais de todas linguagens computacionais. Um vetor é um conjunto de elementos da mesma natureza. Por exemplo, um conjunto de números, um conjunto de palavras, etc.

A forma mais comum de criar um vetor no R é através do uso do comando c que signific acombine, como mostrado a seguir.

1 # criando um vetor numérico com idades dos pacientes
2 > idades <- c(45, 32, 24, 23, 55, 56)
3 
4 # criando um vetor com nomes dos pacientes:
5 > nomes <- c("Eduardo", "José", "Antônio", "Pedro", "Maria", "Gustavo")