sábado, 7 de abril de 2012

R - Iniciando no R com Linux Ubuntu

Estou iniciando no R.
Para quem está iniciando, vou começar a colocar o que estou aprendendo, serei bem objetivo (prático).
Utilizando o Linux Ubuntu.

Instalando o R:
1 : Abrir o terminal: Ctrl + Alt + t
2 : Digitar: sudo apt-get install r-base

Utilizando o Nautilus
1 : Abra o Nautilus Ctrl+o (ou outro gerenciador de arquivos)
2 : Vá até o local onde estão os arquivos com os dados que serão trabalhados (arquivos com números, no meu caso cada número está em uma linha, o arquivo possui somente números, arquivo do tipo .txt)
3 : Digite: Ctrl+l, para aparecer o "caminho"
4 : Digite: Ctrl+c, copiar esse "caminho"
5 : Vá para o terminal

A partir de agora, trabalhando dentro do terminal.
1 : Digite: cd Ctrl+Shift+v, irá para o endereço onde estão os arquivos com os dados (isso serve para quando entrar no R já estar dentro da pasta)
2 : Entrar no R, digite: R

A partir de agora, trabalhando dentro do R.
O prompt de comando do R é um sinal de maior (>).
Crie um arquivo de texto com alguns números, cada um em cada linha, com o nome teste.txt.

Criando e armazenando os dados desse arquivo em um objeto chamado teste:
> teste <- scan("teste.txt")
Read 15 items
Resposta: 15 dados lidos.

Imprimir o conteúdo de um objeto, digite:
> teste
 [1] 5 5 5 3 3 3 4 4 7 7 7 7 7 2 8
Resposta: elementos do objeto teste.

Verificando se os dados são numéricos, digite:
> is.numeric(teste)
[1] TRUE
Resposta: TRUE, siginifando que os dados são numéricos.

Verificar a quantidade de itens no objeto, digite:
> length(teste)
[1] 15
Resposta: 15 dados em um "vetor".

Criando uma tabela de valores absolutos acumulados
> teste.tb <- table(teste)
> teste.tb
teste
2 3 4 5 7 8
1 3 2 3 5 1
Resposta: quantidade de cada elemento.

Saber quantidade de elementos em cada objeto.
> length(teste)
[1] 15
> length(teste.tb)
[1] 6

Criando uma tabela de valores relativos acumulados
> teste.tbr <-prop.table(teste)

Verificando média (cria-se um objeto teste.me que armazena a média dos dados):
> teste.me <- mean(teste)
> teste.me

Assim como a média, segue-se para variância, desvio padrão, coeficiente de variabilidade, máximo, mínimo e moda.
Variância:
> teste.var <- var(teste)
> teste.var

Desvio padrão:
> teste.sd <- sd(teste)
> teste.sd

Coeficiente de variabilidade:
> teste.cv <- 100*teste.sd/teste.me
> teste.cv

Mediana:
> teste.md <- median(teste)
> teste.md

Máximo:
> teste.max <- max(teste)
> teste.max

Mínimo:
> teste.min <- min(teste)
> teste.min

Moda:
> teste.mo <- (teste.tb)[which.max(teste.tb)]
> teste.mo

Quartil:
> quantile(teste)

Percentil de 5%, 20% e 80%:
> quantile(teste,c(0.05,0.20,0.8))

Para sair do R basta digitar
> q()
Poderá salvar os dados.