[R-br] Aplicação de métodos de dados faltantes no ambiente R

classic Classic list List threaded Threaded
2 messages Options
Reply | Threaded
Open this post in threaded view
|

[R-br] Aplicação de métodos de dados faltantes no ambiente R

R-br mailing list

Boa tarde Prezados. 

Estou a tratar dados experimentais em excel, sendo que alguns dados estão em falta em relação a algumas variáveis e objetos (entradas em Excel).

Vou realizar a análise multivariada com dados de uma planilha (40 objetos versus 24 colunas de dados), mas antes, eu tenho que prever os dados em falta de algumas células.

Por gentileza alguém teria recomendação de script no R com a implementação dos métodos? 

- Método do algoritmo E-M (Expectativa-Maximização) que pressupõe a normalidade dos dados referentes às variáveis de resposta

e

- Modelo de regressão logística. A equação gerada permitiria estimar os valores dos dados perdidos. Não assume uma distribuição normal das variáveis de resposta. Ao contrário da regressão linear cujos dados variam de - ∞ a + ∞, na regressão logística eles variam de 0 a 1 e, portanto, são apropriados para variáveis cujos valores variam de 0 a 1.

Em vista do exposto, alguém poderia me ajudar ou recomendar alguém que saiba implementar esses métodos no R?


Grato pela atenção.

Obrigado


 


_______________________________________________
R-br mailing list
[hidden email]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.
Reply | Threaded
Open this post in threaded view
|

Re: [R-br] Aplicação de métodos de dados faltantes no ambiente R

R-br mailing list
Caio,

Neste parágrafo acho que é necessário esclarecer se você se expressou mal ou é problema de entendimento:

- Modelo de regressão logística. A equação gerada permitiria estimar os valores dos dados perdidos. Não assume uma distribuição normal das variáveis de resposta. Ao contrário da regressão linear cujos dados variam de - ∞ a + ∞, na regressão logística eles variam de 0 a 1 e, portanto, são apropriados para variáveis cujos valores variam de 0 a 1.  

Na RL os dados (a variável resposta) não variam de 0 a 1 mas sim são ou zero ou um. A RL é apropriada quando a resposta é binária, e a variável independente é contínua (ou pode ser modelada como tal).

Ou escrito doutra forma: na RL a variável resposta é discreta binária.

HTH
--
Cesar Rabak



On Tue, May 28, 2019 at 1:25 PM Renato Rocha Batista por (R-br) <[hidden email]> wrote:

Boa tarde Prezados. 

Estou a tratar dados experimentais em excel, sendo que alguns dados estão em falta em relação a algumas variáveis e objetos (entradas em Excel).

Vou realizar a análise multivariada com dados de uma planilha (40 objetos versus 24 colunas de dados), mas antes, eu tenho que prever os dados em falta de algumas células.

Por gentileza alguém teria recomendação de script no R com a implementação dos métodos? 

- Método do algoritmo E-M (Expectativa-Maximização) que pressupõe a normalidade dos dados referentes às variáveis de resposta

e

- Modelo de regressão logística. A equação gerada permitiria estimar os valores dos dados perdidos. Não assume uma distribuição normal das variáveis de resposta. Ao contrário da regressão linear cujos dados variam de - ∞ a + ∞, na regressão logística eles variam de 0 a 1 e, portanto, são apropriados para variáveis cujos valores variam de 0 a 1.

Em vista do exposto, alguém poderia me ajudar ou recomendar alguém que saiba implementar esses métodos no R?


Grato pela atenção.

Obrigado


 

_______________________________________________
R-br mailing list
[hidden email]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

_______________________________________________
R-br mailing list
[hidden email]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.