[R-br] derivada da densidade de probabilidade

classic Classic list List threaded Threaded
2 messages Options
Reply | Threaded
Open this post in threaded view
|

[R-br] derivada da densidade de probabilidade

R-br mailing list
Pessoal, 

eu tenho uma variável que segue uma distribuição bimodal, e eu preciso encontrar o melhor ponto que separa essas bimodais, de forma lógica matematicamente. 

Então eu pensei em gerar a curva de densidade e encontrar a derivada dessa curva. O local em que a derivada for zero eu teria o valor critico e também o ponto de mínimo, portanto, o melhor valor para determinar o corte e encontrar os dois grupos distintos. 

Como encontrar a derivada primeira e segunda da densidade?

# Código mínimo executável:

X = c(rnorm(100, 10, 3), rnorm(50, 40, 5))  # Variável bimodal
hist(X, freq = F)
denfuncao = density(X)
lines(denfuncao, lwd = 2)
  # como encontrar a derivada de uma curva se não conheço a função de 
  # densidade?
deriv(expr = denfuncao$x, namevec = denfuncao$x) 

_______________________________________________
R-br mailing list
[hidden email]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
Reply | Threaded
Open this post in threaded view
|

Re: [R-br] derivada da densidade de probabilidade

R-br mailing list
Nilson,

O que você deseja fazer tem um nome que nossos antepassados que já enfrentaram esse problema deram: "construção da ROC pelo método bi-normal".

Por transitividade matemática, você pode descobrir a curva logística que identifica o valor da sua variável que discrimina melhor as duas condições.

Note que embora do ponto de vista matemático esses procedimentos todos podem ser interpretados e compreensíveis (in extremis você poderia fazer uma busca do valor da variável que maximize ou um alfa ou um beta de um teste de hipótese versus as duas subdistribuições), usar isso como busca post hoc nos seus dados para provar uma hipótese pode ser considerado inválido.

Se seu problema for de classificação, você precisa se proteger usando as técnicas desse campo de estudo, como separação de parte dos dados para treino e outra para teste, etc.

HTH
--
Cesar Rabak


On Fri, Nov 1, 2019 at 8:50 PM Nilson Guiotoku por (R-br) <[hidden email]> wrote:
Pessoal, 

eu tenho uma variável que segue uma distribuição bimodal, e eu preciso encontrar o melhor ponto que separa essas bimodais, de forma lógica matematicamente. 

Então eu pensei em gerar a curva de densidade e encontrar a derivada dessa curva. O local em que a derivada for zero eu teria o valor critico e também o ponto de mínimo, portanto, o melhor valor para determinar o corte e encontrar os dois grupos distintos. 

Como encontrar a derivada primeira e segunda da densidade?

# Código mínimo executável:

X = c(rnorm(100, 10, 3), rnorm(50, 40, 5))  # Variável bimodal
hist(X, freq = F)
denfuncao = density(X)
lines(denfuncao, lwd = 2)
  # como encontrar a derivada de uma curva se não conheço a função de 
  # densidade?
deriv(expr = denfuncao$x, namevec = denfuncao$x) 
_______________________________________________
R-br mailing list
[hidden email]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

_______________________________________________
R-br mailing list
[hidden email]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.