[R-br] Identificar cpf's

classic Classic list List threaded Threaded
2 messages Options
Reply | Threaded
Open this post in threaded view
|

[R-br] Identificar cpf's

R-br mailing list
Prezados, 

Boa tarde,

Tenho uma conjunto de dados que são mensagens de textos e preciso identificar os cpf's digitados nestas mensagens.

Quando os cpf's são digitados sem pontos ou traços, consigo extrair esta informação. mas preciso selecionar também os casos como por exemplo:
000.000.000-00
Uma amostra de 69 mensagens dos dados estão nest link

## CMR
d<-unlist(regmatches(dados[1:69,], gregexpr("[0-9,]+", dados[1:69,])))
d<- gsub(",", "", d)
d <- d[d != ""]
d[str_length(d)==11]


_______________________________________________
R-br mailing list
[hidden email]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.
Reply | Threaded
Open this post in threaded view
|

Re: [R-br] Identificar cpf's

R-br mailing list
Olá, Felipe,

Tente esse código para pegar apenas os CPFs que estiverem com a máscara:

t = paste(dados[1:69,2])

d<-unlist(regmatches(t, gregexpr("[0-9]{3}\\.[0-9]{3}\\.[0-9]{3}-[0-9]{2}", t)))

Espero ter ajudado.

Atenciosamente,
Rodrigo de Castro Ângelo

On Mon, Dec 17, 2018 at 6:20 PM Felipe Barletta por (R-br) <[hidden email]> wrote:
Prezados, 

Boa tarde,

Tenho uma conjunto de dados que são mensagens de textos e preciso identificar os cpf's digitados nestas mensagens.

Quando os cpf's são digitados sem pontos ou traços, consigo extrair esta informação. mas preciso selecionar também os casos como por exemplo:
000.000.000-00
Uma amostra de 69 mensagens dos dados estão nest link

## CMR
d<-unlist(regmatches(dados[1:69,], gregexpr("[0-9,]+", dados[1:69,])))
d<- gsub(",", "", d)
d <- d[d != ""]
d[str_length(d)==11]

_______________________________________________
R-br mailing list
[hidden email]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

_______________________________________________
R-br mailing list
[hidden email]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.