Detecção de fraude


(Thiago Rodrigues) #1

Detectar transações fraudulentas e anômalas é um problema clássico de análise de dados, ajuda a detectar atividades problemáticas, como golpistas que fazem pagamentos múltiplos apenas sob um limite de gatilho, novos comerciantes que apresentam comportamento incomum e aparentemente legítimo de clientes que estão conectados a uma rede de golpistas.


(Christian S. Perone) #2

Legal @Thiago, tem um material e um vídeo muito bom da Expero (que trabalha praticamente só com fraude), onde eles começaram a usar GCNs (Graph Convolutional Networks) para modelar relações em deteção de fraude e lavagem de dinheiro. Achei bem interessante porque nem sempre é óbvio como modelar relações, e o que acontece na realidade é que geralmente se ignora essa informação.


(Felipe Antunes) #3

Uma coisa que tenho investigado relacionado a isso é como transformar problemas não supervisionados em supervisionados tendo em vista a Lei de Benford, que pode ser usada para fornecer a razão de fraude em um dado dígito (medido pelo desvio em relação a proporção prevista pela Lei). Em particular tenho estudado como podemos inferir uma ‘label’ a partir do conhecimento da proporção (uma referência https://arxiv.org/abs/1402.5902). Isso levanta outras questões interessantes, como por exemplo saber dados pessoais a partir de dados do censo.


(Christian S. Perone) #4

Legal a ideia cara, e provavelmente generalizaria para outras power laws também. Seria interessante tentar pensar como incorporar por exemplo esse prior da distribuição dos dígitos em bayesian estimation por exemplo. Porque acho que no fim o interesse pra fraude é o teste de hipótese e incerteza certo ? Mas também não entendi muito bem o que tu comentou sobre transformar problemas não-supervisionados em supervisionados (ou self-supervised ?) e a parte do censo.