Verificando Fraudes em Distribuições Aleatórias com a Lei de Benford

08/01/2025

Aprenda a identificar possíveis fraudes em distribuições numéricas usando a Lei de Benford. Id: 35

Capa do artigo Verificando Fraudes em Distribuições Aleatórias com a Lei de Benford

Entendendo a Lei de Benford: Aplicações e Cuidados

A Lei de Benford, também conhecida como Lei dos Números Anômalos, é uma observação estatística intrigante que afirma que, em muitos conjuntos de dados do mundo real, os dígitos iniciais de números não são distribuídos uniformemente. Em vez disso, o número 1 aparece como o primeiro dígito em aproximadamente 30% dos casos, enquanto números maiores, como 9, aparecem menos frequentemente.

A Lei de Benford é regida pela fórmula:

P(𝑑)=log_10(1+1/𝑑), onde P(𝑑) é a probabilidade de um número ter o dígito 𝑑 como o primeiro dígito, e 𝑑 varia de 1 a 9.

Os valores calculados pela fórmula são:

P(1)≈30.1%;

P(2)≈17.6%;

P(2)≈17.6%;

P(3)≈12.5%

P(4)≈9.7%;

P(5)≈7.9%;

P(6)≈6.7%;

P(7)≈5.8%;

P(8)≈5.1%;

P(9)≈4.6%

Gráfico de Linhas - Lei de Benford

Esses valores demonstram que os dígitos iniciais menores aparecem com maior frequência, e a fórmula é amplamente utilizada em auditorias, análise de fraudes e outros contextos onde padrões numéricos anômalos podem indicar irregularidades.

Onde a Lei de Benford se Aplica

Essa lei é aplicável a dados que abrangem várias ordens de magnitude e que não possuem um limite superior ou inferior imposto artificialmente. Exemplos incluem:

  • Dados financeiros, como receitas, despesas e transações bancárias.
  • Populações de cidades.
  • Constantes físicas e resultados de medições científicas.
  • Dados de redes sociais, como contagem de seguidores ou curtidas.

No campo da auditoria e da análise de fraudes, a Lei de Benford é usada para identificar anomalias em conjuntos de dados financeiros. Por exemplo, se os dígitos iniciais em relatórios de vendas não seguirem a distribuição esperada, isso pode indicar manipulação ou erros.

Exemplos Numéricos

Exemplo de Dados Aplicáveis

Considere um conjunto de dados representando as populações de cidades em um país:

  • População da Cidade A: 1.234 habitantes
  • População da Cidade B: 5.678 habitantes
  • População da Cidade C: 12.345 habitantes
  • População da Cidade D: 98.765 habitantes
  • População da Cidade E: 2.456 habitantes
  • ............

Ao analisar os primeiros dígitos dessas populações (1, 5, 1, 9, 2, ...), a distribuição tenderá, normalmente, a seguir a Lei de Benford, já que os números variam em ordens de magnitude e não há restrições artificiais. Você mesmo(a) pode experimentar a eficácia da lei de Benford nesses casos. Pegue, por exemplo, a quantidade de habitantes dos municípios brasileiros. O Brasil possui 5.571 municípios, o que, para esse experimento é uma quantidade suficiente. O IBGE fornece esses dados tabelados. Em uma planilha, crie uma coluna com os primeiros dígitos de cada quantidade encontrada. A frequência dos dígitos de 1 a 9 deve seguir um formato similar ao visto no gráfico acima (linha azul).

Exemplo de Dados Impraticáveis

Considere um conjunto de dados representando notas de alunos em uma prova:

  • Nota do Aluno A: 8,5
  • Nota do Aluno B: 7,0
  • Nota do Aluno C: 6,5
  • Nota do Aluno D: 9,0
  • Nota do Aluno E: 7,5
  • ...
  • Nota do Aluno N: ...

Esses valores, normalmente, não seguem a Lei de Benford porque estão limitados a um intervalo fixo (0 a 10), e a distribuição de dígitos iniciais será determinada pelo próprio sistema de avaliação, não por leis naturais.

Cuidados ao Usar a Lei de Benford

Embora a Lei de Benford seja uma ferramenta poderosa, ela não é universal e deve ser aplicada com muito cuidado. Aqui estão algumas precauções importantes:

  • Contexto dos Dados: A lei funciona melhor em conjuntos de dados que cobrem várias ordens de magnitude. Dados limitados, como pesos de pessoas ou notas de exames, geralmente não seguem a Lei de Benford.
  • Generalização Indevida: Aplicar a Lei de Benford em conjuntos de dados onde ela não se aplica pode levar a conclusões erradas. Por exemplo, salários mínimos em um país com valores regulamentados não seguem essa distribuição.
  • Viés Estatístico: Conjuntos de dados muito pequenos ou enviesados podem parecer não seguir a Lei de Benford mesmo quando deveriam.
  • Falsos Positivos: Uma discrepância nos números não significa, por si só, fraude ou erro. Sempre combine a análise com outras evidências.

Conclusão

A Lei de Benford é uma ferramenta fascinante para análise de dados, mas sua aplicação exige cautela e compreensão do contexto. Quando usada corretamente, pode ajudar a revelar padrões ocultos e identificar irregularidades, mas generalizações indevidas podem levar a interpretações equivocadas. E é claro que, como essa Lei é relativamente bastante conhecida, perde relevância para afastar a possibilidade de fraudes, ainda que, dentro dos parâmetros de confiança estatística, seja útil para apontar indícios, os quais devem ser averiguados por outros meios.

Para comentários:

Se quiser comentar, sugerir (acréscimos, retificações etc), criticar, elogiar, informar, sobre algum trecho deste artigo, peço a gentileza de utilizar a área de comentários do abaixo informada, no Youtube.

Já existe uma mensagem por lá dedicada a comentários sobre temas publicados neste portal.

Essa também é uma forma de contribuir com o trabalho e estimular sua continuidade e aprimoramento.

Peço a gentileza de comentar, curtir e compartilhar o conteúdo, além de se inscrever no canal do Youtube e ativar o sino de notificações para receber notícias de novos conteúdos.

Agradeço desde já!

Destinado para esses comentários em geral:

https://www.youtube.com/@roberto_csantos/community