Aula 02 – Estatística, Jurimetria e Ciência de Dados – Ciência de Dados Aplicada ao Direito, Sistemas de Informação Jurídicos e Gestão de Serviços Jurídicos

“O Direito é uma ciência retardatária nesse movimento de aproximação com a estatística. O jurista estuda leis sem se preocupar com seus resultados práticos. Os bacharéis em Direito (futuros advogados, juízes, consultores legislativos, promotores e diretores jurídicos de empresas) são treinados para discutir ad nauseam todos os sentidos hipotéticos atribuíveis a uma lei, mas, pela falta de conhecimentos básicos em estatística e pesquisa empírica, não possuem qualquer preparo para verificar as consequências práticas que esses sentidos produzem. Nossas teses ainda são realizadas exclusivamente dentro de bibliotecas e se resumem a compilar montanhas de citações, na modalidade acadêmica que costumo chamar halterofilismo bibliográfico. Como resultado, conhecemos quase tudo que outros juristas disseram sobre a lei, mas sabemos quase nada a respeito do que se passa no mundo exterior. Esse nosso fetiche bibliófilo lembra a piada do gourmet fanático que definia a vida com um intervalo aborrecido entre as refeições. Para os juristas, a vida é aquele espaço aborrecido entre uma e outra visita à biblioteca.”
Marcelo Guedes Nunes (2016, p. 26)

Leitura para a aula:

Estatística

Origem da palavra

“A palavra estatística é derivada da palavra status (que significa “estado”). Os primeiros usos da estatística envolviam compilação de dados e gráficos que descreviam vários aspectos de um estado ou país. Em 1662, John Graunt publicou informação estatística acerca de nascimentos e mortes. O trabalho de Graunt foi seguido por estudos sobre taxas de mortalidade e de doenças, tamanhos de populações, renda e taxas de desemprego. As famílias, os governos e as empresas se apóiam fortemente nos dados estatísticos para orientação. Por exemplo, taxas de desemprego, taxas de inflação, índices do consumidor e taxas de nascimento e morte são cuidadosamente compiladas de modo regular, e os dados resultantes são usados pelos dirigentes de negócios para tomarem decisões que afetam futuras contratações, níveis de produção e expansão para novos mercados.” (TRIOLA, Mario. Introdução à Estatística. Rio de Janeiro: LTC, 2006. p. 4)

Estatísticas e Estatística

Todos os dias temos acesso a diversas informações que normalmente chamamos de “estatísticas”. Falamos em estatísticas ou dados de emprego, estatísticas ou dados de renda, estatísticas de chuva, estatísticas de movimento de veículos em uma estrada. A Estatística, por seu turno, é um ramo da matemática, que consiste na análise de conjuntos de dados ou de medições de modo a fornecer interpretação e caracterização numérica de determinada situação. A Estatística também se ocupa de métodos para a realização de experimentos e previsões. Normalmente a Estatística se diferencia, portanto, em dois grandes ramos: Estatística Descritiva e Estatística Inferencial.

Estatística Descritiva

O estudo da Estatística se inicia sempre pelo estudo da Estatística Descritiva. A Estatística Descritiva é certamente mais simples do ponto de vista matemático, uma vez que não requer conhecimentos profundos de probabilidade, nem requer conhecimento de cálculo (no sentido de cálculo integral e diferencial) para ser estudada. Destarte, a Estatística Descritiva é acessível a qualquer pessoa com conhecimento das operações matemáticas elementares, exponenciação e raiz quadrada.

Dado um conjunto de observações ou de medições, alguns cálculos podem ser realizados de modo a fornecer uma interpretação sintética sobre estes dados. Os resultados destes cálculos permitem a comparação mais simples e imediata entre diferentes situações, do que seria impossível se fosse necessário comparar conjuntos de números muito grandes.

Por exemplo, se tenho sob minha responsabilidade na data atual 200 processos no meu escritório, imagino que meu trabalho está aumentando ao longo do tempo se há três meses tinha 150 processos, há dois meses 162 e no mês passado trabalhava com 185. Neste caso, a simples contagem dos processos me fornece uma intuição acerca da característica do meu trabalho.

Outra operação que poderia realizar seria imaginar se minha “responsabilidade” está aumentando ou diminuindo. Para avaliar esta responsabilidade poderia escolher o valor das causas em andamento. Quanto maior o valor, mais “sério” é aquele processo e, portanto, maior minha responsabilidade. Poderia proceder, como fizemos acima, à soma de todos os valores da causa de todos os processos.

Podem também ser realizadas representações gráficas destes dados. Que permitem interpretações que dificilmente seriam extraídas dos números apenas.

Figurative Map of the successive losses in men of the French Army in the Russian campaign 1812–1813.
Drawn by M. Minard, Inspector General of Bridges and Roads (retired). Paris, November 20, 1869.
The numbers of men present are represented by the widths of the colored zones at a rate of one millimeter for every ten thousand men; they are further written across the zones. The red designates the men who enter Russia, the black those who leave it. — The information which has served to draw up the map has been extracted from the works of M. M. Thiers, de Ségur, de Fezensac, de Chambray and the unpublished diary of Jacob, the pharmacist of the Army since October 28th.
In order to better judge with the eye the diminution of the army, I have assumed that the troops of Prince Jérôme and of Marshal Davout, who had been detached at Minsk and Mogilev and have rejoined near Orsha and Vitebsk, had always marched with the army.
Mapa original de Charles Minard sobre a expedição de Napoleão na Rússia – 1812
Figurative Map of the successive losses in men of the French Army in the Russian campaign 1812–1813.
Drawn by M. Minard, Inspector General of Bridges and Roads (retired). Paris, November 20, 1869.
The numbers of men present are represented by the widths of the colored zones at a rate of one millimeter for every ten thousand men; they are further written across the zones. The red designates the men who enter Russia, the black those who leave it. — The information which has served to draw up the map has been extracted from the works of M. M. Thiers, de Ségur, de Fezensac, de Chambray and the unpublished diary of Jacob, the pharmacist of the Army since October 28th.
In order to better judge with the eye the diminution of the army, I have assumed that the troops of Prince Jérôme and of Marshal Davout, who had been detached at Minsk and Mogilev and have rejoined near Orsha and Vitebsk, had always marched with the army.
Mapa refeito – tradução para o inglês e escala Celsius

Estatística Inferencial

A Estatística Inferencial perfaz a coleta de dados sobre uma população (amostra aleatória) de modo a elaborar  inferências sobre a população. Podemos dizer que o objetivo da Estatística Descritiva é o de oferecer um resumo sobre os dados, enquanto o da estatística inferencial é a realização de experimentos e a obtenção de conclusões sobre certo conjunto de observações. A estatística inferencial foge ao escopo do presente curso.

Jurimetria

O prof. Marcelo Nunes define a Jurimetria como “a disciplina do conhecimento que utiliza a metodologia estatística para investigar o funcionamento de uma ordem jurídica. A partir dela, dica claro que a Jurimetria se distingue das demais disciplinas jurídicas tanto pelo objeto quanto pela metodologia empregada.” (2016, p. 115)

Ciência de Dados

Conceitos básicos de Estatística – População e Amostra

População e censoÉ o conjunto de todos os elementos de um determinado domínio de estudo. O censo é o processo de coleta de dados de todos os elementos pertinentes. Por exemplo, todos os brasileiros, todos os alunos de uma escola, todos os processos de um tribunal, todos os carros produzidos por uma fábrica.
Amostra e amostragemParte dos elementos de um conjunto de dados. A estatística lida, em grande parte, com os métodos matemáticos segundo os quais é possível, a partir de uma amostra, extrair conclusões sobre toda população. São temas relativos ao tamanho da amostra (cálculo amostral), ao tipo de amostra (aleatória, estratificada) e sobre a precisão das conclusões (margem de erro). Por exemplo, para mensurar a preferência dos eleitores em um pleito, faz-se entrevista com pequena parcela da população de acordo com características sócio-econômicas (amostragem estratificada e aleatória) e são inferidas conclusões para toda a população.
ParâmetroMedida numérica que descreve a característica de uma população. 
EstatísticaMedida numérica que descreve a característia de uma amostra.