Pesquisadores da USP desenvolvem soluções de inteligência artificial para agilizar processos judiciais
Pesquisadores da USP estão desenvolvendo um novo modelo de IA de baixo custo integrado à administração pública, com alto desempenho em tarefas jurídicas e garantia de proteção de dados sensíveis

A lentidão dos trâmites processuais do sistema judiciário brasileiro é um de seus maiores problemas, contribuindo para o prolongamento de injustiças, já que muitos casos sérios, cuja conclusão mudaria a vida de pessoas, demoram anos ou mesmo décadas para serem finalizados. Por conta disso, uma estratégia de agilização desses trâmites tem sido estudada e implementada: a incorporação de IA aos sistemas do Judiciário.
Essa estratégia promete trazer vários benefícios. Segundo o Relatório sobre o Futuro dos Profissionais 2025, estima-se que 53% dos trabalhadores das áreas jurídicas de risco, conformidade, tributária, contábil, auditoria e comercial acreditam que suas organizações já estão obtendo pelo menos um tipo de benefício com a adoção da IA. Os dados foram coletados entre fevereiro e março de 2025, junto a 2.275 profissionais, distribuídos em todos os continentes.
Segundo o procurador da Fazenda Nacional, Silvio Levcovitz, “muitos tribunais já estão usando a IA para produzir, por exemplo, o relatório inteiro de um processo”. Além de procurador, Levcovitz é pós-doutorando no Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos, e integra a equipe do projeto Desenvolvimento de Grandes Modelos de Língua para Aplicações no Domínio Jurídico, financiado pela Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp), que explora a IA no contexto da Procuradoria-Geral da Fazenda Nacional (PGFN).
Boas práticas do uso da IA na governança
O trabalho em parceria com a PGFN faz parte de um projeto guarda-chuva maior, o Agents4Gov. A ideia é criar um ambiente no qual projetos voltados à implementação da IA na governança floresçam de forma ética em diversas áreas, como na educação superior e, como já destacado, no campo jurídico.
Em 2024, pesquisadores envolvidos no projeto publicaram na revista Artificial Intelligence and Law resultados que demonstram como a IA pode ser usada na identificação automática de informações em documentos jurídicos. No caso, foram usados documentos do Diário Oficial do Distrito Federal, visando reduzir os altos custos da rotulação manual de dados.
O estudo explica como treinar modelos de redes neurais profundas, ou seja, modelos de aprendizado de máquina com múltiplas camadas capazes de aprender padrões complexos em dados, utilizando métodos de rotulação automatizados ou híbridos (quando há uma parcela de participação humana), garantindo alta eficiência e um baixo custo de processamento para o modelo treinado.
Já em 2025, a equipe conquistou um prêmio pelo trabalho de desenvolvimento de um grande modelo de linguagem (LLM), chamado de LLM4Gov, uma ferramenta e framework desenvolvida para permitir que o setor público utilize modelos de linguagem avançados de forma segura, econômica e privada, em conformidade com as legislações de privacidade (LGPD e RGPD). Essas legislações impedem governos de submeter documentos com dados sensíveis a modelos proprietários como o GPT-4, da Open AI, protegendo seus cidadãos.
A questão é que a IA consegue realizar tarefas em segundos, muito mais rapidamente do que qualquer humano. Assim, ela pode ser responsável pela triagem, classificação e agrupamento de processos jurídicos com temas semelhantes, evitando que profissionais percam tempo com essas tarefas. Essa automação tem potencial para diminuir os custos processuais, tornando a justiça mais acessível financeiramente.

Esse é justamente um dos primeiros objetivos do LLM4Gov, conta Levcovitz: “Estamos construindo um classificador de matérias (assuntos dos processos judiciais). É importante sabermos, de forma rápida e automatizada, quais são as matérias de um processo. Porque, a depender delas, o processo terá um direcionamento de fluxo de trabalho diferente”.
Contudo, existem preocupações. Uma delas é o receio de que a automação prejudique a análise das particularidades de cada caso. Atualmente, o consenso é que a IA deve atuar na gestão de fluxos, e não necessariamente substituir a cognição do magistrado em casos complexos. Outra é a escassez de boas diretrizes e manuais de ética para o uso da IA na área jurídica, já que sua implantação nessa esfera é recente. Portanto, é imprescindível a cautela quanto à segurança e à proteção dos dados pessoais.
Um dos principais desafios no setor jurídico público é a classificação inicial de novos processos, etapa essencial para determinar o destino de cada petição. De acordo com o professor Ricardo Marcacini, do ICMC, que coordena o projeto, essa triagem ainda era feita de forma manual ou semiautomática. “Se isso é feito de forma lenta ou errada, o processo acaba indo e voltando. Isso é oneroso porque, quanto mais os encaminhamentos demoram, mais aumenta a fila, afetando negativamente o cidadão”, explica.
Assim, a aplicação de grandes modelos de linguagem (LLM) permite automatizar essa análise semântica em larga escala, garantindo que o processo chegue ao setor correto mais rapidamente, reduzindo o tempo de espera por uma resposta judicial. “Consigo ver os desdobramentos desse resultado em vários órgãos públicos. A IA é uma parceira boa para essa tarefa porque os dados são volumosos, a complexidade não é tão alta, a análise é basicamente semântica. Além disso, os benefícios da implementação da IA nesse contexto é algo que o cidadão consegue entender facilmente”, conta Marcacini.
Desafios como esses motivam os pesquisadores do Laboratório de Inteligência Computacional (Labic), do qual Levcovitz e Marcacini fazem parte. Hoje, uma das linhas de pesquisa do laboratório é voltada à governança, ou seja, a aplicações de ferramentas inteligentes em sistemas públicos e em políticas públicas capazes de estimular decisões e políticas baseadas em evidências.
Uma IA pensada para a governança
Para treinar o LLM4Gov, utilizou-se a abordagem professor-aluno estruturada em três etapas. A primeira delas é a de anonimização, que começa pela identificação e remoção de dados pessoais, por meio de um modelo local, o que garante que os dados permaneçam privados. Em seguida, apenas usando os dados anonimizados, emprega-se um modelo professor, mais robusto e já existente, para treinar um novo modelo aluno, menorzinho, para que ele também desenvolva a capacidade de raciocínio com aquela base de dados.Por meio de um ajuste fino feito no modelo aluno (também chamado de destilado), utilizando técnicas de LoRA (Low-Rank Adaptation, ou adaptação de baixo ranque) e quantização de 4 bits, torna-se possível executá-lo em hardwares com recursos limitados, ou seja, em computadores mais simples e baratos. Sem o uso dessas técnicas de LoRA e quantização, o treinamento de uma nova LLM exigiria muito mais memória e processamento das máquinas, podendo inviabilizar pesquisas de desenvolvimento de novos modelos, a não ser que a instituição seja uma gigante da tecnologia como a Google e não esteja preocupada com isso.
A LoRA é, na verdade, uma estratégia matemática usada no código de treinamento que contorna a necessidade de atualizar todos os pesos da matriz original do modelo ao congelar esses pesos (valores numéricos) e adicionar pequenas matrizes auxiliares, que são as únicas a serem treinadas, facilitando os cálculos necessários durante todo esse processo.
Já a quantização reduz a precisão numérica dos pesos do modelo em treinamento para economizar memória. Modelos maiores são tipicamente treinados em 32 ou 16 bits. Ao comprimir esses valores para apenas 4 bits por parâmetro, há uma otimização computacional significativa.
Dessa maneira, depois desse treino puxado, o LLM recém-treinado é finalmente testado na tarefa concreta de classificação de documentos jurídicos. Assim, os pesquisadores do Labic confirmaram que é possível obter alto desempenho mantendo a conformidade com as leis de proteção de dados e operando apenas em infraestruturas locais, garantindo a segurança e anonimização dos dados. Conclusão: o LLM4Gov é uma solução eficaz para a transformação digital do governo brasileiro, capaz de promover transparência e eficiência.
A alta demanda do Judiciário brasileiro
A morosidade do Judiciário brasileiro é famosa e decorre de fatores estruturais que impedem uma solução rápida e justa de litígios. Segundo dados do Relatório Justiça em Números 2025, o Brasil contava com 80,6 milhões de processos pendentes em dezembro de 2024, o que equivale a um processo pendente para cada três brasileiros. Além disso, o tempo médio de tramitação das pendências é de quatro anos, embora o sistema judiciário venha aumentando sua produtividade ano a ano. Em relação à Europa, o Brasil tem cerca de 14,7 vezes mais casos pendentes por cem habitantes.
Esses resultados ainda podem ser interpretados como subnotificações, pois a desigualdade social brasileira implica que aproximadamente 25% dos brasileiros não possuem acesso efetivo à justiça, devido à falta de assistência jurídica gratuita para quem vive com renda familiar de até três salários mínimos. Além disso, o grande volume de processos se relaciona com o que é chamado de “uso predatório da justiça”, o que significa que a maior parte dos litigantes (bancos, empresas) utiliza o Judiciário como estratégia de negócio, congestionando as instâncias com demandas que poderiam ser resolvidas administrativamente.
Segundo a Pesquisa Nacional da Defensoria Pública 2025, cerca de 17,6% dos brasileiros (ou 37,6 milhões) não têm acesso potencial aos serviços jurídico-assistenciais prestados pelas Defensorias Públicas dos Estados e do Distrito Federal. Agravando esse cenário, há um déficit de profissionais no sistema legislativo em comparação com outros sistemas, em especial os da Europa. Estima-se que 77,5% dos membros da Defensoria Pública consideram excessivo ou muito excessivo o volume de trabalho sob sua responsabilidade.
Matéria: Marcos Vinícius Ribeiro Ferreira | Jornal da USP.



