Qualidade dos dados

Publicamos abertamente a qualidade da nossa base de dados. Cada registro passa por validação automática durante a ingestão: aqueles com problemas evidentes (respostas HTTP ingeridas como texto, HTML cru não parseado, datas impossíveis) são ocultados das páginas públicas com motivo documentado.

Resumo

Registros totais

1.538.060

Publicados

1.538.060

Cobertura média

100,0%

Última atualização da auditoria: 21 de maio de 2026.

Por categoria

Categoria Totais Publicados Cobertura
Editais e Fomento 653.627 653.627 100,0%
Benefícios Sociais 64 64 100,0%
Legislação 445.396 445.396 100,0%
Calendário Fiscal 1.400 1.400 100,0%
Combustíveis 26.275 26.275 100,0%
Indicadores Econômicos 5.598 5.598 100,0%
Licitações 4.044 4.044 100,0%
Transparência 384.992 384.992 100,0%
Estatísticas IBGE 16.474 16.474 100,0%
Direitos Trabalhistas 190 190 100,0%

O que verificamos

Durante cada ingestão (diária para a maioria das fontes), aplicamos um conjunto de regras automáticas para detectar registros corrompidos ou que não devem ser servidos ao público:

  • Respostas HTTP ingeridas como texto. Por exemplo, se durante uma indisponibilidade do PNCP a API retornar uma página HTML de erro ("We apologize for the inconvenience"), o agregador detecta o padrão e oculta o registro.
  • HTML cru não parseado. Linhas que começam com <html>, <!DOCTYPE>, ou contêm <script> sem o resto da página são bloqueadas.
  • Datas impossíveis. Mais de 10 anos no futuro ou anteriores a 1800 são marcadas como inválidas e o registro não é exibido.
  • Encoding inconsistente. Caracteres mojibake em campos identificadores (título, slug) são re-decodificados; quando não recuperáveis, o registro é ocultado.

O que NÃO ocultamos

Preferimos informação disponível a perfeição cosmética. Por isso, não ocultamos:

  • Registros com descrição breve, quando legítima (e.g. categorias tabulares como combustíveis ou indicadores econômicos).
  • Campos opcionais vazios (e-mail do órgão, endereço completo, valor estimado).
  • Registros com algum erro tipográfico ou caractere especial recuperável.

O que acontece com registros ocultados

Os registros que falham a validação são marcados internamente como publicado = FALSE com motivo documentado, mas não são apagados. Permanecem no banco para auditoria futura e podem ser recuperados quando a fonte original corrigir o problema. Casos em que a falha é irrecuperável (e.g. resposta HTTP sem qualquer dado utilizável) podem ser eventualmente removidos em ciclos de manutenção.

Reportar um problema

Esta auditoria é automática e detecta apenas problemas estruturais. Se você notar um erro de conteúdo — um valor incorreto, uma data trocada, um link quebrado — escreva para [email protected] indicando a URL da página. Os reportes de erro têm prioridade máxima.

Esta página é gerada automaticamente a partir do banco de dados de dados-publicos.com a cada build.