PolitonData

Documentação · Editorial

Como a PolitonData processa dados públicos.

Transparência sobre a própria transparência. Esta página descreve as fontes utilizadas, os critérios editoriais adotados e, com igual honestidade, aquilo que a plataforma deliberadamente não se propõe a fazer.

Seção 01

Fontes oficiais e como chegamos a elas

A integralidade das informações aqui apresentadas provém de APIs públicas mantidas pelo Estado brasileiro.

A PolitonData não inventa, não opina, não estima. Toda informação exibida aqui vem diretamente de bases mantidas por órgãos oficiais. Não há intermediários. Não há curadoria ideológica. Não há filtros interpretativos aplicados sobre os dados originais.

Trabalhamos exclusivamente com APIs abertas e documentadas, de acesso irrestrito. O que significa dizer que qualquer leitor pode, se quiser, verificar as mesmas informações que nós processamos. Basta consultar as fontes listadas abaixo.

Verifique você mesmo

Cada dado exibido no perfil de um parlamentar tem correspondência direta com a API oficial. Eventuais divergências vêm da fonte, não do processamento.
Seção 02

Parlamentares, partidos e estados

Cobertura completa dos 594 parlamentares federais da legislatura em exercício, com sincronização diária.

Mantemos cadastro dos 513 deputados federais e 81 senadores em exercício. Para cada parlamentar, armazenamos:

  • Identificação oficial, com nome civil, nome parlamentar e identificador interno da Casa legislativa.
  • Foto oficial, servida diretamente pelos portais institucionais.
  • Filiação partidária atual, atualizada diariamente, já que migrações entre legendas são comuns no Congresso brasileiro.
  • Estado de representação, isto é, a UF pela qual o parlamentar foi eleito.
  • Contato institucional, como email e endereço de gabinete, quando divulgados.

Quando um parlamentar assume em vaga aberta, por convocação de suplente ou outra circunstância prevista, entra no sistema na sincronização seguinte. Quando perde o mandato, permanece registrado como inativo, com o histórico preservado integralmente.

Seção 03

Votações nominais no plenário

Mais de 461 mil votos individuais registrados, sem filtragem, sem interpretação.

Cada vez que um parlamentar vota em alguma matéria no plenário, seu voto é registrado nominalmente pela própria Casa e disponibilizado via API pública. Nós armazenamos integralmente esses registros, sem transformar, sem agregar, sem selecionar.

Para cada voto, conservamos:

  • Identificação da proposição, com seu tipo (PL, PEC, MP, PLP, PDL, PRC) e número oficial.
  • Descrição oficial da matéria, tal como redigida pela Casa.
  • Data e natureza da sessão em que a votação ocorreu.
  • Posição do parlamentar: Sim, Não, Abstenção, Obstrução ou Ausente.

O voto em plenário e o voto sobre o tema

A posição registrada informa como o parlamentar votou naquela sessão. Ela não informa, necessariamente, qual é sua posição pessoal sobre o assunto.

Orientação partidária, acordos de liderança, troca de apoios, pressões da conjuntura e estratégias de mais longo prazo influenciam qualquer voto parlamentar. Um voto Sim pode significar apoio genuíno, concordância procedimental ou concessão política. Interpretar cada caso é tarefa do leitor, não da plataforma.

Seção 04

Gastos (CEAP) e despesas parlamentares

627 mil transações totalizando mais de R$ 722 milhões, importadas diretamente da Câmara dos Deputados.

A Cota para Exercício da Atividade Parlamentar (CEAP) é o orçamento mensal que cada deputado federal dispõe para cobrir despesas ligadas ao mandato: passagens, combustível, material de escritório, consultoria, alimentação, telefonia, correio, divulgação parlamentar, entre outras categorias oficialmente previstas.

Cada nota fiscal apresentada pelo parlamentar à administração da Câmara gera um registro público. Armazenamos todos esses registros, sem agregação nem transformação.

  • Fornecedor, com CNPJ ou CPF e razão social.
  • Categoria de despesa, conforme classificação oficial da Casa.
  • Valor líquido efetivamente reembolsado ao parlamentar.
  • Datas de emissão e de reembolso, que muitas vezes diferem em vários meses.
  • Número do documento fiscal, seja nota, recibo ou cupom.

Sobre os senadores

O Senado dispõe de cota equivalente, a CEAPS, com regras próprias e granularidade de divulgação distinta. Integramos o que é publicado oficialmente.
Seção 05

Proposições e projetos de lei

449 mil proposições catalogadas, com informações de autoria, tramitação e texto oficial.

Toda matéria apresentada nas duas Casas é coletada: projetos de lei ordinária (PL), projetos de lei complementar (PLP), propostas de emenda à Constituição (PEC), medidas provisórias (MP), projetos de decreto legislativo (PDL), projetos de resolução (PRC) e requerimentos formais.

Registramos autoria principal e coautoria, ementa oficial, data de apresentação, regime de tramitação e situação atual: em análise, aprovada, arquivada, retirada ou outros estados previstos.

Assinatura técnica não é adesão política

Parlamentares frequentemente coassinam projetos por cortesia institucional ou reciprocidade entre colegas, sem necessariamente concordar com o mérito da proposta. A assinatura fica registrada, mas não traduz automaticamente posicionamento político.
Seção 06

Discursos oficiais

43.799 discursos preservados com transcrição integral, conforme registrado pela taquigrafia das duas Casas.

Sempre que um parlamentar ocupa a tribuna do plenário, a taquigrafia oficial transcreve o pronunciamento palavra por palavra. Esse material é disponibilizado pela Câmara e pelo Senado em suas respectivas APIs.

Armazenamos o texto integral de cada discurso, acompanhado de data, sessão, tipo de sessão (ordinária, extraordinária, solene) e fase do expediente em que foi proferido (grande expediente, breves comunicações, explicação pessoal, entre outras).

Esse corpus é a base sobre a qual se constroem as duas sínteses descritas a seguir, nas seções 07 e 08.

Volume de discursos não mede desempenho

Alguns parlamentares fazem uso intenso da tribuna e acumulam milhares de pronunciamentos. Outros raramente falam em plenário, concentrando atuação em comissões, relatorias ou articulação de bastidores. A quantidade de discursos mede, portanto, apenas o uso da tribuna como espaço político. Quem fala menos não necessariamente trabalha menos.
Seção 07

Síntese dos discursos

Resumo editorial automático que descreve temas recorrentes, posições e vocabulário característico de cada parlamentar.

Parlamentares com volume suficiente de discursos recebem, em seu perfil, uma síntese editorial automatizada. O texto descreve os temas recorrentes, as posições expressas com frequência e o vocabulário característico identificado nos pronunciamentos do parlamentar em plenário.

A síntese é produzida por um modelo de linguagem, submetido a critérios editoriais definidos pela equipe: neutralidade descritiva, factualidade, ausência de adjetivação política, uso de verbos neutros e distinção clara entre o que foi dito pelo parlamentar e aquilo que é opinião de terceiros. O objetivo declarado não é julgar, mas descrever.

O que a síntese é, e o que não é

É: uma descrição automatizada dos temas, posições e tom predominantes nos pronunciamentos oficiais do parlamentar no plenário.

Não é: uma avaliação de mérito, uma análise de coerência política, um julgamento sobre desempenho parlamentar ou um retrato exaustivo do parlamentar. Atuação em comissões, articulação de bastidores e manifestações fora do plenário permanecem fora do escopo.

Cada síntese traz, em seu rodapé, o volume de discursos em que se baseia e a data de geração. O texto original de cada discurso permanece disponível para consulta.

As sínteses são regeneradas periodicamente, conforme novos pronunciamentos são incorporados ao acervo.

Seção 08

Vocabulário característico

Mapa visual das palavras mais utilizadas por cada parlamentar nos discursos oficiais, processado sem envio de dados a serviços externos.

A nuvem de palavras é produzida por processamento estritamente local, aplicando técnicas clássicas de análise linguística sobre os discursos oficiais do parlamentar. Nenhum texto é enviado para serviços externos. O vocabulário característico é calculado com recursos próprios, sem dependência de terceiros.

As etapas do processamento são as seguintes:

  1. Tokenização. O conjunto dos discursos é dividido em palavras individuais.
  2. Remoção de palavras funcionais. Expressões sem valor informacional próprio (artigos, pronomes, conectivos e outras palavras comuns em português) são descartadas, além de um vocabulário específico do contexto parlamentar brasileiro (tratamentos protocolares, verbos de conversação recorrente).
  3. Detecção de expressões compostas. Sequências como "São Paulo", "Reforma Tributária", "Suprema Corte" ou "Segurança Pública" são preservadas como unidades, e não fragmentadas em palavras isoladas.
  4. Lematização conservadora. Plurais e variações de gênero são consolidados apenas quando a agregação é linguisticamente segura, preservando a integridade do léxico original sempre que há ambiguidade.
  5. Capitalização de nomes próprios. Pessoas, estados, partidos e instituições reconhecidos são apresentados na forma gráfica correta.
  6. Contagem e ordenação. As palavras são contabilizadas e ordenadas por frequência. As mais recorrentes são exibidas visualmente.

Processamento local, dado que não trafega

Como o processamento ocorre inteiramente em nossa infraestrutura, o conteúdo dos discursos não sai do ambiente controlado da plataforma para que a nuvem seja produzida.

Frequência não é equivalente a relevância

A palavra que aparece em maior destaque na nuvem é a mais repetida, não necessariamente a mais importante do ponto de vista político. Parlamentares com vocabulário restrito podem parecer mais enfáticos apenas porque repetem mais. A nuvem mostra o que se diz, com que frequência se diz, mas não qualifica o que está sendo dito.
Seção 09

Frequência de atualização

Dados sincronizados diariamente. Sínteses e vocabulário característico regenerados periodicamente.

Tipo de dadoFrequênciaFonte
Parlamentares, partidos, filiaçõesDiáriaCâmara e Senado
Votações nominaisDiária (sessões anteriores)Câmara e Senado
Gastos CEAPMensal (conforme divulgação oficial)Câmara
ProposiçõesDiáriaCâmara e Senado
Discursos oficiaisDiáriaTaquigrafia oficial
Síntese dos discursosPeriódicaDiscursos oficiais
Vocabulário característicoPeriódicaDiscursos oficiais

Em cada perfil de parlamentar, a data da última sincronização fica visível. Se a informação está desatualizada, o leitor consegue perceber.

Seção 10

Limites e honestidade metodológica

Aquilo que a PolitonData não se propõe a fazer, declarado abertamente.

Nenhum produto de informação pública é neutro em todos os sentidos; todo recorte implica escolhas. As limitações abaixo ficam registradas em voz alta, para que o leitor possa dimensionar com precisão o que está, e o que não está, diante de si.

Não fazemos checagem de fatos

Quando um parlamentar afirma em plenário algo que não corresponde à realidade factual, nós reproduzimos o que ele disse, porque é o que consta da taquigrafia oficial. A verificação de afirmações políticas é função do jornalismo profissional e de agências especializadas de checagem, não desta plataforma.

Não medimos desempenho parlamentar

Atividade em comissões permanentes, articulação de bastidores, relatoria de matérias complexas, negociação com o Executivo, construção de maiorias: tudo isso é parte essencial do trabalho parlamentar e pouco, ou nada, aparece nos dados oficiais quantitativos. Quem fala menos em plenário pode estar decidindo mais em outro lugar.

Não cobrimos redes sociais

Posições expressas em Twitter, Instagram, YouTube, lives ou podcasts estão fora do escopo. A plataforma se restringe àquilo que é publicado em fontes oficiais do Congresso.

Sínteses automatizadas podem errar

Sínteses geradas automaticamente podem, em casos pontuais, omitir nuances relevantes ou enfatizar aspectos secundários em detrimento do essencial. Por isso mantemos transparência sobre a base utilizada e exibimos o cuidado necessário na interpretação. O texto original dos discursos permanece sempre acessível.

As fontes podem conter falhas

APIs oficiais ocasionalmente apresentam inconsistências: registros faltantes, atrasos de atualização, erros de categorização em gastos. Quando identificamos falhas sistemáticas, reportamos ao órgão responsável. Não corrigimos silenciosamente: preferimos replicar a informação tal como consta na fonte e assinalar a origem.

Não produzimos ranking geral

Não há aqui "melhor deputado", "pior senador" ou índices agregados que pretendam reduzir a complexidade da atividade política a um número sintético. Ranking é interpretação; dado é dado. Preferimos entregar o segundo e deixar o primeiro ao leitor.

Encontrou algum erro?

Se o leitor identificar dado incorreto, omissão sistemática ou problema no processamento, queremos saber. Correções são prioridade. Contato: contato@politondata.com.br.

Próximos passos

Agora que os dados estão à vista, consulte-os.

Transparência que transforma.