Documentação · Editorial
Como a PolitonData
processa dados públicos.
Transparência sobre a própria transparência. Esta página descreve as fontes utilizadas, os critérios editoriais adotados e, com igual honestidade, aquilo que a plataforma deliberadamente não se propõe a fazer.
Neste documento
- 01Fontes oficiais e como chegamos a elas
- 02Parlamentares, partidos e estados
- 03Votações nominais no plenário
- 04Gastos (CEAP) e despesas parlamentares
- 05Proposições e projetos de lei
- 06Discursos oficiais
- 07Síntese dos discursos
- 08Vocabulário característico
- 09Frequência de atualização
- 10Limites e honestidade metodológica
Fontes oficiais e como chegamos a elas
A integralidade das informações aqui apresentadas provém de APIs públicas mantidas pelo Estado brasileiro.
A PolitonData não inventa, não opina, não estima. Toda informação exibida aqui vem diretamente de bases mantidas por órgãos oficiais. Não há intermediários. Não há curadoria ideológica. Não há filtros interpretativos aplicados sobre os dados originais.
Trabalhamos exclusivamente com APIs abertas e documentadas, de acesso irrestrito. O que significa dizer que qualquer leitor pode, se quiser, verificar as mesmas informações que nós processamos. Basta consultar as fontes listadas abaixo.
Câmara dos Deputados
↗dadosabertos.camara.leg.br/api/v2
API REST oficial com deputados, partidos, votações nominais, despesas (CEAP), proposições, discursos e presença em sessões.
Senado Federal
↗legis.senado.leg.br/dadosabertos
API REST oficial com senadores, votações, proposições, discursos e dados de mandato.
Verifique você mesmo
Parlamentares, partidos e estados
Cobertura completa dos 594 parlamentares federais da legislatura em exercício, com sincronização diária.
Mantemos cadastro dos 513 deputados federais e 81 senadores em exercício. Para cada parlamentar, armazenamos:
- Identificação oficial, com nome civil, nome parlamentar e identificador interno da Casa legislativa.
- Foto oficial, servida diretamente pelos portais institucionais.
- Filiação partidária atual, atualizada diariamente, já que migrações entre legendas são comuns no Congresso brasileiro.
- Estado de representação, isto é, a UF pela qual o parlamentar foi eleito.
- Contato institucional, como email e endereço de gabinete, quando divulgados.
Quando um parlamentar assume em vaga aberta, por convocação de suplente ou outra circunstância prevista, entra no sistema na sincronização seguinte. Quando perde o mandato, permanece registrado como inativo, com o histórico preservado integralmente.
Votações nominais no plenário
Mais de 461 mil votos individuais registrados, sem filtragem, sem interpretação.
Cada vez que um parlamentar vota em alguma matéria no plenário, seu voto é registrado nominalmente pela própria Casa e disponibilizado via API pública. Nós armazenamos integralmente esses registros, sem transformar, sem agregar, sem selecionar.
Para cada voto, conservamos:
- Identificação da proposição, com seu tipo (PL, PEC, MP, PLP, PDL, PRC) e número oficial.
- Descrição oficial da matéria, tal como redigida pela Casa.
- Data e natureza da sessão em que a votação ocorreu.
- Posição do parlamentar: Sim, Não, Abstenção, Obstrução ou Ausente.
O voto em plenário e o voto sobre o tema
A posição registrada informa como o parlamentar votou naquela sessão. Ela não informa, necessariamente, qual é sua posição pessoal sobre o assunto.
Orientação partidária, acordos de liderança, troca de apoios, pressões da conjuntura e estratégias de mais longo prazo influenciam qualquer voto parlamentar. Um voto Sim pode significar apoio genuíno, concordância procedimental ou concessão política. Interpretar cada caso é tarefa do leitor, não da plataforma.
Gastos (CEAP) e despesas parlamentares
627 mil transações totalizando mais de R$ 722 milhões, importadas diretamente da Câmara dos Deputados.
A Cota para Exercício da Atividade Parlamentar (CEAP) é o orçamento mensal que cada deputado federal dispõe para cobrir despesas ligadas ao mandato: passagens, combustível, material de escritório, consultoria, alimentação, telefonia, correio, divulgação parlamentar, entre outras categorias oficialmente previstas.
Cada nota fiscal apresentada pelo parlamentar à administração da Câmara gera um registro público. Armazenamos todos esses registros, sem agregação nem transformação.
- Fornecedor, com CNPJ ou CPF e razão social.
- Categoria de despesa, conforme classificação oficial da Casa.
- Valor líquido efetivamente reembolsado ao parlamentar.
- Datas de emissão e de reembolso, que muitas vezes diferem em vários meses.
- Número do documento fiscal, seja nota, recibo ou cupom.
Sobre os senadores
Proposições e projetos de lei
449 mil proposições catalogadas, com informações de autoria, tramitação e texto oficial.
Toda matéria apresentada nas duas Casas é coletada: projetos de lei ordinária (PL), projetos de lei complementar (PLP), propostas de emenda à Constituição (PEC), medidas provisórias (MP), projetos de decreto legislativo (PDL), projetos de resolução (PRC) e requerimentos formais.
Registramos autoria principal e coautoria, ementa oficial, data de apresentação, regime de tramitação e situação atual: em análise, aprovada, arquivada, retirada ou outros estados previstos.
Assinatura técnica não é adesão política
Discursos oficiais
43.799 discursos preservados com transcrição integral, conforme registrado pela taquigrafia das duas Casas.
Sempre que um parlamentar ocupa a tribuna do plenário, a taquigrafia oficial transcreve o pronunciamento palavra por palavra. Esse material é disponibilizado pela Câmara e pelo Senado em suas respectivas APIs.
Armazenamos o texto integral de cada discurso, acompanhado de data, sessão, tipo de sessão (ordinária, extraordinária, solene) e fase do expediente em que foi proferido (grande expediente, breves comunicações, explicação pessoal, entre outras).
Esse corpus é a base sobre a qual se constroem as duas sínteses descritas a seguir, nas seções 07 e 08.
Volume de discursos não mede desempenho
Síntese dos discursos
Resumo editorial automático que descreve temas recorrentes, posições e vocabulário característico de cada parlamentar.
Parlamentares com volume suficiente de discursos recebem, em seu perfil, uma síntese editorial automatizada. O texto descreve os temas recorrentes, as posições expressas com frequência e o vocabulário característico identificado nos pronunciamentos do parlamentar em plenário.
A síntese é produzida por um modelo de linguagem, submetido a critérios editoriais definidos pela equipe: neutralidade descritiva, factualidade, ausência de adjetivação política, uso de verbos neutros e distinção clara entre o que foi dito pelo parlamentar e aquilo que é opinião de terceiros. O objetivo declarado não é julgar, mas descrever.
O que a síntese é, e o que não é
É: uma descrição automatizada dos temas, posições e tom predominantes nos pronunciamentos oficiais do parlamentar no plenário.
Não é: uma avaliação de mérito, uma análise de coerência política, um julgamento sobre desempenho parlamentar ou um retrato exaustivo do parlamentar. Atuação em comissões, articulação de bastidores e manifestações fora do plenário permanecem fora do escopo.
Cada síntese traz, em seu rodapé, o volume de discursos em que se baseia e a data de geração. O texto original de cada discurso permanece disponível para consulta.
As sínteses são regeneradas periodicamente, conforme novos pronunciamentos são incorporados ao acervo.
Vocabulário característico
Mapa visual das palavras mais utilizadas por cada parlamentar nos discursos oficiais, processado sem envio de dados a serviços externos.
A nuvem de palavras é produzida por processamento estritamente local, aplicando técnicas clássicas de análise linguística sobre os discursos oficiais do parlamentar. Nenhum texto é enviado para serviços externos. O vocabulário característico é calculado com recursos próprios, sem dependência de terceiros.
As etapas do processamento são as seguintes:
- Tokenização. O conjunto dos discursos é dividido em palavras individuais.
- Remoção de palavras funcionais. Expressões sem valor informacional próprio (artigos, pronomes, conectivos e outras palavras comuns em português) são descartadas, além de um vocabulário específico do contexto parlamentar brasileiro (tratamentos protocolares, verbos de conversação recorrente).
- Detecção de expressões compostas. Sequências como "São Paulo", "Reforma Tributária", "Suprema Corte" ou "Segurança Pública" são preservadas como unidades, e não fragmentadas em palavras isoladas.
- Lematização conservadora. Plurais e variações de gênero são consolidados apenas quando a agregação é linguisticamente segura, preservando a integridade do léxico original sempre que há ambiguidade.
- Capitalização de nomes próprios. Pessoas, estados, partidos e instituições reconhecidos são apresentados na forma gráfica correta.
- Contagem e ordenação. As palavras são contabilizadas e ordenadas por frequência. As mais recorrentes são exibidas visualmente.
Processamento local, dado que não trafega
Frequência não é equivalente a relevância
Frequência de atualização
Dados sincronizados diariamente. Sínteses e vocabulário característico regenerados periodicamente.
| Tipo de dado | Frequência | Fonte |
|---|---|---|
| Parlamentares, partidos, filiações | Diária | Câmara e Senado |
| Votações nominais | Diária (sessões anteriores) | Câmara e Senado |
| Gastos CEAP | Mensal (conforme divulgação oficial) | Câmara |
| Proposições | Diária | Câmara e Senado |
| Discursos oficiais | Diária | Taquigrafia oficial |
| Síntese dos discursos | Periódica | Discursos oficiais |
| Vocabulário característico | Periódica | Discursos oficiais |
Em cada perfil de parlamentar, a data da última sincronização fica visível. Se a informação está desatualizada, o leitor consegue perceber.
Limites e honestidade metodológica
Aquilo que a PolitonData não se propõe a fazer, declarado abertamente.
Nenhum produto de informação pública é neutro em todos os sentidos; todo recorte implica escolhas. As limitações abaixo ficam registradas em voz alta, para que o leitor possa dimensionar com precisão o que está, e o que não está, diante de si.
Não fazemos checagem de fatos
Quando um parlamentar afirma em plenário algo que não corresponde à realidade factual, nós reproduzimos o que ele disse, porque é o que consta da taquigrafia oficial. A verificação de afirmações políticas é função do jornalismo profissional e de agências especializadas de checagem, não desta plataforma.
Não medimos desempenho parlamentar
Atividade em comissões permanentes, articulação de bastidores, relatoria de matérias complexas, negociação com o Executivo, construção de maiorias: tudo isso é parte essencial do trabalho parlamentar e pouco, ou nada, aparece nos dados oficiais quantitativos. Quem fala menos em plenário pode estar decidindo mais em outro lugar.
Não cobrimos redes sociais
Posições expressas em Twitter, Instagram, YouTube, lives ou podcasts estão fora do escopo. A plataforma se restringe àquilo que é publicado em fontes oficiais do Congresso.
Sínteses automatizadas podem errar
Sínteses geradas automaticamente podem, em casos pontuais, omitir nuances relevantes ou enfatizar aspectos secundários em detrimento do essencial. Por isso mantemos transparência sobre a base utilizada e exibimos o cuidado necessário na interpretação. O texto original dos discursos permanece sempre acessível.
As fontes podem conter falhas
APIs oficiais ocasionalmente apresentam inconsistências: registros faltantes, atrasos de atualização, erros de categorização em gastos. Quando identificamos falhas sistemáticas, reportamos ao órgão responsável. Não corrigimos silenciosamente: preferimos replicar a informação tal como consta na fonte e assinalar a origem.
Não produzimos ranking geral
Não há aqui "melhor deputado", "pior senador" ou índices agregados que pretendam reduzir a complexidade da atividade política a um número sintético. Ranking é interpretação; dado é dado. Preferimos entregar o segundo e deixar o primeiro ao leitor.
Encontrou algum erro?
Próximos passos
Agora que os dados estão à vista, consulte-os.
Transparência que transforma.