L
Legadia
Memória Brasileira · IA
Apoie a Legadia

A memória brasileira pode ser perguntada. Mas isso custa créditos de IA.

Cada documento histórico que entra na Legadia passa por uma cadeia de modelos de inteligência artificial — visão computacional para o OCR, embeddings semânticos para a busca, modelos de linguagem para citar e contextualizar trechos. Esse processo tem um custo concreto, em centavos por página, multiplicado por milhares de páginas conforme o acervo cresce. Sua doação é o que mantém esse motor ligado e abre caminho para novas coleções e tecnologias — como o reconhecimento facial em fotografias jornalísticas.

Como o apoio é usado

Cada real é um trecho a mais pesquisável.

Não há staff inflado, escritório ou marketing pago. Os recursos vão direto aos custos técnicos que transformam papel digitalizado em pesquisa instantânea.

OCR + visão computacional

Cada página passa por um modelo de IA com visão. Custo aprox.: R$ 0,15 por página.

Embeddings semânticos

Vetores multilíngues permitem buscar por contexto, não apenas palavra-chave.

Reconhecimento facial

Identificação automática de personagens históricos em fotografias — em desenvolvimento.

Contextualização de fatos

A IA cruza acontecimentos entre fontes, datas e personagens para gerar narrativas.

Novas coleções

Jornais cariocas e paulistas da Era Vargas, Bossa Nova, jornais do Império, fotojornalismo.

Hospedagem e banco

Vercel, Neon Postgres e CDN para servir o acervo crescente em alta velocidade.

Modelos top-tier

Quando o pesquisador pede análise profunda, usamos os modelos mais avançados disponíveis.

Manutenção contínua

Correção de OCR, novos índices, integração com Biblioteca Nacional e arquivos públicos.

Estado atual do acervo

O que está no ar — e o que está pausado por falta de orçamento.

Transparência total: aqui estão os números reais do banco em produção e o gap que separa o acervo atual da experiência completa que queremos entregar.

No ar hoje

1.021 páginas · 23 mil blocos · 100 mil menções

  • Em Guarda (1941-1945, 944 páginas) — classificação completa: foto, manchete, legenda, notícia, anúncio, com coordenadas no scan.
  • 6 jornais Archive.org — Correio da Manhã, A Noite, Diário de Notícias, Correio Paulistano, Diário da Noite, Folha da Noite, O Estado. Texto OCR + busca semântica funcionando.
  • Biblioteca DP — Machado, Alencar, Lobato e outros (1,16 milhão de palavras indexadas).
Em pausa por orçamento

Os jornais Archive não destacam blocos no scan.

  • Quando você abre uma página do A Noite ou Correio da Manhã e clica num bloco, ele não destaca a região no scan — só Em Guarda faz isso.
  • O texto está lá e a IA encontra. O que falta é detecção visual de layout (onde está cada matéria, foto, manchete na página).
  • Pra destravar: re-processar 278 páginas com Claude Vision (~US$30 one-time) + upgrade do banco Neon Postgres (hoje 484 de 512 MB usados, ~US$20/mês).

Os números são reais e atualizados manualmente. O acervo cresce conforme entram contribuições. A meta de curto prazo é equiparar a experiência de leitura nos jornais Archive ao que já existe na Em Guarda.

Doação via Pix

Pix — direto, sem taxa.

QR code Pix da Legadia
escaneie com o app do banco
Chave Pix · CNPJ
63.421.394/0001-71
Beneficiário

Luiz Marcelo Silva dos Santabaia Martins

Qualquer valor é bem-vindo. R$ 10 cobrem o custo de IA de uma página completa. R$ 50 cobrem uma edição inteira de uma revista como a Em Guarda. R$ 500 mantêm a Legadia no ar por um mês.

Pix QR estático não envia confirmação automática. Você preenche um form curto e eu confiro no extrato em até 48h pra te incluir no mural — opcional, doação anônima também é bem-vinda.

Para instituições

Patrocínio cultural — Lei Rouanet, FUNCAP, BNDES.

A Legadia tem perfil compatível com editais culturais brasileiros. Universidades, fundações e empresas com programa de cultura podem patrocinar a digitalização e indexação de acervos específicos — com contrapartida, dedução fiscal e créditos no portal.

Já temos demonstração funcional em produção, código aberto e pipeline replicável. Para conversar sobre patrocínio ou parcerias institucionais:

Próximo trecho

Por R$ 50, uma edição inteira do Em Guarda vira pesquisa.

Equivalente a 22-55 páginas, todos os personagens e lugares extraídos, todas as fotos catalogadas. Multiplicar isso por milhares depende de pessoas como você.