── /sobre ── v1.0 ── mai 2026 ──

Sobre o Inference.

Inference é a publicação de autora única de Beatriz Almeida — um registro documentado de pensamento sobre sistemas de IA, arquitetura de software e a infraestrutura sobre a qual rodam. Não é um blog de notícias, um site de tutoriais ou uma coluna de opinião.

$ cartão.autor

autora Beatriz Almeida

role Arquiteta de Software / Praticante de ML

local São Paulo, BR

since 2024

posts

cadence semanal

licence CC BY-NC 4.0

sponsors nenhum

§ 01 O que isto é

Comecei o Inference porque a escrita de que eu precisava não existia. Os artigos técnicos que eu respeitava eram acadêmicos demais — ricos em citações mas desconectados de produção — ou comerciais demais: tutoriais engenheirados para tráfego orgânico, sem ponto de vista assumido.

O que eu queria ler era um praticante pensando em voz alta, em público, com as evidências na mesa. Então comecei a escrever. Cada post é o registro de uma decisão real: um problema encontrado, as opções avaliadas, a escolha feita e o raciocínio por trás dela. Onde estive errada, eu digo. Onde ainda há incerteza, eu sinalizo.

Não há listicles. Não há 'top dez'. Há uma autora. Há um ponto de vista.

§ 02 Quem escreve

Sou arquiteta de software e praticante de ML em São Paulo. Passei aproximadamente uma década entre laboratórios de pesquisa e times de produção — tempo suficiente para ter entregue sistemas dos quais me orgulho, e tempo suficiente para ter entregue sistemas dos quais hoje me arrependo.

Tenho mestrado em Ciência da Computação pela USP, onde minha dissertação examinou otimização de inferência para arquiteturas transformer. Desde então trabalhei em infraestrutura financeira, engenharia de plataforma de ML e consultoria em sistemas distribuídos. Já fui on-call para sistemas de IA em produção atendendo dezenas de milhões de requisições por dia, e já assinei embaixo de arquiteturas que sabia que falhariam em dois anos. As duas experiências informam o que escrevo.

§ 03 O que cubro

Inference é organizado em torno de três áreas temáticas. Cada post carrega uma tag de tópico primário; o arquivo pode ser filtrado por tópico.

IA / ML

Arquitetura de modelos, pipelines de treino, otimização de inferência, avaliação.

Arquitetura

Design de sistemas, padrões, design de API, sistemas distribuídos.

Infraestrutura

GCP / AWS / Azure, contêineres, CI/CD, observabilidade, engenharia de custo.

§ 04 Voz editorial

Os posts são escritos em primeira pessoa, porque autoria intelectual importa. Quando escrevo 'eu defendo', estou colocando meu nome atrás do argumento. Quando escrevo 'eu estava errada', estou colocando meu nome atrás da correção.

O registro é preciso. Afirmações são sustentadas por evidência — benchmarks, citações ou experiência pessoal claramente identificada. Especulação é permitida, mas sinalizada como tal. Hype não é permitido.

§ 05 Política bilíngue

Inference publica em dois idiomas: inglês em en.inference.dev, português brasileiro em pt.inference.dev. Cada versão é escrita nativamente a partir do mesmo material-fonte — nenhuma é tradução da outra. A voz e a estrutura são consistentes entre ambas. Os exemplos e referências ocasionalmente diferem onde o contexto local importa.

§ 06 Contato

Leio todos os emails. Não rodo patrocínios pagos, posts patrocinados ou links de afiliados. Se quiser sinalizar um erro, mande uma correção. Se quiser sugerir um tópico, mande uma pergunta que eu ainda não tenha respondido.

> beatriz@inference.dev