idea·waddle

Caixa morfológica viva — análise colaborativa entre humanos e agentes, versionada sobre Git.


12parâmetros
2,099,520config. totais
10restrições
933,120config. viáveis
44.4%espaço de solução

Leitura da configuração

atualiza com a seleção ↓
Selecione opções na caixa abaixo para estimar custo, potência e energia.

Valores são placeholders a refinar — premissas em assumptions.yaml, dados por opção em params/*.yaml. Tratar como ordem de grandeza.

Caixa morfológica

Clique numa célula por linha para montar uma configuração. Opções incompatíveis com a seleção ficam bloqueadas; as de alerta seguem disponíveis. Cada escolha revela comentário, proveniência e caminhos de restrição.

Hardware de aceleraçãoQue acelerador(es) formam a base do cluster de inferência.
NVIDIA H100 / H200 (data center, topo)agent:discovery · claude-opus-4-8
NVIDIA L40S / RTX 6000 Ada (custo-benefício)agent:discovery · claude-opus-4-8
AMD Instinct MI300Xagent:discovery · claude-opus-4-8
Huawei Ascend 910Bagent:discovery · claude-opus-4-8
GPUs de consumo / refurbished (RTX 4090/5090)agent:revisor-2 · claude-opus-4-8 (perspectiva diversa simulada)
Origem de fornecimentoDe qual mercado/cadeia as placas e o suporte viriam.
Mercado americano (NVIDIA/AMD via distribuidor)agent:discovery · claude-opus-4-8
Mercado chinês (Huawei/Biren)agent:discovery · claude-opus-4-8
Parceria / doação de fabricante ou nuvemagent:discovery · claude-opus-4-8
Software de serving (inferência)Stack que serve os modelos para a comunidade.
vLLMagent:discovery · claude-opus-4-8
SGLangagent:discovery · claude-opus-4-8
TensorRT-LLMagent:discovery · claude-opus-4-8
Ollamaagent:discovery · claude-opus-4-8
Escala inicialTamanho do investimento inicial do cluster de inferência.
Nó único multi-GPU (4–8 GPUs)agent:discovery · claude-opus-4-8
Cluster pequeno (2–4 nós)agent:discovery · claude-opus-4-8
Cluster médio (8+ nós)agent:discovery · claude-opus-4-8
Interconexão de redeTecnologia de rede entre nós (relevante a partir de múltiplos nós).
Ethernet (100GbE)agent:discovery · claude-opus-4-8
RoCE (RDMA over Converged Ethernet)agent:discovery · claude-opus-4-8
InfiniBand (NDR/HDR)agent:discovery · claude-opus-4-8
Modelo de acesso da comunidadeComo a comunidade universitária consome a inferência.
API compatível com OpenAI (interna)agent:discovery · claude-opus-4-8
Interface web de chatagent:discovery · claude-opus-4-8
API + chat (ambos)agent:discovery · claude-opus-4-8
Refrigeração / energiaComo o calor é dissipado; impacta capex e PUE (eficiência energética).
Ar (CRAC/CRAH)agent:discovery · claude-opus-4-8
Líquido direto ao chip (DLC)agent:discovery · claude-opus-4-8
Imersãoagent:discovery · claude-opus-4-8
ArmazenamentoOnde ficam pesos de modelos, caches e dados de apoio à inferência.
NAS / NFS (SSD)agent:discovery · claude-opus-4-8
Sistema de arquivos paralelo (Lustre/BeeGFS)agent:discovery · claude-opus-4-8
Object storage (S3/MinIO)agent:discovery · claude-opus-4-8
Modelos de LLM a servirQuais famílias de modelos seriam disponibilizadas à comunidade.
Llama (Meta, aberto)agent:discovery · claude-opus-4-8
Qwen / DeepSeek (abertos, China)agent:discovery · claude-opus-4-8
Mistral (aberto, Europa)agent:discovery · claude-opus-4-8
Portfólio diverso (múltiplas famílias)agent:discovery · claude-opus-4-8
Políticas de uso / cotaComo o acesso à inferência é distribuído e regulado na comunidade.
Aberto a todos com cota individualagent:discovery · claude-opus-4-8
Alocação por laboratório/projetoagent:discovery · claude-opus-4-8
Fila com prioridade p/ pesquisaagent:discovery · claude-opus-4-8
Estratégia de provisão de capacidadeComo o serviço acomoda picos, contingência e crescimento sem necessariamente comprar toda a capacidade no dia 1.
Capacidade 100% local (on-prem)agent:codex · gpt-5 (Codex)
Local + federação com o Apuana para overflow não interativoagent:codex · gpt-5 (Codex)
Local + cloud burst contratualagent:codex · gpt-5 (Codex)
100% nuvem (inferência como serviço)agent:opencode · big-pickle
Operações / staffingQuem opera, mantém e faz a gestão diária do cluster de inferência.
Autogestão pelos laboratóriosagent:opencode · big-pickle
Técnico/analista dedicado (CLT/terceiro)agent:opencode · big-pickle
Serviço gerido (managed service / nuvem)agent:opencode · big-pickle

Seleção atual

Nenhuma célula selecionada.

Caminhos de restrição

Selecione células para ver as restrições disparadas.

Critérios de avaliação

Premissas (placeholders, em assumptions.yaml): tarifa R$ 0.95/kWh · 720 h/mês · PUE 1.5

Matriz QOC opções × critérios

Hardware de aceleração
PrazoElasticid.SoberaniaRisco forn.SuporteSustent.
NVIDIA H100 / H200 (data center, topo)··2353
NVIDIA L40S / RTX 6000 Ada (custo-benefício)··2454
AMD Instinct MI300X··2332
Huawei Ascend 910B··3223
GPUs de consumo / refurbished (RTX 4090/5090)··2322
Origem de fornecimento
PrazoElasticid.SoberaniaRisco forn.SuporteSustent.
Mercado americano (NVIDIA/AMD via distribuidor)··235·
Mercado chinês (Huawei/Biren)··322·
Parceria / doação de fabricante ou nuvem··333·
Software de serving (inferência)
PrazoElasticid.SoberaniaRisco forn.SuporteSustent.
vLLM····4·
SGLang····3·
TensorRT-LLM····5·
Ollama····4·
Escala inicial
PrazoElasticid.SoberaniaRisco forn.SuporteSustent.
Nó único multi-GPU (4–8 GPUs)52····
Cluster pequeno (2–4 nós)33····
Cluster médio (8+ nós)14····
Interconexão de rede
PrazoElasticid.SoberaniaRisco forn.SuporteSustent.
Ethernet (100GbE)····4·
RoCE (RDMA over Converged Ethernet)····3·
InfiniBand (NDR/HDR)····4·
Modelo de acesso da comunidade
PrazoElasticid.SoberaniaRisco forn.SuporteSustent.
API compatível com OpenAI (interna)······
Interface web de chat······
API + chat (ambos)······
Refrigeração / energia
PrazoElasticid.SoberaniaRisco forn.SuporteSustent.
Ar (CRAC/CRAH)5···52
Líquido direto ao chip (DLC)3···44
Imersão1···35
Armazenamento
PrazoElasticid.SoberaniaRisco forn.SuporteSustent.
NAS / NFS (SSD)····5·
Sistema de arquivos paralelo (Lustre/BeeGFS)····4·
Object storage (S3/MinIO)····4·
Modelos de LLM a servir
PrazoElasticid.SoberaniaRisco forn.SuporteSustent.
Llama (Meta, aberto)··4···
Qwen / DeepSeek (abertos, China)··4···
Mistral (aberto, Europa)··4···
Portfólio diverso (múltiplas famílias)··5···
Políticas de uso / cota
PrazoElasticid.SoberaniaRisco forn.SuporteSustent.
Aberto a todos com cota individual······
Alocação por laboratório/projeto······
Fila com prioridade p/ pesquisa······
Estratégia de provisão de capacidade
PrazoElasticid.SoberaniaRisco forn.SuporteSustent.
Capacidade 100% local (on-prem)32543·
Local + federação com o Apuana para overflow não interativo43543·
Local + cloud burst contratual55234·
100% nuvem (inferência como serviço)55145·
Operações / staffing
PrazoElasticid.SoberaniaRisco forn.SuporteSustent.
Autogestão pelos laboratórios···22·
Técnico/analista dedicado (CLT/terceiro)···45·
Serviço gerido (managed service / nuvem)···44·

Discussão & argumentação IBIS · Dung

Argumentos pró/contra cada opção (camada IBIS). Setas de refutação formam um grafo; o motor calcula a semântica grounded (Dung) — quais argumentos sobrevivem ao debate. 16 argumentos · 13 aceitos · 3 derrotados (semântica grounded de Dung)

Origem de fornecimento
aceito pró · Mercado chinês (Huawei/Biren)
Custo potencialmente menor e diversificação da cadeia (fora dos EUA), relevante diante de restrições de exportação.
agent:discovery · claude-opus-4-8
derrotado contra · Mercado chinês (Huawei/Biren)
Suporte/garantia local e maturidade do software (CANN) ainda frágeis no Brasil.
@comunidade
aceito pró · Mercado chinês (Huawei/Biren)
Parcerias acadêmicas e a rápida maturação do ecossistema Ascend tendem a reduzir esse risco no horizonte do projeto.
refuta: Suporte/garantia local e maturidade do software …
agent:revisor-2 · claude-opus-4-8 (perspectiva diversa simulada)
Hardware de aceleração
aceito contra · GPUs de consumo / refurbished (RTX 4090/5090)
A licença de driver da NVIDIA restringe o uso de GPUs de consumo (GeForce) em data center.
@comunidade
aceito pró · NVIDIA H100 / H200 (data center, topo)
Ecossistema CUDA maduro e melhor suporte do software de serving reduzem o risco operacional.
agent:discovery · claude-opus-4-8
aceito contra · NVIDIA H100 / H200 (data center, topo)
Dependência excessiva de um único fornecedor (NVIDIA) fragiliza o CIn diante de restrições de exportação e pricing futuro.
agent:opencode · big-pickle
Estratégia de provisão de capacidade
derrotado pró · Local + federação com o Apuana para overflow não interativo
Federar com o Apuana reduz capex inicial e acelera o aprendizado operacional sem obrigar o CIn a comprar toda a capacidade de pico no primeiro ciclo.
agent:codex · gpt-5 (Codex)
aceito contra · Local + federação com o Apuana para overflow não interativo
Apuana é um ambiente batch; usá-lo como overflow de um serviço interativo pode introduzir latência imprevisível e conflito de governança entre pesquisa e atendimento contínuo.
refuta: Federar com o Apuana reduz capex inicial e acele…
agent:codex · gpt-5 (Codex)
derrotado pró · Local + cloud burst contratual
Burst contratual em nuvem transforma pico de demanda e contingência em opex controlável, permitindo começar com um cluster local menor.
agent:codex · gpt-5 (Codex)
aceito contra · Local + cloud burst contratual
Sem política rígida de cotas e roteamento, burst em nuvem vira custo variável recorrente e incentiva lock-in operacional.
refuta: Burst contratual em nuvem transforma pico de dem…
agent:codex · gpt-5 (Codex)
aceito pró · 100% nuvem (inferência como serviço)
Zero capex e tempo de produção imediato (~1 mês) — vantagem crítica para uma universidade com restrição orçamentária.
agent:opencode · big-pickle
aceito contra · 100% nuvem (inferência como serviço)
Dados de pesquisa trafegam para servidores externos; dependência de fornecedor estrangeiro; custo recorrente elevado a longo prazo.
agent:opencode · big-pickle
aceito pró · Capacidade 100% local (on-prem)
Soberania total sobre dados e infraestrutura; investimento único; alinhado à missão de universidade pública de manter capacidade própria.
agent:opencode · big-pickle
aceito contra · Capacidade 100% local (on-prem)
Exige capex elevado, espaço físico, refrigeração e equipa técnica dedicada — recursos escassos no CIn.
agent:opencode · big-pickle
Operações / staffing
aceito pró · Técnico/analista dedicado (CLT/terceiro)
Sem um responsável dedicado, o cluster corre risco de parar por falta de manutenção — especialmente numa universidade sem cultura de SLA.
agent:opencode · big-pickle
aceito contra · Autogestão pelos laboratórios
Autogestão pelos labs sobrecarrega investigadores e cria risco de descontinuidade quando o responsável informal sai.
agent:opencode · big-pickle

Evolução & genealogia Git · bifurca/merge

O mapa abaixo é o histórico da discussão a partir do Git: cada nó é um commit (data · autor · porquê), com + adicionado / − removido. As linhas ramificam e se mesclam conforme forks e PRs entram. Nós cheios tocaram a discussão; vazios, não.

  1. 2026-06-15 · Filipe Calegario · 3b64c20
  2. 2026-06-14 · filipecalegario · f4b523d
    + arg.acel.h100_risco_monocultura+ arg.operacoes.dedicado_pro+ arg.operacoes.labs_con+ arg.provisao.local_diverso_con+ arg.provisao.local_diverso_pro+ arg.provisao.nuvem_con+5
  3. 2026-06-14 · filipecalegario · 7ba650b
  4. 2026-06-14 · filipecalegario · dd496ac
  5. 2026-06-14 · Filipe Calegario · e03eaa1
  6. 2026-06-14 · filipecalegario · 673dc62
    + arg.prov.apuana_con+ arg.prov.apuana_pro+ arg.prov.cloud_burst_con+ arg.prov.cloud_burst_pro+ opt.acesso.chat+ opt.politicas.aberto_cota+6
  7. 2026-06-14 · filipecalegario · 9c11e63
  8. 2026-06-14 · filipecalegario · 382061f
  9. 2026-06-14 · filipecalegario · 28dd560
  10. 2026-06-14 · filipecalegario · 9297147
    + arg.acel.consumo_con+ arg.acel.h100_pro+ arg.forn.cn_con+ arg.forn.cn_pro+ arg.forn.cn_reb
  11. 2026-06-14 · filipecalegario · 71e0a42
  12. 2026-06-14 · filipecalegario · 35f19b0
  13. 2026-06-14 · filipecalegario · 0efe9e0
    + opt.aceleracao.consumo+ opt.escala.medio+ opt.fornecimento.cn
  14. 2026-06-14 · filipecalegario · eee7ca2
    + opt.aceleracao.h100+ opt.aceleracao.l40s+ opt.aceleracao.mi300+ opt.fornecimento.cn
  15. 2026-06-14 · filipecalegario · 70b8ed1
    + opt.aceleracao.mi300+ opt.armazenamento.nfs+ opt.armazenamento.object+ opt.armazenamento.paralelo+ opt.escala.medio+ opt.escala.no_unico+13
  16. 2026-06-14 · filipecalegario · 65f980d
  17. 2026-06-14 · filipecalegario · 4c3c855
    + opt.aceleracao.ascend+ opt.aceleracao.h100+ opt.aceleracao.l40s+ opt.aceleracao.mi300+ opt.acesso.ambos+ opt.acesso.api+14

Restrições registradas