Modelo Base
Target HumanEval
pass@1
Benchmark CTF
Council
0 / 9
modelos respondidos
Fases
0 / 8
completadas
Checklist
0 / 0
tareas completadas
Hardware
GPU PrincipalKaggle P100 16GB
GPU SecundariaT4 × 2 (32GB)
CPU InferenciaOracle Cloud Free
Presupuesto$0 USD
Modelo & Targets
Base ModelQwen2.5-Coder-7B
Quantización baseQ4_0 (6.3GB)
Target HumanEval>95.5%
Target CTF300 casos
Dataset Total
Piloto50 ejemplos
SFT Destilación10,000 ejemplos
Ciberseg LATAM4,000 ejemplos
DPO Preferencias1,000 pares
Tiempo Estimado
F1 Piloto~12 min
F2 SFT~4-5 h
F3 GRPO~8 h
Total estimado~35 h
🎯 Diseño del Reward Signal
Código ejecuta sin error
+1.0
CVE detectado correctamente
+1.2
Código con error de ejecución
-0.8
False positive en CVE
-0.6
Timeout (>30s)
-0.5
🏗️
Etapa 1 — Fundamentos
Arquitectura y preparación
Council de 9 modelos consultado
Abr 2026
Arquitectura 8 fases definida
Abr 2026
Dashboard NEXUS-7 en línea
Abr 2026
Modelo base seleccionado y configurado
En curso
🧪
Etapa 2 — Entrenamiento
Fases 1-4: Base + Razonamiento
F1: Pipeline validado con 50 ejemplos piloto
P100 · ~12 min
F2: SFT con 10K ejemplos + thinking traces
P100 · ~4-5h
F3: GRPO con sandbox de ejecución real
T4×2 · ~8h
F4: Self-play adversarial ataque/defensa
T4×2 · ~5h
🛡️
Etapa 3 — Especialización
Fases 5-7: Dominio ciberseguridad
F5: 4K ejemplos MITRE + Ley 19.223 + CTF
P100 · ~3h
F6: Constitutional AI — self-critique loops
T4 · ~4h
F7: DPO/SimPO con 1K pares de preferencia
P100 · ~1.5h
Benchmark CTF chileno — 300 casos
Validación
🚀
Etapa 4 — Deployment
Fase 8: Producción y escala
F8: Cuantización GGUF Q5_K_M (~5.1GB)
llama.cpp
Deploy Ollama en Oracle Cloud Free
$0/mes
HumanEval pass@1 >95.5% validado
Benchmark
Inferencia ~20 tok/s en CPU
Producción
🌎
Etapa 5 — Escala LATAM
Modelo 2: Ciberseg LATAM completo
Fine-tune sobre NEXUS-7 v1 finalizado
Pendiente F8
Dataset CVEs regionales expandido
Chile + LATAM
Benchmark 300 casos CTF >95%
Target
Primer LLM ciberseg defensiva Chile
Hito histórico
💼
Etapa 6 — AdamGráfica IA
Modelo 3: Marketing LATAM
Qwen2.5-7B-Instruct base (no coder)
Pausado
Dataset marketing digital LATAM
Por construir
Integración con operación AdamGráfica
95% IA
Retoma después de Modelo 1 completo
Planificado
⚡ FLUJO DE TRABAJO — 6 PASOS
1️⃣ Copia prompt
2️⃣ Pega al modelo
3️⃣ Copia respuesta
4️⃣ Pega aquí abajo
5️⃣ Repite ×9
6️⃣ Chairman sintetiza
💡 Orden estratégico: Empieza por DeepSeek (ya lo hicieron con $0) → Qwen (dueños del modelo base) → Grok (crítico brutal) → Kimi (MoE+thinking) → GLM (perspectiva China) → Gemini (infraestructura) → GPT (arquitectura) → Muse (open-source) → Claude (síntesis). Luego pega todo en Perplexity para el veredicto del Chairman.
🎯 Orden estratégico — quién consultar primero y por qué
Progreso general
0 / 0 completadas