NEXUS-7 Dashboard

Modelo Base

—

Target HumanEval

—

pass@1

Benchmark CTF

—

Council

0 / 9

modelos respondidos

Fases

0 / 8

completadas

Checklist

0 / 0

tareas completadas

Progreso de Fases

Pipeline Completo

Especificaciones Técnicas

Hardware

GPU PrincipalKaggle P100 16GB

GPU SecundariaT4 × 2 (32GB)

CPU InferenciaOracle Cloud Free

Presupuesto$0 USD

Modelo & Targets

Base ModelQwen2.5-Coder-7B

Quantización baseQ4_0 (6.3GB)

Target HumanEval>95.5%

Target CTF300 casos

Dataset Total

Piloto50 ejemplos

SFT Destilación10,000 ejemplos

Ciberseg LATAM4,000 ejemplos

DPO Preferencias1,000 pares

Tiempo Estimado

F1 Piloto~12 min

F2 SFT~4-5 h

F3 GRPO~8 h

Total estimado~35 h

Sistema de Rewards — Fase 3 GRPO

🎯 Diseño del Reward Signal

Código ejecuta sin error

+1.0

CVE detectado correctamente

+1.2

Código con error de ejecución

-0.8

False positive en CVE

-0.6

Timeout (>30s)

-0.5

🏗️

Etapa 1 — Fundamentos

Arquitectura y preparación

Council de 9 modelos consultado

Abr 2026

Arquitectura 8 fases definida

Abr 2026

Dashboard NEXUS-7 en línea

Abr 2026

Modelo base seleccionado y configurado

En curso

🧪

Etapa 2 — Entrenamiento

Fases 1-4: Base + Razonamiento

F1: Pipeline validado con 50 ejemplos piloto

P100 · ~12 min

F2: SFT con 10K ejemplos + thinking traces

P100 · ~4-5h

F3: GRPO con sandbox de ejecución real

T4×2 · ~8h

F4: Self-play adversarial ataque/defensa

T4×2 · ~5h

🛡️

Etapa 3 — Especialización

Fases 5-7: Dominio ciberseguridad

F5: 4K ejemplos MITRE + Ley 19.223 + CTF

P100 · ~3h

F6: Constitutional AI — self-critique loops

T4 · ~4h

F7: DPO/SimPO con 1K pares de preferencia

P100 · ~1.5h

Benchmark CTF chileno — 300 casos

Validación

🚀

Etapa 4 — Deployment

Fase 8: Producción y escala

F8: Cuantización GGUF Q5_K_M (~5.1GB)

llama.cpp

Deploy Ollama en Oracle Cloud Free

$0/mes

HumanEval pass@1 >95.5% validado

Benchmark

Inferencia ~20 tok/s en CPU

Producción

🌎

Etapa 5 — Escala LATAM

Modelo 2: Ciberseg LATAM completo

Fine-tune sobre NEXUS-7 v1 finalizado

Pendiente F8

Dataset CVEs regionales expandido

Chile + LATAM

Benchmark 300 casos CTF >95%

Target

Primer LLM ciberseg defensiva Chile

Hito histórico

💼

Etapa 6 — AdamGráfica IA

Modelo 3: Marketing LATAM

Qwen2.5-7B-Instruct base (no coder)

Pausado

Dataset marketing digital LATAM

Por construir

Integración con operación AdamGráfica

95% IA

Retoma después de Modelo 1 completo

Planificado

⚡ FLUJO DE TRABAJO — 6 PASOS

1️⃣ Copia prompt

→

2️⃣ Pega al modelo

→

3️⃣ Copia respuesta

→

4️⃣ Pega aquí abajo

→

5️⃣ Repite ×9

→

6️⃣ Chairman sintetiza

💡 Orden estratégico: Empieza por DeepSeek (ya lo hicieron con $0) → Qwen (dueños del modelo base) → Grok (crítico brutal) → Kimi (MoE+thinking) → GLM (perspectiva China) → Gemini (infraestructura) → GPT (arquitectura) → Muse (open-source) → Claude (síntesis). Luego pega todo en Perplexity para el veredicto del Chairman.

Jerarquía de Consulta

🎯 Orden estratégico — quién consultar primero y por qué

Respuestas del Council

Progreso general

0 / 0 completadas

Dashboard ● ACTIVO

🧠 Mapa de Entrenamiento

🗺️ Etapas del Proyecto

🏛️ Council de Modelos

⚙️ 8 Fases de Entrenamiento

✅ Checklist Operativo

📅 Timeline del Proyecto