Capítulo 1 · Qué es Codex · Academia de IA ConectaNex

El agente de coding de OpenAI: las 6 superficies, por qué se le dice agente y no asistente, mi primer Codex en 5 minutos y los errores típicos al arrancar.

Este capítulo es gratis. Los siguientes 24 + los 5 apéndices se desbloquean con la compra de la guía.

Cuando hoy escuchás “Codex” no se está hablando del modelo viejo de 2021 — aquel que entrenó la primera versión de GitHub Copilot y que OpenAI ya retiró. El Codex actual es algo distinto: el agente de coding de OpenAI. Un sistema que recibe una tarea en lenguaje natural y la lleva a cabo dentro de tu código — abre archivos, los modifica, corre comandos, ejecuta tests y, si tú lo apruebas, abre un Pull Request — sin que tengas que ir copiando código en cada paso.

Esto cambia bastante cómo se siente programar.

La diferencia que importa: asistente vs agente

Un asistente tradicional (Copilot clásico, ChatGPT con código pegado, Tabnine) sugiere. Tú escribes, él autocompleta o propone, tú copiás. La iniciativa, la lleva el humano.

Un agente como Codex ejecuta. Le dices:

“Agrega Stripe Checkout a la página de planes. Necesito un endpoint POST /api/checkout que cree la sesión, un botón en /planes que la dispare, y un test que cubra el flujo de éxito. Mantén el estilo del resto del repo.”

Y Codex hace algo parecido a esto:

Lee tu repo para entender la estructura: cómo se organizan los endpoints, qué framework usas, dónde están los tests.
Plantea un plan (“voy a tocar estos 4 archivos en este orden”).
Te pide aprobación (según el modo configurado — auto, ask, manual).
Edita los archivos y crea los nuevos.
Corre el lint y los tests para verificar que no rompió nada.
Te muestra el diff o, en Cloud, directamente abre el PR.

Ese cambio de iniciativa es lo que justifica la palabra agente. No es “un Copilot mejor”. Es otra clase de herramienta. Tu papel pasa de tipear código a escribir tareas claras y revisar diffs.

Las 6 superficies donde vive

Codex no es una sola app: vive en seis lugares y todos comparten la misma cuenta, las mismas tareas y los mismos archivos recientes. Cada superficie sirve para algo distinto:

#	Superficie	Para qué brilla
1	Desktop (app ChatGPT macOS/Windows)	Tu centro de tareas en el día a día. Atajos, panel lateral, screenshot tool.
2	Móvil (iOS/Android)	Aprobar PRs y revisar diffs cuando no estás en la laptop.
3	Web (`chatgpt.com/codex`)	Torre de control: dashboard de tasks, repos conectados, diff viewer.
4	Codex Cloud	Sandbox en la nube de OpenAI para tareas largas (refactors de mil archivos, migraciones). Lo lanzas, te vas a dormir, te despertás con el PR.
5	IDE (VS Code, Cursor, JetBrains)	Sugerencias inline + chat lateral dentro de tu editor.
6	CLI (`codex`)	Terminal, scripteable, ideal para CI y servidores.

Todas leen los mismos archivos de configuración (especialmente AGENTS.md) y se sincronizan casi en tiempo real: una task que lanzas desde el desktop aparece al toque en el móvil.

Lo que NO es Codex

Tres confusiones típicas:

No es el modelo de 2021. Aquel modelo se llamaba “Codex” y entrenó Copilot. Está retirado. Si encuentras documentación que habla de “Codex API” con endpoints como code-davinci-002, es contenido viejo. No mezclar.
No es Copilot. Copilot vive dentro del editor y se enfoca en autocompletar línea por línea. Codex está pensado para tareas que requieren leer varios archivos antes de tocar uno. Puedes usar Copilot y Codex juntos (uno para inline, otro para chat/tasks), pero no son el mismo producto.
No es solo ChatGPT con código. ChatGPT (sin el panel de Codex) puede explicar código que le pegues, pero no ejecuta nada en tu repo ni abre PRs. Codex sí.

Tu primer Codex en 5 minutos

Si todavía no lo instalaste, haz esto:

Baja la app de ChatGPT (chatgpt.com/download) si estás en macOS o Windows. Inicia sesión.
Si ya tienes ChatGPT Plus, Pro, Team o Enterprise, Codex aparece en el panel lateral.
Abre una carpeta con un repo simple (cualquier proyecto tuyo sirve; si no, clona uno cualquiera).
En el panel de Codex toca Nuevo task y escribe:

“Genera un README.md para este proyecto con: descripción corta, stack usado, cómo correr en local, cómo correr los tests, y una nota de licencia MIT. Si ya existe un README, mejoralo sin perder la información que ya tenga.”
Elige modo de aprobación: ask (te pregunta antes de cambiar nada).
Lanzar.

Codex va a:

Leer la estructura del repo.
Detectar el lenguaje y framework.
Proponer un README.
Pedirte aprobación.
Si dices sí, escribir/sobrescribir el archivo.

Listo. Acabás de hacer tu primera task. Si te animás, prueba con algo más útil: “agrega tests al archivo X” o “convierte esta función de promesas a async/await”.

Cuándo conviene Codex

Codex rinde cuando la tarea cumple al menos uno de estos requisitos:

Toca más de un archivo.
Tiene un criterio claro (“acepta este input, devuelve este output”, “el test debe pasar”).
Es mecánica y repetitiva (“convierte estas 80 clases a hooks”).
Es setup rutinario (“agrégale a este repo ESLint + Prettier + GitHub Actions + README”).
Es triage de bug con un repro claro (“falla cuando…”).

Cuándo todavía conviene el humano

Estas son las áreas donde, en mayo de 2026, Codex pifia más:

Arquitectura nueva sin contexto previo: pídele primero un plan, no que ejecute. La arquitectura es taste, no patrón.
Estado vivo difícil de simular: race conditions, memory leaks bajo carga, problemas intermitentes. Codex no carga producción.
Diseño visual fino y CSS de cascada: las herramientas visuales (Figma, Cursor con screenshot) siguen siendo mejores.
Cualquier cosa que toque producción sin sandbox: aunque Codex sea capaz, no le des esa responsabilidad. Probar siempre en preview.

El error típico cuando arrancas

El error #1 de quien recién empieza con Codex: pedirle tareas vagas.

❌ “mejora este código” ❌ “haz que esto vaya más rápido” ❌ “agrega tests”

Esas tareas devuelven diffs caóticos: Codex toca lo que “le parece” y tú terminás revisando 30 archivos sin saber qué busca. La calidad del output es directamente proporcional a la claridad de la task.

✅ “Refactor auth.service.ts: extrae la lógica de validación de tokens a una función pura llamada verificarToken(token). Mantén la misma firma pública del módulo. Asegúrate de que los tests existentes pasen.”

Sé específico sobre qué tocar, qué no tocar, cómo medir el éxito y qué dejar pasar.

La idea base

Si te quedas con una sola cosa de este capítulo, que sea esta:

Codex no es “magia que escribe código”. Es un ciclo de tarea → plan → ejecución → revisión. Tu papel cambia de tipear todo a escribir tareas claras y revisar diffs.

El resto de la guía te enseña a hacer ese ciclo:

Rápido — atajos, workflows, móvil, integración con tus herramientas.
Seguro — sandboxes, modos de aprobación, secrets, RLS de tus datos.
Barato en costo de tokens — modelos correctos por tarea, AGENTS.md afinado, sin desperdicio.

Siguiente paso

En el capítulo 2 comparamos Codex con Claude Code (el agente de Anthropic) — superficie por superficie, modelo por modelo, sin marketing. Si ya pagas uno de los dos planes, esa comparación te ayuda a decidir si conviene sumar o reemplazar.

Compra la guía para desbloquear los 24 capítulos restantes + los 5 apéndices de referencia. Acceso permanente con tu cuenta, actualizaciones gratis cuando Codex cambia (y cambia seguido).