Cómo clasifico mis proyectos: The Scientist Complexity Framework

La mayoría de portafolios muestran qué se construyó. Pocos logran mostrar qué tan complejo es realmente.

Si has construido tanto scripts como aplicaciones completas, sabes que no todos los proyectos pesan lo mismo… pero casi todos los portafolios los muestran igual.

Cuando empecé a armar este portafolio me encontré con ese problema: ¿cómo muestro que un proyecto es complejo sin aburrir a nadie con detalles técnicos? ¿Y cómo evito que un script de 50 líneas parezca igual de relevante que un sistema distribuido?

La respuesta que encontré fue definir un sistema propio. Lo llamo The Scientist Complexity Framework, y lo uso para clasificar todo lo que construyo.

La idea base

La complejidad de un proyecto no es una sola cosa.

Un ETL que procesa millones de filas puede ser arquitectónicamente simple pero brutalmente complejo en datos. Una app puede tener una infraestructura sofisticada pero datos triviales. Reducir todo a una sola dimensión pierde esa información.

Por eso el framework tiene varias capas.

Capa 1 — Nivel base

Es la dimensión jerárquica. Responde a la pregunta: ¿cómo está construido el sistema?

Nivel	Nombre	Qué incluye
🟢 1	Standalone Script	Scripts, notebooks, ETLs simples. Sin deploy, ejecución manual o programada.
🔵 2	Static App	Webs sin backend, dashboards estáticos. Hosting simple (Vercel, Github pages, Netlify).
🟡 3	Backend System	APIs, CRUD apps, base de datos, autenticación simple.
🟠 4	Distributed System	Backend + frontend separados, colas, workers, integraciones externas.
🔴 5	Scalable Platform	Multi-tenant, alta escalabilidad, observabilidad, CI/CD, infraestructura compleja.

La mayoría de mis proyectos personales viven entre nivel 2 y 3. Los proyectos de datos suelen empezar en 1 y crecer hacia 3 o 4 cuando el volumen lo justifica.

Capa 2 — Complexity Breakdown

Aquí es donde el sistema se vuelve realmente útil.

Son cuatro dimensiones independientes, cada una en escala de 1 a 5:

1 → nulo o mínimo
2 → básico
3 → moderado
4 → avanzado
5 → experto / máximo

🧱 Architecture

¿Qué tan bien diseñado está el código internamente? Separación de responsabilidades, modularidad, uso de patrones.

1 — Sin estructura: código lineal, todo en un mismo lugar
2 — Estructura básica: funciones o módulos simples, algo de organización
3 — Diseño deliberado: capas claras, separación de responsabilidades, código reutilizable
4 — Arquitectura avanzada: patrones de diseño formales, alta cohesión, bajo acoplamiento
5 — Arquitectura de referencia: DDD, hexagonal o event-driven, documentada y extensible a escala

📊 Data

¿Qué tan complejo es el origen, transformación y uso de los datos?

1 — Sin datos relevantes: lógica pura, sin persistencia ni procesamiento
2 — Datos simples: CRUD básico, datasets pequeños, sin transformaciones significativas
3 — Transformaciones moderadas: múltiples fuentes, limpieza, joins, agregaciones
4 — Pipelines complejos: alto volumen, orquestación, calidad de datos, linaje o múltiples destinos
5 — Plataforma de datos: data warehouse, streaming, SLAs de calidad y observabilidad completa

⚙️ Infrastructure

¿Qué tan complejo es el deploy, la operación y el mantenimiento del sistema?

1 — Sin deploy: corre local o en un notebook, no hay nada que operar
2 — Deploy simple: hosting estático o serverless básico, configuración mínima
3 — Cloud con configuración: Docker, servicios gestionados, variables de entorno, algo de CI/CD
4 — Infraestructura avanzada: múltiples entornos, autoscaling, monitoreo, pipelines de deploy robustos
5 — Infraestructura de producción: IaC, disaster recovery, SLOs y observabilidad full-stack

🤖 AI / Agentes

¿Qué tan integrada y sofisticada es la componente de inteligencia artificial o agentes autónomos? Cubre ML clásico, LLMs, agentes y sistemas de razonamiento.

1 — Sin IA: el sistema no usa ningún componente de inteligencia artificial, ML o agentes
2 — Uso puntual: LLM via API, modelo preentrenado o agente simple, sin integración profunda en la lógica
3 — IA integrada: LLM, modelo o agente como parte central del sistema; prompts, chains, razonamiento o inferencia en producción
4 — Sistema de IA completo: agentes autónomos con memoria, RAG, pipelines de entrenamiento o fine-tuning, orquestación de múltiples modelos
5 — Plataforma de IA avanzada: multi-agente coordinado, reentrenamiento automático, A/B testing de modelos, evaluación de razonamiento y monitoreo de drift

Capa adicional — Complexity Flags

Además del nivel y las dimensiones, utilizo flags para marcar características específicas del sistema.

Algunos ejemplos:

🤖 AI/ML
📊 Data-Intensive
⚡ Realtime
📱 Multiplatform
🔐 Auth/Security
☁️ Cloud-Native

Los flags no cambian el nivel base, pero ayudan a entender rápidamente el tipo de sistema.

Ejemplo

Campaign ETL

Nivel 1 — Standalone Script
Data: 4 · Infrastructure: 1 · AI: 1

Es un sistema arquitectónicamente simple, pero con complejidad significativa en procesamiento de datos.

Por qué funciona (para mí)

Lo que me gusta de este sistema es que dos proyectos con el mismo nivel base pueden ser completamente distintos.

Un pipeline de datos puede ser nivel 1 pero tener una complejidad alta en Data. Una aplicación backend puede ser nivel 3, pero si incorpora modelos de ML cambia completamente su naturaleza.

También me obliga a ser honesto. No puedo exagerar la complejidad de algo cuando tengo que justificarlo dimensión por dimensión.

No es un estándar de la industria ni pretende serlo.

Es simplemente la forma en que pienso sobre los sistemas que construyo — y la forma en que decidí mostrarlos.