Machine Learning en producción: lo que nadie te cuenta en los tutoriales
Entrenar un modelo es la parte fácil. Llevarlo a producción, mantenerlo y hacerlo confiable es donde la mayoría de los proyectos de ML fracasan.
El 85% de los proyectos de Machine Learning nunca llegan a producción. Los tutoriales te enseñan a entrenar modelos en notebooks, pero la realidad de llevar eso a un sistema que procesa millones de requests diarios es completamente diferente.
El problema del data drift
Un modelo entrenado hoy con datos de hoy empieza a degradarse mañana. El mundo cambia, el comportamiento de los usuarios cambia, y tu modelo no lo sabe. Sin monitoreo de drift, tu modelo puede estar tomando decisiones pésimas sin que nadie se entere.
Stack mínimo para ML en producción
Feature store, model registry, pipeline de reentrenamiento automatizado, monitoreo de métricas de negocio y técnicas, y un proceso claro de rollback. Herramientas: MLflow, DVC, Evidently, y tu proveedor cloud favorito.