En el último tiempo, muchos científicos de datos se han centrado en crear modelos sobresalientes y descubrir cómo exprimir hasta la última gota de rendimiento de ellos. Sin embargo, muchos se han dado cuenta de que crear modelos de alto rendimiento no equivale necesariamente a que generen valor comercial.; y a menudo, los mejores modelos pueden ser muy complejos y costosos de ejecutar en producción. De hecho, la gran mayoría de los modelos (87%) nunca llegan a la producción según VentureBeat.
Para solucionar este problema es que nace Machine Learning Operations. MLOps, por sus siglas en inglés, es la práctica que garantiza que los modelos creados por el equipo de ciencia de datos se implementen en producción. Así, este es el término general que encapsula las tecnologías que automatizan la administración, implementación, monitoreo y alertas de los modelos de Machine Learning: el equipo de ciencia de datos lo crea y MLOps garantiza que la infraestructura de nivel de producción esté ahí para ejecutarlo.
¿Por qué las empresas deben pensar en MLOps?
1. Valor Comercial
Los modelos no desplegados son inútiles. De hecho, son peor que inútiles; el tiempo y el dinero invertidos en el desarrollo de soluciones impulsadas por Inteligencia Artificial (IA) están destinados a generar un valor comercial tangible, y la única forma de hacerlo es implementando en producción. Al proporcionar un marco y las herramientas para implementar sus modelos, MLOps garantiza que se materialice el valor comercial de un modelo.
2. Equipos motivados
Un equipo de ciencia de datos que dedica su tiempo a crear modelos que nunca se implementan se fatigará y desmotivará rápidamente. Por el contrario, un equipo que implemente constantemente nuevos modelos verá su impacto en todo el negocio y estará entusiasmado y motivado para aprovechar sus resultados. Gracias a este circuito de retroalimentación positiva, es altamente probable que quieran permanecer en la empresa por más tiempo y sentirse inspirados para experimentar y ser creativos. Todos estos, son motivadores clave en el mercado competitivo para los mejores talentos en ciencia de datos. Esta creatividad puede conducir a soluciones innovadoras con las que otros equipos no podrían soñar.
3. Menos tiempo perdido
A menudo, los equipos de ciencia de datos pasan días construyendo modelos solo para que el equipo de operaciones les diga que la solución no es factible. Esta situación es una pérdida para ambos equipos y puede ser motivo de mucha frustración. Sin embargo, tener una función MLOps sólida da como resultado más modelos en producción; esto le brinda al equipo de ciencia de datos más experiencias de referencia sobre qué modelos se pueden y no se pueden implementar. Luego, el equipo de ciencia de datos puede usar este conocimiento para dedicar más tiempo a proyectos que tienen una alta probabilidad de implementarse y reducir el tiempo dedicado a modelos que nunca funcionarán en producción.
Además, sin MLOps, el equipo de Data Science tendría que implementar y mantener sus modelos manualmente cada mes. Este trabajo es rutinario, requiere mucho tiempo y no produce los nuevos modelos que realmente hacen avanzar el negocio. Afortunadamente, con MLOps, su equipo puede automatizar la mayor parte de este tedioso trabajo, lo que genera un ahorro sustancial de tiempo y mantiene a su equipo de ciencia de datos enfocado en un trabajo atractivo y de alto valor.
4. Flujos de trabajo rápidos y repetibles
Los ingenieros de ML no pueden saber completamente qué tan bien funciona un modelo o qué tipo de datos verán en producción hasta que el modelo esté realmente en producción. Usan varias técnicas para estimar y reducir el riesgo de desarrollar soluciones de mala calidad, pero la única forma en que realmente pueden saberlo es una vez que se ha implementado el modelo.
Puede ser un proceso arduo volver a entrenar un modelo implementado. Sin embargo, un proceso MLOps eficiente sabe que querrá volver a entrenar sus modelos en unos pocos días/semanas/meses de todos modos. Por lo tanto, implementa flujos de trabajo rápidos y repetibles que le permiten tener en cuenta la desviación del modelo o volver a entrenar completamente un modelo con datos nuevos.
La implementación de tales prácticas ha sido un cuello de botella para los equipos de ciencia de datos durante mucho tiempo, y solo recientemente han aparecido herramientas en el mercado para hacer esto. Estos procesos de Integración Continua/Despliegue Continuo (CI/CD) y Flujos de Trabajo de Aprobación de Modelos están dando resultados muy positivos, y podemos esperar verlos implementados cada vez más.
5. Ventaja competitiva
Sin duda, entrenar modelos de alta calidad sigue siendo una tarea difícil, pero se ha vuelto significativamente más sencilla en los últimos años. Además, gracias a herramientas como AI Cloud de H2O, puede automatizar la mayor parte del trabajo. Sin embargo, en el futuro, las empresas que superen a la competencia serán aquellas que constantemente pongan sus modelos en producción, entregando predicciones de primer nivel. Esta ventaja solo estará disponible para los equipos con una función MLOps excepcional.
Conclusión
Estas son sólo algunas de las principales razones de alto nivel por las que una empresa debería pensar en MLOps ahora. A la fecha de ésta publicación, se han logrado grandes avances en esta área en los últimos años en Chile y LATAM, y todas las empresas pueden lograr una función MLOps de primera clase. Con ello, se da lugar a más modelos en producción que ofrecen un valor constante para el negocio, generando valor comercial y una ventaja competitiva.