El procesamiento y análisis de datos en inteligencia artificial requiere plataformas distribuidas capaces de gestionar grandes volúmenes de información. Esta guía práctica ofrece los conceptos clave y las habilidades necesarias para abordar tareas de análisis de datos y aprendizaje automático a gran escala.
«Con la creciente disponibilidad de conjuntos de datos grandes y complejos, dominar modelos de programación como MapReduce y Spark se ha convertido en una habilidad imprescindible para científicos de datos, ingenieros de datos y especialistas en machine learning. Triguero y Galar aprovechan su amplia experiencia docente en este ámbito para ofrecer una obra rigurosa y accesible que aborda tanto los conceptos técnicos como las habilidades prácticas necesarias para el análisis de datos a gran escala. Alternan explicaciones claras e intuitivas con ejemplos relevantes de ingeniería de datos y pipelines clásicos de machine learning, todo ello acompañado de código bien estructurado y el resultado de su ejecución. Este libro no solo muestra cómo aplicar este conocimiento en la práctica hoy en día, sino que también prepara al lector para aplicarlo con éxito en escenarios futuros».-Arun Kumar, Universidad de California, San Diego.