La tecnolog铆a progresa sin cesar y con ella proliferan los dispositivos conectados a la red, lo que hace que cada vez generemos y almacenemos cantidades m谩s ingentes de datos. En este contexto se est谩 produciendo un crecimiento espectacular en la diversidad de formatos de datos e informaci贸n, tambi茅n llamados Big Data.
Y es que, sencillamente, si una empresa no es capaz de manejar cantidades enormes de datos con eficacia y aprovechando esa informaci贸n para mejorar, esto se traducir谩 en p茅rdida de productividad, de oportunidades y de beneficios. Existen muchas tecnolog铆as destinadas a procesar y analizar grandes cantidades de informaci贸n. Pero cuando Apache Hadoop entr贸 en escena, todo cambi贸: por fin es posible escribir programas con facilidad y llevar a cabo an谩lisis de datos a gran escala.
Este libro explica c贸mo trabajan juntas las numerosas partes del ecosistema Hadoop y c贸mo se pueden utilizar para construir soluciones adaptadas a la empresa. Aprender谩 c贸mo realizar el dise帽o de datos y su impacto en la implementaci贸n, al mismo tiempo que ver谩 c贸mo funciona MapReduce y c贸mo reformular problemas concretos. Encontrar谩 ejemplos detallados de c贸digo Java que puede utilizar, derivados de aplicaciones que han sido construidas e implantadas con 茅xito.