lunes, 3 de febrero de 2014

Introducción al Big Data - Conociendo a Hadoop

   Hadoop está en todos lados y se ha convertido en sinónimo de Big Data, tanto que se ha convertido en un estándar de facto, tanto que todos los productos con cabida en el mundo Big Data son compatibles.
 
Cursos y documentación
   Tras la búsqueda de información sobre como iniciarse en el mundo del Big Data y Hadoop, recomiendo los siguientes enlaces y libros:
 
>> http://bigdatauniversity.com: Pagina web que recoge múltiples recursos, tutoriales y cursos relacionados con el mundo del big data. 
 
   He realizado el curso online gratuito titulado "Hadoop Fundamentals I - v2", pensado para usuarios que se inician en Hadoop. Me ha parecido muy claro y conciso para iniciarse y comprender los aspectos básicos de HDFS y Mapreduce, así como en las tecnologías/lenguajes de programación de alto nivel (abstracción de Mapreduce) Pig, Hive y Jaql. 
   Está estructurado en 6 lecciones, cada una con diversos vídeos (se incluye la transcripción de los vídeos en PDF), incluyendo prácticas de laboratorio en algunas lecciones utilizando el software IBM InfoSphere BigInsights como distribución de Hadoop (se incluyen imágenes de VMware  con un sistema linux con el software ya instalado y configurado). Al final del curso existe un test de conocimientos, mandándote un certificado a través de mail si lo apruebas. 

 >> Libro:  Hadoop: The definitive guide (3rd edition), es uno de los libros más recomendados, donde se explica con gran lujo de detalles y de una manera muy práctica el sistema Hadoop y a buena parte del ecosistema que se ha formado a su alrededor.



Diversas distribuciones
   Hadoop consiste en una familia de productos y tecnologías de fuente abierta supervisada por la Apache Software Foundation o ASF.  La librería de software de fuente abierta de Apache Hadoop también se puede solicitar a ASF en apache.org. Los usuarios que deseen un paquete más preparado para las compañías pueden recurrir a algunos fabricantes que ya ofrecen distribuciones de Hadoop que incluyen herramientas administrativas, mantenimiento y asistencia técnica adicionales. Algunos fabricantes ofrecen sus propias implementaciones de MapReduce que no están basadas en Hadoop.

No hay comentarios:

Publicar un comentario