Open Source Hadoop para la gestión de Big Data

Tecnologias de Software Libre

El análisis de Big Data se ha disparado en el escenario de negocios en los últimos 12 meses más o menos, y una de las más grandes plataformas de análisis de Big Data es el proyecto de código abierto Apache Hadoop. Generalmente corre en Linux y es usado por grandes compañías, incluyendo a Yahoo, Facebook y Twitter.

Plataforma de Datos Hortonworks (HDP) para Windows

Lo que está a punto de cambiar en los próximos meses es que Hadoop está llegando a Windows en la forma de Hortonworks Data Platform (HDP) para Windows, una distribución de Hadoop de código abierto totalmente soportada que corre en Windows Server. Horton, una compañía establecida en California, es patrocinador y contribuyente del proyecto Apache Hadoop, y ya ofrece su distribución HDP basada en Linux en forma comercial. Esto abrirá Hadoop a un gran número de organizaciones que no tienen en casa las habilidades de Linux. Shaun Connolly, vicepresidente de Estrategia Corporativa de Hortonworks, explica el pensamiento detrás del movimiento de HDP hacia Windows de esta manera: "En esencia, se trata de una decisión impulsada por el mercado", señala. "Hadoop se ha creado para el crecimiento del mercado de hardware de commodity, y este mercado es de 70% Windows, según la base instalada y según el expertise".

Las compañías que solo tienen empleados en Windows podrán hacer uso de Hadoop fácilmente porque Excel se puede utilizar como una herramienta de inteligencia de negocios para ver los resultados de Hadoop de análisis de Big Data (aunque Hadoop se esté ejecutando en Windows o Linux). "De manera ideal queremos que los usuarios de Microsoft sean ajenos al hecho de que todo viene de Hadoop”, señala Connolly. “Si los usuarios finales pueden consumir datos sin ninguna curva de aprendizaje, gracias a herramientas como Excel, entonces obtendrán mayor valor”.

Los departamentos de Windows también podrán beneficiarse de Hadoop en Windows, ya que el personal con las habilidades de Windows, será capaz de escribir aplicaciones utilizando Hadoop VisualStudio de Microsoft y el framework .Net, sin necesidad de ningún conocimiento Linux. (Dicho sea de paso, ambas ofertas de Windows de Hortonworks y de Microsoft son 100% Apache Hadoop -no han tenido ajustes al código- así que cualquier app de Linux Hadoop puede ser fácilmente llevada a Windows, señala Connolly).

Pero resulta que el HDP para Windows no es la única manera de que Hadoop está llegando a Windows. Microsoft ha estado trabajando tras bambalinas con Hortonworks desde finales del 2011, y el gigante de Redmond está a punto de lanzar su propia distribución de Hadoop que llama HDInsight. Esta estará disponible como un servicio que se ejecute en la nube de Azure de la compañía, o como un producto que está destinado a ser utilizado como base de una instalación de Hadoop en nube privada on-premise.

Hace una década Microsoft era resueltamente contraria al software de código abierto, e irónicamente, puede ser que su apoyo a Hadoop se derive de esta vieja animosidad, según Wes Miller, analista de Directions on Microsoft. "Creo que parte de la razón por la que Microsoft quiere Hadoop en Windows, es debido a la preocupación acerca de la competencia que plantea Linux", comenta.

Fuente: CIO

Tema Relacionado: Tecnologias de Software Libre