Webinar
Eventos ITGLOBAL.COM
Hadoop

Hadoop é uma plataforma de software de código aberto projetada para armazenar e processar grandes quantidades de dados em clusters de computadores. A inspiração para a criação da plataforma foi o MapReduce do Google, uma estrutura de software que divide os aplicativos em muitas partes pequenas, cada uma das quais pode ser iniciada ou reiniciada em qualquer nó do cluster.

A plataforma permite escalar de um servidor para milhares de máquinas, cada uma das quais fornece computação local e armazenamento de dados. O Hadoop usa a replicação de dados para armazenar várias cópias de blocos de dados em nós diferentes, o que permite que os dados sejam restaurados automaticamente em caso de falhas ou perda da disponibilidade do nó.

Os principais componentes do Hadoop

  • Hadoop Distributed File System (HDFS) é um componente do Hadoop projetado para armazenar grandes quantidades de dados e fornecer acesso a eles. O HDFS divide os dados em blocos e os distribui para os nós do cluster, fornecendo tolerância a falhas e processamento paralelo de dados.
  • MapReduce é um modelo de programação e processamento de dados no Hadoop. Ele permite dividir a tarefa de processamento de dados em pequenas partes (map) e, em seguida, coletar os resultados (reduce) em cada nó do cluster.
  • Hadoop YARN é um componente do Hadoop que gerencia os recursos de sistemas que armazenam dados e realizam análises. O YARN permite gerenciar recursos de computação em um cluster e colocar tarefas em nós disponíveis.
  • Hadoop Comum é um módulo do Hadoop que inclui vários utilitários e bibliotecas necessárias para suportar a operação de outros componentes do Hadoop. O Hadoop Common fornece funcionalidade comum para toda a plataforma.
  • Hadoop Streaming é uma abordagem no Hadoop que permite usar qualquer linguagem de programação para escrever tarefas do MapReduce. Ele fornece flexibilidade na escolha da linguagem de programação e simplifica a integração do código existente e a expansão dos recursos do Hadoop.

Comparando o Hadoop com bancos de dados tradicionais
O Hadoop pode armazenar qualquer tipo de dados, estruturados e não estruturados, e escalar para petabytes de dados. Os bancos de dados tradicionais, por outro lado, exigem dados estruturados e têm limitações de armazenamento.

Exemplos de Uso do Hadoop
O Hadoop é utilizado em diversos setores. Por exemplo, plataformas de mídia social como Facebook e Twitter podem usar o Hadoop para armazenar e processar grandes quantidades de dados. Gigantes do comércio eletrônico, como Amazon e Alibaba, usam a plataforma para criar sistemas de recomendação de produtos, detecção de fraudes e pesquisa de clientes.

Usamos cookies para otimizar a funcionalidade do site e aprimorar nossos serviços. Para saber mais, leia nossa Política de Privacidade.
Configurações de cookies
Cookies estritamente necessários
Cookies analíticos