quarta-feira, 27 de junho de 2012

Hadoop e suas aplicações.



Quando você pensar em computação distribuída, certamente vai topar com o Hadoop.
Atualmente o Hadoop é o framework de computação distribuída mais usado quando se pensa em Big Data. Muitos desenvolvedores tem a curiosidade de saber em que tipo de problemas o Hadoop pode ser usado. Abaixo algumas aplicações da tecnologia.

Detecção de tendências
Detectar novas tendências rapidamente é necessário para um mundo cada vez mais conectado. Com o twitter e a constante troca de informações o volume de informação cresce a cada segundo.

Sistema de Recomendação
Sistemas de recomendação são parte integrante de muitos dos serviços que usamos. Amazon, Netflix, Last.fm entre outros nos mostram o grande valor que sistemas assim podem gerar.

Detecção de fraudes
É a eterna luta entre gato e rato. Detectar fraudes de maneira rápida é uma tarefa bastante complicada. Com o Hadoop podemos processar quantidades gigantes de dados e perceber tendências imperceptíveis em escala menor.

Customer Churn Analysis (análise de rotatividade de clientes)
Empresas que operam grandes volumes de usuários como as operadoras de telefonia sabem que muitas vezes um único usuário que resolve mudar de operadora acaba levando com ele muitos outros. Analisar os padrões de interações entre seus usuários e detectar quem são os que tem mais chances de mudar de operadora é uma grande ferramenta estratégica.

Análise de LOGS
Quem trabalha com aplicações WEB, sabe que elas podem gerar quantidades absurdas de arquivos de log. O Hadoop é aplicado com grande maestria em aplicações de manipulação de logs. Projetos paralelos como o Pig visam inclusive facilitar este tipo de trabalho.

Análise de transação de ponto de venda
Analisar e cruzar dados de grandes cadeias de lojas visando agregar estes dados historicamente e tentar perceber o que os pontos de venda mais bem sucedidos tem em comum é uma grande oportunidade para geração de negócios.

Análise de dados de rede para prever falhas
Perguntas difíceis de responder tais como: Qual o ponto mais fraco da minha rede ? Quando ela vai se partir ? Muitas empresas de telecom estão tratando analisando o volume e a direção do tráfego em suas redes.

Segmentação de usuários
Conhecer os seus usuários e tentar entender melhor como eles interagem com seus produtos e como eles interagem entre si é sinônimo de geração de negócios.

Modelar Risco
A modelagem de risco na área de seguros e instituições financeiras faz parte da sobrevivência destas instituições. Para conseguir uma modelagem mais próxima do real o uso do Hadoop permite a utilização de um número sem precedentes de fatores.

Ad Targeting
Muitas Ad Network já estão utilizando tecnologias Big Data para otimizar tanto a relevância quanto o posicionamento de suas propagandas. Nada pior que propaganda mal relacionada com o conteúdo de um website.