Quando
você pensar em computação distribuída, certamente vai topar com o Hadoop.
Atualmente o Hadoop é o framework de computação
distribuída mais usado quando se pensa em Big Data. Muitos desenvolvedores tem
a curiosidade de saber em que tipo de problemas o Hadoop pode ser usado. Abaixo
algumas aplicações da tecnologia.
Detecção
de tendências
Detectar
novas tendências rapidamente é necessário para um mundo cada vez mais
conectado. Com o twitter e a constante troca de informações o volume de
informação cresce a cada segundo.
Sistema de Recomendação
Sistemas de
recomendação são parte integrante de muitos dos serviços que usamos. Amazon,
Netflix, Last.fm entre outros nos mostram o grande valor que sistemas assim
podem gerar.
Detecção
de fraudes
É a eterna luta entre gato e rato. Detectar fraudes de
maneira rápida é uma tarefa bastante complicada. Com o Hadoop podemos
processar quantidades gigantes de dados e perceber tendências imperceptíveis em
escala menor.
Customer Churn Analysis (análise
de rotatividade de clientes)
Empresas
que operam grandes volumes de usuários como as operadoras de telefonia sabem que muitas vezes um único usuário que
resolve mudar de operadora acaba levando com ele muitos outros. Analisar os
padrões de interações entre seus usuários e detectar quem são os que tem mais
chances de mudar de operadora é uma grande ferramenta estratégica.
Análise de LOGS
Quem
trabalha com aplicações WEB, sabe que elas podem gerar quantidades absurdas de arquivos de log. O Hadoop é
aplicado com grande maestria em aplicações de manipulação de logs. Projetos
paralelos como o Pig visam inclusive facilitar este tipo de trabalho.
Análise de transação de ponto de
venda
Analisar
e cruzar dados de grandes cadeias de lojas
visando agregar estes dados historicamente e tentar perceber o que os pontos de
venda mais bem sucedidos tem em comum é uma grande oportunidade para geração de
negócios.
Análise de dados de rede para
prever falhas
Perguntas difíceis de
responder tais como: Qual o ponto mais
fraco da minha rede ? Quando ela vai se partir ? Muitas empresas de telecom
estão tratando analisando o volume e a direção do tráfego em suas redes.
Segmentação de usuários
Conhecer
os seus usuários e tentar entender melhor
como eles interagem com seus produtos e como eles interagem entre si é sinônimo
de geração de negócios.
Modelar Risco
A modelagem de risco na área de seguros e instituições financeiras
faz parte da sobrevivência destas instituições. Para conseguir uma modelagem mais próxima do real o uso do Hadoop
permite a utilização de um número sem precedentes de fatores.
Ad Targeting
Muitas
Ad Network já estão utilizando tecnologias Big Data para otimizar tanto a
relevância quanto o posicionamento de suas propagandas. Nada
pior que propaganda mal relacionada com o conteúdo de um website.