Latest news

Entrevista: “Thinking Big About Data”

Cada vez mais, as empresas são desafiadas a obter informações detalhadas de forma a conseguirem tomar decisões mais ponderadas. A ascensão de tecnologias de Big Data & Analytics mudou a forma como as organizações gerem os seus dados. Entrevistámos Nuno Barreto – Associate Partner & Big Data Lead da Xpand IT para descobrir como é que as soluções de Big Data podem ajudar as empresas a tirar partido dos seus dados e criar valor de negócio.

1. Como classifica o investimento da Xpand IT na área de Big Data & Analytics? 

Big Data & Analytics são áreas onde a Xpand IT tem investido significativamente desde 2012. Vemos essa área como uma excelente opção, uma vez que se enquadra perfeitamente com o nosso perfil empresarial: exigimos sempre competências técnicas muito específicas. Big Data Analytics está atualmente em segundo lugar no volume global de vendas da empresa.

2. Afinal, o que é Big Data? Alguns dizem que não existe “Big Data”, apenas data. Concorda? 

Sim, Big Data é real! Quando a tecnologia “tradicional” (ex: RDBMSs) se torna insuficiente para analisar a informação desejada, seja porque fica demasiado caro ou porque é simplesmente impossível, então estamos a lidar com Big Data. Por outras palavras, Big Data é tecnologia – se for necessario delinear uma solução, utilizando motores de dados mais adequados ao Volume, Velocidade ou Variedade de dados envolvidos, então estamos a lidar com Big Data. Estas tecnologias passam por Hadoop ou bancos de dados NoSQL (ex: MongoDB, Cassandra).

3. A quantidade de dados recolhidos por empresas, está a crescer a um ritmo nunca antes visto. Particularmente o número de dados não estruturados. Como consequência, torna-se cada vez mais difícil retirar informação útil e que faça sentido. Como é que a Xpand IT pode ajudar as empresas a resolver esta questão?

Mais do que uma questão de como retirar informação útil dos dados recolhidos, as empresas deveriam preocupar-se em procurar soluções para os armazenar. Por vezes – eu diria equivocadamente – acredito que não exista valor a ser extraído desses dados. Mas uma das principais vantagens de tecnologias como o Hadoop, é que permitirem às empresas armazenar dados altamente fiáveis com um custo muito reduzido. A decisão quanto ao valor dos dados, pode ser tomada depois de analisar a informação e a correlacionar entre si. As empresas devem por isso preocupar-se em armazenar dados para que posteriormente os possam analisar e extrair valor.

4. Que Indústrias podem beneficiar de tecnologias de Big Data & Analytics?

O número de empresas que usam tecnologias de Big Data é cada vez maior, e por esse motivo o número de indústrias que podem beneficiar está tambem em crescimento. Naturalmente empresas que já façam a gestão de grandes quantidades de informação (estruturada), são as que mais facilmente se apercebem do potencial que Big Data representa: industrias tais com o retalho, banca e telecomunicações. Não obstante, estudos demonstram que mais cedo ou mais tarde, outras industriais irão necessitar de adotar tecnologias de Big Data & Analytics.

5. Quais são os elementos tecnológicos que devem ser incluídos numa estratégia de Big Data?

A peça tecnológica que é fundamental em qualquer estratégia de Big Data é o Hadoop. A sua versatilidade (que é constantemente melhorada), os custos baixos e a facilidade de crescimento são elementos cruciais. É claro que dependendo dos detalhes da situação e dos requisitos específicos (como por exemplo, latência), poderá justificar-se a utilização de motores NoSQL. Uma vez mais, destacamos MongoDB pela sua versatilidade e fácil integração com o Hadoop. Finalmente, de forma a garantir que tudo corre sem problemas, existe a necessidade de utilizar uma ferramenta de integração de dados, capaz de funcionar com todos os sistemas “legacy” e com todos os novos motores de Big Data.

6. Quais as soluções de Big Data mais procuradas pelos vossos clientes? Qual é a tendência a curto prazo?

A Xpand IT trabalha com diversos clientes, independentemente do seu objetivo para com tecnologias de Big Data. Temos clientes que fazem uso das características gratuitas de MongoDB para implantar IoT backend. Existem clientes que utilizam ETL offloading em Hadoop através de Hive, clientes que fazem Analytics com Impala e clientes que utilizam Spark e Kafka para processamento de eventos em tempo real. No entanto, o uso do Data Hub está a ganhar mais notoriedade, pois é desenvolvido conforme as necessidades dos seus utilizadores.

7. O que tem a Xpand IT para oferecer e como é que se encaixa nas necessidades do cliente?

Na Xpand IT acreditamos que os nossos serviços e produtos de Big Data & Analytics são actualmente muito completos. Em termos de capacidades, conseguimos abranger praticamente todo o processo: desde a arquitetura da infra-estrutura, instalação e implementação, incluindo a configuração de segurança para o desenvolvimento de aplicativos usando Spark, Kafka, Impala, Hive, HBase, MongoDB, Cassandra e MapReduce. Somos parceiros da Cloudera, que é líder em distribuição de Hadoop em Portugal, da MongoDB, um dos motores NoSQL mais versáteis do mercado e da DataStax, o braço comercial da Apache Cassandra, que pode efetuar grandes ajustes para alguns casos específicos. O nosso portfólio foi cuidadosamente adaptado para que possamos ajudar os nossos clientes nos diversos estágios da sua jornada de adoção de tecnologias Big Data, para que possamos construir relações e parcerias muito duradouras.

1f55d05f7f6a721bc92dc402097ae650c106fff6790e04b6e7pimgpsh_fullsize_distr

Ana PaneiroEntrevista: “Thinking Big About Data”