Tin Kranželić

tikr

Data Analytics Engineer

O que é o Microsoft Fabric e como pode impactar o seu negócio

ESTE ARTIGO EM 5 SEGUNDOS:
  • A era em que vivemos hoje é a era em que a inteligência artificial acelerou dramaticamente, tornando-se cada vez mais um componente indispensável da vida cotidiana e do trabalho.
  • O exemplo mais proeminente disso é o, já famoso, modelo de linguagem Chat-GPT da OpenAI.
  • Por essa razão e com a análise de dados a imergir para a era da IA, em maio de 2023, a Microsoft anunciou um novo produto chamado Microsoft Fabric, que imediatamente despertou grande interesse e atenção da comunidade de análise de dados. Descubra o que é o Microsoft Fabric e como pode realmente fazer diferença no seu negócio.

O que é o Microsoft Fabric? Na sua essência, o Microsoft Fabric é um conjunto de ferramentas e serviços analíticos integrados que trabalham juntos para fornecer uma experiência unificada de end-to-end. É um produto SaaS (Software as a Service), o que significa que há pouca responsabilidade administrativa sobre os utilizadores, para que não precisem de se preocupar muito com o provisionamento de recursos, infraestrutura subjacente, etc. Em vez disso, podem obter valor comercial real a partir dos dados em questão de minutos.

A grande vantagem e novidade que o Fabric traz é o conceito de capacidade. Até este ponto, quando várias ferramentas e serviços analíticos de diversos fornecedores eram combinados, muitas vezes resultava em utilização abaixo do ideal de recursos, levando a desperdício de recursos e, no final, custos desnecessários para os utilizadores. Com isso em mente, a introdução de capacidades como única pool de computação para alimentar todos os serviços que o Fabric oferece, tem o potencial de aumentar significativamente a utilização de recursos e reduzir custos.

Além disso, o Fabric introduziu os conceitos de capacidade de expansão e suavização, que, sem entrar em muitos detalhes, essencialmente permite aos utilizadores usar mais recursos do que possuem quando precisam de realizar o trabalho mais rapidamente.

Componentes do Fabric

Como mencionado anteriormente, o Fabric é a experiência completa de analytics. Isto significa que cobre todos os requisitos de análise que uma empresa pode executar. As principais experiências que compõem o ecossistema do Fabric são as seguintes:

• Synapse Data Warehouse
• Synapse Data Engineering
• Synapse Data Science
• Synapse Real-Time Analytics
• Data Factory
• Power BI
• Data Activator

Todos eles já são serviços bem estabelecidos e conhecidos, exceto o Data Activator. É uma experiência sem código que fornece a capacidade de deteção e monitorização em tempo real dos dados, para que se possam acionar ações correspondentes quando padrões de dados específicos são identificados.

No cerne do Microsoft Fabric está o data lake lógico unificado para o armazenamento de todos os dados. É baseado no Azure Data Lake Gen2 e é chamado OneLake. Ele é o equivalente ao OneDrive do Microsoft 365.

O OneLake traz várias vantagens para a mesa. Todos os dados armazenados dentro do OneLake são facilmente acessíveis por todos os motores analíticos que alimentam as experiências referidas acima.

O OneLake também é um data lake multi-nuvem que pode incorporar dados de diferentes fornecedores de nuvem, como Amazon ou Google. Tudo isso torna o OneLake uma novidade verdadeiramente poderosa criada pela Microsoft.

Framework

A nossa Framework foi construída especificamente para acelerar projetos, reduzindo o tempo e o esforço que se pode ter ao construir uma solução do zero no Fabric e estabelecer uma base de dados que aproveita as melhores práticas desde o início. Com esta Framework, pode-se ter uma solução projetada para coletar todas as informações que se possui, tratá-las e organizá-las de forma que os relatórios sejam totalmente encadeados e garantam a qualidade dos dados. Num nível mais alto, o processo inteiro é dividido em várias fases:

Fase de Ingestão

Os dados são extraídos de várias fontes de dados diferentes e carregados no Fabric Data Warehouse de acordo com a lógica de ingestão especificada – ingestão completa ou incremental. Os dados recém-carregados podem então aproveitar a infraestrutura otimizada do Microsoft Fabric.

Fase de Processamento

Os dados brutos ingeridos na fase anterior são transformados e enriquecidos para atender aos requisitos empresariais, a fim de criar tabelas de dimensão e fatos que compõem o modelo de dados que poderá ser usado posteriormente para fins de reporte dentro do Power BI para tomar decisões mais acertadas baseadas em factos.

Fase de DevOps

O controlo de versões e a integração contínua (CI) podem ser incorporados com o Azure DevOps e a entrega contínua (CD) com os pipelines de implantação do Power BI de acordo com um conjunto de boas práticas usadas no desenvolvimento de software moderno.

Fase de Monitorização

A monotorização neste ponto pode ser feito por meio de um Hub de Monitorização e da app Microsoft Fabric Capacity Metrics, que unifica a telemetria de todas as experiências de carga de trabalho do Fabric num conjunto único de análises prontas para uso, a fim de monitorizar o desempenho das cargas de trabalho e devido uso em comparação com a capacidade adquirida. Também é possível conectar o workspace do Fabric ao workspace do Azure Log Analytics, o que permite rastrear métricas dos logs e possível criação de visualizações personalizadas para ajudar a rastrear o desempenho da carga de trabalho.

Vantagens adicionais e limitações atuais

Vale a pena mencionar várias outras vantagens que o Fabric traz, bem como algumas das limitações atuais.

Uma das novidades muito bem recebidas pelos utilizadores é certamente o modo de conexão Direct Lake no Power BI, que oferece todos os benefícios dos modos existentes, como velocidade no caso do modo Import e dados atualizados em real-time no caso do modo Query Direct, mas sem os seus defeitos, como a duplicação de dados no modo Import.

Outra que traz grande valor é a automação de várias tarefas de manutenção que precisavam de ser feitas manualmente noutras plataformas analíticas. O trabalho frequente com dados tem o potencial de gerar muitos novos arquivos, e se isso não for cuidado, pode levar rapidamente a problemas de desempenho no futuro. Felizmente para os utilizadores, não há necessidade de desenvolver mecanismos adicionais para cuidar disso, mas existem recursos e capacidades incorporados no Fabric que podem alcançar exatamente esse trabalho.

Além disso, a administração e governança centralizadas de todos os artefactos de dados empresariais retiram o peso das preocupações dos utilizadores sobre desafios de segurança ou conformidade.

Finalmente, uma vantagem que não pode ser deixada de fora da lista é a ferramenta de IA Copilot, que capacitará os desenvolvedores profissionais a criar fluxos e pipelines de dados simples a complexos usando linguagem natural.

Por outro lado, ainda existem algumas características que estão a faltar ou à espera de serem incorporadas na oferta do Fabric.

Em relação à monotorização do Fabric, há um plano futuro para oferecer uma base de dados somente de leitura de logs detalhados de diagnóstico, o que melhorará ainda mais as capacidades de monitorização e utilização geral de toda a carga de trabalho.

Nem todos os itens do Fabric suportam atualmente o controlo de versões e/ou implementação por meio de pipelines de implementação. Exemplo de um item assim é um pipeline de dados ou um Data Warehouse que não é implementável. Considerando o quanto o Fabric é recente como produto, é de esperar que essas limitações sejam superadas ao longo do tempo.

Outra coisa que vale a pena mencionar para todos os utilizadores atuais do Synapse que perguntam se podem migrar os seus projetos facilmente para o Fabric é que, atualmente, não há uma opção simples de migração lift and shift para soluções inteiras.

Pensamento final

Em conclusão, é óbvio que o Microsoft Fabric traz alguns conceitos novos que têm o potencial de impactar significativamente a trajetória da indústria de analytics. Com isso em mente, a Microsoft procura solidificar a sua posição de liderança no mundo da análise de dados empresariais. A ideia é atender a todos os requisitos da análise de negócio de uma maneira mais fácil, rápida, eficiente e menos dispendiosa. O Microsoft Fabric certamente parece ser um passo na direção certa.

Tin KranželićO que é o Microsoft Fabric e como pode impactar o seu negócio
read more