Iniciando o Jornada de um Ecossistema de Dados Abertos com a SAP
Em março de 2023, a SAP anunciou o SAP Datasphere
, um serviço de dados abrangente que visa oferecer acesso contínuo e escalável a dados comerciais cruciais.
A SAP também anunciou sua visão de criar um poderoso ecossistema de dados abertos em torno do SAP Datasphere. Para concretizar essa visão, a SAP se associou aos principais fornecedores de tecnologia. A imagem abaixo fornece uma breve visão geral dessas parcerias.
Créditos da imagem: SAP (março de 2023)
Em maio de 2023, a SAP também anunciou sua parceria com o Google Cloud
como parte do Ecossistema de Dados Abertos.
No cenário tecnológico impulsionado pelos negócios de hoje, os clientes operam com um ecossistema diversificado e complexo de pilhas tecnológicas para atender às suas necessidades em constante evolução. Essa diversidade permite que criem aplicativos personalizados para suas necessidades específicas. No entanto, essa diversidade pode rapidamente resultar em silos de dados fragmentados. Por meio da parceria, a SAP e a Databricks têm como objetivo quebrar os silos integrando dados de várias fontes ao longo dos planos de dados. A parceria capacita os usuários a
liberar
o potencial de seus dados por meio de uma integração bidirecional do Data Lakehouse com o SAP Datasphere.
O
'Porquê'
por trás da Integração da SAP e Databricks
Há muita confusão em torno da integração entre Databricks e Datasphere, principalmente em relação à relevância da Databricks no ecossistema da SAP. Ao longo deste blog, exploraremos conceitos arquitetônicos como unificação de dados, malha de dados e tecido empresarial.
Também aprofundaremos o porquê, o quê e o como da integração da SAP e Databricks. Exploraremos como as organizações podem se beneficiar ao adotar essa integração, desde uma melhor governança de dados e escalabilidade até capacidades de análise em tempo real e aprendizado de máquina.
Dados: O novo petróleo da era digital
Muitas vezes, o autor de citações é motivo de debate e uma das citações famosas em nosso mundo digital é sobre
dados sendo o novo petróleo.
Em 2006, o matemático britânico Clive Humby disse: "dados são o novo petróleo", não apenas referindo-se aos dados como petróleo como uma mercadoria muito valiosa. Ele comparou os dados ao petróleo também porque o petróleo em seu estado bruto não é tão valioso quanto é após o processo de refinamento. Da mesma forma, o verdadeiro potencial dos dados não está em seu estado bruto, mas sim na versão refinada que obtemos após o processamento e transformação real.
Embora haja um debate sobre a fonte dessa citação, ela tem uma essência poderosa: os dados nos cercam e são gerados continuamente, consciente ou inconscientemente, por meio de cliques, transações ou até mesmo deslizes simples. As organizações coletam esse vasto depósito de potencial de dados não explorado. No entanto, gerenciar esses dados em constante expansão, especialmente na era das soluções baseadas em nuvem predominantes, apresenta desafios. Os dados estão distribuídos em diferentes plataformas com formatos de dados variados, resultando em
silos de dados
, tornando a análise e extração de valor cada vez mais complexas.
É exatamente aqui que entra em jogo o verdadeiro valor da integração da SAP e Databricks. É a chave que desbloqueia os tesouros ocultos dos dados. Abaixo está uma arquitetura de referência da integração do Datasphere e Databricks (Ecossistema de Dados Abertos). Nas seções que se seguirão neste blog, aprofundaremos em diferentes padrões de arquitetura que aproveitam o melhor de ambos os mundos.
O Datasphere permite a unificação de dados desses diferentes sistemas de origem com diferentes formas de integração e gestão de dados.
A federação de dados