Wir freuen uns, die Transform 2022 am 19. Juli persönlich und vom 20. bis 28. Juli virtuell zu veranstalten. Treffen Sie führende KI- und Datenexperten für aufschlussreiche Gespräche und spannende Networking-Möglichkeiten. Registrieren Sie sich noch heute!

Google Cloud gibt heute eine Reihe von Ankündigungen bekannt, die eine Reihe von Daten-, Analyse- und KI-Diensten umfassen. Heute wird eine Kombination aus Preview- und General Availability (GA)-Releases vorgestellt, die zusammen Googles Daten- und KI-Geschichte im Wettbewerb mit Amazon Web Services (AWS) und Microsoft Azure untermauern werden.

In einem Blogpost sagte Gerrit Kazmaier, Google Clouds GM für Datenbanken, Datenanalyse und Looker: „Mit dem dramatischen Wachstum von Datenmengen und -typen, Arbeitslasten und Nutzern sind wir an einem Wendepunkt angelangt, an dem herkömmliche Datenarchitekturen – selbst wenn sie in der Cloud bereitgestellt werden – nicht mehr in der Lage sind, ihr volles Potenzial zu erschließen. Infolgedessen wächst die Kluft zwischen Daten und Wert.

Vielleicht ist das übergreifende Thema der heutigen Ankündigungen von Google die Zusammenführung der Dinge. Das Data Warehouse und der Data Lake von Google Cloud werden stärker integriert; die von Google selbst entwickelten Business Intelligence (BI)-Komponenten werden besser mit der BI-Technologie von Looker koordiniert, die Google im Jahr 2020 übernommen hat; und auch die Analyse- und KI-Komponenten von Google werden nahtloser zusammenarbeiten.

Ein Lagerhaus am See

Die vielleicht wichtigste der heutigen Ankündigungen ist die Einführung eines neuen Data-Lake-Angebots mit dem Namen BigLake in der Vorschau. Wie der Name schon vermuten lässt, wird dieser Service die Integration von Data Lakes, die in Google Cloud Storage (GCS) gespeichert sind, mit BigQuery, dem Data Warehouse Service von Google Cloud, deutlich verbessern. Google Cloud-Kunden werden nicht nur in der Lage sein, Daten im Lake und im Warehouse gemeinsam abzufragen, und zwar von Diensten wie Spark, Presto und sogar TensorFlow, sondern auch die Sicherheit und Verwaltung der Daten im Lake und im Warehouse können vereinheitlicht werden.

Diese Koordinierung von Lake und Warehouse wird den Anhängern des so genannten Lakehouse-Modells entgegenkommen, während gleichzeitig respektiert wird, dass Data-Lake- und Data-Warehouse-Technologien jeweils relative Stärken haben. Mit anderen Worten: Die Kunden haben die Wahl, welche Daten sie wo speichern möchten, und können dennoch eine einheitliche Abfrage- und Governance-Erfahrung machen. Die allgemeine Verfügbarkeit dieses Dienstes wird voraussichtlich bis Ende des Kalenderjahres erfolgen.

Google kündigt außerdem Spanner Change Streams an, einen Dienst zur Erfassung von Änderungsdaten, der Daten in Echtzeit von Google Cloud Spanner in BigQuery, Pub/Sub oder Google Cloud Storage repliziert. Dieses Angebot scheint recht vergleichbar mit Microsofts Azure Cosmos DB Change Feed. Dieser Service ist noch nicht verfügbar, aber Google sagt, dass er „in Kürze“ verfügbar sein wird.

Ein großes (BI-)Geschäft

Vor sechs Jahren brachte Google sein Self-Service-BI-Produkt namens Google Data Studio auf den Markt, mit dem Geschäftsanwender auf einfache Weise Visualisierungen für Daten erstellen konnten, die in einer Vielzahl von Repositories und Plattformen gespeichert waren. Später wurden Erweiterungen vorgenommen, um auch Google Sheets datenfreundlicher zu machen. Doch dann erwarb Google Cloud auch den BI-Anbieter Looker, so dass sich Kunden und Fachjournalisten (darunter auch dieser) fragten, wie es mit Data Studio weitergeht.

Google hat diese Frage heute geklärt und erklärt, dass Google Data Studio jetzt eine Verbindung zu Daten in Looker-Modellen herstellen kann und dass Google Connected Sheets dies ebenfalls kann. Looker beinhaltet die Explore Datenabfrage und das Visualisierungs-Frontend, aber es ist einlso verfügt über eine Art Back-End, das es Kunden ermöglicht, umfassende Modelle zu erstellen, die Daten aus verschiedenen Quellen mischen und die Elemente dieser gemischten Daten definieren, die die Messgrößen (Metriken) und Dimensionen (Kategorien wie Produkt, Zeit und Ort, die zur Aggregation oder zum Aufschlüsseln der Metriken verwendet werden) des Modells bilden.

Looker-Modelle werden in einer speziellen Sprache namens LookML erstellt (das „ML“ steht für Markup Language, nicht für maschinelles Lernen), und diese Modelle können nun von Google Data Studio und Google Sheets gelesen werden, so dass sie auch für Entwickler, Unternehmens-BI-Analysten, Self-Service-BI-Business-Anwender und Tabellenkalkulationsanwender geeignet sind.

KI, trifft BI

Google sieht sich schon seit geraumer Zeit als führender Anwärter auf die Schaffung einer erstklassigen Cloud für künstliche Intelligenz (KI). Und während die KI-Fähigkeiten des Unternehmens ganz offensichtlich sind, war die KI von Google Cloud bis vor kurzem eher eine Sammlung von Einzeldiensten. Das Sortiment umfasste einen Cloud-TensorFlow-Dienst, eine Reihe von Web-API-basierten kognitiven Diensten und einen datenbankinternen KI-Dienst namens BigQuery ML (wobei ML dieses Mal für „Machine Learning“ steht). In der Zwischenzeit boten Azure Machine Learning von Microsoft und SageMaker von AWS stärker integrierte Plattformen für maschinelles Lernen an, wenn auch manchmal nur aufgrund einer gemeinsamen Marke.

Googles Antwort darauf war der KI-Dienst Vertex, der im Mai letzten Jahres zur allgemeinen Verfügbarkeit freigegeben wurde. Und auch hier setzt Google Cloud auf Zusammenhalt und Integration. Ein wichtiger Teil des Dienstes, Vertex AI Workbench, der heute für die allgemeine Verfügbarkeit freigegeben wird, lässt sich nativ mit BigQuery, Serverless Spark und Dataproc integrieren.

Heute fügt Google eine neue Model Registry zu Vertex AI hinzu. Eine Model Registry ist in der Welt des maschinellen Lernens vergleichbar mit einem Datenkatalog in der Datenbank- und Analysewelt, da es sich um ein durchsuchbares, zentrales Repository und Governance-Tool für alle maschinellen Lernmodelle eines Unternehmens handelt. Google weist auch darauf hin, dass die Modellregistrierung Modelle katalogisieren wird, die sowohl in Vertex AI als auch in BigQuery ML vorhanden sind, um das übergreifende Thema der Vereinheitlichung beizubehalten.

Analytics-Stack redux

Interessant an den heutigen Ankündigungen von Google ist, wie sehr sie an Muster erinnern, die in der Welt der Analytik und BI bereits aufgetaucht sind. Zum Beispiel ähnelt die Schaffung einer parallelen Data-Warehouse/Data-Lake-Umgebung sehr dem, was Microsoft mit Azure Synapse Analytics bereits getan hat: das frühere Azure SQL Data Warehouse mit Azure Data Lake Storage, Spark und einer Data-Lake-Abfrage-Engine zusammenzubringen.

Auf der BI-Seite erinnert die Zusammenführung nativer und erworbener Technologien stark an das, was Microsoft, IBM, SAP und Oracle in den 2000er Jahren taten, als sie ihre eigenen BI-Akquisitionen von ProClarity, Cognos, BusinessObjects bzw. Hyperion tätigten. Selbst der Gedanke, dass Google die semantische Layer-Technologie von Looker nutzt, um sie mit Data Studio und Connected Sheets zu verbinden, ist nicht neu. Bis heute sind BusinessObjects „Universes“, ebenfalls eine semantische Datenmodelltechnologie, ein Kernstück der BI-Geschichte von SAP, sowohl vor Ort als auch im Analytics Cloud Service des Unternehmens.

In vielerlei Hinsicht ähneln die großen Cloud-Anbieter von heute den „Mega-Anbietern“ von vor fünfzehn bis zwanzig Jahren. Und passenderweise zeigen die heutigen Ankündigungen von Google Cloud im Bereich Daten und Analytik, dass das Enterprise-Stack-Modell sehr lebendig ist, even im Zeitalter der Cloud.

VentureBeat hat es sich zur Aufgabe gemacht, ein digitaler Marktplatz für technische Entscheidungsträger zu sein, um Wissen über transformative Unternehmenstechnologien zu erlangen und Transaktionen durchzuführen. Erfahren Sie mehr über die Mitgliedschaft.



Quelle

Wir freuen uns, die Transform 2022 am 19. Juli persönlich und vom 20. bis 28. Juli virtuell zu veranstalten. Treffen Sie führende KI- und Datenexperten zu aufschlussreichen Gesprächen und interessanten Networking-Möglichkeiten. Registrieren Sie sich noch heute!

Google Cloud gibt heute eine Reihe von Ankündigungen bekannt, die eine Reihe von Daten-, Analyse- und KI-Diensten umfassen. Heute wird eine Kombination aus Preview- und General Availability (GA)-Releases vorgestellt, die zusammen Googles Daten- und KI-Geschichte im Wettbewerb mit Amazon Web Services (AWS) und Microsoft Azure untermauern werden.

In einem Blogpost sagte Gerrit Kazmaier, Google Clouds GM für Datenbanken, Datenanalyse und Looker: „Mit dem dramatischen Wachstum von Datenmengen und -typen, Arbeitslasten und Nutzern sind wir an einem Wendepunkt angelangt, an dem herkömmliche Datenarchitekturen – selbst wenn sie in der Cloud bereitgestellt werden – nicht mehr in der Lage sind, ihr volles Potenzial zu erschließen. Infolgedessen wächst die Lücke zwischen Daten und Wert.

Vielleicht ist das übergreifende Thema der heutigen Ankündigungen von Google die Zusammenführung der Dinge. Das Data Warehouse und der Data Lake von Google Cloud werden stärker integriert; die von Google selbst entwickelten Business Intelligence (BI)-Komponenten werden besser mit der BI-Technologie von Looker koordiniert, die Google im Jahr 2020 übernommen hat; und auch die Analyse- und KI-Komponenten von Google werden nahtloser zusammenarbeiten.

Ein Lagerhaus am See

Die vielleicht wichtigste der heutigen Ankündigungen ist die Einführung eines neuen Data-Lake-Angebots mit dem Namen BigLake in der Vorschau. Wie der Name schon vermuten lässt, wird dieser Service die Integration von Data Lakes, die in Google Cloud Storage (GCS) gespeichert sind, mit BigQuery, dem Data Warehouse Service von Google Cloud, deutlich verbessern. Google Cloud-Kunden werden nicht nur in der Lage sein, Daten im Lake und im Warehouse gemeinsam abzufragen, und zwar von Diensten wie Spark, Presto und sogar TensorFlow, sondern auch die Sicherheit und Verwaltung der Daten im Lake und im Warehouse können vereinheitlicht werden.

Diese Koordinierung von Lake und Warehouse wird den Anhängern des so genannten Lakehouse-Modells entgegenkommen, während gleichzeitig respektiert wird, dass Data-Lake- und Data-Warehouse-Technologien jeweils relative Stärken haben. Mit anderen Worten: Die Kunden haben die Wahl, welche Daten sie wo speichern möchten, und können dennoch eine einheitliche Abfrage- und Governance-Erfahrung machen. Die allgemeine Verfügbarkeit dieses Dienstes wird voraussichtlich bis Ende des Kalenderjahres erfolgen.

Google kündigt außerdem Spanner Change Streams an, einen Dienst zur Erfassung von Änderungsdaten, der Daten in Echtzeit von Google Cloud Spanner in BigQuery, Pub/Sub oder Google Cloud Storage repliziert. Dieses Angebot scheint recht vergleichbar mit Microsofts Azure Cosmos DB Change Feed. Dieser Service ist noch nicht verfügbar, aber Google sagt, dass er „in Kürze“ verfügbar sein wird.

Ein großes (BI-)Geschäft

Vor sechs Jahren brachte Google sein Self-Service-BI-Produkt namens Google Data Studio auf den Markt, mit dem Geschäftsanwender auf einfache Weise Visualisierungen für Daten erstellen konnten, die in einer Vielzahl von Repositories und Plattformen gespeichert waren. Später wurden Erweiterungen vorgenommen, um auch Google Sheets datenfreundlicher zu machen. Doch dann erwarb Google Cloud indie BI-Player Looker ebenfalls, so dass sich Kunden und Branchenjournalisten (einschließlich dieses Journalisten) fragten, was die Zukunft von Data Studio sei.

Google hat diese Frage heute geklärt und erklärt, dass Google Data Studio jetzt eine Verbindung zu Daten in Looker-Modellen herstellen kann und dass Google Connected Sheets dies ebenfalls kann. Looker umfasst das Front-End für die Datenabfrage und -visualisierung von Explore, verfügt aber auch über eine Art Back-End, mit dem Kunden umfassende Modelle erstellen können, die Daten aus verschiedenen Quellen zusammenführen und die Elemente dieser zusammengeführten Daten definieren, die die Messgrößen (Metriken) und Dimensionen des Modells bilden (Kategorien wie Produkt, Zeit und Ort, die zum Aggregieren oder Aufschlüsseln der Metriken verwendet werden).

Looker-Modelle werden in einer speziellen Sprache namens LookML erstellt (das „ML“ steht für Markup Language, nicht für maschinelles Lernen), und diese Modelle können nun von Google Data Studio und Google Sheets gelesen werden, so dass sie auch für Entwickler, Unternehmens-BI-Analysten, Self-Service-BI-Business-Anwender und Tabellenkalkulationsanwender geeignet sind.

KI, trifft BI

Google sieht sich schon seit geraumer Zeit als führender Anwärter auf die Schaffung einer erstklassigen Cloud für künstliche Intelligenz (KI). Und während die KI-Fähigkeiten des Unternehmens ganz offensichtlich sind, war die KI von Google Cloud bis vor kurzem eher eine Sammlung von Einzeldiensten. Das Sortiment umfasste einen Cloud-TensorFlow-Dienst, eine Reihe von Web-API-basierten kognitiven Diensten und einen datenbankinternen KI-Dienst namens BigQuery ML (wobei ML dieses Mal für „Machine Learning“ steht). In der Zwischenzeit boten Azure Machine Learning von Microsoft und SageMaker von AWS stärker integrierte Plattformen für maschinelles Lernen an, wenn auch manchmal nur aufgrund einer gemeinsamen Marke.

Googles Antwort darauf war der KI-Dienst Vertex, der im Mai letzten Jahres zur allgemeinen Verfügbarkeit freigegeben wurde. Und auch hier setzt Google Cloud auf Zusammenhalt und Integration. Ein wichtiger Teil des Dienstes, die Vertex AI Workbench, die heute für die allgemeine Verfügbarkeit freigegeben wird, lässt sich nativ mit BigQuery, Serverless Spark und Dataproc integrieren.

Heute fügt Google eine neue Model Registry zu Vertex AI hinzu. Eine Model Registry ist in der Welt des maschinellen Lernens vergleichbar mit einem Datenkatalog in der Datenbank- und Analysewelt, da es sich um ein durchsuchbares, zentrales Repository und Governance-Tool für alle maschinellen Lernmodelle eines Unternehmens handelt. Google weist auch darauf hin, dass die Modellregistrierung Modelle katalogisieren wird, die sowohl in Vertex AI als auch in BigQuery ML vorhanden sind, um das übergreifende Thema der Vereinheitlichung beizubehalten.

Analytics-Stack redux

Interessant an den heutigen Ankündigungen von Google ist, wie sehr sie an Muster erinnern, die bereits in der Welt der Analytik und BI aufgetaucht sind. Zum Beispiel ähnelt die Schaffung einer parallelen Data-Warehouse/Data-Lake-Umgebung sehr dem, was Microsoft mit Azure Synapse Analytics bereits getan hat: das frühere Azure SQL Data Warehouse mit Azure Data Lake Storage, Spark und einer Data-Lake-Abfrage-Engine zusammenzubringen.

Auf der BI-Seite erinnert die Zusammenführung nativer und erworbener Technologien stark an das, was Microsoft, IBM, SAP und Oracle in den 2000er Jahren taten, als sie ihre eigenen BI-Akquisitionen von ProClarity, Cognos, BusinessObjects bzw. Hyperion tätigten. Selbst der Gedanke, dass Google die semantische Layer-Technologie von Looker nutzt, um sie mit Data Studio und Connected Sheets zu verbinden, ist nicht neu. Bis zum heutigen Tag hat BusinessObjects „Univers

es“, ebenfalls eine semantische Datenmodelltechnologie, sind ein Kernstück der BI-Geschichte von SAP, sowohl vor Ort als auch im Analytics Cloud Service des Unternehmens.

In vielerlei Hinsicht ähneln die großen Cloud-Anbieter von heute den „Mega-Anbietern“ von vor fünfzehn bis zwanzig Jahren. Und passenderweise zeigen die heutigen Ankündigungen von Google Cloud im Bereich Daten und Analytik, dass das Enterprise-Stack-Modell auch im Zeitalter der Cloud sehr lebendig ist.

VentureBeat hat es sich zur Aufgabe gemacht, ein digitaler Treffpunkt für technische Entscheidungsträger zu sein, um Wissen über transformative Unternehmenstechnologien zu erlangen und Transaktionen durchzuführen. Erfahren Sie mehr über die Mitgliedschaft.



Weiterlesen: https://venturebeat.com/2022/04/06/google-cloud-federates-warehouse-and-lake-bi-and-ai/