Avec les récentes fonctionnalités de filtrage et d’observabilité, l’offre DBaaS de Google se rapproche de PostgreSQL. Le fournisseur les a optimisé pour améliorer les performances.

Depuis 2022, Google a choisi d’entrer sur le marché des bases de données PostgreSQL en lançant AlloyDB pour concurrencer à la fois le projet open source, mais surtout Aurora d’AWS et PostgreSQL dans Azure de Microsoft. Depuis, l’offre a évolué et s’est déployée dans plusieurs régions avec comme objectif de devenir une vraie alternative à PostgreSQL. Ce dernier a gagné en popularité avec ses capacités transactionnelles et analytiques, sa sécurité et sa gouvernance et son support des langages de programmation.
Un filtrage optimisé pour la recherche vectorielle
Pour se rapprocher un peu plus du projet open source, Google a intégré des fonctions de filtrage pour améliorer les performance de la recherche vectorielle basée sur son outil ScaNN. Une tendance devenue essentielle pour le développement d’applications à base d’IA. Les entreprises peuvent exécuter cette capacité directement sur la base de données au lieu d’un post-traitement à côté de l’application. « Ce type de filtrage garantit la rapidité, la précision et l’efficacité de ces types de recherche, en combinant automatiquement le meilleur des index vectoriels et traditionnels sur les colonnes des métadonnées afin d’améliorer les requêtes », explique Google Cloud.
Le filtrage en ligne peut également être exécuté dans PostgreSQL pour obtenir des gains de performance, en particulier avec l’utilisation de la clause WHERE dans une instruction SELECT à l’intérieur d’une requête ou d’un optimiseur de base de données ou en se servant de l’extension de recherche vectorielle telle que pgvector. « Mais des ensembles de données trop volumineux peuvent entraîner des complexités et une diminution des performances », a observé Mukesh Ranjan, vice-président de la société de conseil Everest Group. Il ajoute néanmoins que « cette approche apporte des avantages aux développeurs, tels que des requêtes plus simples, une gestion cohérente des données, en particulier pour les cas d’utilisation de l’IA et de la recherche sémantique ».
Des outils d’observabilité en plus
Autre fonction ajoutée, l’observabilité avec l’intégration de plusieurs outils. Il s’agit notamment d’un évaluateur de rappel qui aide à mesurer la qualité de la recherche vectorielle. De plus, Google Cloud ajoute des statistiques de distribution d’index vectoriels pour voir rapidement les changements dans les données en temps réel. Les sociétés pourront ainsi obtenir des performances plus stables et cohérentes. Selon Mukesh Rajan, ces outils d’observabilité sont comparables à ceux proposés aux capacités de base de PostgreSQL. « Vous bénéficiez toujourd de l’observabilité standard de PostgreSQL (comme pg_stat_statements), plus l’interface utilisateur avancée de Google Cloud, des analyses plus approfondies et des suggestions de réglage potentielles basées sur l’apprentissage automatique », assure l’analyste.
Ces différentes fonctions montrent qu’AlloyDB veut conserver sa parfaite compatibilité avec PostgreSQL et ses capacités (syntaxe SQL, concurrence, indexation, procédures stockées). Google Cloud ajoute une architecture différent pour améliorer les performances. « Essentiellement, l’approche de Google a été la suivante : Prendre le cadre de Postgre, le garder compatible, puis l’accélérer avec un autre moteur de stockage et des outils d’infrastructure et de gestion de Google », glisse Mukesh Rajan.
Leave A Comment