Il existe plusieurs bases de données qui facilitent la création de modèles d’apprentissage automatique permettant de mieux exploiter les informations. Plusieurs plateformes comme Brytlyt, BlazingSQL et Kinetica se démarquent et s’alignent aux côtés des géants de l’informatique comme Google, Microsoft, Amazon et Oracle. Découvrez ces bases de données qui prennent en charge le « machine learning ».
1- Amazon Redshift
Ce service managé à très grande capacité (1015 octets) est idéal pour les utilisateurs SQL qui veulent créer, élaborer et développer des modèles de machine learning avec des outils SQL.
2- Brytlyt
Cette plateforme basée sur un navigateur est parfaite pour le traitement de l’Intelligence Artificielle dans une base de données avec des aptitudes de deep learning. Brytlyt est apprécié pour sa rapidité : en effet, il lui suffit de quelques secondes pour traiter des milliards de lignes de données. Il prend en charge les GPU et peut également traiter de gros volumes de modèles d’apprentissage profond et plus complexe, mais il lui faut un peu plus de temps.
3- Google Cloud BigQuery
BigQuery de Google Cloud permet de réaliser des analyses sur d’importantes quantités de données en quelques secondes seulement. Toujours au niveau du pétaoctet (1015), il set à crée et à exécuter des modèles de machine learning en effectuant des requêtes SQL.
4- Blazing SQL
Ce moteur accéléré par le GPU est basé sur l’écosystème RAPIDS (bibliothèques de logiciel et d’API open source) et il est proposé sous la forme de projet open source et de service payant. BlazingSQL est totalement en open source depuis le début de l’année 2021 et vous permet de traiter des données et de faire des prédictions machine learning.
5- Microsoft SQL Server
Il s’agit d’un service d’apprentissage qui prend en charge Python, Java, R, T-SQL PREDICT et rx_Predict dans SGBDR SQL Server, mais également SparkML dans les données Big Data de SQL Server. La base de données prévoit un espace de stockage pour les modèles formés, mais vous pouvez aussi les stocker en externe.
6- Kinetica Streaming Dat Warehouse
Cette plateforme permet à la fois d’analyser les données historiques en permanence avec l’intelligence de localisation et l’intelligence artificielle. Elle est appréciée pour sa rapidité, l’organisation intuitive des informations et les différentes fonctionnalités (agrégation, filtrage et visualisation).
7- Oracle Cloud Infrastructure Data Science
Cette plateforme managée et sans serveur est idéale pour les professionnels de science des données qui veulent construire et gérer des modèles de machine learning en utilisant Oracle Cloud Infrastructure. Elle renferme des outils, des bibliothèques, mais aussi des packages basés sur Python.