Accueil Package dbplyr : utilisation de dplyr sur une base SQL

dbplyr : utilisation de dplyr sur une base SQL

dbplyr

Le workflow classique dans R consiste à récupérer des données en mémoire dans R à l’aide de requêtes puis à manipuler les données afin d’obtenir le résultat attendu.
Sur des gros volumes de données c’est assez pénible de fonctionner ainsi, c’est là que le package dbplyr peut s’avérer intéressant.
Il permet d’identifier les tables SQL comme des objets R sans récupérer les données, vous pourrez ainsi manipuler les données sans avoir à les charger en mémoire.
En d’autres termes, cela permet de faire une requête SQL en utilisant le langage R avec la syntaxe du package dplyr.
Pour quelqu’un qui maîtrise mieux le R que le SQL c’est un véritable gain de temps. Il est également possible d’afficher la requête SQL à partir du code R, comme un google traduction R <=> SQL.

show_query

Un autre cas d’usage particulièrement intéressant est la possibilité de réaliser des jointures avec des données externes.
Si vous avez une liste de numéros de séjour et que vous voulez récupérer les données dans une table pour cette liste, il vous suffit d’utiliser un left_join() avec l’argument copy = T.
adnp75

 

left_join

Charger d'autres articles liés
Charger d'autres écrits par healthdata
Charger d'autres écrits dans Package

Laisser un commentaire

Consulter aussi

Health Data Hub : Un pas avant mais…

Le 18/11/19 la ministre Agnès Buzyn annonçait le lancement du Health Data Hub pour le 1/12…