Excel vers SQL: Pourquoi vous devriez changer
Si vous utilisez des applications de tableur comme Excel ou Google Sheets au travail, ces problèmes peuvent vous être familiers:
- Il est facile d’apporter des modifications accidentelles aux données
- Il est difficile de reproduire une ancienne analyse sur de nouvelles données (tant d’étapes à retenir!)
- C’est lent avec de grands ensembles de données
- Il est lourd de partager des feuilles de calcul géantes par courrier électronique
Les applications de feuilles de calcul sont accessibles, omniprésentes et flexibles. Ils peuvent fusionner des cellules, ajouter des commentaires, pivoter sur des données, formater des tableaux et créer des graphiques. Mais avec la flexibilité vient le risque. Ils peuvent entraîner plus de travail, plus d’attente, plus de maux de tête en matière de versions et une précision moindre. Heureusement, SQL peut être plus rapide, plus facile et plus sûr qu’Excel. Poursuivez votre lecture pour découvrir ce qu’est SQL et comprendre pourquoi c’est un moyen supérieur de manipuler et d’analyser des données.
Inconvénients d’Excel
Commençons par une application pratique. Jetez un œil à ce tableau des Pokémon et de leurs caractéristiques:
Name | Type | Weight |
---|---|---|
bulbasaur | grass | 15 |
charmander | fire | 19 |
squirtle | water | 20 |
pikachu | electric | 13 |
oddish | grass | 12 |
snorlax | normal | 1014 |
mewtwo | psychic | 269 |
Suppose that we want to use Excel to filter out everything but the name et le type de chaque Pokémon de type Herbe dans la table. Dans Excel, nous devons utiliser des instructions étape par étape pour obtenir les données:
- ouvrez la table Pokémon
- ajoutez un filtre à la colonne « type »
- filtre pour type= »grass »
- supprimez toutes les colonnes sauf « nom »
À ce stade, nous avons modifié les données (erreurs potentielles), nous n’avons aucune copie des étapes enregistrées nulle part (difficile à répliquer), et nous devrons envoyer le fichier entier par e-mail à nos autres dresseurs Pokémon (contrôle de version douloureux).
À mesure que la table Pokémon grandit, Excel — ou Google Sheets — ralentit. Si le nombre de lignes se chiffre en milliers, cela pourrait vraiment nuire à notre flux de travail. Si vous avez déjà été coincé à regarder un message « Pinwheel of Death » ou un message « Excel quit inopinément », vous connaissez la douleur.
Qu’est-ce que SQL ?
SQL est juste un langage utilisé en programmation. Lorsque nous disons « utiliser SQL », c’est ce que nous voulons dire:
- Vos données sont stockées dans une base de données relationnelle, composée de tables. Ces tableaux ressemblent généralement à une feuille dans Excel, avec des lignes et des colonnes.
- Vous récupérez des données et effectuez une analyse avec des requêtes, qui sont un ensemble d’instructions écrites en SQL. Vous pouvez les enregistrer de la même manière que vous enregistrez un fichier texte.
- Au lieu de décrire comment obtenir les données — comme dans Excel ou des feuilles — vos requêtes décrivent les données que vous souhaitez. Vous pouvez exécuter ces requêtes avec un interpréteur SQL, qui effectue les étapes de récupération et d’analyse nécessaires pour vous.
Excel vers SQL : Pourquoi faire le changement ?
SQL est beaucoup plus rapide qu’Excel. Cela peut prendre quelques minutes en SQL pour faire ce qu’il faut près d’une heure pour faire dans Excel. Excel peut techniquement gérer un million de lignes, mais c’est avant les tableaux croisés dynamiques, les onglets multiples et les fonctions que vous utilisez probablement.
SQL sépare également l’analyse des données. Lorsque vous utilisez SQL, vos données sont stockées séparément de votre analyse. Au lieu d’envoyer un fichier Excel massif par e-mail, vous pouvez envoyer de minuscules fichiers texte contenant les instructions pour votre analyse. Les coéquipiers ont chacun accès aux mêmes données, de sorte qu’ils peuvent exécuter votre analyse par eux-mêmes. Ils n’ont pas à gérer les versions des fichiers ni à risquer de corrompre les données, et ils peuvent les ré-exécuter sur d’autres données.
Tout cela contribue à la demande sérieuse des employeurs pour des compétences SQL.
Dites adieu au « Moulinet de la mort »
Analysez les données avec SQL
Comment fonctionnent les requêtes ?
Vous vous souvenez de la table Pokémon ?
Name | Type | Weight |
---|---|---|
bulbasaur | grass | 15 |
charmander | fire | 19 |
squirtle | water | 20 |
pikachu | electric | 13 |
oddish | grass | 12 |
snorlax | normal | 1014 |
mewtwo | psychic | 269 |
With SQL, we can write queries to declare exactly what we want from the données. Par exemple :
Cette requête dit « Je veux le nom et le type de chaque Pokémon dans la table pokemon
qui est un type ‘grass’. »
Notre table résultante ressemblerait à ceci:
Nom | Type |
---|---|
bulbasaur | herbe |
oddish | herbe |
Décomposons cette requête:
-
SELECT
est le mot qui indique SQL pour lancer une requête -
name
ettype
sont des colonnes dans lepokemon
table -
FROM
est le mot qui indique à la requête de regarder lepokemon
table -
WHERE
filtres de nos données sur les conditions spécifiées
la Comparer à l’équivalent de travail dans Excel. Plutôt que de prendre une série d’étapes sujettes aux erreurs, lentes à exécuter, difficiles à répliquer et difficiles à partager, les requêtes SQL peuvent être plus rapides, plus faciles et plus sûres.
Puis-je encore utiliser des formules en SQL ?
Si vous êtes un utilisateur expérimenté d’Excel, vous pourriez hésiter à abandonner des formules familières comme celle-ci :
ou celle-ci :
SQL offre les mêmes fonctionnalités, avec une plus grande lisibilité, grâce à sa syntaxe structurée et de type anglais. SUM
est utilisé pour ajouter plusieurs valeurs, et CASE
est utilisé pour gérer la logique conditionnelle. Par exemple :
ou :
La première instruction renvoie la somme de tous les poids de la table pokemon
. La deuxième instruction renvoie deux colonnes : le nom de chaque Pokémon et une étiquette de taille (« petit » si moins de 5, « moyen » si moins de 15, etc.). Notez que SQL utilise des noms de colonnes spécifiques au lieu de références de cellules abstraites, et des mots comme WHEN
et THEN
au lieu de parenthèses et de virgules.
Vous pouvez également utiliser des tableaux croisés dynamiques. Ce qui vous prend sept clics dans Excel vous prendrait sept frappes en SQL — tapez simplement GROUP BY
:
Cette requête renverra le poids total de tous les Pokémon qui relèvent de chaque type:
Type | Poids |
---|---|
27 | |
19 | |
20 | |
électrique | 13 |
normal | 1014 |
psychique | 269 |
Cette instruction SQL est plus concise et concrète que la liste d’instructions dont vous auriez besoin pour décrire la même chose pivot dans Excel, et l’instruction peut être exécutée sur plusieurs ensembles de données avec peu d’effort. En d’autres termes, l’instruction SQL est facile à examiner et facilement transférable.
En conclusion
Les applications de tableur comme Sheets et Excel sont idéales pour les présentations, les graphiques et les petites analyses, mais elles peuvent être inadéquates pour les tâches nécessitant un levage plus lourd. SQL peut effectuer la plupart de ces tâches plus rapidement, et il est plus convivial du début à la fin.
Si vous souhaitez expérimenter le SQL vous-même ou si vous ne pensez pas que les Pokémon constituent un argument suffisamment convaincant, essayez notre outil gratuit » Pourquoi apprendre le SQL? »cours, écrit par le concepteur de programmes de données de Codecademy et responsable de la science des données, Hillary Green-Lerman.
Si vous êtes prêt à apprendre les tenants et les aboutissants du langage et à le pratiquer avec des données réelles, vous pouvez apprendre SQL à partir de zéro dans le dernier Pro Intensif de Codecademy. À mesure que vous apprendrez et vous améliorerez avec SQL, vous pourrez transférer une plus grande partie de votre charge de travail d’Excel vers SQL, en réservant Excel comme dernière étape pour créer des tableaux et des graphiques attrayants.
Sonny Li et Dan Layfield ont contribué à cet article.
Leave a Reply