Articles

Excel naar SQL: waarom u de Switch

Als u spreadsheettoepassingen zoals Excel of Google Spreadsheets op het werk gebruikt, kunnen deze problemen u bekend zijn:

  • het is gemakkelijk om toevallige wijzigingen aan te brengen in data
  • het is moeilijk om een oude analyse te repliceren op nieuwe data (zoveel stappen om te onthouden!)
  • het is traag met grote gegevenssets
  • het is omslachtig om gigantische spreadsheets te delen via e-mail

Spreadsheettoepassingen zijn benaderbaar, alomtegenwoordig en flexibel. Ze kunnen Cellen samenvoegen, opmerkingen toevoegen, draaien op gegevens, tabellen opmaken en grafieken maken. Maar met flexibiliteit komt risico. Ze kunnen leiden tot meer werk, meer wachten, meer versiehoofdpijn en een lagere nauwkeurigheid. Gelukkig kan SQL sneller, gemakkelijker en veiliger zijn dan Excel. Lees verder om te leren wat SQL is en om te zien waarom het een superieure manier is om gegevens te manipuleren en te analyseren.

nadelen van Excel

laten we beginnen met een praktische toepassing. Neem een kijkje op deze tabel van Pokémon en hun kenmerken:

Name Type Weight
bulbasaur grass 15
charmander fire 19
squirtle water 20
pikachu electric 13
oddish grass 12
snorlax normal 1014
mewtwo psychic 269

Suppose that we want to use Excel to filter out everything but the name en type van elk gras type Pokémon in de tabel. In Excel moeten we stapsgewijze instructies gebruiken om de gegevens te verkrijgen:

  • open de Pokémon-tabel
  • voeg een filter toe aan de kolom “type”
  • filter voor type = “grass”
  • verwijder alle kolommen behalve “name”

Op dit punt hebben we de gegevens bewerkt (mogelijke fouten), hebben we nergens een kopie van de stappen opgeslagen (moeilijk te repliceren), en we je moet het hele bestand e-mailen naar onze collega Pokémon trainers (painful version control).

naarmate de Pokémon-tabel groeit, vertraagt Excel-of Google-Sheets. Als het aantal rijen in de duizenden is, kan het onze workflow echt schaden. Als je ooit vastzit te staren naar een “Pinwheel of Death “of een” Excel onverwacht gestopt ” bericht, Je kent de pijn.

Wat is SQL?

SQL is slechts een taal die gebruikt wordt in het programmeren. Als we zeggen “gebruik SQL”, dan bedoelen we dit:

  • uw gegevens worden opgeslagen in een relationele database, die bestaat uit tabellen. Die tabellen zien er meestal uit als één blad in Excel, met rijen en kolommen.
  • u haalt gegevens op en voert analyses uit met queries, een reeks instructies geschreven in SQL. U kunt ze opslaan op dezelfde manier als u een tekstbestand op te slaan.
  • in plaats van te beschrijven hoe u de gegevens kunt verkrijgen—zoals in Excel of Sheets—beschrijven uw query ‘ s welke gegevens u wilt. U kunt deze query ‘ s uitvoeren met een SQL-interpreter, die de nodige herstel-en analysestappen voor u uitvoert.

Excel naar SQL: waarom de switch maken?

SQL is veel sneller dan Excel. Het kan Minuten in SQL duren om te doen wat het bijna een uur kost om te doen in Excel. Excel kan technisch één miljoen rijen verwerken, maar dat is vóór de draaitabellen, meerdere tabbladen en functies die u waarschijnlijk gebruikt.

SQL scheidt ook analyse van gegevens. Bij gebruik van SQL worden uw gegevens apart van uw analyse opgeslagen. In plaats van het e-mailen van een enorme Excel-bestand, kunt u kleine platte tekst bestanden met de instructies voor uw analyse te sturen. Teamgenoten hebben allemaal toegang tot dezelfde gegevens, zodat ze uw analyse zelf kunnen uitvoeren. Ze hoeven geen bestandsversies te beheren of het risico lopen de gegevens te beschadigen, en ze kunnen het opnieuw uitvoeren op andere gegevens.

dit alles draagt bij aan de ernstige vraag van werkgevers naar SQL-vaardigheden.

Say goodbye to the “Pinwheel of Death”

analyseer Data met SQL

Hoe werken query ‘ s?

herinner je de Pokémon-tabel?

Name Type Weight
bulbasaur grass 15
charmander fire 19
squirtle water 20
pikachu electric 13
oddish grass 12
snorlax normal 1014
mewtwo psychic 269

With SQL, we can write queries to declare exactly what we want from the gegevens. Bijvoorbeeld:

deze query zegt ” Ik wil de naam en het type van elke Pokémon in de pokemon tabel die een ‘grass’ type is.”

onze resulterende tabel ziet er als volgt uit:

naam Type
bulbasaur grass oddish grass

laten we deze query opsplitsen:

  • SELECT is het sleutelwoord dat aangeeft SQL om te beginnen een query
  • name en type kolommen zijn in de pokemon tabel
  • FROM is het sleutelwoord dat de query om te kijken naar de pokemon tabel
  • WHERE filters voor onze gegevens op de opgegeven voorwaarden

dit Vergelijken met het equivalent werken in Excel. In plaats van het nemen van een reeks stappen die vatbaar zijn voor fouten, langzaam uit te voeren, moeilijk te repliceren, en omslachtig om te delen, SQL query ‘ s kunnen sneller, gemakkelijker en veiliger.

kan ik nog steeds formules gebruiken in SQL?

Als u een Excel power-user bent, kunt u aarzelen om bekende formules als deze op te geven:

of dit:

SQL biedt dezelfde functionaliteit, met een grotere leesbaarheid, dankzij de gestructureerde en Engels-achtige syntaxis. SUM wordt gebruikt om meerdere waarden toe te voegen, en CASE wordt gebruikt om voorwaardelijke logica af te handelen. Bijvoorbeeld:

of:

het eerste statement geeft de som van alle gewichten in de tabel pokemon. Het tweede statement geeft twee kolommen terug: de naam van elke Pokémon en een maatlabel (“small” indien Onder 5, “medium” indien Onder 15, enz.). Merk op dat SQL specifieke kolomnamen gebruikt in plaats van abstracte celverwijzingen, en woorden als WHEN en THEN in plaats van haakjes en komma ‘ s.

u kunt ook draaitabellen gebruiken. Wat kost je zeven klikken in Excel zou je zeven toetsaanslagen in SQL-typ gewoon GROUP BY:

deze query geeft het totale gewicht van alle Pokémon die onder elk type vallen:

Tekst Gewicht
gras 27
brand 19
water 20
elektrische 13
normaal 1014
psychische 269

Deze SQL-instructie wordt beknopt en concreet is dan de lijst van instructies die u zou moeten beschrijven dezelfde pivot in Excel, en de instructie kan worden uitgevoerd op meerdere datasets met weinig inspanning. Met andere woorden, de SQL verklaring is gemakkelijk te beoordelen en gemakkelijk overdraagbaar.

concluderend

Spreadsheettoepassingen zoals Sheets en Excel zijn geweldig voor presentaties, grafieken en kleine analyses, maar ze kunnen ontoereikend zijn voor taken die zwaarder tillen vereisen. SQL kan de meeste van die taken sneller voltooien en is van begin tot eind gebruiksvriendelijker.

als je zelf wilt experimenteren met SQL of als je denkt dat Pokémon geen overtuigend argument genoeg is, probeer dan onze gratis ” Why learn SQL?”cursus, geschreven door Codecademy’ s data curriculum ontwerper en hoofd van Data Science, Hillary Green-Lerman.

Als u klaar bent om de ins en outs van de taal te leren en deze met echte data te oefenen, kunt u SQL vanaf nul leren in Codecademy ‘ s nieuwste Pro Intensive. Terwijl u leert en verbetert met SQL, zult u in staat zijn om meer van uw werklast te verschuiven van Excel naar SQL, het reserveren van Excel als een laatste fase om aantrekkelijke tabellen en grafieken te maken.

Sonny Li en Dan Layfield droegen bij aan dit artikel.