Articles

Excel zu SQL: Warum Sie den Wechsel vornehmen sollten

Wenn Sie Tabellenkalkulationsprogramme wie Excel oder Google Sheets bei der Arbeit verwenden, sind Ihnen diese Probleme möglicherweise bekannt:

  • Es ist leicht, versehentliche Änderungen an Daten vorzunehmen
  • Es ist schwierig, eine alte Analyse auf neue Daten zu replizieren (so viele Schritte, an die Sie sich erinnern sollten!)
  • Es ist langsam mit großen Datenmengen
  • Es ist umständlich, riesige Tabellenkalkulationen per E-Mail zu teilen

Tabellenkalkulationsanwendungen sind zugänglich, allgegenwärtig und flexibel. Sie können Zellen zusammenführen, Kommentare hinzufügen, Daten drehen, Tabellen formatieren und Diagramme erstellen. Aber mit Flexibilität kommt Risiko. Sie können zu mehr Arbeit, mehr Wartezeiten, mehr Kopfschmerzen bei der Versionierung und geringerer Genauigkeit führen. Glücklicherweise kann SQL schneller, einfacher und sicherer sein als Excel. Lesen Sie weiter, um zu erfahren, was SQL ist und warum es eine überlegene Methode zum Bearbeiten und Analysieren von Daten ist.

Nachteile von Excel

Beginnen wir mit einer praktischen Anwendung. Schauen Sie sich diese Pokémon-Tabelle und ihre Eigenschaften an:

Name Type Weight
bulbasaur grass 15
charmander fire 19
squirtle water 20
pikachu electric 13
oddish grass 12
snorlax normal 1014
mewtwo psychic 269

Suppose that we want to use Excel to filter out everything but the name und Art jedes Gras Typ Pokémon in der Tabelle. In Excel müssen wir eine Schritt-für-Schritt-Anleitung verwenden, um die Daten abzurufen:

  • Öffnen Sie die folgende Tabelle
  • Fügen Sie der Spalte „type“ einen Filter hinzu
  • filter für type = „name“
  • Entfernen Sie alle Spalten außer „name“

Zu diesem Zeitpunkt haben wir die Daten bearbeitet (mögliche Fehler), wir haben keine Kopie der Schritte irgendwo gespeichert (schwer zu replizieren), und wir müssen die datei an unsere Pokémon-Trainerkollegen (siehe Versionskontrolle).

Wenn die Google—Tabelle wächst, wird Excel — oder Google Sheets – langsamer. Wenn die Anzahl der Zeilen in die Tausende geht, könnte dies unseren Workflow wirklich beeinträchtigen. Wenn Sie jemals auf ein „Windrad des Todes“ oder eine „Excel unerwartet beenden“ -Nachricht gestarrt haben, kennen Sie den Schmerz.

Was ist SQL?

SQL ist nur eine Programmiersprache. Wenn wir „SQL verwenden“ sagen, meinen wir Folgendes:

  • Ihre Daten werden in einer relationalen Datenbank gespeichert, die aus Tabellen besteht. Diese Tabellen sehen normalerweise wie ein Blatt in Excel aus, mit Zeilen und Spalten.
  • Sie rufen Daten ab und führen Analysen mit Abfragen durch, bei denen es sich um Anweisungen handelt, die in SQL geschrieben sind. Sie können sie auf die gleiche Weise speichern, wie Sie eine Textdatei speichern.
  • Anstatt zu beschreiben, wie die Daten abgerufen werden — wie in Excel oder Sheets — beschreiben Ihre Abfragen, welche Daten Sie möchten. Sie können diese Abfragen mit einem SQL-Interpreter ausführen, der die erforderlichen Abruf- und Analyseschritte für Sie ausführt.

Excel zu SQL: Warum wechseln?

SQL ist viel schneller als Excel. In SQL kann es Minuten dauern, was in Excel fast eine Stunde dauert. Excel kann technisch eine Million Zeilen verarbeiten, aber das ist vor den Pivot-Tabellen, mehreren Registerkarten und Funktionen, die Sie wahrscheinlich verwenden.

SQL trennt auch die Analyse von den Daten. Bei der Verwendung von SQL werden Ihre Daten getrennt von Ihrer Analyse gespeichert. Anstatt eine riesige Excel-Datei per E-Mail zu senden, können Sie winzige Textdateien mit den Anweisungen für Ihre Analyse senden. Teamkollegen haben jeweils Zugriff auf dieselben Daten, sodass sie Ihre Analyse selbst ausführen können. Sie müssen keine Dateiversionen verwalten oder riskieren, die Daten zu beschädigen, und sie können sie auf anderen Daten erneut ausführen.

All dies trägt zur ernsthaften Nachfrage von Arbeitgebern nach SQL-Fähigkeiten bei.

Verabschieden Sie sich vom „Windrad des Todes“

Analysieren Sie Daten mit SQL

Wie funktionieren Abfragen?

Erinnerst du dich an den Pokémon-Tisch?

Name Type Weight
bulbasaur grass 15
charmander fire 19
squirtle water 20
pikachu electric 13
oddish grass 12
snorlax normal 1014
mewtwo psychic 269

With SQL, we can write queries to declare exactly what we want from the Daten. Zum Beispiel:

Diese Abfrage besagt: „Ich möchte den Namen und Typ jedes Pokémon in der pokemon Tabelle, die ein „Gras“ -Typ ist.“

Unsere resultierende Tabelle würde so aussehen:

Name Typ
bulbasaur Gras
seltsam Gras

Lassen Sie uns diese Abfrage aufschlüsseln:

  • SELECT ist das Schlüsselwort, das SQL anweist, eine Abfrage zu starten
  • name und type sind Spalten in der pokemon Tabelle
  • FROM ist das Schlüsselwort, das die Abfrage anweist, die pokemon Tabelle
  • WHERE filtert unsere Daten unter bestimmten Bedingungen

Vergleichen Sie dies mit der entsprechenden Arbeit in Excel. Anstatt eine Reihe von Schritten auszuführen, die fehleranfällig, langsam auszuführen, schwer zu replizieren und umständlich zu teilen sind, können SQL-Abfragen schneller, einfacher und sicherer sein.

Kann ich noch Formeln in SQL verwenden?

Wenn Sie ein Excel-Power-User sind, zögern Sie vielleicht, vertraute Formeln wie diese aufzugeben:

oder dies:

SQL bietet die gleiche Funktionalität, mit größerer Lesbarkeit, dank seiner strukturierten und englischen Syntax. SUM wird verwendet, um mehrere Werte hinzuzufügen, und CASE wird verwendet, um bedingte Logik zu behandeln. Beispiel:

oder:

Die erste Anweisung gibt die Summe aller Gewichtungen in der pokemon-Tabelle zurück. Die zweite Anweisung gibt zwei Spalten zurück: den Namen jedes Pokémon und eine Größenbezeichnung („klein“, wenn unter 5, „mittel“, wenn unter 15 usw.). Beachten Sie, dass SQL bestimmte Spaltennamen anstelle von abstrakten Zellreferenzen und Wörter wie WHEN und THEN anstelle von Klammern und Kommas verwendet.

Sie können auch Pivot-Tabellen verwenden. Was in Excel sieben Klicks erfordert, würde in SQL sieben Tastenanschläge erfordern – geben Sie einfach GROUP BY ein:

Diese Abfrage gibt das Gesamtgewicht aller Pokémon zurück, die unter jeden Typ fallen:

Typ Gewicht
Gras 27
Feuer 19
Wasser 20
electric 13
normal 1014
psychic 269

Diese SQL-Anweisung ist prägnanter und konkreter als die Liste der Anweisungen, die Sie benötigen würden, um denselben Pivot in Excel zu beschreiben, und die die Anweisung kann mit geringem Aufwand für mehrere Datasets ausgeführt werden. Mit anderen Worten, die SQL-Anweisung ist einfach zu überprüfen und leicht übertragbar.

Abschließend

Tabellenkalkulationsanwendungen wie Sheets und Excel eignen sich hervorragend für Präsentationen, Grafiken und kleine Analysen, können jedoch für Aufgaben, die schwereres Heben erfordern, unzureichend sein. SQL kann die meisten dieser Aufgaben schneller erledigen und ist von Anfang bis Ende benutzerfreundlicher.

Wenn Sie selbst mit SQL experimentieren möchten oder nicht überzeugend genug argumentieren möchten, probieren Sie unser kostenloses „Warum SQL lernen?“ Kurs, geschrieben von Codecademys Data Curriculum Designer und Head of Data Science, Hillary Green-Lerman.

Wenn Sie bereit sind, die Ins und Outs der Sprache zu lernen und es mit echten Daten zu üben, können Sie SQL von Grund auf in Codecademy neuesten Pro Intensive lernen. Wenn Sie mit SQL lernen und sich verbessern, können Sie mehr von Ihrer Arbeitslast von Excel auf SQL verlagern und Excel als letzte Stufe reservieren, um attraktive Tabellen und Diagramme zu erstellen.

Sonny Li und Dan Layfield haben zu diesem Artikel beigetragen.