Articles

Excel SQL: Proč By Se Spínačem

Pokud používáte tabulkový procesor, jako je Excel nebo Google Listy na práci, tyto problémy by mohly být známé na vás:

  • je To snadné, aby se náhodné změny dat
  • je těžké replikovat staré analýzy na nová data (takže mnoho kroků k zapamatování!)
  • je To pomalé s velkými soubory dat
  • je To těžkopádné sdílet obří tabulky přes e-mail

Tabulkových aplikací, jsou přístupní, všudypřítomné, a flexibilní. Mohou sloučit buňky, přidávat komentáře, otáčet data, formátovat tabulky a vytvářet grafy. Ale s flexibilitou přichází riziko. Mohou vést k více práci, více čekání, více verzování bolesti hlavy, a nižší přesnost. Naštěstí SQL může být rychlejší, jednodušší a bezpečnější než Excel. Čtěte dále a dozvíte se, co je SQL, a zjistěte, proč je to vynikající způsob manipulace a analýzy dat.

nevýhody aplikace Excel

začněme praktickou aplikací. Podívejte se na tuto tabulku Pokémonů a jejich charakteristiky:

Name Type Weight
bulbasaur grass 15
charmander fire 19
squirtle water 20
pikachu electric 13
oddish grass 12
snorlax normal 1014
mewtwo psychic 269

Suppose that we want to use Excel to filter out everything but the name a typ každého typu trávy Pokémon v tabulce. V aplikaci Excel, musíme použít krok-za-krokem návod, jak získat data:

  • otevřete Pokémon tabulky
  • přidat filtr na sloupec „typ“
  • filtr pro typ = „tráva“
  • odstranit všechny sloupce s výjimkou „jméno“

v tuto chvíli jsme upravili data (případné chyby), nemáme kopie kroky uloženy kdekoliv (těžko replikovat), a budeme muset e-mailem celý soubor, aby naši kolegové trenéři Pokémonů (bolestivé verze control).

jak tabulka Pokémonů roste, Excel – nebo Tabulky Google-se zpomaluje. Pokud je počet řádků v tisících, mohlo by to opravdu poškodit náš pracovní postup. Pokud jste někdy uvízli a zírali na zprávu „Větrník smrti“ nebo „Excel neočekávaně ukončit“, znáte bolest.

co je SQL?

SQL je pouze jazyk používaný v programování. Když říkáme „použít SQL“, máme na mysli toto:

  • vaše data jsou uložena v relační databázi, která je tvořena tabulkami. Tyto tabulky obvykle vypadají jako jeden list v aplikaci Excel s řádky a sloupci.
  • načítáte data a provádíte analýzu pomocí dotazů, což jsou sady instrukcí napsaných v SQL. Můžete je uložit stejným způsobem, jakým uložíte textový soubor.
  • místo popisu, jak získat data—jako v Excelu nebo tabulkách—vaše dotazy popisují, jaká data chcete. Tyto dotazy můžete spustit pomocí interpretu SQL, který pro vás provede nezbytné kroky vyhledávání a analýzy.

Excel na SQL: proč provést přepínač?

SQL je mnohem rychlejší než Excel. To může trvat několik minut v SQL dělat to, co to trvá téměř hodinu dělat v aplikaci Excel. Excel technicky zvládne jeden milion řádků, ale to je před kontingenčními tabulkami, více kartami a funkcemi, které pravděpodobně používáte.

SQL také odděluje analýzu od dat. Při použití SQL jsou vaše data uložena odděleně od analýzy. Místo e-mailu masivní soubor aplikace Excel, můžete posílat malé textové soubory obsahující pokyny pro vaši analýzu. Spoluhráči mají každý přístup ke stejným datům, takže mohou vaši analýzu spustit sami. Nemusí Spravovat verze souborů ani riskovat poškození dat a mohou je znovu spustit na jiných datech.

to vše přispívá k vážné poptávce zaměstnavatelů po dovednostech SQL.

rozloučte se s „Větrníkem smrti“

analyzujte Data pomocí SQL

jak fungují dotazy?

Pamatujete si tabulku Pokémonů?

Name Type Weight
bulbasaur grass 15
charmander fire 19
squirtle water 20
pikachu electric 13
oddish grass 12
snorlax normal 1014
mewtwo psychic 269

With SQL, we can write queries to declare exactly what we want from the datum. Například:

Tento dotaz říká, „chci, název a typ každý Pokémon v pokemon tabulka, že je „tráva“ typ.“

Naše výsledná tabulka bude vypadat takto:

Jméno Typ
bulbasaur tráva
oddish tráva

Pojďme prolomit tento dotaz dole:

  • SELECT je klíčové slovo, které říká, SQL pro spuštění dotazu
  • nametype sloupce v pokemon tabulka
  • FROM je klíčové slovo, které říká, dotaz se podívat na pokemon tabulka
  • WHERE filtry naše data na specifikovaných podmínek

Porovnat s ekvivalentní práci v aplikaci Excel. Spíše než o řadu kroků, které jsou náchylné na chyby, pomalé provedení, těžké napodobit, a těžkopádné sdílet, SQL dotazy mohou být rychlejší, jednodušší a bezpečnější.

mohu stále používat vzorce v SQL?

Pokud jste aplikaci Excel, power-uživatele, můžete být váhají, aby se vzdali známé vzorce, jako je tento:

nebo takto:

SQL nabízí stejné funkce, s větší čitelnost, a to díky své strukturované a anglicky jako syntaxe. SUM se používá k přidání více hodnot, a CASE se používá pro zpracování podmíněné logiky. Například:

:

první příkaz vrátí součet všech závaží v pokemon tabulka. Druhý příkaz vrací dva sloupce: Název každého Pokémona a štítek velikosti („malý“, pokud je pod 5, „Střední“, pokud je pod 15 atd.). Všimněte si, že SQL používá specifické názvy sloupců namísto abstraktní odkazy na buňky, a slova jako WHENTHEN namísto závorky a čárky.

můžete také použít kontingenční tabulky. To, co trvá sedm kliknutí v aplikaci Excel by trvat sedm kláves v SQL—stačí zadat GROUP BY:

Tento dotaz vrátí celkové hmotnosti všech Pokémon, které spadají pod každý typ:

Typ Hmotnost
tráva 27
oheň 19
voda 20
elektrický 13
normální 1014
médium 269

Tento příkaz SQL je více stručné a konkrétní, než seznam instrukcí budete potřebovat k popisu stejné pivot v aplikaci Excel, a prohlášení lze spustit na více souborů údajů s minimálním úsilím. Jinými slovy, příkaz SQL je snadno kontrolovatelný a snadno přenosný.

Závěr

Tabulkových aplikací, jako Listy a Excel jsou skvělé pro prezentace, grafů, a malé analýzy, ale mohou být nedostatečné pro úkoly, které vyžadují těžší zvedání. SQL dokáže většinu těchto úkolů dokončit rychleji a je uživatelsky přívětivější od začátku do konce.

Pokud byste chtěli experimentovat s SQL sami nebo si nemyslíte, že Pokémon dělá dostatečně přesvědčivý argument, zkuste náš bezplatný „proč se učit SQL?“kurz, napsal Codecademy data curriculum designer a vedoucí datové vědy, Hillary Green-Lerman.

Pokud jste připraveni se naučit vstupy a výstupy jazyka a procvičovat je s reálnými daty, můžete se naučit SQL od nuly v Codecademy nejnovější Pro intenzivní. Jak se učíte a vylepšujete pomocí SQL, budete moci přesunout více své pracovní zátěže z Excelu na SQL a rezervovat Excel jako poslední fázi, abyste vytvořili atraktivní tabulky a grafy.

Sonny Li a Dan Layfield přispěli k tomuto článku.