Excel SQL: Proč By Se Spínačem
Pokud používáte tabulkový procesor, jako je Excel nebo Google Listy na práci, tyto problémy by mohly být známé na vás:
- je To snadné, aby se náhodné změny dat
- je těžké replikovat staré analýzy na nová data (takže mnoho kroků k zapamatování!)
- je To pomalé s velkými soubory dat
- je To těžkopádné sdílet obří tabulky přes e-mail
Tabulkových aplikací, jsou přístupní, všudypřítomné, a flexibilní. Mohou sloučit buňky, přidávat komentáře, otáčet data, formátovat tabulky a vytvářet grafy. Ale s flexibilitou přichází riziko. Mohou vést k více práci, více čekání, více verzování bolesti hlavy, a nižší přesnost. Naštěstí SQL může být rychlejší, jednodušší a bezpečnější než Excel. Čtěte dále a dozvíte se, co je SQL, a zjistěte, proč je to vynikající způsob manipulace a analýzy dat.
nevýhody aplikace Excel
začněme praktickou aplikací. Podívejte se na tuto tabulku Pokémonů a jejich charakteristiky:
Name | Type | Weight |
---|---|---|
bulbasaur | grass | 15 |
charmander | fire | 19 |
squirtle | water | 20 |
pikachu | electric | 13 |
oddish | grass | 12 |
snorlax | normal | 1014 |
mewtwo | psychic | 269 |
Suppose that we want to use Excel to filter out everything but the name a typ každého typu trávy Pokémon v tabulce. V aplikaci Excel, musíme použít krok-za-krokem návod, jak získat data:
- otevřete Pokémon tabulky
- přidat filtr na sloupec „typ“
- filtr pro typ = „tráva“
- odstranit všechny sloupce s výjimkou „jméno“
v tuto chvíli jsme upravili data (případné chyby), nemáme kopie kroky uloženy kdekoliv (těžko replikovat), a budeme muset e-mailem celý soubor, aby naši kolegové trenéři Pokémonů (bolestivé verze control).
jak tabulka Pokémonů roste, Excel – nebo Tabulky Google-se zpomaluje. Pokud je počet řádků v tisících, mohlo by to opravdu poškodit náš pracovní postup. Pokud jste někdy uvízli a zírali na zprávu „Větrník smrti“ nebo „Excel neočekávaně ukončit“, znáte bolest.
co je SQL?
SQL je pouze jazyk používaný v programování. Když říkáme „použít SQL“, máme na mysli toto:
- vaše data jsou uložena v relační databázi, která je tvořena tabulkami. Tyto tabulky obvykle vypadají jako jeden list v aplikaci Excel s řádky a sloupci.
- načítáte data a provádíte analýzu pomocí dotazů, což jsou sady instrukcí napsaných v SQL. Můžete je uložit stejným způsobem, jakým uložíte textový soubor.
- místo popisu, jak získat data—jako v Excelu nebo tabulkách—vaše dotazy popisují, jaká data chcete. Tyto dotazy můžete spustit pomocí interpretu SQL, který pro vás provede nezbytné kroky vyhledávání a analýzy.
Excel na SQL: proč provést přepínač?
SQL je mnohem rychlejší než Excel. To může trvat několik minut v SQL dělat to, co to trvá téměř hodinu dělat v aplikaci Excel. Excel technicky zvládne jeden milion řádků, ale to je před kontingenčními tabulkami, více kartami a funkcemi, které pravděpodobně používáte.
SQL také odděluje analýzu od dat. Při použití SQL jsou vaše data uložena odděleně od analýzy. Místo e-mailu masivní soubor aplikace Excel, můžete posílat malé textové soubory obsahující pokyny pro vaši analýzu. Spoluhráči mají každý přístup ke stejným datům, takže mohou vaši analýzu spustit sami. Nemusí Spravovat verze souborů ani riskovat poškození dat a mohou je znovu spustit na jiných datech.
to vše přispívá k vážné poptávce zaměstnavatelů po dovednostech SQL.
rozloučte se s „Větrníkem smrti“
analyzujte Data pomocí SQL
jak fungují dotazy?
Pamatujete si tabulku Pokémonů?
Name | Type | Weight |
---|---|---|
bulbasaur | grass | 15 |
charmander | fire | 19 |
squirtle | water | 20 |
pikachu | electric | 13 |
oddish | grass | 12 |
snorlax | normal | 1014 |
mewtwo | psychic | 269 |
With SQL, we can write queries to declare exactly what we want from the datum. Například:
Tento dotaz říká, „chci, název a typ každý Pokémon v pokemon
tabulka, že je „tráva“ typ.“
Naše výsledná tabulka bude vypadat takto:
Jméno | Typ |
---|---|
bulbasaur | tráva |
oddish | tráva |
Pojďme prolomit tento dotaz dole:
-
SELECT
je klíčové slovo, které říká, SQL pro spuštění dotazu -
name
type
sloupce vpokemon
tabulka -
FROM
je klíčové slovo, které říká, dotaz se podívat napokemon
tabulka -
WHERE
filtry naše data na specifikovaných podmínek
Porovnat s ekvivalentní práci v aplikaci Excel. Spíše než o řadu kroků, které jsou náchylné na chyby, pomalé provedení, těžké napodobit, a těžkopádné sdílet, SQL dotazy mohou být rychlejší, jednodušší a bezpečnější.
mohu stále používat vzorce v SQL?
Pokud jste aplikaci Excel, power-uživatele, můžete být váhají, aby se vzdali známé vzorce, jako je tento:
nebo takto:
SQL nabízí stejné funkce, s větší čitelnost, a to díky své strukturované a anglicky jako syntaxe. SUM
se používá k přidání více hodnot, a CASE
se používá pro zpracování podmíněné logiky. Například:
:
první příkaz vrátí součet všech závaží v pokemon
tabulka. Druhý příkaz vrací dva sloupce: Název každého Pokémona a štítek velikosti („malý“, pokud je pod 5, „Střední“, pokud je pod 15 atd.). Všimněte si, že SQL používá specifické názvy sloupců namísto abstraktní odkazy na buňky, a slova jako WHEN
THEN
namísto závorky a čárky.
můžete také použít kontingenční tabulky. To, co trvá sedm kliknutí v aplikaci Excel by trvat sedm kláves v SQL—stačí zadat GROUP BY
:
Tento dotaz vrátí celkové hmotnosti všech Pokémon, které spadají pod každý typ:
Typ | Hmotnost |
---|---|
tráva | 27 |
oheň | 19 |
voda | 20 |
elektrický | 13 |
normální | 1014 |
médium | 269 |
Tento příkaz SQL je více stručné a konkrétní, než seznam instrukcí budete potřebovat k popisu stejné pivot v aplikaci Excel, a prohlášení lze spustit na více souborů údajů s minimálním úsilím. Jinými slovy, příkaz SQL je snadno kontrolovatelný a snadno přenosný.
Závěr
Tabulkových aplikací, jako Listy a Excel jsou skvělé pro prezentace, grafů, a malé analýzy, ale mohou být nedostatečné pro úkoly, které vyžadují těžší zvedání. SQL dokáže většinu těchto úkolů dokončit rychleji a je uživatelsky přívětivější od začátku do konce.
Pokud byste chtěli experimentovat s SQL sami nebo si nemyslíte, že Pokémon dělá dostatečně přesvědčivý argument, zkuste náš bezplatný „proč se učit SQL?“kurz, napsal Codecademy data curriculum designer a vedoucí datové vědy, Hillary Green-Lerman.
Pokud jste připraveni se naučit vstupy a výstupy jazyka a procvičovat je s reálnými daty, můžete se naučit SQL od nuly v Codecademy nejnovější Pro intenzivní. Jak se učíte a vylepšujete pomocí SQL, budete moci přesunout více své pracovní zátěže z Excelu na SQL a rezervovat Excel jako poslední fázi, abyste vytvořili atraktivní tabulky a grafy.
Sonny Li a Dan Layfield přispěli k tomuto článku.
Leave a Reply