Articles

Excel la SQL: De ce ar trebui să facă trecerea

dacă utilizați aplicații de calcul tabelar, cum ar fi Excel sau foi de calcul Google la locul de muncă, aceste probleme ar putea fi familiar pentru tine:

  • Este ușor de a face modificări accidentale la date
  • este greu de a reproduce o analiză veche pe date noi (atât de mulți pași să-și amintească!)
  • este lent, cu seturi mari de date
  • este greoaie pentru a partaja foi de calcul gigant prin e-mail

aplicații de calcul tabelar sunt abordabile, omniprezente, și flexibil. Ele pot îmbina celule, adăuga comentarii, pivot pe date, tabele de format și pot crea grafice. Dar cu flexibilitate vine riscul. Acestea pot duce la mai multă muncă, mai multă așteptare, mai multe dureri de cap și o precizie mai mică. Din fericire, SQL poate fi mai rapid, mai ușor și mai sigur decât Excel. Citiți mai departe pentru a afla ce este SQL și pentru a vedea de ce este o modalitate superioară de a manipula și analiza datele.

dezavantajele Excel

să începem cu o aplicație practică. Aruncati o privire la acest tabel de Pok Oktimon și caracteristicile lor:

Name Type Weight
bulbasaur grass 15
charmander fire 19
squirtle water 20
pikachu electric 13
oddish grass 12
snorlax normal 1014
mewtwo psychic 269

Suppose that we want to use Excel to filter out everything but the name și tipul de fiecare tip de iarbă Pok Unixmon în tabel. În Excel, trebuie să folosim instrucțiuni pas-cu-pas pentru a obține datele:

  • deschideți tabelul Pok de la Unktimon
  • adăugați un filtru la coloana „type”
  • filtru pentru type = „grass”
  • eliminați toate coloanele, cu excepția „name”

în acest moment am editat datele (erori potențiale), nu avem o copie a pașilor salvați oriunde (greu de reprodus) și va trebui să trimiteți prin e-mail fișier întreg pentru colegii noștri Pok trainers oktimon (controlul dureros al versiunii).

pe măsură ce tabelul Pok Unktimonon crește, Excel—sau foi de calcul Google—încetinește. Dacă numărul de rânduri este în mii, ar putea afecta cu adevărat fluxul nostru de lucru. Dacă ați fost vreodată blocat uitându-vă la un mesaj „Pinwheel of Death” sau la un mesaj „Excel quit neasteptate”, știți durerea.

ce este SQL?

SQL este doar un limbaj folosit în programare. Când spunem „folosiți SQL”, la asta ne referim:

  • datele dvs. sunt stocate într-o bază de date relațională, care este formată din tabele. Aceste tabele arată de obicei ca o foaie în Excel, cu rânduri și coloane.
  • preluați date și efectuați analize cu interogări, care sunt un set de instrucțiuni scrise în SQL. Le puteți salva în același mod în care salvați un fișier text.
  • în loc să descrieți cum să obțineți datele—cum ar fi în Excel sau foi de calcul—interogările dvs. descriu ce date doriți. Puteți rula aceste interogări cu un interpret SQL, care face pașii necesari de recuperare și analiză pentru dvs.

Excel la SQL: de ce face comutatorul?

SQL este mult mai rapid decât Excel. Poate dura câteva minute în SQL pentru a face ceea ce durează aproape o oră pentru a face în Excel. Excel poate gestiona tehnic un milion de rânduri, dar asta este înainte de tabelele pivot, mai multe file și funcțiile pe care probabil le utilizați.

SQL separă, de asemenea, analiza de date. Când utilizați SQL, datele dvs. sunt stocate separat de analiza dvs. În loc să trimiteți prin e-mail un fișier Excel masiv, puteți trimite mici fișiere text simple care conțin instrucțiunile pentru analiza dvs. Colegii de echipă au fiecare acces la aceleași date, astfel încât să poată rula analiza pe cont propriu. Nu trebuie să gestioneze versiunile de fișiere sau să riște să corupă datele și le pot rula din nou pe orice alte date.

toate acestea contribuie la cererea serioasă din partea angajatorilor pentru abilități SQL.

Spune La revedere de la”Pinwheel de moarte”

analiza datelor cu SQL

cum funcționează interogări?

amintiți-vă de masă Pok Oktimon?

Name Type Weight
bulbasaur grass 15
charmander fire 19
squirtle water 20
pikachu electric 13
oddish grass 12
snorlax normal 1014
mewtwo psychic 269

With SQL, we can write queries to declare exactly what we want from the data. De exemplu:

această interogare spune „Vreau numele și tipul de fiecare Pok Unktimon înpokemon tabel care este un tip de „iarbă”.”

tabelul nostru rezultat ar arăta astfel:

nume Tip
bulbasaur iarbă
oddish iarbă

să spargem această interogare:

  • SELECT este cuvântul cheie care spune SQL pentru a începe o interogare
  • name și type sunt coloane în pokemon tabel
  • FROM este cuvântul cheie care spune interogării să se uite la pokemon tabelul
  • WHERE filtrează datele noastre în condiții specificate

comparați acest lucru cu munca echivalentă din Excel. Mai degrabă decât a lua o serie de pași care sunt predispuse la eroare, lent pentru a executa, greu de reprodus, și greoaie pentru a partaja, interogări SQL poate fi mai rapid, mai ușor și mai sigur.

mai pot folosi formule în SQL?

Dacă sunteți un Excel power-user, ați putea ezita să renunțe la formule familiare, cum ar fi aceasta:

sau acest lucru:

SQL oferă aceeași funcționalitate, cu o mai mare lizibilitate, datorită sintaxei sale structurate și engleză-ca. SUM este utilizat pentru a adăuga mai multe valori, iar CASE este utilizat pentru a gestiona logica condiționată. De exemplu:

sau:

prima instrucțiune returnează suma tuturor greutăților din tabelulpokemon. A doua declarație returnează două coloane: numele fiecărui Pok Oktimon și o etichetă de dimensiune („mic” dacă este sub 5, „Mediu” dacă este sub 15 etc.). Observați că SQL folosește nume de coloane specifice în loc de referințe de celule abstracte și cuvinte precum WHEN și THEN în loc de paranteze și virgule.

s-ar putea folosi tabele pivot, de asemenea. Ceea ce vă duce șapte clicuri în Excel vă va duce șapte apăsări de taste în SQL-trebuie doar să tastați GROUP BY:

această interogare va returna greutatea totală a tuturor Pokului care se încadrează în fiecare tip:

Tip greutate
iarbă 27
foc 19
apă 20
electric 13
normal 1014 psihic 269

această instrucțiune SQL este mai concisă și mai concretă decât lista de instrucțiuni de care aveți nevoie pentru a descrie același pivot în Excel, iar instrucțiunea poate fi rulată pe mai multe seturi de date cu puțin efort. Cu alte cuvinte, instrucțiunea SQL este ușor de revizuit și ușor transferabilă.

în concluzie

aplicații de calcul tabelar, cum ar fi foi de calcul și Excel sunt foarte bune pentru prezentări, grafice, și analize mici, dar ele pot fi inadecvate pentru sarcini care necesită ridicare mai grele. SQL poate finaliza majoritatea acestor sarcini mai repede și este mai ușor de utilizat de la început până la sfârșit.

Dacă doriți să experimentați cu SQL-te sau nu crezi că Pok Unktimon face un argument suficient de convingător, Încercați nostru gratuit ” de ce să învețe SQL?”curs, scris de proiectantul curriculumului de date al Codecademy și șeful științei datelor, Hillary Green-Lerman.

Dacă sunteți gata să învețe intrarile si iesirile de limba și practica cu date reale, puteți învăța SQL de la zero în cele mai recente Pro Intensive Codecademy lui. Pe măsură ce învățați și îmbunătățiți cu SQL, veți putea schimba mai mult din volumul de lucru de la Excel la SQL, rezervând Excel ca ultimă etapă pentru a crea tabele și grafice atractive.

Sonny Li și Dan Layfield au contribuit la acest articol.