Articles

Excel a SQL: Perché si dovrebbe fare lo Switch

Se si utilizzano applicazioni di fogli di calcolo come Excel o Google Fogli al lavoro, questi problemi potrebbero essere familiari a voi:

  • E ‘facile apportare modifiche accidentali ai dati
  • E’ difficile replicare una vecchia analisi su nuovi dati (tanti passi da ricordare!)
  • È lento con grandi insiemi di dati
  • È ingombrante condividere fogli di calcolo giganti tramite e-mail

Le applicazioni per fogli di calcolo sono accessibili, onnipresenti e flessibili. Possono unire celle, aggiungere commenti, ruotare su dati, formattare tabelle e creare grafici. Ma con la flessibilità viene rischio. Possono portare a più lavoro, più attesa, più mal di testa di versione e minore precisione. Fortunatamente, SQL può essere più veloce, più facile e più sicuro di Excel. Continua a leggere per imparare cos’è SQL e per capire perché è un modo superiore per manipolare e analizzare i dati.

Svantaggi di Excel

Iniziamo con un’applicazione pratica. Date un’occhiata a questa tabella di Pokémon e le loro caratteristiche:

Name Type Weight
bulbasaur grass 15
charmander fire 19
squirtle water 20
pikachu electric 13
oddish grass 12
snorlax normal 1014
mewtwo psychic 269

Suppose that we want to use Excel to filter out everything but the name e tipo di ogni Erba tipo Pokémon nella tabella. In Excel, è necessario utilizzare step-by-step istruzioni per ottenere i dati:

  • aprire il Pokémon tabella
  • aggiungere un filtro alla colonna “tipo”
  • filtro per il tipo = “erba”
  • rimuovere tutte le colonne tranne “nome”

a questo punto, abbiamo modificato i dati (potenziali errori), non abbiamo una copia dei passaggi salvato da nessuna parte (difficile da replicare), e abbiamo bisogno di e-mail che l’intero file per i nostri compagni di allenatori di Pokémon (dolorosa di controllo di versione).

Man mano che la tabella Pokémon cresce, Excel—o Google Sheets—rallenta. Se il numero di righe è nelle migliaia, potrebbe davvero danneggiare il nostro flusso di lavoro. Se sei mai stato bloccato a fissare una “Girandola di morte” o un messaggio “Excel quit inaspettatamente”, conosci il dolore.

Che cos’è SQL?

SQL è solo un linguaggio utilizzato nella programmazione. Quando diciamo “usa SQL”, questo è ciò che intendiamo:

  • I tuoi dati sono memorizzati in un database relazionale, che è fatto di tabelle. Quelle tabelle di solito sembrano un foglio in Excel, con righe e colonne.
  • È possibile recuperare i dati ed eseguire l’analisi con query, che sono un insieme di istruzioni scritte in SQL. È possibile salvarli allo stesso modo in cui si salva un file di testo.
  • Invece di descrivere come ottenere i dati—come in Excel o Fogli—le query descrivono quali dati si desidera. È possibile eseguire queste query con un interprete SQL, che esegue le fasi di recupero e analisi necessarie per l’utente.

Excel a SQL: perché fare il passaggio?

SQL è molto più veloce di Excel. Può richiedere minuti in SQL per fare quello che ci vuole quasi un’ora per fare in Excel. Excel può gestire tecnicamente un milione di righe, ma è prima delle tabelle pivot, delle schede multiple e delle funzioni che probabilmente stai utilizzando.

SQL separa anche l’analisi dai dati. Quando si utilizza SQL, i dati vengono memorizzati separatamente dall’analisi. Invece di inviare via email un enorme file Excel, è possibile inviare piccoli file di testo contenenti le istruzioni per l’analisi. I compagni di squadra hanno accesso agli stessi dati, in modo da poter eseguire l’analisi da soli. Non devono gestire le versioni dei file o rischiare di corrompere i dati e possono eseguirli nuovamente su qualsiasi altro dato.

Tutto ciò contribuisce alla seria richiesta da parte dei datori di lavoro di competenze SQL.

Dì addio alla “Girandola della morte”

Analizza i dati con SQL

Come funzionano le query?

Ricordi la tabella Pokémon?

Name Type Weight
bulbasaur grass 15
charmander fire 19
squirtle water 20
pikachu electric 13
oddish grass 12
snorlax normal 1014
mewtwo psychic 269

With SQL, we can write queries to declare exactly what we want from the dati. Ad esempio:

Questa query dice “Voglio il nome e il tipo di ogni Pokémon nella tabella pokemon che è un tipo ‘grass’.”

la Nostra tabella risultante sarà simile a questa:

Nome Tipo
bulbasaur erba
oddish erba

rompere questa query giù:

  • SELECT è la parola chiave che indica SQL per iniziare una query
  • name e type sono le colonne nel pokemon tabella
  • FROM è la parola chiave che indica la query guardare il pokemon tabella
  • WHERE filtri nostri dati specifici condizioni

Confronta questo per l’equivalente di lavoro in Excel. Invece di eseguire una serie di passaggi soggetti a errori, lenti da eseguire, difficili da replicare e ingombranti da condividere, le query SQL possono essere più veloci, più semplici e più sicure.

Posso ancora usare le formule in SQL?

Se sei un utente esperto di Excel, potresti essere riluttante a rinunciare a formule familiari come questa:

o questo:

SQL offre le stesse funzionalità, con una maggiore leggibilità, grazie alla sua sintassi strutturata e simile all’inglese. SUMviene utilizzato per aggiungere più valori eCASE viene utilizzato per gestire la logica condizionale. Ad esempio:

oppure:

La prima istruzione restituisce la somma di tutti i pesi nella tabella pokemon. La seconda dichiarazione restituisce due colonne: il nome di ogni Pokémon e un’etichetta di dimensione (“piccolo” se sotto 5,” medio ” se sotto 15, ecc.). Si noti che SQL utilizza nomi di colonne specifici invece di riferimenti di celle astratte e parole come WHEN e THEN invece di parentesi e virgole.

È possibile utilizzare anche le tabelle pivot. Ciò che ti porta sette clic in Excel ti porterebbe sette sequenze di tasti in SQL-basta digitare GROUP BY:

Questa query restituirà il peso totale di tutti i Pokémon che rientrano in ciascun tipo:

Tipo Peso
erba 27
fuoco 19
acqua 20
elettrico 13
normale 1014
psichica 269

Questa istruzione SQL è più conciso e concreto che l’elenco di istruzioni che si avrebbe bisogno di descrivere lo stesso pivot in Excel, e la dichiarazione può essere eseguito su più set di dati con poco sforzo. In altre parole, l’istruzione SQL è facile da rivedere e facilmente trasferibile.

In conclusione

Le applicazioni per fogli di calcolo come Fogli ed Excel sono ideali per presentazioni, grafici e piccole analisi, ma possono essere inadeguate per attività che richiedono un sollevamento più pesante. SQL può completare la maggior parte di queste attività più velocemente, ed è più facile da usare dall’inizio alla fine.

Se vuoi sperimentare te stesso con SQL o non pensi che i Pokémon facciano un argomento abbastanza convincente, prova il nostro “Perché imparare SQL?”corso, scritto dal progettista curriculum dati di Codecademy e responsabile della scienza dei dati, Hillary Green-Lerman.

Se sei pronto per imparare i dettagli della lingua e praticarla con dati reali, puoi imparare SQL da zero nell’ultimo Pro Intensive di Codecademy. Man mano che impari e migliori con SQL, sarai in grado di spostare più del tuo carico di lavoro da Excel a SQL, riservando Excel come ultima fase per creare tabelle e grafici attraenti.

Sonny Li e Dan Layfield hanno contribuito a questo articolo.