Excel a SQL: Por qué Debe hacer el cambio
Si utiliza aplicaciones de hojas de cálculo como Excel o Google Sheets en el trabajo, estos problemas pueden ser familiares para usted:
- Es fácil hacer cambios accidentales en los datos
- Es difícil replicar un análisis antiguo en datos nuevos (¡tantos pasos para recordar!)
- Es lento con grandes conjuntos de datos
- Es engorroso compartir hojas de cálculo gigantes por correo electrónico
Las aplicaciones de hojas de cálculo son accesibles, ubicuas y flexibles. Pueden combinar celdas, agregar comentarios, pivotar en datos, dar formato a tablas y crear gráficos. Pero la flexibilidad conlleva riesgos. Pueden generar más trabajo, más espera, más dolores de cabeza en el control de versiones y una menor precisión. Afortunadamente, SQL puede ser más rápido, fácil y seguro que Excel. Siga leyendo para saber qué es SQL y para ver por qué es una forma superior de manipular y analizar datos.
Desventajas de Excel
Comencemos con una aplicación práctica. Echa un vistazo a esta tabla de Pokémon y sus características:
Name | Type | Weight |
---|---|---|
bulbasaur | grass | 15 |
charmander | fire | 19 |
squirtle | water | 20 |
pikachu | electric | 13 |
oddish | grass | 12 |
snorlax | normal | 1014 |
mewtwo | psychic | 269 |
Suppose that we want to use Excel to filter out everything but the name y el tipo de todos los Pokémon de tipo Hierba de la mesa. En Excel, tenemos que usar instrucciones paso a paso para obtener los datos:
- abrir la tabla Pokémon
- agregar un filtro a la columna «tipo»
- filtro para type = «grass»
- eliminar todas las columnas excepto «nombre»
En este punto, hemos editado los datos (errores potenciales), no tenemos una copia de los pasos guardados en ningún lugar (difícil de replicar) y tendremos que enviar por correo electrónico todo el archivo por nuestros compañeros entrenadores Pokémon (control de versiones doloroso).
A medida que la tabla Pokémon crece, Excel o Google Sheets se ralentizan. Si el número de filas es de miles, realmente podría dañar nuestro flujo de trabajo. Si alguna vez te has quedado atascado mirando un mensaje de «Molinete de la Muerte» o «Excel renunció inesperadamente», conoces el dolor.
¿Qué es SQL?
SQL es solo un lenguaje utilizado en la programación. Cuando decimos «usar SQL», esto es lo que queremos decir:
- Sus datos se almacenan en una base de datos relacional, que está hecha de tablas. Esas tablas suelen parecerse a una hoja en Excel, con filas y columnas.
- Puede recuperar datos y realizar análisis con consultas, que son un conjunto de instrucciones escritas en SQL. Puede guardarlos de la misma manera que guarda un archivo de texto.
- En lugar de describir cómo obtener los datos, como en Excel o en hojas de cálculo, sus consultas describen qué datos desea. Puede ejecutar estas consultas con un intérprete SQL, que realiza los pasos de recuperación y análisis necesarios por usted.
Excel a SQL: ¿Por qué hacer el cambio?
SQL es mucho más rápido que Excel. Puede tomar minutos en SQL hacer lo que se tarda casi una hora en hacer en Excel. Excel puede manejar técnicamente un millón de filas, pero eso es antes de las tablas dinámicas, las pestañas múltiples y las funciones que probablemente esté utilizando.
SQL también separa el análisis de los datos. Cuando se utiliza SQL, los datos se almacenan por separado del análisis. En lugar de enviar por correo electrónico un enorme archivo de Excel, puede enviar pequeños archivos de texto sin formato que contengan las instrucciones para su análisis. Cada uno de los compañeros de equipo tiene acceso a los mismos datos, para que puedan ejecutar el análisis por su cuenta. No tienen que administrar versiones de archivos ni correr el riesgo de dañar los datos, y pueden volver a ejecutarlos en cualquier otro dato.
Todo esto contribuye a la gran demanda de habilidades SQL por parte de los empleadores.
Diga adiós al»Molinete de la muerte»
Analice los datos con SQL
¿Cómo Funcionan las consultas?
¿Recuerdas la mesa Pokémon?
Name | Type | Weight |
---|---|---|
bulbasaur | grass | 15 |
charmander | fire | 19 |
squirtle | water | 20 |
pikachu | electric | 13 |
oddish | grass | 12 |
snorlax | normal | 1014 |
mewtwo | psychic | 269 |
With SQL, we can write queries to declare exactly what we want from the datos. Por ejemplo:
Esta consulta dice»Quiero el nombre y el tipo de cada Pokémon en la tabla pokemon
que sea de tipo ‘grass’.»
Nuestra tabla resultante tendría este aspecto:
Nombre | Tipo |
---|---|
bulbasaur | hierba |
oddish | hierba |
Vamos a romper esta consulta abajo:
-
SELECT
es la palabra clave que indica a SQL que inicie una consulta -
name
ytype
son columnas en la tablapokemon
-
FROM
es la palabra clave que le dice a la consulta que mire la tablapokemon
-
WHERE
filtra nuestros datos en condiciones especificadas
Compare esto con el trabajo equivalente en Excel. En lugar de tomar una serie de pasos propensos a errores, lentos de ejecutar, difíciles de replicar y engorrosos de compartir, las consultas SQL pueden ser más rápidas, fáciles y seguras.
¿Puedo seguir usando fórmulas en SQL?
Si eres un usuario avanzado de Excel, es posible que dudes en renunciar a fórmulas familiares como esta:
o esta:
SQL ofrece la misma funcionalidad, con mayor legibilidad, gracias a su sintaxis estructurada y similar al inglés. SUM
se usa para agregar múltiples valores, y CASE
se usa para manejar lógica condicional. Por ejemplo:
o:
La primera instrucción devuelve la suma de todos los pesos en el pokemon
tabla. La segunda instrucción devuelve dos columnas: el nombre de cada Pokémon y una etiqueta de tamaño («pequeño» si es menor de 5 años, «mediano» si es menor de 15 años, etc.).). Observe que SQL usa nombres de columna específicos en lugar de referencias abstractas a celdas, y palabras como WHEN
y THEN
en lugar de paréntesis y comas.
También puede usar tablas dinámicas. Lo que te lleva siete clics en Excel te llevará siete pulsaciones de teclas en SQL: simplemente escribe GROUP BY
:
Esta consulta devolverá el peso total de todos los Pokémon que caen bajo cada tipo:
Tipo | Peso |
---|---|
hierba | 27 |
fuego | 19 |
agua | 20 |
eléctrico | 13 |
normal | 1014 |
psíquico | 269 |
Esta instrucción es más conciso y concreto de la lista de instrucciones que usted necesita para describir el mismo pivot en Excel, y la declaración se puede ejecutar en múltiples conjuntos de datos con poco esfuerzo. En otras palabras, la instrucción SQL es fácil de revisar y fácilmente transferible.
En conclusión
Las aplicaciones de hojas de cálculo como Hojas y Excel son excelentes para presentaciones, gráficos y análisis pequeños, pero pueden ser inadecuadas para tareas que requieren un levantamiento más pesado. SQL puede completar la mayoría de esas tareas más rápido y es más fácil de usar de principio a fin.
Si quieres experimentar con SQL tú mismo o crees que Pokémon no tiene un argumento suficientemente convincente, prueba nuestro programa gratuito » ¿Por qué aprender SQL?»curso, escrito por la diseñadora de currículos de datos de Codecademy y Jefa de Ciencia de Datos, Hillary Green-Lerman.
Si está listo para aprender los pormenores del lenguaje y practicarlo con datos reales, puede aprender SQL desde cero en el último curso intensivo Pro de Codecademy. A medida que aprenda y mejore con SQL, podrá transferir una mayor parte de su carga de trabajo de Excel a SQL, reservando Excel como última etapa para crear tablas y gráficos atractivos.
Sonny Li y Dan Layfield contribuyeron a este artículo.
Leave a Reply