Articles

Excel a SQL: Por qué Debe hacer el cambio

Si utiliza aplicaciones de hojas de cálculo como Excel o Google Sheets en el trabajo, estos problemas pueden ser familiares para usted:

  • Es fácil hacer cambios accidentales en los datos
  • Es difícil replicar un análisis antiguo en datos nuevos (¡tantos pasos para recordar!)
  • Es lento con grandes conjuntos de datos
  • Es engorroso compartir hojas de cálculo gigantes por correo electrónico

Las aplicaciones de hojas de cálculo son accesibles, ubicuas y flexibles. Pueden combinar celdas, agregar comentarios, pivotar en datos, dar formato a tablas y crear gráficos. Pero la flexibilidad conlleva riesgos. Pueden generar más trabajo, más espera, más dolores de cabeza en el control de versiones y una menor precisión. Afortunadamente, SQL puede ser más rápido, fácil y seguro que Excel. Siga leyendo para saber qué es SQL y para ver por qué es una forma superior de manipular y analizar datos.

Desventajas de Excel

Comencemos con una aplicación práctica. Echa un vistazo a esta tabla de Pokémon y sus características:

Name Type Weight
bulbasaur grass 15
charmander fire 19
squirtle water 20
pikachu electric 13
oddish grass 12
snorlax normal 1014
mewtwo psychic 269

Suppose that we want to use Excel to filter out everything but the name y el tipo de todos los Pokémon de tipo Hierba de la mesa. En Excel, tenemos que usar instrucciones paso a paso para obtener los datos:

  • abrir la tabla Pokémon
  • agregar un filtro a la columna «tipo»
  • filtro para type = «grass»
  • eliminar todas las columnas excepto «nombre»

En este punto, hemos editado los datos (errores potenciales), no tenemos una copia de los pasos guardados en ningún lugar (difícil de replicar) y tendremos que enviar por correo electrónico todo el archivo por nuestros compañeros entrenadores Pokémon (control de versiones doloroso).

A medida que la tabla Pokémon crece, Excel o Google Sheets se ralentizan. Si el número de filas es de miles, realmente podría dañar nuestro flujo de trabajo. Si alguna vez te has quedado atascado mirando un mensaje de «Molinete de la Muerte» o «Excel renunció inesperadamente», conoces el dolor.

¿Qué es SQL?

SQL es solo un lenguaje utilizado en la programación. Cuando decimos «usar SQL», esto es lo que queremos decir:

  • Sus datos se almacenan en una base de datos relacional, que está hecha de tablas. Esas tablas suelen parecerse a una hoja en Excel, con filas y columnas.
  • Puede recuperar datos y realizar análisis con consultas, que son un conjunto de instrucciones escritas en SQL. Puede guardarlos de la misma manera que guarda un archivo de texto.
  • En lugar de describir cómo obtener los datos, como en Excel o en hojas de cálculo, sus consultas describen qué datos desea. Puede ejecutar estas consultas con un intérprete SQL, que realiza los pasos de recuperación y análisis necesarios por usted.

Excel a SQL: ¿Por qué hacer el cambio?

SQL es mucho más rápido que Excel. Puede tomar minutos en SQL hacer lo que se tarda casi una hora en hacer en Excel. Excel puede manejar técnicamente un millón de filas, pero eso es antes de las tablas dinámicas, las pestañas múltiples y las funciones que probablemente esté utilizando.

SQL también separa el análisis de los datos. Cuando se utiliza SQL, los datos se almacenan por separado del análisis. En lugar de enviar por correo electrónico un enorme archivo de Excel, puede enviar pequeños archivos de texto sin formato que contengan las instrucciones para su análisis. Cada uno de los compañeros de equipo tiene acceso a los mismos datos, para que puedan ejecutar el análisis por su cuenta. No tienen que administrar versiones de archivos ni correr el riesgo de dañar los datos, y pueden volver a ejecutarlos en cualquier otro dato.

Todo esto contribuye a la gran demanda de habilidades SQL por parte de los empleadores.

Diga adiós al»Molinete de la muerte»

Analice los datos con SQL

¿Cómo Funcionan las consultas?

¿Recuerdas la mesa Pokémon?

Name Type Weight
bulbasaur grass 15
charmander fire 19
squirtle water 20
pikachu electric 13
oddish grass 12
snorlax normal 1014
mewtwo psychic 269

With SQL, we can write queries to declare exactly what we want from the datos. Por ejemplo:

Esta consulta dice»Quiero el nombre y el tipo de cada Pokémon en la tabla pokemon que sea de tipo ‘grass’.»

Nuestra tabla resultante tendría este aspecto:

Nombre Tipo
bulbasaur hierba
oddish hierba

Vamos a romper esta consulta abajo:

  • SELECT es la palabra clave que indica a SQL que inicie una consulta
  • name y type son columnas en la tabla pokemon
  • FROMes la palabra clave que le dice a la consulta que mire la tablapokemon
  • WHEREfiltra nuestros datos en condiciones especificadas

Compare esto con el trabajo equivalente en Excel. En lugar de tomar una serie de pasos propensos a errores, lentos de ejecutar, difíciles de replicar y engorrosos de compartir, las consultas SQL pueden ser más rápidas, fáciles y seguras.

¿Puedo seguir usando fórmulas en SQL?

Si eres un usuario avanzado de Excel, es posible que dudes en renunciar a fórmulas familiares como esta:

o esta:

SQL ofrece la misma funcionalidad, con mayor legibilidad, gracias a su sintaxis estructurada y similar al inglés. SUM se usa para agregar múltiples valores, y CASE se usa para manejar lógica condicional. Por ejemplo:

o:

La primera instrucción devuelve la suma de todos los pesos en el pokemon tabla. La segunda instrucción devuelve dos columnas: el nombre de cada Pokémon y una etiqueta de tamaño («pequeño» si es menor de 5 años, «mediano» si es menor de 15 años, etc.).). Observe que SQL usa nombres de columna específicos en lugar de referencias abstractas a celdas, y palabras como WHEN y THEN en lugar de paréntesis y comas.

También puede usar tablas dinámicas. Lo que te lleva siete clics en Excel te llevará siete pulsaciones de teclas en SQL: simplemente escribe GROUP BY:

Esta consulta devolverá el peso total de todos los Pokémon que caen bajo cada tipo:

Tipo Peso
hierba 27
fuego 19
agua 20
eléctrico 13
normal 1014
psíquico 269

Esta instrucción es más conciso y concreto de la lista de instrucciones que usted necesita para describir el mismo pivot en Excel, y la declaración se puede ejecutar en múltiples conjuntos de datos con poco esfuerzo. En otras palabras, la instrucción SQL es fácil de revisar y fácilmente transferible.

En conclusión

Las aplicaciones de hojas de cálculo como Hojas y Excel son excelentes para presentaciones, gráficos y análisis pequeños, pero pueden ser inadecuadas para tareas que requieren un levantamiento más pesado. SQL puede completar la mayoría de esas tareas más rápido y es más fácil de usar de principio a fin.

Si quieres experimentar con SQL tú mismo o crees que Pokémon no tiene un argumento suficientemente convincente, prueba nuestro programa gratuito » ¿Por qué aprender SQL?»curso, escrito por la diseñadora de currículos de datos de Codecademy y Jefa de Ciencia de Datos, Hillary Green-Lerman.

Si está listo para aprender los pormenores del lenguaje y practicarlo con datos reales, puede aprender SQL desde cero en el último curso intensivo Pro de Codecademy. A medida que aprenda y mejore con SQL, podrá transferir una mayor parte de su carga de trabajo de Excel a SQL, reservando Excel como última etapa para crear tablas y gráficos atractivos.

Sonny Li y Dan Layfield contribuyeron a este artículo.