«Una expresión regular bien usada vale más que mil celdas en blanco»
Imagina que tienes una hoja de Google Sheets con 10.000 filas y necesitas borrar todos los emails duplicados.
O validar que los teléfonos están en formato internacional.
O separar nombres y apellidos que alguien metió en la misma columna.
Podrías hacerlo a mano.
O podrías usar expresiones regulares.
¿Qué es una expresión regular?
Una expresión regular (o regex) es como una receta para encontrar patrones dentro de un texto.
Sirve para identificar partes específicas dentro de una cadena, como si le dieras instrucciones precisas a una lupa digital: «encuentra cualquier cosa que parezca un email, un número o un código«.
No busca palabras exactas, sino formas: secuencias de letras, números o símbolos que siguen un modelo específico.
Píensalo como un detector de formas ocultas.
Si le dices «encuentra todo lo que parezca un correo electrónico», sabrá distinguir demo.ana@ejemplo-regex.fake
aunque esté metido en una frase como «Contacto: ana@ejemplo-regex.fake
«.
Ejemplos de patrones comunes:
- Correos electrónicos:
\w+@\w+\.\w{2,}
- Teléfonos:
\+\d{2,3}\s?\d{9}
- Códigos postales:
\d{5}
Y puedes usarlas en Python, Google Sheets, Google BigQuery o herramientas de automatización como Zapier o Make, que también permiten aplicar expresiones regulares en sus flujos de trabajo.
¿Para qué sirve en análisis de datos?
Ideal para limpieza de datos con expresiones regulares en herramientas como Google Sheets o Google BigQuery.
Las expresiones regulares son un recurso clave para automatizar tareas repetitivas y evitar errores humanos.
Aquí van sus aplicaciones más potentes:
- Limpieza: Elimina espacios, caracteres raros o formatos incorrectos.
- Validación: Verifica que los datos cumplen un formato (email, teléfono, DNI…).
- Extracción: Saca partes de un texto: el dominio del correo, el prefijo telefónico…
- Transformación: Reemplaza cadenas con patrones inteligentes.
Caso real: limpiar emails en Google Sheets
Tienes una columna con emails mezclados con texto: "Cliente: demo_usuario@ejemplo-regex.fake"
Usas:
=REGEXEXTRACT(A2; "[\w.-]+@[\w.-]+\.[a-zA-Z]{2,6}")
Y obtienes solo el correo.
Automáticamente.
Caso real: limpiar emails en Google BigQuery
Tienes una tabla con una columna llamada comentario_cliente
que contiene textos mezclados con correos.
Usas:
SELECT REGEXP_EXTRACT(comentario_cliente, r"[\w.-]+@[\w.-]+\.[a-zA-Z]{2,6}") AS email_limpio
FROM tu_dataset.tu_tabla;
Y extraes el email en una nueva columna.
Rápido y a escala.
Caso real: extraer emails en Looker Studio
Tienes un campo de texto en una fuente de datos conectada a Looker Studio con información variada.
Usas:
REGEXP_EXTRACT(Texto, "[\w.-]+@[\w.-]+\.[a-zA-Z]{2,6}")
Creas un campo calculado con esa fórmula, y el panel muestra solo los correos extraídos.
¿Da miedo? Al principio, sí. Pero luego…
Aprender regex es como aprender a montar en bici.
Cuesta al inicio, pero una vez lo dominas, te lleva muy lejos.
Estos son los símbolos esenciales para empezar:
.
cualquier carácter*
cero o más veces+
una o más veces[]
conjunto de caracteres()
agrupa parte del patrón
Combínalos.
Prueba.
Y celebra cuando limpies miles de filas con una sola fórmula.
Dónde probar tus expresiones regulares
Antes de aplicar regex en datos reales, prueba en una hoja vacía de Google Sheets con funciones como REGEXMATCH
, REGEXEXTRACT
o REGEXREPLACE
.
En BigQuery, usa tablas temporales para hacer pruebas sin afectar tus datos definitivos.
Conclusión: la magia está en los detalles
Dominar expresiones regulares no es opcional si quieres ser ágil con datos.
Te ahorra errores.
Te ahorra horas.
Y te da superpoderes analíticos sin depender de nadie.
«El mejor analista no es el que sabe más, sino el que automatiza mejor.»
Cuéntame qué reto tienes ahora.