Requerimientos.
Los requerimientos para manejar las expresiones
regulares en Python son las siguientes:
·
Archivo de texto con la
información que se quiera limpiar o extraer.
·
Librería “re” para hacer uso de
expresiones regulares.
·
Phyton 2.7 en adelante.
Para este ejemplo se tomará un archivo .html de una página de Internet y se filtrarán únicamente los correos electrónicos que esta contenga. Sigue estos pasos para utilizar expresiones regulares, también llamadas “redis” en Python:
· Importa la librería para utilizar “redis”.
·
Lee el archivo de texto y carga
su información a una variable.
·
Utiliza el método de re.findall
de la librería para encontrar y guardar en un arreglo todas las cadenas de
caracteres que coincidan con la expresión regular.
Este método recibe como parámetros la expresión regular seguida del texto en el que hará la búsqueda.
Para finalizar utiliza el método Len, para obtener el número de correos encontrados en tu archivo de texto. Con expresiones regulares podrás extraer y limpiar cualquier tipo de información, también te facilitan y reducen el tiempo de programación, además de que mejora sustancialmente el tiempo de procesamiento de tu programa.
Fuente:Fundación Carlos Slim – Curso Analista de Datos.
Comentarios
Publicar un comentario
Si deseas comentar dentro de la línea del respeto, eres bienvenido para expresarte