Los datos de texto sin formato a menudo no tienen el formato adecuado y contienen muchos espacios en blanco redundantes al principio y al final de las cadenas, así como caracteres en blanco dobles dentro del texto.
En el siguiente tutorial, explicaré cómo eliminar dichos espacios de una cadena en Python . Primero echemos un vistazo a los posibles escenarios:
Como puede ver en el gráfico, podemos eliminar espacios al principio y al final (ver Ejemplo 1); solo al final (ver Ejemplo 2); solo al principio (ver Ejemplo 3); espacios duplicados (ver Ejemplo 4); y todos los espacios (ver Ejemplo 5).
Entonces, si desea obtener más información sobre la eliminación de espacios en blanco, siga leyendo…
Ejemplo 1: eliminar espacios en blanco desde el principio y el final de la cadena en Python (función de eliminación)
Considere la siguiente cadena de ejemplo en Python (es decir, Python 3):
my_string = "¡Esta oración contiene muchos espacios en blanco redundantes!" |
Nuestra cadena de ejemplo contiene una oración con espacios en blanco al principio y al final (así como espacios dobles dentro de la cadena, pero hablaremos de eso más adelante).
Para recortar todos los espacios antes y después de nuestra oración, podemos usar la función strip en Python:
mi_cadena_1 = mi_cadena . strip ( ) # Aplicar la función strip print ( my_string_1 ) # Imprime la cadena actualizada # "¡¡Esta oración contiene muchos espacios en blanco redundantes !!!" |
¡Muy facil! Entonces, ¿qué pasa si queremos eliminar solo los espacios en el lado derecho o izquierdo de nuestra cadena? ¡Eso es lo que les voy a mostrar en los Ejemplos 2 y 3!
Ejemplo 2: recortar espacios en blanco en el lado derecho de una cadena (función rstrip)
Con la función de tira de Python, pudimos eliminar todos los espacios izquierdo y derecho (como se muestra en el Ejemplo 1). Sin embargo, a veces es posible que desee mantener el espacio en blanco al principio y eliminar solo el espacio al final.
Para esta tarea, podemos usar la función rstrip de Python:
mi_cadena_2 = mi_cadena . rstrip ( ) # Aplicar la función rstrip print ( my_string_2 ) # Imprime la cadena actualizada # "¡¡Esta oración contiene muchos espacios en blanco redundantes !!!" |
Eche un vistazo a las comillas al final de nuestra oración: eliminamos todos los espacios finales, pero mantuvimos los espacios al principio.
Entonces, ¿podemos hacer eso al revés? Por que podemos…
Ejemplo 3: eliminar espacios en el lado izquierdo de una cadena (función lstrip)
Para eliminar el espacio inicial delante de una oración, podemos usar el comando lstrip (exactamente como lo hicimos antes con rstrip):
mi_cadena_3 = mi_cadena . lstrip ( ) # Aplicar la función lstrip print ( my_string_3 ) # Imprime la cadena actualizada # "¡¡Esta oración contiene muchos espacios en blanco redundantes !!!" |
¡Eso es todo! Pero quédate conmigo, todavía tenemos que eliminar los espacios redundantes dentro del texto…
Ejemplo 4: Cómo eliminar el espacio adicional entre el texto en Python (operación re.sub)
Hasta ahora, hemos utilizado solo funciones de la familia strip. Sin embargo, para deshacernos de los caracteres en blanco duplicados entre las palabras de nuestra oración, debemos aplicar la operación re.sub :
import re # Importar expresiones regulares my_string_4 = re . sub ( " + " , " " ,my_string ) # Aplicar función sub print ( my_string_4 ) # Imprimir cadena actualizada # " ¡¡¡Esta oración contiene muchos espacios en blanco redundantes !!!" |
¿Quieres extraer aún más espacios en blanco? Que así sea…
Ejemplo 5: eliminar todos los espacios en blanco (función de reemplazo)
Para eliminar todos los espacios de nuestro texto, podemos aplicar la función de reemplazo :
mi_cadena_5 = mi_cadena . replace ( " " , "" ) # Aplicar la función de reemplazo print ( my_string_5 ) # Imprimir la cadena actualizada # "¡Esta oración contiene muchos espacios en blanco redundantes!" |
Sin embargo, eso no tiene mucho sentido en nuestro caso específico.
Video: Ejemplos adicionales de espacios en blanco y cómo eliminar la puntuación en Python
¿Necesita algunos ejemplos más para la función strip de Python (vea también el Ejemplo 1-3 de este tutorial)? Entonces echa un vistazo al siguiente vídeo de YouTube de Ethan Weed. En el video, da más ejemplos para la función de tira y también explica cómo quitar la puntuación. Los ejemplos se muestran en vivo en el software de programación Python.
Otras lecturas
Alejandro Lugón es un economista y escritor especializado en Python y R, conocido por ser el creador del blog Estadisticool. Nacido en México, Lugón se graduó de la Universidad Autónoma de México con una Licenciatura en Economía. Desde entonces ha trabajado como economista en varias empresas. Lugón también ha escrito varios libros sobre temas relacionados con la economía, el análisis de datos y la programación. Su blog Estadisticool se ha convertido en un lugar de referencia para los programadores de Python y R. Alejandro Lugón es una inspiración para aquellos que buscan aprender programación y análisis de datos. Su trabajo ha ayudado a muchas personas a entender mejor el uso de la tecnología para hacer sus trabajos.