Tratamiento de texto

Trabajo fundamental con archivos de texto

  • touch: Crea un archivo.

    touch test.txt
    
  • cat: Muestra el contenido de un archivo.

    cat test.txt
    
  • head: Muestra las primeras 10 líneas de un archivo.

    head test.txt
    
    • head -n: Muestra las primeras n líneas.

      head -n 5 test.txt
      
  • tail: Muestra las últimas 10 líneas de un archivo.

    tail test.txt
    
    • tail -n: Muestra las últimas n líneas.

      tail -n 5 test.txt
      

Búsqueda y tratamiento de texto

  • grep: Búsqueda mediante expresiones regulares.

    grep Foo big_file.txt
    
    • grep -i: Para buscar sin importar si está en mayúscula o minúscula.

      grep -i foo big_file.txt
      
    • Para buscar algo que está al final de una línea.

      grep “foo$” big_file.txt
      
    • O al principio.

      grep “^foo” big_file.txt
      
  • sed: Screem Editor. Tratamiento de flujos de caracteres.

    sed no modifica el archivo, lo que hace es crear un nuevo flujo con la modificación.

    • Para reemplazar una expresión por otra.

      s indica que debe hacerse una sustitución, y g indica que debe hacerse a lo largo de todo el flujo.

      sed 's/Pepe/Pepito/g' pinocho.txt
      
    • Para realizar varios reemplazos.

      sed 's/Pepe/Pepito/g; s/Grillo/Grillito/g' pinocho.txt
      
    • Para eliminar la última línea de un archivo.

      sed '$d' films.csv
      
  • awk: Trataminento de texto bien estructurado (por ejemplo, archivos "csv").

    • Para trabajar con archivos de textos delimitados por comas.

      awk -F ‘,’ ‘{ print $1}’ films.csv # Imprime por consola la primera columna