Sistemas operativos > Aplicaciones y diccionarios linux

DicTool 0.1 Alpha para LINUX ( Generador de diccionarios )

<< < (4/4)

benjavalles:
Generador basado en crunch para linux y windows con interface grafica
https://sourceforge.net/projects/crunchide/

gos:
Una solucion sencilla para extraer todas las palabras de una pagina web a un diccionario, ordenadas y sin duplicados:

lynx.exe -dump -nolist https://foro.seguridadwireless.net/ | tr -s '[ .,;:*#]' '\n' | sort -u

Y para eliminar acentos y otros caracteres no deseados, pasarlo todo a minusculas:

lynx.exe -dump -nolist https://foro.seguridadwireless.net/ | sed -e 's/[áA]/a/g'|sed -e 's/[éÉ]/e/g'|sed -e 's/[íI]/i/g'|sed -e 's/[óO]/o/g'|sed -e 's/[úUüÜ]/u/g' | tr -cs '[:alnum:]' '\n' | tr '[:upper:]' '[:lower:]' | sort -u

(igual puede ser necesario ajustar la codificacion del terminal a utf8)
Y con el lynx es posible bajarse no solo una pagina web sino el site entero con los parametros -traversal y -crawl.  Te deja cada pagina en un archivo, luego le pasas lo anterior a todo el site de un plumazo.  Si alguien necesita mas detalles puedo añadirlo.

Saludos





Navegación

[0] Índice de Mensajes

[*] Página Anterior

Ir a la versión completa