CeWL é um aplicativo de rubi que aranha uma url dada para uma profundidade especificada, opcionalmente seguindo links externos e retorna uma lista de palavras que podem ser usadas para crackers de senha, como John the Ripper .
O CeWL também possui um aplicativo de linha de comando associado, FAB (Files Already Bagged), que usa as mesmas técnicas de extração de meta-dados para criar listas de autores / criadores já baixadas.
Uso
Registro de mudanças
cewl [OPTION] ... URL
- - ajuda, -h
- Mostre ajuda
- --depth x, -dx
- A profundidade para aranha, padrão 2
- --min_word_length, -m
- O comprimento mínimo da palavra, que destrói todas as palavras sob o comprimento especificado, padrão 3
- - offsite, -o
- Por padrão, a aranha só visitará o site especificado. Com esta opção, também visitará sites externos
- --Escreva, -w arquivo
- Escreva a saída para o arquivo em vez de stdout
- --ua, -u user-agent
- Altere o agente do usuário
- -v
- Verbose, mostrar depuração e saída extra
- --não palavras, -n
- Não publique a lista de palavras
- --meta, -um arquivo
- Inclua meta dados, arquivo de saída opcional
- --email, -e arquivo
- Incluir endereços de e-mail, arquivo de saída opcional
- - arquivo de arquivo meta
- Nome do arquivo para saída de metadados
- - arquivo de arquivo de servidor
- Nome do arquivo para saída de e-mail
- Diretório - meta-temp-dir
- O diretório usado usado pelo exiftool ao analisar arquivos, o padrão é / tmp
- --count, -c:
- Mostre a contagem para cada uma das palavras encontradas
- --auth_type
- Digest ou básico
- --auth_user
- Nome de usuário de autenticação
- --auth_pass
- Senha de autenticação
- --proxy_host
- Proxy host
- --porta proxy
- Porta Proxy, padrão 8080
- --proxy_username
- Nome de usuário para proxy, se necessário
- --proxy_password
- Senha para proxy, se necessário
- --verbose, -v
- Verbo
- URL
- O site da aranha.
Acompanhando a história.
- Versão 4.3 - Várias correções de erros de aranha e a introdução da classificação dos resultados por contagem
- Versão 4.2 - Corrigiu a gema da aranha substituindo a função, também manipulando os links #name corretamente
- Versão 4.1 - Pequenas correções de erros e adicionou novo parâmetro para definir nomes de arquivos para saída de e-mail e metadados
- Versão 4 - Funciona com Ruby 1.9.x e pega texto fora de alt e tags de título
- Versão 3 - Agora páginas de aranhas referenciadas em comandos de localização de JavaScript
- Versão 2.2 - Dados de endereços de e-mail e meta-dados podem ser gravados em seus próprios arquivos
- Versão 2.1 - Corrigido um erro que algumas pessoas estavam tendo ao usar a opção de e-mail
- Versão 2 - Suporte adicionado de meta-dados
- Versão 1 - lançado