1. Introducción
El término CAPTCHA hace referencia a una prueba utilizada en las páginas web para determinar si es un humano el que intenta realizar una acción como comentar en un artículo, visualizar información, también es muy común en páginas de descargas como depositfiles, turbobit, fileshare, etc.
Podría apostar que existen varios softwares "navegando por la web" con el único fin de buscar información, realizar comentarios spam, etc.
El método CAPTCHA es realmente sencillo, se le muestra al usuario una imagen, a partir de ella debe poner los caracteres que están en la imagen, si los caracteres son correctos se le muestra o permite realizar la acción previamente solicitada, en caso contrario simplemente bloquea la acción o da otra oportunidad para que pueda ingresar el texto de la imagen.
Pero ésta seguridad es muy relativa, existen los denominados software OCR(Optical Character ecognition) los cuales convierten una imagen a texto. Las imágenes CAPTCHA se obtienen mediante la misma página web, lo cual posibilita , sabiendo la URL, que un software pueda realizar una llamada HTTP , ej. usando curl, y una vez obtenida la imagen se use un programa OCR para convertir la imagen a texto.
1.1. Contenidos
- Requerimientos.
- Análisis de peticiones http
- Script en bash para la resolución del captcha.