Captchas: por qué los necesitamos y cómo están evolucionando

Como seres humanos que vivimos en el mundo moderno, tenemos que afirmar que no somos robots con bastante frecuencia y que ni siquiera vivimos en una distopía de ciencia ficción futurista. Independientemente, si está marcando la casilla “No soy un robot”, enseñar una IA qué constituye una “señal” (Pista: la respuesta “correcta” es lo que la mayoría de los otros usuarios hayan elegido; intente pensar como la multitud), o resolver problemas matemáticos, el objetivo es siempre el mismo: evitar que los bots estropeen los sitios web y tal vez usar a los humanos que resuelven los captchas para digitalizar algunos libros, entrenar algún software de reconocimiento de imágenes o generar algunos ingresos publicitarios. Pero hay más en los captchas de lo que parece, y están lejos de ser infalibles.

¿Por qué necesitamos captchas?

CAPTCHA significa “Prueba pública de Turing completamente automatizada para diferenciar las computadoras y los humanos, ”Que, además de ser un acrónimo verdaderamente elegante, le dice la mayor parte de lo que necesita saber. La idea es, como dice el lema reCAPTCHA de Google, crear una tarea que sea “Fácil para las personas, difícil para los bots”.

prueba-captcha-turing

“Bot” generalmente se refiere a cualquier programa que esté configurado para completar automáticamente algún proceso, ya sea para publicar noticias en Twitter o dejar spam en las secciones de comentarios del sitio web. Usados ​​correctamente, estos programas son bastante útiles, pero también se pueden usar para generar contenido inútil / plagado de anuncios / malicioso, abrumar un sitio con suscripciones, manipular resultados de encuestas en línea, extraer direcciones de correo electrónico o hacer cualquier cantidad de otras cosas desagradables. Es mejor no dejarlos entrar.

¿Qué es exactamente un captcha?

captcha-texto-distorsionado

Si ha estado en Internet por un tiempo, recordará que durante la mayor parte de la década de 2000, el tipo de captcha más común era una tira de texto distorsionado con una cadena de caracteres alfanuméricos. Esta ya no es una forma muy segura de captcha, pero cuando Google adquirió reCAPTCHA en 2009, todavía era lo suficientemente bueno como para obtener la mayoría de los bots. Desde entonces, Google ha cambiado a las casillas más seguras “No soy un robot” (que en realidad monitorean el comportamiento como el movimiento del mouse y la información del navegador para verificar si eres un bot) y desafíos de reconocimiento de imágenes. Sin embargo, los captchas basados ​​en audio todavía existen y son sorprendentemente fáciles de romper con el software de reconocimiento de voz.

ID de imagen captcha

Los captchas de reconocimiento de imágenes han tenido sus propios problemas, ya que pueden ser un poco ambiguos para los encuestados humanos. Sin embargo, como se mencionó anteriormente, no hay una respuesta correcta, ya que la computadora no sabe qué imágenes son escaparates y cuáles son schnauzers, simplemente acepta la opinión de la mayoría humana como correcta. Si 75/100 humanos deciden etiquetar una imagen borrosa de un trapeador como un schnauzer, la computadora asumirá que el trapeador es un schnauzer y lo marcará mal si no lo etiqueta como tal.

Pero también hay muchas otras opciones de captcha, y pueden ser bastante creativas. Estas son solo algunas de las ideas que han aparecido en varios sitios web.

los captcha de bloqueo deslizante:

captcha-slidelock

El captcha del problema matemático:

captcha-matemáticas

El captcha de arrastrar y soltar:

captcha-rompecabezas

los captcha de orientación de imagen:

orientación-captcha

los captcha de lógica / gramática:

captcha-egglue

También hay algunos captchas que nunca ves, como el captcha honeypot, que implica agregar un campo invisible a una página web, esperar a que un bot lo complete (los humanos no lo harán, ya que no pueden verlo), y posteriormente pateando el bot. Luego está el “captcha invisible, ”A menudo emparejado con su cuadro, que observa cómo navega por una página web (movimientos del mouse, desplazamiento, clics, comportamiento general) para ver si debería proporcionarle un captcha de reconocimiento de imagen como una doble verificación.

Captchas: hacer del mundo un lugar mejor

Puede que no lo sepas, pero las horas acumuladas que has dedicado a demostrar que no eres un robot pueden haber marcado la diferencia. reCAPTCHA, ahora el servicio captcha de Google, fue diseñado originalmente por Luis von Ahn (ahora más conocido como el fundador de Duolingo), como una forma de utilizar la capacidad intelectual desperdiciada para digitalizar libros. Al presentar a los usuarios una palabra escaneada de un libro o periódico, este sistema podría confirmar la identidad del usuario y realizar una especie de encuesta de opinión sobre cuál era la palabra. Si suficientes personas estuvieran de acuerdo con la palabra, el sistema de digitalización aceptaría la respuesta en la versión del libro electrónico.

Después de implementar este sistema, solo tomó dos años digitalizar toda la biblioteca de Google Books. y todo el archivo del New York Times. En 2012, cambiaron al uso de humanos para ingresar números de casas extraídos de Google Street View.

captcha-digitalización

En 2014, las cosas dieron un giro irónico hacia lo robótico: captchas de reconocimiento de imágenes. Estos funcionan según el principio de que las máquinas no son muy buenas para descubrir qué hay en una imagen, pero, como se describió anteriormente, han sido bastante efectivas para entrenar a las IA para que hagan precisamente eso. Dado que este captcha eventualmente se quedará sin trabajo, se está eliminando gradualmente en favor de los menos visibles orientados al comportamiento / seguimiento.

En conclusión: ¿soy un robot?

A medida que la inteligencia artificial, el aprendizaje profundo y una serie de otros avances se produzcan en las próximas décadas, los captchas también tendrán que evolucionar. La mayoría de los captchas que existen ya han sido descifrados, y cada vez es más fácil. Entrenamiento de una máquina para leer captchas de texto distorsionado ahora toma unos quince minutos. Quizás lo único que quede en el futuro sea captchas biométricas (¡Espero que te gusten los escaneos de reconocimiento facial!), o tal vez despertemos y descubramos que la singularidad ya ha sido alcanzado, y fuimos los bots todo el tiempo.

Crédito de la imagen: Chippee vía mala recaptcha de google números de casa

¿Es útil este artículo?

¡Compártelo en redes!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *