Cómo utiliza Google el reconocimiento de patrones con Google Street View para identificar y transcribir todos los números de calle de las ciudades
por carlosp

Cómo utiliza Google el reconocimiento de patrones con Google Street View para identificar y transcribir todos los números de calle de las ciudades

01-01-2015  |  Google  |  0 comentarios

Google Street View se ha convertido en una parte esencial de la experiencia de mapeo en línea. Permite a los usuarios bajar hasta el nivel de la calle para ver el área local en detalle fotográfico.

Pero también es un recurso útil para Google. La compañía utiliza las imágenes para leer los números de casa y relacionarlas con su geolocalización. Este localiza físicamente la posición de cada edificio en su base de datos.

Eso es particularmente útil en lugares donde el número de la calle son no disponible, o lugares como Japón y Corea del Sur, donde las calles son raramente numerados en orden cronológico, pero en otros aspectos, como el orden en que fueron construidos, un sistema que hace que muchos edificios increíblemente difícil encontrar, incluso para los locales.

Pero la tarea de detectar e identificar estos números tarda muchísimo tiempo. Cámaras de Street View de Google han registrado cientos de millones de imágenes panorámicas que juntos contienen decenas de millones de números de las casas. La tarea de buscar estas imágenes de forma manual para detectar e identificar los números no es una tarea cualquiera.

Así que, naturalmente, Google ha resuelto el problema mediante la automatización de la misma. Hace menos de una semana (20 diciembre 2014), Ian Goodfellow y amigos de la empresa revelan cómo lo han hecho. Su método resulta que dependen de una red neural que contiene 11 niveles de neuronas que han entrenado para detectar los números en las imágenes.

Para empezar, explica  Goodfellow, suponen que el número del edificio ya ha sido visto y la imagen recortada de manera que el número es al menos un tercio de la anchura del marco resultante. También suponen que el número es más de cinco dígitos, una suposición razonable en la mayoría de las partes del mundo.

Pero el equipo no divide el número en un solo dígito, como muchos otros grupos han hecho. Su enfoque es localizar el número completo dentro de la imagen recortada y para identificarlo en una sola vez, todo con una sola red neuronal. 

Capacitan a esta red utilizando imágenes tomadas de un conjunto de datos a disposición del público de las imágenes numéricas conocidas como el conjunto de datos de números de Street View Casa. Contiene unos 200.000 números tomadas por cámaras de Street View de Google y puestos a disposición del público. El entrenamiento se lleva alrededor de seis días para completar, según dicen.

Goodfellow y sus colegas dicen que no tiene sentido en el uso de un sistema automatizado que no puede igualar o mejorar el desempeño de los operadores humanos que generalmente pueden detectar con precisión los números del 98 por ciento de las veces. Así que este es el objetivo del equipo.

Sin embargo, eso no significa que la detección de un 98 por ciento de los números en el 100 por ciento de las imágenes. En lugar de ello, Goodfellow y co dicen que es aceptable para detectar el 98 por ciento de los números en un cierto subconjunto de imágenes, que en este caso llegar a cubrir alrededor del 95 por ciento del total.

Pero incluso esto es mucho mejor que cualquier otro equipo ha sido capaz de lograr. "A nivel mundial, se han detectado de forma automática y transcribimos cerca de 100 millones de números de calle física en [humana] precisión a nivel de operador", dicen, que describe esto como un "éxito sin precedentes".

Y pueden hacerlo a una velocidad considerable. "Podemos transcribir todos los puntos de vista que tenemos de los números de la calle en Francia en menos de una hora utilizando nuestra infraestructura de Google", dicen. Sí, eso es sólo una hora.

Una pregunta interesante es si la misma técnica podría ayudar a extraer otros números como números de teléfono en los letreros de negocios o incluso placas de matrícula.

Sin embargo, Goodfellow y co no son optimistas. Dicen que el éxito de su técnica se basa en gran medida en el supuesto de que los números de la calle no son nunca más de cinco dígitos."Para las grandes [número de dígitos] nuestro método es poco probable que escala bien", dicen.

Y, por supuesto, el sistema todavía no es perfecto. Que el 2 por ciento de los números mal identificados sigue siendo una espina en el costado del equipo.

Pero mientras tanto, Google puede estar seguro de que se ha dado un paso adelante significativo en la extracción de caracteres y el reconocimiento: la localización e identificación de los números de una sola red neuronal.

 

La gran pregunta, por supuesto, es lo que se viene. Y Goodfellow y co obligan al abrir el kimono sólo una fracción: "Este enfoque de usar una sola red neural como un sistema completo de extremo a extremo podrían ser aplicables a otros problemas tales como la transcripción de texto general o reconocimiento de voz." 




Si te gustó, comparte que es gratis!
     

Galería de imágenes

  • Cómo utiliza Google el reconocimiento de patrones con Google Street View para identificar y transcribir todos los números de calle de las ciudades
  • Cómo utiliza Google el reconocimiento de patrones con Google Street View para identificar y transcribir todos los números de calle de las ciudades


Visto en:  http://arxiv.org/abs/1312.6082
Artículo original:  http://arxiv.org/abs/1312.6082
Tags:  google Google Street View  

0 Comentarios

  • Logo noticias de tecnologia
    Noticias tecnologia

    el 03-12-2023 - responder a este mensaje

    1

    Todavía nadie ha comentado sobre la noticia de Cómo utiliza Google el reconocimiento de patrones con Google Street View para identificar y transcribir todos los números de calle de las ciudades , anímate y sé el primero en expresar tu opinión o tus dudas...

Comentar

El email no será público, rellena los campos con *