Categorías
Inteligencia artificial Windows

Tiflo Audio 123 – Picture Smart: Nueva opción para describir imágenes utilizando inteligencia artificial con JAWS 2019

En éste episodio, Manolo demuestra la nueva opción Picture Smart, que acaba de ser integrada en la actualización del lector de pantalla JAWS 2019.

Picture Smart permite elegir una foto desde la computadora y enviarla para analizarla por medio de inteligencia artificial y se muestra una descripción en textos clasificadas en varias categorías.

Las descripciones pueden incluir detalles como el número de personas en la foto, puntos de referencia reconocibles, detalles del paisaje y Si hay texto en la imagen, OCR el texto lo presentará también.

Durante el podcast, Manolo demostró el reconocimiento de cinco fotos desde el explorador de archivos. También revisó los textos de los resultados, utilizando su línea braille.

Para usar Picture Smart, se deben presionar Insert + BARRA ESPACIADORA seguido de la letra P. Una vez que la opción de Picture Smart esté activa, estarán disponibles las siguientes opciones:

  • Letra A: abrir el cuadro de diálogo de Picture Smart donde puede adquirir una imagen de un escáner.
  • Letra F: describir la imagen seleccionada actualmente en el Explorador de archivos. Las imágenes admitidas incluyen BMP, JPEG, GIF, TIF o PNG.
  • Letra C: describir una imagen asociada con el control actual. Por ejemplo, un gráfico en una página web o en un mensaje de correo electrónico.
  • Letra B: describir el contenido del Portapapeles de Windows si contiene una imagen.

Importante: Picture Smart solo está disponible actualmente en la interfaz de usuario en idioma inglés de JAWS ya que los servicios que realizan el análisis de imágenes actualmente no admiten idiomas internacionales para descripciones de imágenes. Para los usuarios de versiones localizadas de JAWS que se ejecutan en versiones de Windows distintas del inglés, debe cambiar el idioma de la interfaz de usuario de JAWS a inglés para probar esta función.

Manolo demostró la alternativa de seleccionar los textos de los resultados en Inglés, y los copió en un traductor y mostró las descripciones de cada foto en Español.

Notas del podcast:

Página de JAWS:

http://www.freedomscientific.com/products/software/jaws/

Reproducir
Categorías
Entrevistas General Inteligencia artificial

Tiflo Audio 122 – Visita al impresionante Radiotelescopio de Arecibo desde la perspectiva de una persona ciega

En éste episodio, Manolo presenta un podcast dedicado a las ciencias y la astronomía, descubriendo las maravillas del universo, durante su visita a las facilidades del Observatorio de Arecibo.

El radiotelescopio de Arecibo, Recolecta datos radioastronómicos, aeronomía terrestre y radar planetarios para los científicos mundiales. Aunque ha sido empleado para diversos usos, principalmente se usa para la observación de objetos estelares.

Manolo comienza el podcast, con una entrevista a la Dra. Carmen Pantojas, profesora en la Facultad de Ciencias Naturales, de la Universidad de Puerto Rico (UPR).

Luego, Manolo nos presenta un pequeño segmento de una de las películas en Español que hablan del Radiotelescopio.

Mientras que en el Centro de Visitantes, Manolo tocó una maqueta del Radiotelescopio y leyó material relacionado al mismo en braille. Luego, tocó un meteorito que se encuentra en el área de las exhibiciones.
El episodio finaliza cuando Manolo le sacó una foto al Radiotelescopio para identificarlo por medio de la inteligencia artificial y la app Seeing AI en su celular.

Notas del podcast:

Observatorio de Arecibo Facebook

https://www.facebook.com/Arecibo.Observatory/

Reproducir
Categorías
Android General Inteligencia artificial iOS

Tiflo Audio 116 – Disfrutando de los sonidos de la fiesta de la calle San Sebastián desde la perspectiva de una persona ciega utilizando la tecnología de inteligencia artificial

En éste episodio, Manolo nos presenta los sonidos de la fiesta de la calle San Sebastián. La misma se trata de un festival internacional que se celebra el tercer fin de semana de enero, desde jueves a domingo en el Viejo San Juan, Puerto Rico.

La primera parada fue en Bahía Urbana, punto de llegada al Viejo San Juan. Manolo utiliza las apps con tecnologías de inteligencia artificial Seeing AI (iPhone) y Envision AI (Android), para complementar su disfrute del Oceáno Atlántico y de barcos como cruceros y veleros en la bahía de San Juan.

Manolo también utiliza las tecnologías de geolocalización y los asistentes de voz SIRI y Google Assistant, durante toda su trayectoria para llegar hasta la calle San Sebastián.

Durante su recorrido, Manolo camina por el Paseo de la Princesa y su fuente, pasando luego por la Puerta de San Juan.

Más adelante, visita el Cuartel de Ballajá, donde disfruta de las artesanías y de música salsa, con una orquesta tocando en vivo.

Finalmente, Manolo llega hasta la Calle San Sebastián, donde nos presenta los sonidos festivos de comparsas, música y la algarabía de miles de personas disfrutando y compartiendo de las diferentes actividades.

Notas del podcast:

Fiestas De La Calle San Sebastián Puerto Rico – Página Oficial Facebook:

https://www.facebook.com/pages/category/Community/Fiestas-De-La-Calle-San-Sebasti%C3%A1n-Puerto-Rico-P%C3%A1gina-Oficial-1178835555509752/

Compañía de Turismo del Gobierno de Puerto Rico:

https://www.prtourism.com/dnn/Inicio

Reproducir
Categorías
Android Inteligencia artificial

Tiflo Audio 112 – Envision AI: App que integra inteligencia artificial y reconocimiento de textos OCR para Android

En este episodio, Manolo hace una demostración de Envision AI, app para Android que integra tecnologías de inteligencia artificial, reconocimiento de textos OCR, lectura de códigos de barra, entre otras.

La app presenta las siguientes opciones:

Opción de textos:

  • Lectura instantánea de textos
  • Leer textos escritos a mano
  • Lectura de documentos impresos OCR

Opción general:

  • Describir ecenas
  • Códigos de barra
  • Enseñar a reconocer personas

Para la demostración, Manolo utilizó el lector de pantalla TalkBack para Android.

Notas del podcast:

Descargar Envision AI desde la tienda PlayStore:

https://play.google.com/store/apps/details?id=com.letsenvision.envisionai&hl=es

Página web del desarrollador:

https://www.letsenvision.com/

Correo electrónico del desarrollador:

karthik@letsenvision.com

Reproducir
Categorías
Equipos parlantes Inteligencia artificial

Tiflo Audio 91 – OrCam: Dispositivo parlante con tecnologías OCR, inteligencia artificial y realidad aumentada

En éste episodio, Manolo hace una demostración de OrCam, un sistema parlante y portátil para personas ciegas y con baja visión, que utiliza tecnologías OCR, inteligencia artificial y la realidad aumentada. El mismo, ha sido desarrollado por una empresa en Israel.
El dispositivo OrCam es una pequeña cámara usada al estilo de Google Glass, conectada por un cable delgado a una computadora portátil diseñada para caber en el bolsillo del usuario. El sistema se engancha a las gafas del usuario con un pequeño imán y utiliza un altavoz de conducción ósea para ofrecer respuesta auditiva a medida que lee en voz alta las palabras u objetos apuntados por la persona ciega.
Manolo comienza el podcast describiendo la unidad física, así como el funcionamiento de cada uno de sus botones.
Luego, hace una demostración de la opción de reconocimiento de textos impresos (OCR). Primero utilizando gestos para la lectura parlante de una página de un libro. También, reconoce los textos en una caja de cereal.
Finaliza la demostración, con la opción de reconocimiento de caras.
La unidad demostrada por Manolo, estaba en el idioma Inglés, aunque ya hay una nueva versión con más opciones e integra el idioma Español.

Reproducir