Hasta alcanzar lugares donde un Android no ha llegado jamás

0

Por si no eres suficientemente friki o fan de Star Trek, te vamos a hablar de Majel (nombre inspirado en la mujer de Gene Roddenberry, creador de la serie, y que aparecía en numerosos papeles en ella, entre otros siendo la voz de la computadora a bordo de las naves de la Federación).

Majel es el proyecto secreto (parece que ya no tanto) de Google. Es, como los mas avispados podréis haber adivinado, una respuesta al asistente personal Siri de Apple. Al igual que Siri, es una evolución de Voice Actions que en teoría permitirá solicitar información en conversación natural.

El grupo de desarrollo detrás de todo este trabajo parece estar en Google X, los recientemente descubiertos “laboratorios secretos” de Google, donde importantes expertos en campos experimentales como la Inteligencia Artifical trabajan sin descanso para satisfacer la búsqueda de nuevas tecnologías de Google. No en vano son los creadores del proyecto de los coches sin conductor que lleva un año en pruebas y que se acaba de anunciar su patente por parte del gigante de Mountain View.

En Google X parecen estar trabajando duramente para conseguir una release antes de final de año; pero viendo las fechas, lo mas probable es que no lo tengamos antes de Febrero. Seguramente y a diferencia del enfoque de Apple, vendrá como una Google App o una actualización del sistema, con lo cual estará disponible para una gran variedad de dispositivos; aunque todo esto son informaciones sin confirmar y es mejor tomarlas con cierto escepticismo.

Recientemente muchas fuentes cercanas a Google habían dejado caer continuas alusiones a Star Trek, lo que parece un buen indicativo de que algo se mueve detrás de las cortinas.

Matias Duarte: “La voz va a ser absolutamente una parte esencial de interfaces de usuario. Me refiero a que Google y Android han estado trabajando en Voice durante años. Incluso en Ice Cream Sandwich hemos incluido mejoras significativas en el modo en el que el dictado por voz funciona […]

Realmente quiero que los ordenadores sean multimodales. Cuando miras un show de ciencia-ficción como Star Trek, alguien se acerca a una pared, y comienza a tocar cosas y a hablar al ordenador al mismo tiempo. Este es el modo en el que creo que nuestras interfaces necesitan evolucionar. Necesitas ser capaz de comenzar utilizando el email, tocando cosas en la pantalla, hablar con él, tocar mas cosas y no tener que estar pensando “estoy usando Voice o no estoy usando Voice”. Simplemente usas la entrada de datos que es mas natural en ese momento”

Amit Singhal, ingeniero software de Google, también aporta información sobre el tema.

Amit Singhal: “Mi sueño siempre ha sido construir el ordenador de Star Trek, y en mi mundo ideal, debería ser capaz de ir a una computadora y decirle “Oye, cual es el mejor momento para que plante semillas en India, contando con que el monzón fue antes este año?” Y una vez que podamos responder a esa pregunta (que hoy por hoy no somos capaces), la gente comenzará a buscar respuestas para preguntas aún mas complejas. Estas son auténticas necesidades de información. Auténticas preguntas que si nosotros – Google – podemos responder, nuestros usuarios se volverán mas inteligentes y estarán mas satisfechos en su búsqueda del conocimiento”

Si todavía tienes dudas, Mike Cohen, jefe de Tecnologías de Voz y co-fundador de Nuance Communications, empresa creadora de algunas de las tecnologías con las que Siri trabaja también hace ciertas menciones a la serie. ¿Sospechoso, verdad?

Mike Cohen: “En Star Trek, no pasan mucho tiempo escribiendo cosas con teclados – solo hablan con sus ordenadores y los ordenadores les responden. Es un modo mas natural de comunicar, pero llegar ahí requiere pulir una serie de difíciles problemas de investigación.

Recientemete hemos hecho algunos avances con las tecnologías de la voz y las herramientas que obtienen entradas de voz. Pero que hay cuando el ordenador te habla – en otras palabras, salida de voz?

Por eso estamos orgullosos de anunciar que hemos adquirido Phonetic Arts, una compañía de síntesis de voz con base en Cambridge, Inglaterra. El equipo de investigadores e ingenieros de Phonetic Arts trabajan en la última tecnología de síntesis de voz, siendo capaces de proporcionar tecnología que genera voz computerizada de forma natural de pequeñas muestras de voz grabada.

Estamos muy satisfechos de su tecnología y aunque aún no tenemos planes para compartirla, tenemos confianza en que juntos podamos movernos mas rápidamente hacia ese futuro de Star Trek”

Si de algo nos jactamos en AndroTalk es de ser personas malvadas y sin corazón que disfrutamos poniéndoos los dientes largos hasta el infinito. Asi que vamos a comentarte sobre “supuestas fuentes” que han hablado sobre el proyecto Majel.

El primero es un tal Ted, que escribe desde una IP anónima (no a nosotros, obviamente) describiendo su experiencia con él.

“Es definitivamente igual de bueno o mejor que Siri. Al menos en una tablet puedes navegar a través de diferentes respuestas con paneles paginados. Por ejemplo, si preguntas “enséñame la Estatua de la Libertad”, automáticamente te lleva a resultados en Google Images, pero otro panel debajo de él puede ser su localización en Google Maps y otro puede tener una página de la Wikipedia. También es bastante bueno dando respuestas breves si le preguntas. La interfaz de usuario es definitvamente mejor que la de Siri, pero es un poco mas complicada de utilizar.

Durante una fase del proyecto eras capaz de activarla diciendo “Ordenador…” Era difícil no poner el acento de Jean Luc Piccard mientras lo hacías!”

El segundo es un supuesto ex-trabajador de Google X cuyo comentario fue posteado en Reddit:

“Esto es una absoluta violación del Contrato de Confidencialidad, pero que mas dá. Que me denuncien.

El foco principal de Google X de los últimos años ha sido una Inteligencia Artificial altamente avanzada que empuje la tecnología que hay debajo de muchos programas populares de Google. Por octubre (la última vez que estuve sobre el proyecto), la IA había pasado el Test de Turing el 93% del tiempo en pruebas de una hora de duración, mediante una conversación de tipo chat. Se eligió el estilo chat para aislar la IA del sintetizador de voz y la presencia física del robot.

El robot mismo no es particulamente avanzado porque el enfoque no es mecánico, si no de software. Es basicamente una cosa con ruedas que parece un robot. El reconocimiento de voz es algo mejor de lo que obtendrías con entrada de voz habitual, porque utiliza micrófonos de alta calidad y asistencia de lectura de labios.

He tenido la oportunidad de interactuar con el robot personalmente y sinceramente es la cosa mas increíble que he visto. Me gusta pensar que es como Stephen Hawking porque es extremadamente inteligente y puedes interactuar con él de manera natural; pero es físicamente incapaz de hacer mucho. Hay una segunda fase de desarrollo para incluirlo en una plataforma robótica avanzada”

En resumen, parece ser, como no  podía ser de otra manera, que Google se halla tentando como llevar una experiencia similar a Siri para su plataforma. Aunque muchos lo pueden ver como una copia, está claro que Apple ha dado un paso innovador apostando fuerte por una interfaz de voz con un asistente personal y en un mercado tan reñido como el de las plataformas móviles, no puedes quedarte atrás.

¡Teletransportame, Scotty!

Fuente: AndroidAndMe

About Author

Leave A Reply

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.