Category Archives: Informática

Reconocimiento de voz

Compártelo si te gusta:

Acabo de instalarme el Dragon NaturallySpeaking. Muchos se preguntarán: “¿qué demonios es eso?”. Es un programa de dictado y reconocimiento de voz, que te ayuda a dictar tus documentos, o, al menos, eso pretende.

A decir verdad, el mundo del reconocimiento de voz ha evolucionado mucho. Hasta tal punto de que una frase puede ser dictada de forma continua sin pausas. Esto antes era impensable, ya que para hacer un dictado con los programas pioneros en el tema de reconocimiento de voz, tenías que ir diciendo cada palabra una a una y rezar para que te la reconociera. Parecías un jefe indio hablando con el rostro pálido. Ahora, la cosa ha llegado a tal punto en el que no sólo no se tiene por qué hablar así, sino que se recomienda, o incluso se exige, que para un buen reconocimiento de voz no hagas pausas entre las palabras. De esta forma, es mucho más sencillo ya que puedes hablarle directamente con un tono de voz normal, eso sí, cuidando el acento, sin cecear en exceso y procurando vocalizar.

Este mundo sigue estando en pañales. Este programa en concreto, tiene varios fallos en cuanto al reconocimiento. Yo soy andaluz, como más de uno sabrá, y por eso tengo un ligero ceceo que, aunque, en mi caso no es tan pronunciado como en otra gente, sigue siendo un escollo para el programa de dictado. Tengo que forzarme por decir lo más posible las eses finales, así como intentar no unir las palabras como hacemos los andaluces. También es una tentación hablar rápido ya que, como sabe todo el mundo, los andaluces nos caracterizamos por hablar excesivamente rápido. Yo creo que, con paciencia, este programa puede adaptarse a cualquier tipo de acento, con mayor o menor esfuerzo, pero con un éxito de un 80% o 90%.

Quitando el problema de la malinterpretación de las palabras, así como de algunos comandos y ciertos signos, es posible tener una “relación buena” con este programa. Eso sí, siempre y cuando no intentemos que sea efectivo al 100%. Esto es debido al eterno problema de la interpretación del lenguaje. Nosotros tenemos un sistema de lenguajes que puede llevar a confusión, ya que por ejemplo, si intentamos escribir la palabra “tu” en un contexto de una oración como por ejemplo: “tu madre me dijo que tú estabas durmiendo”, es posible que la primera aparición de la palabra la entienda como con tilde y la segunda sin tilde, cuando es al contrario. También pueden suponer un problema palabras o expresiones que por su forma de pronunciarse pueden escribirse de dos o más maneras, como por ejemplo “a ver” y “haber”. De esta forma, si empiezas un texto con cualquiera de las dos palabras, el motor de reconocimiento podrá interpretar que estás intentando decir “haber” cuando quisiste decir “a ver”. Lógicamente, esto no es un problema de programación, ya que, en realidad, la mayoría de las veces lo entiende de una forma de otra, sino que es un problema de interpretación lingüística.

El problema de la interpretación lingüística viene sucediendo desde que el hombre creó los ordenadores, ya que, el hecho de que la gente del mundo pudiera hablar entre sí, llevó a las casas de creación de programas a la creación de sistemas de traducción. Este asunto trajo de cabeza a programadores, analistas, lingüistas y especialistas en informática en general. ¿Cómo se podría intentar crear un programa que tradujera un texto de forma efectiva, con los menores errores posibles y que tuviera en cuenta la interpretación lingüística para traducir diversas formas de expresión que sólo las entiende el ser humano? Todavía no se ha solucionado. ¿Cuando se solucionará? Yo creo que se arreglará cuando se cree la inteligencia artificial. Sólo entonces, los ordenadores podrán interpretar lo que una persona dice sin errores. De hecho, el problema de la interpretación viene pasando también en los programas de texto-a-voz. Estos programas leen algo en voz alta, justamente al contrario que el reconocimiento de voz. Debido a la gran cantidad de formas de leer una palabra, de las múltiples formas en las que una frase puede ser leída, e incluso de las infinidades de formas en las que una misma frase puede ser interpretada, los programas de texto-a-voz se ven ante el problema de que su lectura debe ser lo más neutral posible, anulando estados de ánimo, ironías, sarcasmos, énfasis o incluso las exclamaciones.

Hoy por hoy, tanto la interpretación de textos para la traducción, como el texto-a-voz o el reconocimiento de voz están en una fase alpha, es decir, un estado en el que comienza a dar los primeros pasos pero que necesita de mucho trabajo porque para que sea efectivo al 100%, los ordenadores deben pensar, razonar e interpretar lo que decimos, porque si no, el tema del texto-a-voz y el reconocimiento quedará estancado en un punto sin posibilidad de avance.

Para terminar, he de decir que el Dragon NaturallySpeaking ha sido el que me ha ayudado a escribir este texto. Quizás el tiempo que he estado dictando todo esto y corrigiendo los problemas que iban saliendo, podría haber escrito dos como este, pero no habría valido de nada mi valoración y mi análisis. Realmente no ha tenido muchos errores, en comparación con los que en su día tuvieron sus compañeros a estas alturas. Digo esto porque el programa lleva funcionando un par de horas y le he dictado algo así como media página de texto para probar. Después de eso me he puesto a dictarle este artículo con un éxito bastante grande.

Pienso que este tipo de programas tienen más efectividad para personas que están continuamente dictando y escribiendo textos. Para estas personas, pasarse un tiempo adaptando el programa a su voz puede ser bastante productivo ya que, lo compensará luego escribiendo textos el doble de rápido. También es muy útil para personas con movilidad reducida o incapacitadas, ya que permite manejar el propio sistema operativo (Windows) con la voz: manejar el menú inicio, abrir o cerrar ventanas, navegar por las que tenemos abiertas y controlar cualquier aspecto de Windows.

Compártelo si te gusta:

Microsoft decide que Windows sea compatible con Linux

Compártelo si te gusta:

Como lo oís. Se está dando los primeros pasos, así que no hay que desesperar. Podéis leer la noticia entera aquí:

http://www.internautas.org/html/3595.html

Compártelo si te gusta:

Linux Ubuntu

Compártelo si te gusta:

Hace un par de días que instalé la versión Ubuntu de Linux. No es de mis favoritas, pero ya me acostumbraré. Supongo que iré trasladando cosas, pero primero necesito estudiar bien Linux, no puedo estar tan desorientado.

Lo bueno de esta edición es lo fácil que es actualizarla. Además, tiene un sistema de paquetes impresionante y se puede instalar paquetes a distancia desde una terminal, ya que él solo se encarga de descargar los paquetes necesarios e instalarlos.

Según dicen los desarrolladores, está basada en Debian, así que, al menos, tiene una buena base. A ver cómo sigue esto.

Compártelo si te gusta:

Megapirula F5 (volante muy barato)

Compártelo si te gusta:

F5 es el nick de un amigo con el que fui a ver el nuevo PC-City que han abierto en Palmones, en la ciudad de Los Barrios. Raison nos acompañó también para verla aunque él ya lo había visto el día antes.

Dando vueltas por la tienda, fuimos a dar con un volante NGS con pedales que parecía muy bueno. Tenía 8 botones y dos palancas a los lados para sustituir a los pedales en el caso de que estos no estuvieran conectados. Miramos el precio que estaba al lado y nos dimos cuenta que decía que valía 19,90 € (!). Os podéis imaginar lo que nos entró cuando vimos semejante precio. Decidimos pensárnoslo pero lo cierto es que ya estaba decidido. Raison no quiso, pero F5 y yo cojimos uno cada uno y llamamos a varios colegas para preguntarles si querían que le comprásemos uno. Nuestro colega Nitrogen aceptó… y ya iban 3.

Raison comentó que no andaba muy bien económicamente para permitirse este gasto. Así que con los 3 volantes nos dirigimos a pagar. Tras preguntar a la chica de la caja cuánto valían, ésta nos dijo que costaban 59,90 (?). Pensamos: “Esto debe estar equivocado”, y se lo dijimos. La muchacha llamó al encargado, el cual fue al lugar de donde habíamos cojido los volantes. Raison, fue detrás de él para comentarle que el precio de dicho volante no estaba allí, sino en otro lugar, junto a unos ordenadores de exposición. De pronto, F5 y yo vimos desde la caja cómo el encargado quitaba el cartel del precio y venía hacia nosotros. Pero también nos dimos cuenta de que Raison venía con otro volante en la mano. Cuando llegó nos dijo:

– Yo me voy a pillar otro porque ese precio está equivocado.

F5 y yo esbozamos una sonrisa y pensamos: “Ésta es la nuestra”. El encargado vino a la caja y nos comentó:

– El precio está equivocado.

A lo que F5, experto en aprovechar ocasiones como esta, añadió con aire de pasotismo:

– Vale.

Como queriendo decir “¿Y qué? Yo me voy a llevar estos 4 volantes por 20 € cada uno”.

El encargado quiso confundirnos diciéndonos que sólo podía cobrarnos uno, a lo que F5 respondió:

– ¿Un qué?

La víctima dijo que sólo podría cobrarlo en un solo tique y F5, ni corto ni perezoso dijo que, estupendo, que se lo cobrara todo en un solo tique.

Y ahí íbamos nosotros, saliendo por la puerta con 4 volantes de 60 € adquiridos con un descuento del 66,68 % (jajaja).

Pero lo gracioso no es eso, sino que, como para confirmar que ellos son los que mandaban y que nadie se reía de ellos, nos mandaron un guarda jurado al coche (mientras guardábamos los volantes) porque “la chica no había visto que hubiéramos pagado”. Pero yo no me callé y dije en voz alta con el guarda jurado a mi lado:

– Joder, que desconfiados son.

F5, para quitarle importancia dijo que era su trabajo y yo me reafirmé diciendo:

– Pues a mí no me ha gustado.

Pues 160 € que perdieron por no hacer las cosas bien. A ver si escaneo el tique de compra que tiene F5 y os lo pongo.

Compártelo si te gusta:

Lenguaje D

Compártelo si te gusta:

Los que son programadores o les gusta la programación saben la historia del famoso lenguaje C. De hecho más de uno sabrá que C++ es un juego de palabras que representa C=C+1.

Bueno, pues acabo de leer una noticia en Barrapunto en la que se dice que existe el lenguaje D. Trae novedades como redimensionamiento de arrays sin tener que asignar memoria para ellos, etc.

Se trata de una derivación de C++, ya que es orientado a objetos y posee toda la base de C++ con varios añadidos. Esperemos a ver cómo evoluciona.

Compártelo si te gusta: