Timbre y Semántica

De musiki

Tema

La relación entre el binomio tímbrica-semántica

Subtema

Análisis y codificación prosódica e interacción de los estados emocionales en diferentes discursos.

Abstract

En este trabajo se intentará analizar los aspectos qué operan a la hora de transmitir un mensaje en un discurso, tanto las características qué se desprenden del hablante como a su vez esas características son captadas y recibidas por los oyentes. A su vez se verá cómo al cambiar los aspectos tímbricos, de entonación y emisión del mensaje se puede generar o evocar distintas sensaciones en el oyente.

In this work we will try to analyze the aspects that operate when transmitting a message in a discourse, both the characteristics that come from the speaker and in turn those characteristics are captured and received by the listeners. At the same time, it will be seen how changing the timbral, intonation and emission aspects of the message can generate or evoke different sensations in the listener.

Introducción

En el presente trabajo se buscará a través de diferentes ejemplos ver los estados de la fonética y fonología, así como también entender los afectos-emociones que pueden desprenderse de un discurso. Se podrá de esta manera hacer un análisis de los distintos parámetros y estrategias que operan a lo hora de transmitir un mensaje.

No solo  el contenido semántico de lo que se quiere transmitir forma parte del discurso, sino que a esto se debe sumarle una serie de características tales como el sistema postural, nervioso, respiratorio, fonador los cuales intervienen en la entonación y  ayudan a que el mensaje sea captado de una forma o de otra, pudiendo así manejar distintos climas del discurso. Por lo que el énfasis sonoro permite modificar la atracción estética y el significado del sonido, así como también modificar los volúmenes relativos de los sonidos para lograr distintos efectos, acentuando en determinados momentos o variando la intensidad de acuerdo con la situación.

Se intentara de está manera poner en relieve la relación del texto y su significado con las características que provienen del intérprete, su sistema de entonación, de inflexión y los estados emocionales que resulten en cada intervención, buscando así una mirada amplia de los distintos parámetros que se analizaran.

Problema central y secundarios

Problema central

¿Existe una relación entre la semántica que se establece en un discurso y la tímbrica del hablante? Si existe tal relación ¿cuál sería?

Problemas secundarios

¿De qué dependen los estados emocionales en un discurso de lo personal, de cómo se transmite el mensaje, de el grado de entendimiento de la semántica?

¿Se pueden transmitir o evocar tales emociones-sensaciones a través de las variaciones en las inflexiones y prosódicas del habla?

Un mismo sentido semántico ¿puede cambiar si se modifican las inflexiones, la prosodia y la forma de emitir el mensaje?

Marco Teórico

Estados emocionales y prosodia.

En el campo de las emociones, estamos en el corazón de los procesos humanos, de la más íntima a la más universal, y de la más variable a la más compleja. Nuestros comportamientos, nuestros estados mentales, están ligados a nuestras emociones, los cuales pueden por momentos manejar situaciones o ver realidades que solo se explican por la subjetividad relegando a la objetividad pura. Con los años se han encontrado medios y herramientas que ayudaron a controlar nuestra subjetividad para poder expresarla mejor.

Muchas son las definiciones que se han tomado a lo largo de la historia sobre los estados emocionales. Darwin, por ejemplo, fue uno de los iniciadores del análisis de expresiones vocales de la emoción, y sostiene que tales expresiones se encuentran en los estados pre-humanos y que los bebés la utilizan como un sistema de comunicación. Mientras que por lo contrario Aristóteles asegura que los sentimientos se basan en los conocimientos y en las creencias de cada persona, y que las distintas situaciones afectan a los estados emocionales y las acciones particulares de cada individuo.

En principio se podría decir que existen dos paradigmas en el fenómeno emocional el paradigma universal y el cognitivo, este último está emparentado al análisis de las emociones y es en el que nos centraremos más en este trabajo.

En el primer paradigma se puede categorizar por un lado a las emociones básicas (universales) que son las que van cambiando y adaptándose a los distintos cambios de la vida, y, por el otro, las emociones complejas (esperanza, orgullo) que se emparentan más a la psicología. (Nguyen Noel, 2007)

En el paradigma cognitivo las emociones están dadas por las características de cada persona, su historia, personalidad, temperamento, situación actual, es decir, la idiosincrasia de cada sujeto. Es por esto que puede ir cambiando dependiendo de las distintas situaciones y contingencias de la vida. A su vez también las expresiones faciales, los gestos pueden enfatizar y/o alterar la semántica del mensaje.

La prosodia puede considerarse como un sistema de activación de emociones, en la cual para lograr una activación positiva se necesita un aumento de la frecuencia fundamental y su amplitud, mientras que para lograr lo contrario, es decir lograr un matiz más sutil, va ser necesario bajar la la frecuencia fundamental (Nguyen Noel, 2007).

El análisis prosódico y de la frecuencia fundamental se divide en tres parámetros:

  • Altura y extensión: aquí como se dijo anteriormente dependiendo la altura media del hablante y como la desvia, va a generar distintos modos de captación en el oyente. Así un registro alto se emparenta más a alegría, sorpresa, ligereza, mientras que cuando se modifica la frecuencia fundamental del hablante a un registro más bajo se relaciona  a una situación de tristeza, gravedad.
  • Intensidad: este parámetro se asocia con la aumento de la prominencia del mensaje, donde se puede generar un mensaje más enérgico, o con cierto grado de molestia.
  • Tempo: a su vez la velocidad del hablante es importante a la hora de la transmisión de un mensaje, ya que mientras más rápido se transmita el ritmo de un mensaje más se va a percibir al hablante excitado, con más energía o por lo contrario un mensaje con un ritmo más lento se va a percibir al hablante más tranquilo.

Objetivos

-Analizar y comparar las relaciones que se establecen entre las inflecciones del hablante y la semántica del mensaje.

-Analizar las características de la curva de la voz (altura, intensidad,velocidad, etc) en distintos momentos de un discurso

-Determinar cómo las características de la voz van a influir en las emociones del oyente.

- Estudiar la representación mental que evoca un mismo mensaje semánticamente hablando, en función de hacer variaciones en aspectos de la voz del hablante: prosodia, tono, volumen y formas de emisión del mensaje.

Materiales y métodos

El esquema de investigación que se utilizó en este trabajo fue el de la recolección de datos e información pertinente que ayude a la objetivación del problema planteado, el análisis de la pronunciación de la voz a través del programa Praat. Su objetivo es la comparación y observación de la codificación prosódica con el sentido semántico que se encuentra en un mensaje.

En este caso como primer paso se eligieron dos discursos particulares y diferenciados, en cuanto a su carácter, que remarquen y enfaticen las cualidades que se quieren estudiar en este trabajo. Como primer material se toma el discurso de Leopoldo Fortunato Galtieri en el cual  declara enfáticamente la guerra contra

Gran Bretaña por el conflicto de las Islas Malvinas, y por lo contrario, se lo comparara con el discurso de rendición del mismo.

Como segunda instancia se focalizó sobre tres momentos particulares  de cada discurso, para luego comparar los resultados obtenidos. En las primeras tres tomas del primer discurso, se puede observar como la voz de Galtieri va en favor al mensaje que quiere transmitir, ya que está declarando una guerra, por lo que la inflexión de su voz tiene que ser percibida con confianza, con un gran nivel de intensidad y énfasis, sin ningún titubeo, para que los oyentes lo sientan como verdad absoluta. Como propone Noel Nguyen en su libro “Fonologia y fonetica: Estados emocionales y prosodia”  cuando el hablante supera su frecuencia fundamental media  genera/evoca en el oyente que el mensaje transmitido sea captado con mayor confianza, a su vez el manejo de la intensidad de la voz puede generar o evocar un mensaje con mucha más energía y la velocidad con que se maneje el discurso son las estrategias que se ponen en relieve y en comparación en los discursos de Galtieri (404).

-Texto del primer discurso Primer toma: ”Si el pueblo de Gran Bretaña no han escuchado hasta ahora ni una sola palabra de ataque o una sola palabra, ultrajando su honor y su reputación hasta hoy”.

-Texto del primer discurso segunda toma: “Pero le pido como presidente de la Nación, al gobierno y pueblo inglés la moderación en sus expresiones y la moderación en sus hechos. El gobierno argentino y el pueblo argentino en este Cabildo abierto puede enardecerse y presentar a las ofensas, mayores ofensas.”

-Texto del primer discurso tercer toma: “Que sepa el mundo América, que un pueblo con voluntad decidida como el pueblo argentino. Si quieren venir que vengan, les presentaremos batalla.”

En estas tres tomas hay un claro mensaje semántico, el cual debe ser  transmitido con la mayor determinación y confianza posible, tal como lo hace Galtieri. Para eso como se anticipó anteriormente, Galtieri utiliza una mayor frecuencia fundamental para  este discurso, donde la media general de una voz masculina es de 100 hz, aqui está utilizando como frecuencia general en todo el discurso los 280 hz llegando a picos de casi 340 hz (tales datos fueron calculados por el analizador de voz “praat”).

Curva de altura primer toma
Error al crear miniatura: Falta archivo

Como se ven en estos gráficos la curva de la altura varía muy poco, manteniéndose casi siempre en el registro medio-agudo, si bien hay movimientos de la voz como el pico máximo de altura, que están utilizados en momentos claves y combinados con el ritmo del discurso. Por ejemplo en el tercer gráfico la primer parte (que es donde está el pico de 336 hz) combina  la frase “Que sepa el mundo América”  separado y remarcado en sílabas y  elevando aún más la altura de la voz. Esta estrategia la utiliza con mucha frecuencia en todo el discurso.

Como contraposición y método de comparación tenemos el segundo discurso de Galtieri, donde enuncia la rendición y pérdida de la guerra. En este discurso claramente tiene que transmitir un mensaje totalmente contrario al primero, aquí la voz de Galtieri poco se asemeja a aquella enfática, con gran intensidad y un tono elevado. Por lo que se percibe y se evoca a una voz con cierto grado de tristeza, con un registro más bajo, en donde la frecuencia general del discurso está en los 180 hz.

-Texto del segundo discurso primer toma: “El combate de puerto argentino ha finalizado.Nuestros soldados lucharon con esfuerzo supremo por la dignidad de la Nación. Los que cayeron están vivos para siempre en el corazón y la historia grande de los argentinos”.

-Texto del segundo discurso segunda toma: “Pelearon contra la incomprensión, el menosprecio y la soberbia.Enfrentaron con más coraje que armamento la abrumadora superioridad de una potencia, apoyada por la tecnología militar de los Estados Unidos de Norteamérica, sorprendentemente enemigos de la Argentina y su pueblo”.

-Texto del segundo discurso tercer toma:” Que nadie trate de jugar con nuestras heridas y nuestras emociones.Que nadie se confunda creyendo que somos duros en la pelea pero débiles del arma. El mundo sabe que no somos un pueblo que haya forjado su existencia al calor de las guerras de conquista y es testigo que jamás nos negamos a la paz”.

Error al crear miniatura: Falta archivo
Curva altura tercer toma
Curva de altura primer toma
Curva de altura segunda toma

Como se puede percibir en estos gráficos hay  tanto en el oscilograma (parte superior del gráfico) como en el espectrograma una disminución del espectro de la voz y del registro (medio) en comparación a los gráficos del primer discurso. Estas cualidades están claramente afectadas por la semántica del mensaje, a su vez el ritmo del discurso se encuentra más constante y menos marcado por las inflexiones de la voz, si bien lo utiliza para cierto momentos por ejemplo en los cierres de frases o para enfatizar momentos puntuales del discurso, en general remarcar aspectos negativos de los enemigos y positivos para los soldados argentinos (“Nuestros soldados...lucharon con esfuerzo supremo…” “Pelearon...contra la incomprensión...menosprecio…” “...sorprendentemente enemigo de la Argentina”).

A su vez la intensidad como se dijo anteriormente baja considerablemente y se mantiene casi siempre constante, por lo que se puede decir, si tomamos como referencias las teorías empleadas en el libro de Nguyen, que el mensaje va a llegar con menos energía, con cierto grado de gravedad, sumado al sentido semántico que se tiene que transmitir en el mensaje.

A su vez podemos observar y comparar como al manipular e invertir las inflexiones de la voz en un mismo mensaje va a generar un cambio en la percepción del oyente. Dependiendo cuanto se modifique la inflexión de la voz será el modo de percepción de quien escuche. En la primer imagen se ve la curva original, la cual presenta las características ya conocidas y analizadas en primer instancia. Pero qué sucedería si cambiaramos la curva de la voz por ejemplo a la inversa de la original, suena lógico que en el oyente vaya  haber un cambio en la percepción porque va a recibir un mismo mensaje que no se adecue totalmente con la inflexión y prosodia de la voz, y con el carácter que la semántica demanda; pero el mensaje, según la información que nos brinda Nguyen en su libro, ¿se captaría totalmente opuesto o generaría otro estado de emoción en el oyente?

MovimientoVoz(t1)
MovimientoVoz(i2.t1)

En la segunda imagen se puede ver como la curva de la voz está desfasada con la curva original generando así un cambio en la percepción del oyente, la cual está más emparentado con un cambio en el estado emocional que con percibir al mensaje como totalmente lo opuesto, es decir que el sentido del mensaje se va a captar, pero al cambiar la inflexión de la voz que iba en favor del mensaje hace que genere una sensación distinta, por ejemplo de mayor gracia o comedia en la voz, porque no hay acentuación en los momentos cruciales del discurso, porque el tono de voz va en contra de la prosodia y el mensaje.

Si bien los cambios de emociones pueden estar asociado a la semántica del mensaje, cabe destacar que también se puede generar cambios manteniendo un mismo sentido semántico y modificando las inflexiones de la voz. A su vez por la significación que tiene la palabra sería difícil establecer qué un mismo sentido semántico se capte de manera opuesta modificando la tímbrica y la inflexión de la voz, por ejemplo  nuestro primer discurso difícilmente se pueda percibir como un mensaje de tristeza o, a la inversa, que el segundo discurso  sea captado con total felicidad ya que el sentido del mensaje es muy fuerte como para que solamente cambiando la tímbrica a la voz sea captado totalmente opuesto a lo que se está transmitiendo. Pero se puede inferir tanto en los parámetros-características de la voz y en la forma de emitir un mensaje qué se puede llegar a dispersar el contenido semántico porque el oyente al captar un mensaje difuso pondrá el foco en otros parámetros como lo sónico de la voz y sus características de emisión.

Veremos cómo opera en el discurso el significado lingüístico, que está comprendido por: el semántico donde se ve como las palabras y oraciones van a reflejar la realidad o representación mental de la realidad del mensaje, y el pragmático donde los oyentes agregan información contextual a las oraciones y hacen inferencias, consciente o inconscientemente, sobre lo que se está diciendo (Patel, Aniruddh D 2008). Asimismo se va a relacionar tal significado con la percepción y emociones que se puedan desprender al cambiar aspectos y características propias del sonido de la voz, como también formas de emitir un mensaje.

Al cambiar y hacer nuevas combinaciones entre el contenido semántico, en este caso siempre el mismo, y las cualidades afectivas de la voz se pueden evocar distintas sensaciones.

Si utilizamos del primer discurso el primer texto y modificamos las características originales del habla, y logramos una voz susurrada, con poca sonoridad, con bajo  tono de voz, sin una acentuación marcada de las sílabas, veremos como en los oyentes se activará de manera inconsciente o consciente, una representación mental del susurro, el cual evoca en el bagaje cultural sensación de misterio, miedo, sumado a la altura de la voz que baja y la intensidad que disminuye.

Se nota en la imagen y en la escucha como casi qué no hay un tono bien definido,esto sucede por las características del susurro, por lo qué se percibe más un color en la voz.

Si bien el sentido y contenido semántico no se modificó desde las palabras,tal vez sí desde percepción, puede quedar en un segundo plano por las características qué evoca en el oyente esté tipo de comportamiento de la voz.

Otro cambio que se podría poner en relieve es la articulación de las palabras, es decir, reducir la duración de las palabras a lo mínimo perceptible, con cambios  constantes en la altura de la voz y acentuaciones que no se correspondan a las naturales de cada palabra. Así se logrará que el mensaje sea tal vez más confuso, evocando sensaciones de inestabilidad, inquietud en los oyentes. Aquí entran en juego los tiempos de reacción sobre los parámetros que estamos analizando, es decir el tiempo que se tarda en percibir un estímulo, por ejemplo en este caso las articulaciones cortas, y dar una respuesta sobre esa característica de la voz qué nos evoca otras sensaciones qué la original.También puede actuar sobre la altura, timbre ¿semántica?  

Error al crear miniatura: Falta archivo

En está imagen se percibe más claro y definido las regiones de las alturas por donde se mueve la voz. Al cambiar constantemente las alturas, sucede qué produce  qué los oyentes presten más atención y focalicen más sobre ese parámetro, dejando tal vez de lado o en otro plano a la semántica del mensaje, cabe destacar que a este parámetro debe sumarse la forma de emisión del mensaje. El cambio de la percepción del sentido semántico puede estar ligado a la duración coherente, aquí  muy breves, de las palabras para la comprensión de un mensaje y la relación entre ellas.

Ahora tomaremos del segundo discurso y veremos qué sucede si modificamos parámetros de la voz y formas de emisión en el segundo texto.

Sí cambiamos por ejemplo  la manera de hablar en un discurso, y lo haríamos todo en modo interrogativo con un tono de voz más elevado y remarcando el final de cada frase de la voz, se perdería el sentido semántico original ya qué está evocando una pregunta en lo qué se está transmitiendo y no estaría cumpliendo su objetivo original de informar en el mensaje.

En la imagen se ve las curvas qué se generan en cada final de frase, donde por lo general suelen ser descendente, a modo conclusivo lo cual evoca una especie de final.

Aquí en el oyente sucede algo similar a lo qué pasa en el ejemplo del susurro, como las personas están acostumbradas a qué ciertas características en las inflexiones de la voz se asocien con un modo de percepción cotidiano, en este caso con la interrogación, va a evocar una sensación diferente a la original.

Como se hizo una disminución en la duración de las palabras en el primer discurso, ahora modificaremos y aumentaremos la duración en distintos momentos de las palabras, con un tono de voz más elevado sin qué haya mucho movimientos en las alturas y emitiendo el mensaje qué remite a un vendedor en la calle, por las características y la asociaciones de esas características qué hacemos al reconocer esas inflexión de la voz. A su vez el prolongar las palabras hace qué se produzca un mensaje difuso, por lo qué esto puede dispersar la atención del oyente y focalizarse, por ejemplo en el timbre e inflexión de la voz más qué en el mensaje.

En la imagen se observa la poca movilidad en las alturas, por la duración de las acentuaciones (acentuación agógica) y como es el movimiento de la voz en los distintos momentos.

Para hablar de la percepción de los oyentes debemos explayarnos sobre los procesos cognitivos, sinónimo de pensamiento o acto de pensar, a los que hace referencia David Houron. Entre estos menciona la capacidad de evocar representaciones mentales de las palabras, sonidos, melodías.  Por lo que sí hacemos hincapié a lo que nos dice Houron, podemos hacer una analogía entre las sensaciones qué se desprenden en los distintos ejemplos y las representaciones mentales qué se logra al cambiar las características de la voz.

El autor sostiene qué en la musicología cognitiva existen hábitos musicales de la mente las cuales se pueden emparentar como se dijo anteriormente a la asociación en la letra, al sonido, al comportamiento de las alturas, etc. Somo capaces de hacer representaciones mentales y de manipularlas por ejemplo acelerando una melodía para reconocerla,  repasar una letra de manera rápida o poner en primer plana a las características de la voz por sobre lo semántico, en este caso el susurro. Si bien podemos manipular las representaciones, no se puede hacer de todas las formas qué queramos, por ejemplo para entender el comportamiento melódico de la voz se debe pasar por  toda la frase y no por una parte corta de ella, no podemos aislar momentos del todo, se necesita contexto.

Cuadro de resultados

Original

Variaciones

Error al crear miniatura: Falta archivo

*1- Mensaje captado pero cambia la sensación por los cambios de la voz e inflexión. Aquí la atención va a estar interferida por los cambios en las acentuaciones de la voz, evocando así a un tono de la voz que cotidianamente se asemeja o puede causar gracia.

*2- Mensaje difuso, donde se evoca la sensación de miedo, misterio por la características sonora del susurro. La representación mental que se evoca al percibir tales características sonoras deja en un segundo plano al contenido del mensaje, y contextualizan las sensaciones de misterio con el susurro.

*3- Sensación inquietud, se genera un mensaje confuso por lo que se pone más atención en las características de la voz. El cambio constante de altura y la brevedad en la duración de las palabras producen un mensaje confuso, por lo que las características de la voz van a resaltar por sobre la semántica.

*4- Representación mental del modo interrogativo, cambiando el sentido semántico. Aquí sucede algo parecido con el susurro, con la diferencia que aquí la percepción del contenido semántico puede cambiar porque se evoca a una forma de percibir el mensaje que no es la del contenido original.

*5- Mensaje difuso por las características de la voz, donde se pone el foco más en la inflexión que la semántica. Aquí el mensaje puede ser difuso por las características en la forma de emitir el mensaje que evoca, por las inflexiones en el habla, a la de los vendedores de la calle.

Discusión

El propósito de este trabajo es  proponer un análisis qué está ligado a la emisión sonora de la voz con sus características, a la percepción de los oyentes y cómo evocar sensaciones a través de cambios en los parámetros de la voz. Si bien en estos análisis se pueden obtener diversos resultados ya qué se está hablando de los procesos que suceden en la mente de cada oyente, por lo qué la significación para uno, por ejemplo del susurro, puede ser totalmente distinta para otro. El susurro cotidianamente es utilizado para generar un clima tenso, de miedo, pero me podrían decir qué por las características qué presenta al escucharlo, tono suave, tempo constante, les genere o evoque más tranquilidad y difícilmente uno puede discutirle sobre su forma de percibir.

En cuanto a la recopilación de resultados obtenidos podemos decir, teniendo en cuenta, como se dijo anteriormente, los grados de la percepción en cada oyente, qué si bien el contenido semántico es en principio el regulador de sensaciones, por el mensaje qué se va a transmitir, hay muchos factores secundarios qué pueden alterar y hasta dejar en un segundo plano lo qué en principio se toma como más importante. Al poner foco sobre estos parámetros secundarios, pero sin dejar de lado la relación con la semántica, podemos ver cómo en cada caso las características afectadas preponderan o igualan a lo qué en principio era más importante, y como por distintos motivos van a evocar sensaciones que no se parezcan a la original. A su vez como nuevos planteamientos o nuevas observaciones podemos incluir  una mirada más profunda como por ejemplo que la emisión sonora de la voz sea el motivo principal de regulador de sensaciones, dejando como parámetro secundario a la semántica, algo qué en principio parecería difícil de lograr.

Conclusión

A modo conclusivo se puede afirmar que según el sentido semántico que se quiere transmitir en un mensaje, son muchas las estrategias que se pueden implementar para ir en favor o no a lo que se esté transmitiendo, generando así distintos disparadores perceptuales en los oyentes.Si bien la semántica en un mensaje tiene mucha importancia, la decisión de cómo se va a emitir la voz, de que inflexión se va a utilizar tiene gran significación, ya que puede producir distintas emociones y captaciones en el oyente.

A su vez un mismo sentido semántico puede quedar en un segundo plano cuando se modifican los parámetro de la voz, la forma de emitir un mensaje, las inflexiones qué se utilice en la transmisión de un mensaje, por la representación mental y asociaciones qué hacemos al escuchar  ciertas características de los sonidos de la voz, insitando a qué la atención se focalice sobre esos parámetros y dejando a el sentido semántico en otro plano.

Agradecimientos

A la cátedra de Seminario de Composición a cargo de los profesores Luciano Azzigotti y Luciano Kulikov de la Universidad Nacional de Tres de Febrero, por sus aportes y su apoyo a lo largo de la investigación.

A la Universidad Nacional de Tres de Febrero por la calidad y formación educativa que brinda a sus alumnos de manera gratuita.

Bibliografía

    • Nguyen Noel, “Fonologia y fonetica: estados emocionales y prosodia” abril 23 de 2007.
    • Viviana Cárdenas, “La relación entre semántica y sintaxis desde la perspectiva de la producción de lenguaje escrito” junio 23 de 2010. (http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S1665-12002010000100008)
    • Ververidis, (2006)- “Emotional speech recognition”  abril 24 de 2006
    • David Houron, “Música e mente: fundamentos da musicologia cognitiva” enero a diciembre 2012.
    • Patel, Aniruddh D. 'Music, language, and the brain'. Oxford University Press, 2008.