Introducción a la Inteligencia Artificial en Música

→ Historia y paradigmas
→ Conceptos técnicos esenciales
→ Estrategias de prompting
![](https://i.imgur.com/3dKJzNX.png) Instrumeno I 863 | 2026 | Luciano Azzigotti ---
  1. Prompting → Uso básico de IA mediante instrucciones directas.

  2. Ingeniería de Prompts → Diseño estratégico de prompts para obtener respuestas optimizadas / estructura

  3. Recuperación Estructurada de IA → Uso de IA para generar respuestas estructuradas basadas en bases de datos o modelos específicos.

  4. Programación Asistida → Uso de asistentes de código como Cursor, Copilot, Codeium, Amazon CodeWhisperer, que completan y corrigen código en tiempo real. VibeCoding.


  1. Interacción con API → Integración de IA en flujos de trabajo mediante APIs (ej. OpenAI, Hugging Face, Cohere, Deepseek ).

  2. Ajuste de Modelos (Fine-Tuning) → Modificación de modelos preexistentes con datasets personalizados (ej. Fine-tuning de GPT, Llama, T5).

  3. Modelos de IA Personalizados → Creación de modelos propios a pequeña escala con herramientas como BERT, LLaMA, Mistral, RWKV.

  4. Arquitecto de IA → Desarrollo de nuevos paradigmas en IA, diseñando arquitecturas, datasets y modelos desde cero.


Este nuevo nivel 4 (“Programación Asistida”) es clave porque se ha convertido en un punto intermedio entre la simple interacción con IA y la integración de APIs, marcando la transición hacia el uso productivo y técnico de la inteligencia artificial en el código.

graph TD classDef prompt fill:#CDF,stroke:#459,stroke-width:2px classDef engineering fill:#FF8,stroke:#660,stroke-width:2px classDef retrieval fill:#FDB,stroke:#840,stroke-width:2px classDef assisted fill:#FCF,stroke:#720,stroke-width:2px a["Prompting"]:::prompt --> b["Ingeniería de Prompts"]:::engineering b --> c["Recuperación Estructurada de IA"]:::retrieval c --> d["Programación Asistida"]:::assisted d ==> e["Interacción con API"] d ==> f["Ajuste de Modelos (Fine-Tuning)"] d ==> g["Modelos de IA Personalizados"] d ==> h["Arquitecto de IA"] e -.-> i[(APIs)]:::retrieval f -.-> j[(Datasets)]:::retrieval g -.-> k[(Herramientas)]:::retrieval h -.-> l[(Arquitecturas)]:::retrieval style a fill:#CDF,stroke:#459,stroke-width:2px style b fill:#FF8,stroke:#660,stroke-width:2px style c fill:#FDB,stroke:#840,stroke-width:2px style d fill:#FCF,stroke:#720,stroke-width:2px

Introducción a la Inteligencia Artificial

La Inteligencia Artificial (IA) es un campo interdisciplinario que combina matemáticas, computación y neurociencia para crear sistemas capaces de realizar tareas que tradicionalmente requieren inteligencia humana.

note:
La IA en música no solo automatiza procesos, sino que redefine la creatividad y la relación entre el compositor y la tecnología. https://www.youtube.com/watch?v=N1TEjTeQeg0


los dos paradigmas de la IA


lógico-simbólico

- la esencia de la IA es razonar.

- se logra a través de reglas simbólicas para manipular expresiones simbólicas

- aprender puede esperar, primero debemos saber como se representa el conocimiento

biológico-inspirado

- la esencia de la inteligencia es aprender las potencias de las conexiones en una red neuronal

- razonar puede esperar. Primero debemos entender como funciona el aprendizaje


Momentos Claves en la Historia de la IA


1950 - Alan Turing propone la prueba de Turing.

1956 - Conferencia de Dartmouth: nacimiento oficial de la IA.

1980s - Resurgimiento con redes neuronales y aprendizaje profundo.

2017 - Introducción de Transformer (Vaswani et al.).

2022 - Popularización de ChatGPT 3.

note:
Cada uno de estos hitos marcó un cambio en el paradigma de la IA, pasando de reglas explícitas a modelos basados en aprendizaje de datos.


1950 – Alan Turing propone la Prueba de Turing


Paradigmas matemáticos y cognitivos


1956 – Conferencia de Dartmouth


Paradigmas matemáticos y cognitivos


1980s – redes neuronales y aprendizaje profundo


Paradigmas matemáticos y cognitivos


2017 – Introducción de Transformers (Vaswani et al.)



Paradigmas matemáticos y cognitivos


2022 – Popularización de ChatGPT-3




Paradigmas matemáticos y cognitivos


flowchart TD A[Historia de la Inteligencia Artificial] -->|1950: Turing y la Computabilidad| B(Computadora y Algoritmos) A -->|1950: Cognición Simbólica| C(Procesamiento de Información) B -->|1956: Dartmouth y la IA Simbólica| D(Primeros Lenguajes de IA: LISP) C -->|1956: Modelos Cognitivos Computacionales| E(Sistemas Basados en Reglas) D -->|1980s: Redes Neuronales| F(Backpropagation y Perceptrón Multicapa) E -->|1980s: Conexionismo| G(Modelos PDP y Cognición Distribuida) F -->|2017: Deep Learning con Transformers| H(Transformers y GPUs Especializadas) G -->|2017: Modelos Atencionales| I(Procesamiento Contextualizado del Lenguaje) H -->|2022: ChatGPT y Modelos Generativos| J(IA Multimodal y GPT-4) I -->|2022: Modelos Predictivos del Pensamiento| K(Aprendizaje de Retroalimentación Humana) %% ESTILOS PERSONALIZADOS (Manual porque classDef no funciona en Advanced Slides) style A fill:#004466,stroke:#004466,stroke-width:2px,color:#FFFFFF style B fill:#004466,stroke:#004466,stroke-width:2px,color:#FFFFFF style D fill:#004466,stroke:#004466,stroke-width:2px,color:#FFFFFF style F fill:#004466,stroke:#004466,stroke-width:2px,color:#FFFFFF style H fill:#004466,stroke:#004466,stroke-width:2px,color:#FFFFFF style J fill:#004466,stroke:#004466,stroke-width:2px,color:#FFFFFF style C fill:#993300,stroke:#993300,stroke-width:2px,color:#FFFFFF style E fill:#993300,stroke:#993300,stroke-width:2px,color:#FFFFFF style G fill:#993300,stroke:#993300,stroke-width:2px,color:#FFFFFF style I fill:#993300,stroke:#993300,stroke-width:2px,color:#FFFFFF style K fill:#993300,stroke:#993300,stroke-width:2px,color:#FFFFFF

Conceptos de IA


1. Artificial Intelligence (AI)

Definición: Simulación de la inteligencia humana en máquinas para realizar tareas como resolver problemas, reconocer patrones y tomar decisiones.

ejemplo → Cuando usas Siri o Alexa para obtener una respuesta, estás interactuando con IA.


2. Machine Learning (ML)

Subcampo de la IA que permite a las máquinas aprender de datos en lugar de ser programadas explícitamente.

ejemplo → Netflix recomienda películas basándose en tus hábitos de visualización previos.


3. Deep Learning

Subcampo del Machine Learning basado en redes neuronales profundas que analiza datos en múltiples capas.

ejemplo → Facebook etiqueta automáticamente a las personas en fotos reconociendo sus rostros.


4. Weak AI (Narrow AI)

IA diseñada para realizar tareas específicas sin comprender más allá de su propósito.

ejemplo → Un programa de ajedrez puede ser excelente jugando, pero no puede escribir un poema.


5. Artificial General Intelligence (AGI)

Inteligencia artificial con capacidad de aprendizaje general en múltiples dominios, similar a la inteligencia humana.

ejemplo → Un robot que puede aprender a cocinar, escribir historias y resolver problemas matemáticos sin entrenamiento específico para cada tarea.


6. Neural Network

Modelo de IA que imita la estructura del cerebro humano para reconocer patrones en datos.

ejemplo → La transcripción de voz a texto en teléfonos utiliza redes neuronales para convertir el sonido en palabras.


7. Algorithm

Conjunto de pasos o instrucciones utilizadas para resolver problemas.

ejemplo → Los motores de búsqueda como Google usan algoritmos para clasificar resultados relevantes.

note:
Estos conceptos son esenciales para comprender cómo funciona la IA y su impacto en la música y otras áreas creativas.


Transformer (2017)

Principales ideas establecidas

Eliminación de la recurrencia en redes neuronales.

Introducción del mecanismo de atención.

Aceleración del entrenamiento en paralelo.

Autores principales

Ashish Vaswani

Noam Shazeer

Jakob Uszkoreit

Paper clave

"Attention is All You Need" (Vaswani et al., 2017).

note:
El modelo Transformer sentó las bases para el desarrollo de modelos como GPT y BERT, revolucionando la IA generativa.


ChatGPT 3 (2022)

Innovaciones y cambio de paradigma

- Modelos generativos con gran cantidad de parámetros.

- Capacidad de entender y generar texto de forma coherente.

- Expansión de la IA al público general.

Autores principales

- Alec Radford

- Jeffrey Wu

- Ilya Sutskever

Paper clave

"Language Models are Few-Shot Learners" (Brown et al., 2020).

note:
ChatGPT 3 marcó la transición de la IA de investigación a aplicación masiva, con implicaciones en educación y composición musical.


Conceptos Claves en IA

ver también 1214 parámetros de IA




note:
Estos términos permiten entender cómo funciona la IA a nivel técnico y su aplicación en la música.


Estrategias de Prompting

Estructura de un prompt

- Role: Define el papel de la IA.

- Contextual prompt: Proporciona información relevante.

- Chain-of-thought: Divide la respuesta en pasos lógicos.

Estrategias avanzadas

- Prompting iterativo.

- Especificación de formato de salida.

- Uso de ejemplos en el input.

note:
Un buen prompt mejora significativamente la calidad de las respuestas generadas por IA.


IS and ML avazandos


1. Attention Mechanism

En deep learning, los mecanismos de atención permiten que los modelos se enfoquen en partes específicas de los datos de entrada, de manera similar a cómo los humanos prestan atención a la información relevante.

ejemplo → Al leer una historia larga, solo recordamos los eventos o personajes principales. El mecanismo de atención funciona de manera similar, enfocándose en las partes más importantes de los datos.


2. Backpropagation

Algoritmo fundamental para entrenar redes neuronales. Calcula el gradiente de la función de pérdida con respecto a cada peso usando la regla de la cadena y luego actualiza los pesos para minimizar la pérdida.

ejemplo → Un golfista ajusta su swing basándose en el error del tiro anterior. Backpropagation ajusta la red neuronal en función de los errores en sus predicciones.


3. Batch Learning

Método de entrenamiento en el que el modelo se entrena con todo el conjunto de datos a la vez, en lugar de hacerlo de manera incremental con lotes pequeños de datos.

ejemplo → En lugar de estudiar un capítulo a la vez para un examen, estudiar todo el temario de una sola vez. Eso es batch learning.


4. BERT (Bidirectional Encoder Representations from Transformers)

Modelo basado en transformers desarrollado por Google para tareas de procesamiento de lenguaje natural. Lee el texto de forma bidireccional para comprender mejor el significado de cada palabra.

ejemplo → En la frase “Él fue al banco a retirar dinero”, BERT reconoce que “banco” se refiere a una institución financiera y no a la orilla de un río.


5. RNN (Recurrent Neural Network)

Redes neuronales diseñadas para datos secuenciales. Tienen bucles que permiten que la información se transfiera entre pasos de la secuencia, lo que las hace ideales para datos de series temporales o texto.

ejemplo → Para predecir la siguiente palabra en una canción, una RNN recuerda las palabras anteriores para hacer una predicción más precisa.


6. Generative Adversarial Networks (GANs)

Redes neuronales compuestas por dos modelos: un generador que intenta crear datos falsos y un discriminador que intenta distinguir entre datos reales y falsos.

ejemplo → Un falsificador intenta hacer una copia perfecta de un cuadro, mientras que un detective de arte intenta identificar cuál es falso. Con el tiempo, el falsificador mejora tanto que el detective no puede distinguir la diferencia.


7. Embeddings

Representaciones vectoriales de datos categóricos o discretos en un espacio continuo de menor dimensión, lo que facilita su procesamiento por modelos de machine learning.

ejemplo → Representar ciudades en un mapa con coordenadas en lugar de nombres; los embeddings hacen algo similar con los datos en ML.


8. Word Embeddings

Tipo específico de embedding utilizado para palabras, convirtiéndolas en vectores que capturan su significado semántico.

ejemplo → En word embeddings, palabras similares como “rey” y “reina” aparecen cercanas en el espacio vectorial, mientras que palabras no relacionadas como “rey” y “manzana” están más separadas.


9. Decoders y Encoders

Arquitectura donde los encoders convierten las entradas en una representación compacta y los decoders las transforman de vuelta en la salida deseada. Se usan comúnmente en traducción automática.

ejemplo → Para traducir una oración del inglés al francés, el encoder la convierte en una representación intermedia y el decoder la traduce al francés.


10. Capsule Networks

Redes neuronales diseñadas para reconocer patrones en los datos sin importar su posición, orientación o escala, superando algunas limitaciones de las CNN.

ejemplo → Reconocer un gato en una imagen, sin importar si está de cabeza, lejos o girado. Las Capsule Networks identifican estos patrones sin depender de la posición espacial.

note:
Estos conceptos avanzados permiten comprender cómo funcionan las arquitecturas de IA modernas y su aplicación en la música y el arte generativo.


integración


  1. Tokens – Unidades mínimas de procesamiento en modelos de lenguaje.
  2. Parámetros – Pesos ajustables en redes neuronales que determinan la salida de la IA.
  3. Context Window – Límite de tokens que un modelo puede procesar en una sola consulta.
  4. Prompt Engineering – Técnica de redacción de instrucciones para obtener respuestas óptimas de la IA.

  1. Fine-Tuning – Ajuste de un modelo preentrenado con datos específicos para mejorar su desempeño en tareas concretas.
  2. Attention Mechanism – Algoritmo que permite a los modelos enfocarse en información relevante dentro de un contexto.
  3. Hallucination – Cuando la IA genera información incorrecta o inventada.
  4. Embeddings – Representación vectorial de palabras o conceptos para capturar relaciones semánticas.

  1. Chain-of-Thought (CoT) – Técnica para guiar el razonamiento del modelo paso a paso.
  2. Benchmarking – Evaluación comparativa de modelos de IA mediante métricas estandarizadas.
  3. Zero-Shot Learning – Capacidad del modelo de responder a tareas sin haber sido entrenado explícitamente en ellas.
  4. Few-Shot Learning – Técnica en la que el modelo aprende con pocos ejemplos antes de generar una respuesta.

  1. Transfer Learning – Uso de un modelo entrenado en una tarea para aplicarlo en otra similar.
  2. Bias en IA – Tendencia del modelo a generar respuestas influenciadas por los datos con los que fue entrenado.
  3. Temperature – Parámetro que controla la aleatoriedad de las respuestas generadas por la IA.
  4. Sampling Methods – Técnicas como Top-k y Top-p (nucleus sampling) para influir en la generación de texto.

  1. Reinforcement Learning from Human Feedback (RLHF) – Técnica que mejora el comportamiento de la IA a partir de evaluaciones humanas.
  2. Gradient Descent – Algoritmo de optimización usado en el entrenamiento de redes neuronales.
  3. Latent Space – Representación abstracta de datos en modelos generativos.
  4. Multimodal AI – Modelos capaces de procesar múltiples tipos de datos (texto, imagen, audio).

chat vs reasoning


Trabajo Práctico: 333

Objetivo

- Comprender conceptos fundamentales de IA mediante una presentación estructurada.

- Desarrollar habilidades de síntesis, visualización y aplicación creativa.

- Aprender a explicar IA de manera accesible y clara.


Instrucciones

- Se formarán grupos de 3 estudiantes.

- Cada grupo seleccionará un concepto de IA de la lista proporcionada.

- Realizarán una presentación de 3 minutos aplicando la técnica 333.


Estructura de la Presentación

- Definir en 3 frases: Explicar el concepto de forma clara y concisa.

- 3 imágenes: Ilustrar el concepto con gráficos o esquemas relevantes.

- 3 ejemplos: 1) Explicación mediante metáfora. 2) Ejemplo en código. 3) Aplicación creativa.

note:
El objetivo es explicar conceptos técnicos de IA de manera efectiva y comprensible, combinando teoría, imagen y práctica.


Ejemplo de Presentación

Attention Mechanism

Definición en 3 Frases

- Un mecanismo de atención permite que los modelos de IA enfoquen su procesamiento en partes relevantes de los datos de entrada.

- Funciona asignando pesos a diferentes elementos del input, destacando aquellos más importantes.

- Es clave en modelos como Transformers, mejorando la comprensión contextual en tareas de lenguaje y visión.


3 Imágenes Claves


![[https://d3lkc3n5th01x7.cloudfront.net/wp-content/uploads/2023/11/08031612/Attention-mechanism-27190-01-1.png]]

Ejemplo visual del mecanismo de atención destacando palabras en una oración.


![[https://i.imgur.com/rR60F7V.png]]

Representación del cálculo de pesos en una red neuronal.


Ejemplo de atención en visión por computadora: IA detectando objetos en una imagen.


Ejemplo 1: Metáfora

Imagina que estás en una fiesta ruidosa y alguien dice tu nombre. A pesar del ruido, tu cerebro automáticamente dirige tu atención a esa voz, ignorando el resto. El mecanismo de atención en IA hace algo similar: ignora la información irrelevante y se centra en lo importante.


Ejemplo 2: Código


import torch
import torch.nn.functional as F

# Simulación de pesos de atención
query = torch.tensor([0.8, 0.2, 0.6])
keys = torch.tensor([[0.7, 0.1, 0.5], [0.2, 0.9, 0.4]])
attention_scores = F.softmax(torch.matmul(query, keys.T), dim=-1)
print(attention_scores)

Este código muestra una implementación básica del mecanismo de atención en PyTorch.

note:

Explicación del Mecanismo de Atención en PyTorch

Código Base

import torch
import torch.nn.functional as F

# Simulación de pesos de atención
query = torch.tensor([0.8, 0.2, 0.6])
keys = torch.tensor([[0.7, 0.1, 0.5], [0.2, 0.9, 0.4]])
attention_scores = F.softmax(torch.matmul(query, keys.T), dim=-1)
print(attention_scores)

Explicación Paso a Paso

1. Importaciones

import torch
import torch.nn.functional as F

Para visualizarlo de manera práctica:

En el contexto del aprendizaje profundo, los tensores son fundamentales porque:

Por ejemplo, una imagen en color se puede representar como un tensor de orden 3:

Los tensores son la estructura de datos principal en frameworks como PyTorch y TensorFlow, permitiendo operaciones eficientes y cálculo de gradientes automático.)

2. Vector Query

query = torch.tensor([0.8, 0.2, 0.6])

3. Matriz de Keys

keys = torch.tensor([[0.7, 0.1, 0.5], 
                     [0.2, 0.9, 0.4]])

4. Cálculo de Puntajes de Atención

attention_scores = F.softmax(torch.matmul(query, keys.T), dim=-1)

a. Producto Matricial

b. Softmax

5. Resultados

print(attention_scores)

Interpretación de Resultados

Aplicación Práctica


Ejemplo 3: Aplicación Creativa

Proponer una aplicación musical donde la IA utilice mecanismos de atención para analizar patrones en una partitura y sugerir variaciones armónicas en tiempo real.

note:
El modelo podría detectar y enfatizar patrones melódicos dentro de una pieza musical, proporcionando recomendaciones compositivas basadas en su análisis de datos históricos.


Ejemplo de uso

ver torch.py