Mecanismo de Atenção (Attention)

Definição Básica

Mecanismo que permite que modelos de IA foquem nas partes mais relevantes dos dados de entrada ao processar informação.

Definição Detalhada

O mecanismo de atenção calcula pesos de importância para cada elemento da entrada usando queries, keys e values. Self-attention permite que cada posição de uma sequência atenda a todas as outras posições. Multi-head attention executa múltiplas operações de atenção em paralelo, capturando diferentes tipos de relações. Flash Attention é uma otimização que reduz o uso de memória e acelera o cálculo.

Exemplos Práticos

Em tradução, a atenção conecta 'gato' a 'cat'; em visão, foca em regiões relevantes de uma imagem para classificação.

Termos Relacionados

Transformer Large Language Model (LLM)

Mecanismo de Atenção (Attention)

Imagens Ilustrativas

Definição Básica

Definição Detalhada

Exemplos Práticos

Termos Relacionados