Dados sintéticos são criados quando dados reais são escassos, caros, privados ou enviesados. Técnicas incluem: GANs para imagens sintéticas, LLMs para texto sintético, simuladores 3D para dados de robótica/autônomos, e métodos estatísticos para dados tabulares. Preservam privacidade (não contêm informações pessoais reais) e permitem balanceamento de classes. Estudos mostram que modelos treinados com dados sintéticos de alta qualidade podem rivalizar com modelos treinados em dados reais.