Fast Language-Audio Pre-training Papers

FLAP: Fast Language-Audio Pre-training

root November 8, 2023 0

The article introduces Fast Language-Audio Pre-training (FLAP), a self-supervised learning approach that learns to align audio and language representations through masking, contrastive learning, and reconstruction. FLAP randomly drops audio spectrogram…

Press ESC to close

Fast Language-Audio Pre-training

Please allow ads on our site