November 4, 2023

In-Context Prompt Editing For Conditional Audio Generation

The paper addresses the issue of distributional shift in machine learning models, especially in text-to-audio generation. The authors observe a consistent audio quality degradation in generated audio samples with user prompts as opposed to training set prompts. They present a retrieval-based in-context prompt editing framework that uses training captions as demonstrative exemplars to improve user prompts. The framework showed an enhancement in audio quality across a set of collected user prompts.

Publication date: 3 Nov 2023
Project Page: Not provided
Paper: https://arxiv.org/pdf/2311.00895

Post Views: 286

audio quality, distributional drift, Machine Learning Models, Prompt Engineering, text-to-audio generation

In-Context Prompt Editing For Conditional Audio Generation

root

Leave a Reply Cancel reply

Press ESC to close

Share Article:

root

On The Open Prompt Challenge In Conditional Audio Generation

Low-latency Real-time Voice Conversion on CPU

Leave a Reply Cancel reply

Please allow ads on our site