November 4, 2023

In-Context Prompt Editing For Conditional Audio Generation

The paper addresses the issue of distributional shift in machine learning models, especially in text-to-audio generation. The authors observe a consistent audio quality degradation in generated audio samples with user prompts as opposed to training set prompts. They present a retrieval-based in-context prompt editing framework that uses training captions as demonstrative exemplars to improve user prompts. The framework showed an enhancement in audio quality across a set of collected user prompts.

Publication date: 3 Nov 2023
Project Page: Not provided
Paper: https://arxiv.org/pdf/2311.00895

Post Views: 287

root

Exit mobile version

Please allow ads on our site

Looks like you're using an ad blocker. Please support us by disabling these ad blocker.

Press ESC to close

Share Article:

root

On The Open Prompt Challenge In Conditional Audio Generation

Low-latency Real-time Voice Conversion on CPU

Please allow ads on our site