Implementing RLHF: Learning to Summarize with trlX

Jan 23, 2023

Learning a language? Try out my project: BridgeIt

Implementation of Reinforcement Learning with Human Feedback for text summarization task using CarperAI’s trlX framework.