月度归档: 2023年3月

4 篇文章

【翻译】The Annotated Diffusion Model
本文翻译自 Hugging Face 博客:https://huggingface.co/blog/annotated-diffusion 在这篇文章,我们深入了解降噪扩散模型(Denoising Diffusion Probabilistic Models)(也称作 DDPMs,diffusion models,score-based gener…
【翻译】Fine-tuning 20B LLMs with RLHF on a 24GB consumer GPU
本文为站长作为 Hugging Face 中文翻译组成员之一而翻译的 HF 博客文章,原文为 https://huggingface.co/blog/trl-peft 我们很高兴正式发布 trl 与 peft 的集成,使任何人都可以更轻松地使用强化学习进行大型语言模型 (LLM) 微调!在这篇文章中,我们解释了为什么这是现有微调方法的有竞争力的替代…
【翻译】Introducing ⚔️ AI vs. AI ⚔️ a deep reinforcement learning multi-agents competition system
本文为站长作为 Hugging Face 中文翻译组成员之一而翻译的 HF 博客文章,原文为 https://huggingface.co/blog/aivsai 我们很高兴地介绍我们创建的一个新工具:⚔️ AI vs. AI ⚔️,一个深度强化学习多智能体竞赛系统。 这个工具托管在 Space 上,允许我们创建多智能体竞赛。它包含三个元素: 一个…