lm-human-preferences

language model tuning

Training methods and tools for fine-tuning language models using human preferences

Code for the paper Fine-Tuning Language Models from Human Preferences

GitHub

1k stars

23 watching

164 forks

Language: Python

last commit: about 2 years ago

Screenshot of openai/lm-human-preferences website

openai.com/blog/fine-tuning-gpt-2/

Related projects:

Repository	Description	Stars
openai/finetune-transformer-lm	This project provides code and model for improving language understanding through generative pre-training using a transformer-based architecture.	2,167
flagai-open/aquila2	Provides pre-trained language models and tools for fine-tuning and evaluation	439
google-research/flan	A repository providing tools and datasets to fine-tune language models for specific tasks	1,484
huggingface/pytorch-openai-transformer-lm	Implementing OpenAI's transformer language model in PyTorch with pre-trained weights and fine-tuning capabilities	1,511
csuhan/onellm	A framework for training and fine-tuning multimodal language models on various data types	601
vhellendoorn/code-lms	A guide to using pre-trained large language models in source code analysis and generation	1,789
lge-arc-advancedai/auptimizer	Automates model building and deployment process by optimizing hyperparameters and compressing models for edge computing.	200
bilibili/index-1.9b	A lightweight, multilingual language model with a long context length	920
jshilong/gpt4roi	Training and deploying large language models on computer vision tasks using region-of-interest inputs	517
luogen1996/lavin	An open-source implementation of a vision-language instructed large language model	513
r2d4/openlm	Library that provides a unified API to interact with various Large Language Models (LLMs)	367
ethanyanjiali/minchatgpt	This project demonstrates the effectiveness of reinforcement learning from human feedback (RLHF) in improving small language models like GPT-2.	214
brightmart/xlnet_zh	Trains a large Chinese language model on massive data and provides a pre-trained model for downstream tasks	230
openai/generating-reviews-discovering-sentiment	Generates reviews and discovers sentiment using a language model	1,512
apache/opennlp-models	Provides pre-trained binary models for natural language text processing across multiple languages	4