MacBERT

Chinese language model fine-tuning tool

Improves pre-trained Chinese language models by incorporating a correction task to alleviate inconsistency issues with downstream tasks

Revisiting Pre-trained Models for Chinese Natural Language Processing (MacBERT)

GitHub

646 stars

14 watching

60 forks

last commit: over 2 years ago

bertlanguage-modelmacbertnlppytorchtensorflowtransformers

www.aclweb.org/anthology/2020.findings-emnlp.58/

Related projects:

Repository	Description	Stars
ymcui/chinese-mobilebert	An implementation of MobileBERT, a pre-trained language model, in Python for NLP tasks.	81
ymcui/pert	Develops a pre-trained language model to learn semantic knowledge from permuted text without mask labels	356
ymcui/chinese-xlnet	Provides pre-trained models for Chinese natural language processing tasks using the XLNet architecture	1,652
ymcui/chinese-electra	Provides pre-trained Chinese language models based on the ELECTRA framework for natural language processing tasks	1,405
zhuiyitechnology/wobert	A Word-based Chinese BERT model trained on large-scale text data using pre-trained models as a foundation	460
ymcui/lert	A pre-trained language model designed to leverage linguistic features and outperform comparable baselines on Chinese natural language understanding tasks.	202
brightmart/xlnet_zh	Trains a large Chinese language model on massive data and provides a pre-trained model for downstream tasks	230
ymcui/chinese-mixtral	Develops and releases Mixtral-based models for natural language processing tasks with a focus on Chinese text generation and understanding	589
langboat/mengzi	Develops lightweight yet powerful pre-trained models for natural language processing tasks	533
ethan-yt/guwenbert	Pre-trained language model for classical Chinese texts using RoBERTa architecture	511
cluebenchmark/cluepretrainedmodels	Provides pre-trained models for Chinese language tasks with improved performance and smaller model sizes compared to existing models.	806
turkunlp/wikibert	Provides pre-trained language models derived from Wikipedia texts for natural language processing tasks	34
yunwentechnology/unilm	This project provides pre-trained models and tools for natural language understanding (NLU) and generation (NLG) tasks in Chinese.	439
cluebenchmark/electra	Trains and evaluates a Chinese language model using adversarial training on a large corpus.	140
sww9370/rocbert	A pre-trained Chinese language model designed to be robust against maliciously crafted texts	15