Loss is “nan” when fine-tuning HuggingFace NLI model (both RoBERTa/BART)

后端未结

关注

 0  1104

I\'m using HuggingFace\'s Transformer\'s library and I’m trying to fine-tune a pre-trained NLI model (ynie/roberta-large-snli_mnli_fever_anli_R1_R2_R3-nli) on a