Encoder-only Transformer model Fine-tuning을 통해 CoLA 데이터셋 분류하기 & Scheduler-Free 적용하기
Pretraining BERT model with Code example & using The Road Less Scheduled 1. Introduction 나에게 주어진 Task는 다음과 같다. (Assignment 1) 주어진 영어 문장에 대해 문법 적합성 판정을 이진분류(binary classification)하는 데이터셋인 ...