Датасеты также доступны для скачивания через библиотеку datasets
в HuggingFace:
from datasets import load_dataset
dataset = load_dataset("ai-forever/MERA", DATASET_NAME)
# Available DATASET_NAME: ['simplear', 'rwsd', 'rumultiar',
# 'rumodar', 'rutie', 'rummlu', 'ruhumaneval', 'ruhatespeech',
# 'rcb', 'lcs', 'bps', 'rudetox', 'ruethics', 'ruhhh', 'use', 'parus',
# 'mathlogicqa', 'ruopenbookqa', 'ruworldtree', 'multiq', 'chegeka']