玩酷网

NCIFD项目:中央民族大学国家语言资源监测与研究少数民族语言中心构造的一个面向

NCIFD项目:中央民族大学国家语言资源监测与研究少数民族语言中心构造的一个面向大模型的民族文化微调数据集

github.com/letsgoLakers/NCIFD/

NCIFD数据集的构成主要分为两部分通过Self-Instruct框架构建的NCSI和Self-QA框架构建的NCQA。其中公开10,000条数据,涵盖建筑、服饰、工艺、饮食、礼仪、语言、习俗七大领域的内容。