现有语料库整理
中文语料资源合计,包括情感词、ptt、人民日报等等。北外许家金团队整理的语料库,包括多语种、平行语料库。超大规模中文语料,包括维基百科、新闻语料等。中英文均有,情感训练分析数据集。汉语-BCC语料库-北语。汉语-CCL语料库-北大。其他:NLP网站备用。
·
汉语-BCC语料库-北语
人民日报语料库
汉语-CCL语料库-北大
世界语言资源平台
中文语料资源合计,包括情感词、ptt、人民日报等等
中英文均有,情感训练分析数据集
CLUEbenchmark/CLUEDatasetSearch: 搜索所有中文NLP数据集,附常用英文NLP数据集
中文语料训练合集
北外许家金团队整理的语料库,包括多语种、平行语料库
超大规模中文语料,包括维基百科、新闻语料等
brightmart/nlp_chinese_corpus: 大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
其他:NLP网站备用
我爱自然语言处理 – I Love Natural Language Processing
一些英文的:
Factiva: Business Intelligence & News Monitoring | Dow Jones
The TIME Magazine Vault
Welcome to The American Presidency Project | The American Presidency Project
更多推荐
所有评论(0)