各领域公开数据集下载
使用的数据集 THCHS30 是Dong Wang, Xuewei Zhang, Zhiyong Zhang这几位大神发布的开放语音数据集,可用于开发中文语音识别系统。 为了感谢这几位大神,我是跪在电脑前写的本帖代码。 下载中文语音数据集(5G+): 1 2 3 4 5 6 7 $ wget http : / / data .cslt .org / thchs30 / zip / wav .tgz $ wget http : / / data .cslt .org / thchs30 / zip / doc .tgz $ wget http : / / data .cslt .org / thchs30 / zip / lm .tgz # 解压 $ tar xvf wav .tgz $ tar xvf doc .tgz $ tar xvf lm .tgz 在开始之前,先好好检视一下数据集。 训练 金融 美国劳工部统计局官方发布数据 沪深股票除权除息、配股增发全量数据,截止 2016.12.31 上证主板日线数据,截止 2017.05.05,原始价、前复权价、后复权价,1260支股票 深证主板日线数据,截止 2017.05.05,原始价、前复权价、后复权价,466支股票 深证中小板日线数据,截止 2017.05.05,原始价、前复权价、后复权价,852支股票 深证创业板日线数据,截止