pyttsx的中文语音识别问题及探究之路
最近在学习pyttsx时,发现中文阅读一直都识别错误,从发音来看应该是字符编码问题,但搜索之后并未发现解决方案。自己一路摸索解决,虽说最终的原因非常可笑,大牛们可能也是一眼就能洞穿,但也值得记录一下。嗯,主要并不在于解决之道,而是探究之旅。 1、版本(python2中谈编码解码问题不说版本都是耍流氓) python:2.7 pyttsx:1.2 OS:windows10中文版 2、系统的各种字符编码 sys.getdefaultencoding() ascii sys.getfilesystemencoding() mbcs locale.getdefaultlocale() ('zh_CN', 'cp936') locale.getpreferredencoding() cp936 sys.stdin.encoding UTF-8 sys.stdout.encoding UTF-8 3、探究之路 (1)初体验: 按照http://pyttsx.readthedocs.io/en/latest/engine.html 的说明,传入中文,使用unicode类型,utf-8编码,结果发音并不是输入的内容。 1 #-*- coding: UTF-8 -*- 2 import sys 3 import pyttsx 4 5 reload(sys) 6 sys