作为当前最火的AI应用,ChatGPT在积累了1亿用户之后开始尝试商业运营了,昨天正式发布了API,企业可以付费接入,75万单词只要2美元,成本比之前降低了90%。
实际上昨天开放的业务还有一个,那就是语音转文字的API,基于公司的Whisper大模型,去年9月份首次推出Whisper Large-v1模型,12月开源了升级版的Whisper Large-v2模型。
这次商业化之后,Whisper API的收费也很低廉,每分钟只要0.006美元,人民币约为4分钱,预计会让很多语音相关的企业压力很大。
Whisper API支持对语音文件进行转录和翻译,并支持包括英语、中文、阿拉伯语、日语、德语、西班牙语等几十种语言。
不过不同语言的准确率差别不小,Whisper large-v2模型在识别西语、英语、意大利语、德语等语言单词错误率都能控制在5%以内,这种语言转文字之后只需要用户简单修改就好。
至于中文,v1模型的错误率就有19.6%,v2略微提升到14.7%,改进不大,错误率比英文、西语之类的高很多,用户使用起来有些麻烦,需要校正的地方就多。
至于为何有这样的差距,除了中文自身的特点之外,很可能跟训练使用的中文语料较少有关,毕竟网上的内容主要还是外文。
文/快科技