微软携手ProjectGutenberg,利用AI语音技术制作5000本
,微软近日与“免费数字图书馆计划”Project Gutenberg 合作,利用 AI 为电子书库制作了超过 5000 本免费有声书。
据悉,在这一项目中,研究人员结合了机器学习、自动文本选择和自然语音合成等多项 AI 技术,实现了电子书自动转化为语音的全流程。
IT之家经过查询得知,项目团队首先开发出一种算法,可以自动分析电子书的结构,区分正文和非关键部分的页码、表格等,然后使用 WaveNet、Tacotron 和 FastSpeech 等文本转语音技术,生成类似真人的自然朗读语音。此外,该团队还使系统能够辨别书中叙述者、对话和不同角色,并相应调整语音,实现故事情节的语音表达。
微软表示,此次计划已收集整理了超过 35000 小时的有声书语音数据,涵盖了各类经典文学、戏剧、传记等作品,这些语音数据都将以开源方式免费提供。用户也可以用自己录制的少量语音,生成“用自己的声音朗读整本书”的效果,这一项目相对丰富了网站有声书的内容,同时也为视障人士提供了便利。
参考
-
Thousands of free and open audiobooks powered by Microsoft AI
-
论文 Large Scale Intelligent Microservices
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
猜你喜欢
- iPhone16“预告发布会”即将开始:苹果iPhone15系列京东上架
- 投票:苹果iPhone15/Pro系列手机正式发布,起价不变、顶配史上最
- 全国去年机动车拍卖成交额创五年来新高
- 先行指标释放积极信号经济“进”的势能积聚
- Linux发行版LMDE6“Faye”正进行测试:采用Debian12作
- 消息称一加明年1月举办活动,发布一加12/12R手机和一加PadGo平板
- 吉利银河L6官宣9月16日上市:四款车型,预售价12.8万元-15.8万
- 2024款小鹏G9纯电SUV将于9月19日上市,配置调整
- 南京溧水区:8月1日至年底前买房发购房补助,“卖旧换新”再给额外补助
- 英伟达RTX3090SUPER公版显卡现身闲鱼:纯黑外壳,与3090Ti
-
最新内容