常见问题 — Audiobook Maker
Audiobook Maker是一款免费的EPUB和PDF转MP3及M4B有声书转换器,拥有超过400种神经网络AI语音,支持数十种语言(Microsoft Edge TTS)。无需注册,无使用限制,直接在浏览器中运行。
如何免费将EPUB转换为有声书?
将EPUB文件上传到Audiobook Maker,从400多种神经网络AI语音中选择合适的声音和语言,然后点击转换。免费文字转语音转换器会提取书中文本并按章节拆分,生成带有嵌入式章节的MP3或M4B格式有声书,可随时下载并在任何设备上收听。无需注册,也没有使用限制。
如何将PDF转换为有声书?
Audiobook Maker支持将PDF文件直接转换为MP3和M4B格式有声书。上传您的PDF,选择神经网络AI语音和朗读语言,转换器会自动从页面中提取文本并保留文档结构。神经网络文字转语音引擎将内容转换为高质量自然音频,可在智能手机、平板电脑或MP3播放器上收听。无需注册。
你们支持 M4B 格式吗?
支持。Audiobook Maker 可以生成专业级通用 M4B 格式有声书。与普通 MP3 文件不同,M4B 格式允许直接在音频文件中嵌入章节,保留章节标题、结构和元数据。它是 Apple Books、iTunes 及许多专业应用的标准有声书格式。您还可以生成 MP3 文件或包含独立章节的 ZIP 压缩包,以满足不同需求。
支持哪些电子书格式?
Audiobook Maker 支持 EPUB、PDF 和 TXT 格式用于有声书转换。推荐使用 EPUB 以获得最佳效果,因为它具有清晰的章节逻辑结构。PDF 也完全支持,并具备先进的文本提取功能。如果您的书籍是 MOBI 或 AZW 等其他格式,可以先用 Calibre 等免费工具轻松转换为 EPUB 后再上传。输出格式包括 MP3、带章节的 M4B 或分章节的 ZIP 压缩包。
有多少种AI语音可用?支持哪些语言?
Audiobook Maker提供超过400种高质量神经网络AI语音(基于Microsoft Edge TTS),支持数十种语言,包括中文、英语、意大利语、法语、西班牙语、德语、葡萄牙语、俄语、日语、韩语、阿拉伯语、印地语等。应用界面提供6种语言,但语音合成引擎支持Edge TTS库提供的所有语言。
AI语音听起来自然吗?
是的,转换器使用基于 Microsoft Edge TTS 的高质量神经网络 TTS 语音,结合先进的 AI 语音合成技术,能够产生自然、流畅且悦耳的声音。与旧式机械语音不同,神经网络语音能够捕捉语调、韵律和节奏,提供可与真人朗读相媲美的专业听觉体验。您可以在开始完整转换前免费试听预览。
需要安装什么吗?
不需要,Audiobook Maker 完全在网页浏览器中运行,无需任何安装。您无需在电脑、智能手机或平板电脑上下载、安装或配置任何软件。只需打开网站,上传书籍并启动转换即可。整个文字转语音过程在我们的服务器上安全快速地完成。
可以从书籍章节生成播客吗?
可以,Audiobook Maker 能自动生成包含所有章节的播客 RSS 订阅源。您可以复制订阅源链接并添加到 Apple 播客、Spotify、Overcast 或 Pocket Casts 等任何播客应用,以便流媒体收听各章节。此功能非常适合在驾驶或健身时听书,无需将文件下载到设备上占用空间。
服务真的免费吗?
是的,Audiobook Maker 完全免费,没有使用限制。无需注册,无需信用卡,生成的音频文件中也没有任何广告。这个开源项目由社区自愿捐赠支持。所有核心功能,包括文字转语音转换和 M4B 生成,均对所有用户免费开放。
Audiobook Maker 是 Speechify 的免费替代品吗?
是的。与 Speechify 需要付费订阅不同,Audiobook Maker 100% 免费,无需注册,并提供数十种语言的数百种神经网络 AI 语音,没有任何使用限制。您可以在 AlternativeTo (https://alternativeto.net/software/audiobook-maker/about/) 上找到与类似工具的详细对比。
可以用什么工具收听Audiobook Maker生成的有声书?
Audiobook Maker生成的MP3文件可以用任何音频播放器播放。在Android上,我们推荐Smart AudioBook Player,这是一款专为有声书设计的应用,能记住您的收听位置、支持速度调节并自动整理章节。在iPhone上,您可以使用Apple图书应用或任何MP3播放器。您也可以使用应用生成的播客RSS订阅源,直接在您喜爱的播客应用中收听章节。
什么是AI文本优化?它有哪些优势?
AI文本优化是一个可选步骤,由大语言模型(LLM)执行,用于对从书籍中提取的文本进行改写,使其在朗读时更加自然。它在语音合成之前运行,处理多个方面:展开首字母缩略词(例如"NASA" → "N.A.S.A."以强制逐字母发音)、将数字、日期、计量单位和符号以完整词形展开、在标题和场景切换后插入自然停顿、去除排版伪影(脚注、正文内参考文献、音节连字符、双空格)、修正引号和标点以获得流畅的阅读节奏,并防止多语言(Multilingual)语音出现语言漂移(即偶尔用错误语言朗读句子)。最终结果是一个明显更悦耳、更专业的有声书,堪比精心制作的叙述。您还可以下载.abm格式的优化后项目,以便复用、编辑或用不同声音生成新的音频版本,无需重新运行优化。
什么是 PREMIUM 语音?
PREMIUM 语音是一项付费选项,利用尖端的 Gemini 2.5 Flash 和 3.1 Flash TTS 模型生成超高品质的有声书,语音极其自然且富有表现力。Gemini TTS 技术能够以远超标准语音的保真度捕捉细微差别、情感和语调,提供可与高端人工朗读相媚美的专业聆听体验。生成过程采用优化的分块技术以保持叙事完整性,每款 PREMIUM 语音在语音选择器中均以 'gemini' 前缀标识。