jk's notes
  • edge-tts

edge-tts

概述

使用该项目来使用微软的语音合成, 生成 mp3, 同时还可以生成 vtt, 同步文字信息.

参考连接:

  • GitHub 项目地址
  • 简书参考

需要 python 环境.

使用步骤:

  1. 利用 pip 安装 edge-tts.
  2. 使用命令行, 将文本文件, 或文字转换为音频.
edge-tts -t '文字内容' --write-media '文件名.mp3' # 将文字转换为音频
edge-tts -f '文件地址' --write-media '文件名.mp3' # 将文字转换为音频

详细步骤

安装 edge-tts

pip install edge-tts

需要提前保证网络环境, 同时安装 python 环境.

运行 edge-tts 出现下面提示表示安装成功

PS C:\Users\jk> edge-tts
usage: edge-tts [-h] [-t TEXT] [-f FILE] [-v VOICE] [-l] [--rate RATE] [--volume VOLUME] [--pitch PITCH]
                [--words-in-cue WORDS_IN_CUE] [--write-media WRITE_MEDIA] [--write-subtitles WRITE_SUBTITLES]
                [--proxy PROXY]
edge-tts: error: one of the arguments -t/--text -f/--file -l/--list-voices is required

参数说明

常用参数说明

选项描述
-h 或 --help显示帮助信息.
-t 或 --text指定待转换的文本内容.
-f 或 --file指定需要转换的文件.
-l 或 list-voices列举可用的语音引擎. 这里需要注意, 默认为英文, 要转码中文, 需要指定中文引擎.
--pitch用于调整码率. 单位是 Hz, 用法: --pitch=-50Hz.
--rate用于调整速度, 使用 --rate=+50% 或 --rate=-50% 的形式.
--volume调整音量, 语法与 --rate 一样.
--write-media指定生成文件的路径.
--write-subtitles指定生成的 vtt 文件路径.

示例说明

查看帮助文档

edge-tts -h

image-20240529154138218

查看可用的语音引擎

edge-tts -l

image-20240529154300714

中文引擎包括

Name: zh-CN-XiaoxiaoNeural
Gender: Female

Name: zh-CN-XiaoyiNeural
Gender: Female

Name: zh-CN-YunjianNeural
Gender: Male

Name: zh-CN-YunxiNeural
Gender: Male

Name: zh-CN-YunxiaNeural
Gender: Male

Name: zh-CN-YunyangNeural
Gender: Male

Name: zh-CN-liaoning-XiaobeiNeural
Gender: Female

Name: zh-CN-shaanxi-XiaoniNeural
Gender: Female
Last Updated:
Contributors: jk