项目介绍
Spleeter 是由音乐流媒体服务 Deezer 使用 Python 和 TensorFlow 开发的深度学习音源分离工具。它主要用于将完整的音乐曲目分离为独立的音轨,如人声、鼓点、贝斯和其他乐器。该项目开源了预训练模型,能够快速、高质量地实现专业级别的音源分离,大大降低了音乐分析和处理的技术门槛,适用于DJ、音乐制作人、研究人员以及音乐爱好者。
核心功能
- 高质量音源分离:可将歌曲分离为2-5个独立音轨(如人声/伴奏、人声/鼓/贝斯/其他)
- 预训练模型:提供多种预设分离模型,无需额外训练即可直接使用
- 快速处理:GPU加速下可达到实时或超实时的处理速度
- 多种输出格式:支持WAV, MP3等多种音频格式输出
- 批量处理:支持一次性处理整个音乐文件夹,提高工作效率
- 命令行和API:提供简单易用的命令行接口和Python API
- Docker支持:可通过Docker容器快速部署,避免环境配置问题
- 可扩展架构:支持用户使用自己的数据集训练自定义分离模型
集成方式
Spleeter 提供了多种便捷的集成和使用方式:
- 命令行工具:安装后直接使用spleeter命令处理音频文件
- Python包:通过pip安装,在Python脚本中调用分离函数
- Docker部署:使用官方Docker镜像,无需安装Python和CUDA环境
- Web应用:基于Spleeter开发在线分离服务,如几个知名的在线伴奏提取网站
- 与其他音频工具集成:可结合FFmpeg、Audacity等工具构建音频处理流水线
- 本地服务器:部署为本地服务,通过API供其他应用调用
- 云函数:部署在AWS Lambda或Google Cloud Functions等无服务器平台上
适合的场景
Spleeter 的音源分离能力使其在多个领域有广泛应用:
- 音乐制作和混音:提取人声或乐器音轨进行重新混音或采样
- 卡拉OK和伴奏制作:快速生成高质量的伴奏音乐
- 音乐教育:分离特定乐器声部,用于听力训练和乐谱学习
- 音频修复:从损坏的录音中提取可用音轨或降低背景噪音
- 内容创作:为视频制作提取背景音乐或制作音效
- 音乐分析:用于音乐信息检索、和弦检测、节奏分析等研究
- DJ表演:实时或离线分离音轨,用于现场表演和混音