Let's GitHub

资源分类

图片音频效率开发编程

热门标签

处理存储AI综合文本转语音人声分离提取语音转文本语音识别知识管理时间管理任务管理语言学习影视学习博客JavaPython其他命令行前端实践学习路线git
FFmpeg

FFmpeg-完整的跨平台音视频录制、转换与流处理解决方案

音频

FFmpeg是音视频处理领域的事实标准与核心工具集。它包含了一系列用于处理多媒体内容的库和命令行工具,支持几乎所有已知的音频和视频格式的读取、转换、编辑与流传输。其核心库被全球大量软件项目广泛依赖,是一个功能极其强大的工业级解决方案。

LGPL-2.1及部分GPL综合
Coqui TTS

Coqui TTS-一款高质量、开源的深度学习文本转语音工具包

音频

Coqui TTS是一个基于深度学习的开源文本转语音(TTS)工具包,专注于生成高质量、自然度接近人声的语音。它提供了大量预训练模型,支持多语言,并允许用户使用自己的数据集训练独特的语音合成模型。项目集成了最新的研究模型,是学术研究和商业应用的热门选择。

MPL-2.0 license文本转语音
Spleeter

Spleeter-由Deezer开发的用于音源分离的深度学习工具

音频

Spleeter是由Deezer开发并开源的音源分离工具。它基于TensorFlow,使用预先训练好的深度学习模型,能够快速将音乐曲目分离为不同音轨,例如:人声、鼓点、贝斯、钢琴及其他乐器。该工具因其简单易用和良好的分离效果,在音乐分析和处理领域被广泛使用。

MIT人声分离
Whisper

Whisper-由OpenAI开发的高鲁棒性通用语音识别系统

音频

Whisper是由OpenAI开发并开源的通用的语音识别(ASR)系统。它通过在大规模、多样化的音频数据集上进行训练,具备了强大的多语言识别能力、卓越的抗噪性以及出色的口音和术语处理能力。该系统支持包括转录、翻译等多种任务,因其高准确率和高可靠性,已成为目前最主流的开源语音识别解决方案之一。

MIT语音转文本语音识别
VanBlog

VanBlog-一款简洁优雅、支持一键部署的开源一体化博客系统

开发

VanBlog 是一款追求简洁与速度的现代化开源博客系统,采用前后端分离架构。它将管理后台与前台站点深度融合为单一应用,支持通过 Docker 快速部署,开箱即用。系统提供丰富的博客功能,包括文章/分类/标签管理、评论、搜索、数据统计等,并内置响应式设计,在手机和电脑上均有良好的浏览体验。其设计理念注重作者的写作和后台操作体验,同时为读者提供快速流畅的访问速度,适合追求轻量、易用且功能完整的个人博主使用。

GPL-3.0博客DockerVueTypeScript开源
ImageMagick

ImageMagick-跨平台通用图片处理工具集

图片

跨平台最主流的图片处理工具集,支持数百种图片格式,提供裁剪、缩放、旋转、滤镜、格式转换等全场景处理,Apache 2.0开源协议可完全商用,是图像处理领域的工业级解决方案。

ImageMagick 许可证处理
Chevereto Free

Chevereto Free-功能强大的自托管图像托管服务

图片

一个功能强大、界面优雅的开源自托管图像托管平台。允许用户上传、管理和分享图像,支持相册、多用户系统、API访问和链接缩短等功能,可以将图像存储在本地或连接到多种云存储服务。

AGPL-3.0存储
IOPaint

IOPaint-基于AI的强大图像修复与编辑工具

图片

一个功能强大的开源图像修复工具,基于前沿的AI模型(如LaMa, MAT, Stable Diffusion)。它提供了直观的图形界面,能够轻松去除图片中不需要的物体、水印、划痕和人物,并进行智能补绘、面部修复等操作。支持本地部署,保护隐私。

Apache-2.0AI
HivisionIDPhotos

HivisionIDPhotos-一款功能全面的AI证件照生成与处理工具

图片

一个强大的开源AI证件照生成与处理系统。它能够实现发丝级精度的智能人像抠图,自动替换证件照背景(纯色/渐变),支持包括中国、美国、日本、欧洲等在内的20多个国家/地区的官方证件照规格尺寸,并提供智能换装(需要服装素材)、亮度调整、批量处理等功能,可通过Web界面、本地部署或API方便地使用。

Apache-2.0AI证件照
memos

memos-一个开源、自部署的极简笔记与知识管理平台

效率

memos 是一款设计简洁、注重隐私的开源笔记与知识管理应用。它采用类似社交动态的“微博流”形式组织内容,支持 Markdown 语法、标签分类、内容搜索、资源附件以及日历视图等功能。用户可以将它部署在自己的服务器或 NAS 上,实现数据的完全私有化控制,适合用于记录日常想法、整理个人知识库或作为小型团队共享信息的工具。其界面清爽,操作直观,深受注重数据主权和简洁体验的用户喜爱。

MIT知识管理

网站数据

运行天数1
项目总数43

关于本站

Let's Github 是一个专注于分享 GitHub 上实用开源项目的平台,旨在帮助开发者发现高质量工具与资源,站在巨人的肩膀上,更高效地学习、借鉴并构建自己的项目。

© 2026 letsgithub.com 保留所有权利。