当前位置:首页 > 技术分享 > 正文内容

Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!

lmwmm1年前 (2024-08-21)技术分享1206

Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!

AI 圈又有大新闻啦!Stability AI 又悄悄放出一个大招,这次不再是画图,而是音乐生成!而且还是开源的!

这个新工具叫 Stable Audio Open,简单来说,用文字就能生成各种音频——无论是鼓点、旋律,还是环境音效,全都不在话下!最最最重要的是,它还能为 Sora 和可灵 这些视频生成配音!接下来我介绍3种使用方法

1.最简单在线使用

Stable Audio 2.0

点击前往

 

Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!

 

2.本地一键安装包:点击下载】,适合新手,低配的电脑也能运行,但是效果没有第3种好!
Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!

3.手动安装

首先,将存储库克隆到本地机器:

git clone https://github.com/RoyalCities/RC-stable-audio-tools.git
cd RC-stable-audio-tools

创建虚拟环境

Windows :

python -m venv venv
venv\Scripts\activate

macOS 和 Linux:

python3 -m venv venv
source venv/bin/activate

安装所需的软件包

安装稳定的音频工具和必要的软件包setup.py

pip install stable-audio-tools
pip install .

 

Windows 用户的额外步骤

 

为了确保 Gradio 使用 GPU/CUDA 而不是默认使用 CPU,请卸载并重新安装torch、,torchvisiontorchaudio使用正确的 CUDA 版本:

pip uninstall -y torch torchvision torchaudio
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

配置

 

config.json根目录中包含一个示例。对其进行自定义以指定自定义模型和输出的目录(.wav 和 .mid 文件将存储在此处):

{
   "model_directory": "models",
   "output_directory": "generations"
}

使用方法

 

Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成! 运行 Gradio 界面

 

使用批处理文件或直接从命令行启动 Gradio 界面:

  • 批处理文件示例:

@echo off
cd /d path-to-your-venv/Scripts
call activate
cd /d path-to-your-stable-audio-tools
python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt
pause

或命令行:

python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt

Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成! 生成音频和 MIDI

 

Gradio 界面中的输入提示会生成音频和 MIDI 文件,这些文件将按照 中指定的方式保存config.json

该界面已经扩展了 Bar/BPM 设置(可修改用户提示 + 样本长度条件)、MIDI 显示 + 转换,还具有动态模型加载功能。

模型必须与附带的配置文件一起存储在其自己的子文件夹中。即,一次微调可以有多个检查点。所有相关检查点都可以放在同一个“model1”子文件夹中,但重要的是,它们的相关配置文件包含在与检查点本身相同的文件夹中。

要切换模型,只需使用下拉菜单选择要加载的模型,然后选择“加载模型”。

 


扫描二维码推送至手机访问。

版权声明:本文由点度点度金讯时代-BLOG发布,如需转载请注明出处。

本文链接:https://www.lmwmm.com/post/3730.html

分享给朋友:

“Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!” 的相关文章

编辑Hosts文件的方法

编辑Hosts文件的方法

Hosts是一个没有扩展名的系统文件,可以用记事本等工具打开,其作用就是将一些常用的网址域名与其对应的IP地址建立一个关联“数据库”,当用户在浏览器中输入一个需要登录的网址时,系统会首先自动从Hosts文件中寻找对应的IP地址,一旦找到,系…

12家国内外AI大模型及申请体验地址汇总

12家国内外AI大模型及申请体验地址汇总

近期,由ChatGPT引发的AI军备竞赛,可谓是百家齐鸣,眼花缭乱,应接不暇。本周,国内外多家大公司像约好了一样,纷纷发布或即将发布自己的AI大模型。这些公司分布在各行各业,可能都是想借助大模型提升自己的核心竞争力,在新一轮的科技竞赛中处于…

【讲座预告】火爆全网的ChatGPT应用实训,人人可学!点击报名!

【讲座预告】火爆全网的ChatGPT应用实训,人人可学!点击报名!

随着以自然语言处理为代表的人工智能的发展,OpenAI公司的最新成果ChatGPT近来“火出圈”。 TA不仅能和任何人“对答如流”,擅长写策划方案和调研报告,还能翻译文章、撰写邮件、创作脚本、编写代码,甚至能通过谷歌L3程序员面试和…

谷歌全面开放AI 对话机器人Bard,“人人”可用【附教程】

谷歌全面开放AI 对话机器人Bard,“人人”可用【附教程】

自从ChatGPT发布后,微软借助ChatGPT技术升级Bing搜索、office办公软件等一系列操作,给谷歌造成了很大的压力。但是,毕竟瘦死的骆驼比马大,作为早早以“AI First”作为公司战略的搜索巨头,实力不容小觑。这不,在今天凌晨…

今天起,重装(安装)系统不求人!

今天起,重装(安装)系统不求人!

你是否经历有过电脑蓝屏、垃圾软件变多的情况?又或者用腻了Win10、用不惯Win11,想重装电脑但又不会操作,售后离得又远也不方便出门……没关系,今天手把手教你搞定它!比如笔者,突然想升级到Win11玩一玩,于是从Win10 LTSC202…

Windows 12发布时间曝光!

Windows 12发布时间曝光!

[摘要]多方消息显示,微软正在准备发布 "突破性 "的以人工智能为中心的新一代Windows版本,内部代号 "Hudson Valley "(哈德逊河谷)。 快科技12月10日消息,多方消息显示,微…