当前位置:首页 > 技术分享 > 正文内容

Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!

lmwmm2年前 (2024-08-21)技术分享1524

AI 圈又有大新闻啦!Stability AI 又悄悄放出一个大招,这次不再是画图,而是音乐生成!而且还是开源的!

这个新工具叫 Stable Audio Open,简单来说,用文字就能生成各种音频——无论是鼓点、旋律,还是环境音效,全都不在话下!最最最重要的是,它还能为 Sora 和可灵 这些视频生成配音!接下来我介绍3种使用方法

1.最简单在线使用

Stable Audio 2.0

点击前往

 

 

2.本地一键安装包:点击下载】,适合新手,低配的电脑也能运行,但是效果没有第3种好!

3.手动安装

首先,将存储库克隆到本地机器:

git clone https://github.com/RoyalCities/RC-stable-audio-tools.git
cd RC-stable-audio-tools

创建虚拟环境

Windows :

python -m venv venv
venv\Scripts\activate

macOS 和 Linux:

python3 -m venv venv
source venv/bin/activate

安装所需的软件包

安装稳定的音频工具和必要的软件包setup.py

pip install stable-audio-tools
pip install .

 

Windows 用户的额外步骤

 

为了确保 Gradio 使用 GPU/CUDA 而不是默认使用 CPU,请卸载并重新安装torch、,torchvisiontorchaudio使用正确的 CUDA 版本:

pip uninstall -y torch torchvision torchaudio
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

配置

 

config.json根目录中包含一个示例。对其进行自定义以指定自定义模型和输出的目录(.wav 和 .mid 文件将存储在此处):

{
   "model_directory": "models",
   "output_directory": "generations"
}

使用方法

 

🎚️ 运行 Gradio 界面

 

使用批处理文件或直接从命令行启动 Gradio 界面:

  • 批处理文件示例:

@echo off
cd /d path-to-your-venv/Scripts
call activate
cd /d path-to-your-stable-audio-tools
python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt
pause

或命令行:

python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt

🎶 生成音频和 MIDI

 

Gradio 界面中的输入提示会生成音频和 MIDI 文件,这些文件将按照 中指定的方式保存config.json

该界面已经扩展了 Bar/BPM 设置(可修改用户提示 + 样本长度条件)、MIDI 显示 + 转换,还具有动态模型加载功能。

模型必须与附带的配置文件一起存储在其自己的子文件夹中。即,一次微调可以有多个检查点。所有相关检查点都可以放在同一个“model1”子文件夹中,但重要的是,它们的相关配置文件包含在与检查点本身相同的文件夹中。

要切换模型,只需使用下拉菜单选择要加载的模型,然后选择“加载模型”。

 


扫描二维码推送至手机访问。

版权声明:本文由点度点度金讯时代-BLOG发布,如需转载请注明出处。

本文链接:https://www.lmwmm.com/post/3730.html

分享给朋友:

“Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!” 的相关文章

Windows 11 23H2 新增"系统组件"中心

Windows 11 23H2 新增"系统组件"中心

微软正在 Windows 11 23H2 中测试新的"系统组件"页面,这一功能最终也将抵达 22H2。设置"中的"系统组件"页面是一种管理默认应用程序、扩展程序、编解码器和其他被认为与 Wi…

进入PG新时代:CES电竞屏幕一举突破2K和480Hz刷新率的颠覆性创新

进入PG新时代:CES电竞屏幕一举突破2K和480Hz刷新率的颠覆性创新

即将开幕的美国CES消费PG电子展掀起一波电竞屏幕技术的风潮,LG和三星两大屏幕巨头预告了引人注目的最新一代产品。三星推出了新款Odyssey OLED系列电竞屏幕,其中27寸的G6以360Hz的刷新率和0.03ms的反应速度带来顺滑的画面…

PG游戏库的热点传言:TH推测PS5 Pro或将在第三季度末震撼发布

PG游戏库的热点传言:TH推测PS5 Pro或将在第三季度末震撼发布

科技产品展会CES 2024即将于1月9日举行,许多期待的PG游戏玩家猜测索尼或许会在此次展会上揭晓PS5的升级版主机。然而,游戏泄露消息的专家Tom Henderson在平台上提出了不同观点,认为索尼可能会打破以往的时间规律,不在CES上…

PG数据统计2023年Steam游戏数量超过14000,次高为Switch

PG数据统计2023年Steam游戏数量超过14000,次高为Switch

Steam是Valve旗下的PC游戏平台,也是当今最大的PG游戏在线市场,其推出的游戏数量一直保持着增长态势,并且没有出现停滞或减少的迹象。根据第三方网站PG SOFT电子游戏的统计数据,2023年在Steam平台上推出的游戏数量达到了14…

安卓手机迎来磁吸充电新时代?外媒看好华硕在ibb游戏领域的竞争优势

安卓手机迎来磁吸充电新时代?外媒看好华硕在ibb游戏领域的竞争优势

新一代Qi2无线充电标准崭露头角,苹果iPhone率先实现支持,然而Android阵营何时跟进成为焦点。媒体《9to5google》瞄准华硕,或许成为首个Qi2兼容手机的品牌。Qi2是由苹果与无线充电联盟(WPC)共同打造的通用充电标准,结…

《黎明杀机》与《心灵杀手》携手合作,为BB游戏玩家打造专属英雄「艾伦韦克」

《黎明杀机》与《心灵杀手》携手合作,为BB游戏玩家打造专属英雄「艾伦韦克」

备受期待的多人不对称恐怖逃脱游戏《黎明杀机》宣布与动作恐怖作品《心灵杀手》合作,引来了BB游戏玩家的热切关注。游戏将推出新的人类方幸存者「艾伦韦克」(Alan Wake),其造型灵感来源于《心灵杀手2》中的主角,让玩家在1月30日迎来了令人…