财联社8月3日讯(编辑 牛占林)美东时间周三,Meta发布了一款开源人工智能(AI)工具AudioCraft(直译为音频技艺),该工具可以帮助用户根据文本提示创作音乐和音频。
【资料图】
(来源:Meta官网)
Meta表示,这款人工智能工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉,可用文本内容生成高质量、逼真的音频和音乐。
Meta在官网介绍称,MusicGen接受过Meta拥有的和特别授权的音乐训练,可以从文本提示生成音乐,而AudioGen接受过公共音效训练,可从文本提示生成音频,比如模拟狗叫或脚步声;再加上EnCodec编解码器的改进版本,用户可以更高效率地生成更高质量的音乐。
在6月初,Meta推出了名为MusicGen的开源人工智能模型,这是一种深度学习语言模型,可以根据文本提示生成音乐。
Meta的EnCodec是一个基于深度学习的音频编解码器,由人工智能驱动,可以在音频质量没有损失的前提下,将音频压缩到比MP3格式还要小10倍的程度。
AudioGen则是一个来自Meta和耶路撒冷希伯来大学的研究团队的人工智能模型,可以通过输入文本来生成音频,亦可以扩展现有音频。AudioGen可以区分不同的声音对象,并在声学上将它们分开。
Meta还演示了MusicGen和AudioGen工作的流程图,并表示将让这些模型开源,让研究人员和从业人员可以用自己的数据集训练适合自己的模型,并帮助推进人工智能生成音频和音乐领域的发展。
与其他音乐模型相比,AudioCraft系列模型能够生成长期一致的高质量音乐和音频,还简化了音频生成模型的整体设计,使得该工具简单易用。
Meta相信它的模型可以引领新一波歌曲潮流,就像合成器改变音乐一样。“我们认为MusicGen可以变成一种新型的乐器,就像最初出现的合成器一样。”
当然,Meta也承认创作复杂而又优秀的音乐还是比较困难的,因此它选择将AudioCraft开源,以使用于训练它的数据多样化。
今年早些时候,谷歌也发布了名为MusicLM的音乐生成模型,并于5月向上月向所有用户开放。除此之外,目前较为常见的音乐模型还有Riffusion、Mousai和Noise2Music等。
财联社8月3日讯(编辑牛占林)美东时间周三,Meta发布了一款开源人工智
今年上半年,地方国企聚焦主业,着力稳经营促增长,主要经营指标符合预
【经济日报:促消费资本市场大有可为】财联社8月3日电,经济日报文章指
国内期货夜盘收盘多数下跌,焦炭跌超4%,焦煤跌超3%,液化石油气(LPG)
据21世纪经济报道,记者从国家金融监督管理总局天津监管局了解到,天津
据中证报,自7月8日证监会发布公募基金费率改革工作安排以来,截至8月2
俄罗斯6月份失业率为3 1%,上个月为3 2%;截至7月31日当周,俄罗斯消费
“数据显示,美国赤字规模正在扩大,目前占GDP的10 2%,创2012年(疫情
来源:中国日报网中国日报网8月2日电(记者董静)7月28日,意大利广播
8月2日北向资金减持56 29万股司尔特。近5个交易日中,获北向资金减持的
智通财经APP讯中州证券01375发布公告公司和保荐人华泰联合证券有限责任
本市强降雨持续,部分地区继续发布暴雨红色预警信号,部分区域降级为暴
一、赡养义务是否涵盖未抚养子女赡养义务是涵盖未抚养子女,子女对父母
,你们好,今天0471房产来聊聊一篇盛,盛简述的文章,网友们对这件事情
来为大家解答以上问题。安装photoshop7 0 1的序列号,安装photoshop7 0
8月2日,应急管理部召开会议,强调要清醒认识当前防汛救灾形势的严峻性
佛慈制药披露半年报,2023年上半年公司实现营业收入6 09亿元,同比增长
上交所就上海毕得医药科技股份有限公司解聘高级管理人员及相关事项向毕
8月2日,曙光数创“冷平衡”战略发布会在京举办,会上曙光数创发布了最
8月2日18时,按照国家住建部指令,郑州水务集团有限公司救援队启程赶往
根据私募排排网数据,7月一共有480家私募管理人备案了私募证券产品,合
恒大物业港交所公告,本公司已向联交所申请由2023年8月3日上午9时正起
美国至7月28日当周EIA原油库存下降1704 9万桶,预期下降136 7万桶,前
在美国纽约曼哈顿的第六大道上,有一块巨大的时钟,实时显示着美国国债
8月2日,《财富》杂志公布最新一期世界500强排行榜。本次上榜的公司在2
广告
X 关闭
广告
X 关闭