Stage1st

 找回密码
 立即注册
搜索
查看: 2429|回复: 5
打印 上一主题 下一主题

[软件] 现在ai吹的这么厉害,有没有可以多人声分离的工具

[复制链接]
跳转到指定楼层
楼主
发表于 2024-3-3 09:23 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 midearth 于 2024-3-3 09:50 编辑

就是一段音轨有多个人说话,能不能把其中某个人的声音提取出来。
因为基本都是轮流说话,所以手动截取某些时间段也行,但有没有工具可以自动做到这点了?
补充下,是音频分离,不是转写,自己用,要免费的
回复

使用道具 举报

     
2#
发表于 2024-3-3 09:36 来自手机 | 只看该作者
飞书妙记
回复

使用道具 举报

     
3#
发表于 2024-3-3 09:38 | 只看该作者
有很多支持会议记录的工具
回复

使用道具 举报

头像被屏蔽
     
4#
发表于 2024-3-3 12:23 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
5#
发表于 2024-3-3 13:17 | 只看该作者
研究过,目前是能识别多说话人,但是不能完全识别
回复

使用道具 举报

     
6#
发表于 2024-3-3 14:30 | 只看该作者
免费的试一下IBM Watson和Google Cloud,之前试过还过得去
如果是针对汉语的可以试试讯飞和企鹅,不过企鹅的是商用的

一步到位做音频分离的我印象里现在还没有,不过既然你都提了基本都是轮流说话,没有重叠的情况下,ASR过后拿结果的时间段去调ffmpeg或者gstreamer去切不就好了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|Archiver|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|stage1st 沪ICP备13020230号-1 沪公网安备 31010702007642号

GMT+8, 2024-4-28 02:54 , Processed in 0.025039 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表