Stage1st

 找回密码
 立即注册
搜索
查看: 3754|回复: 19
打印 上一主题 下一主题

[硬件] 现在基于ai的实时语音翻译app已经可以用了啊

[复制链接]
头像被屏蔽
     
跳转到指定楼层
楼主
发表于 2024-2-20 14:45 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
2#
发表于 2024-2-20 17:40 来自手机 | 只看该作者
有道翻译官好用些,查词会给出例句,还有截屏翻译
回复

使用道具 举报

头像被屏蔽
     
3#
 楼主| 发表于 2024-2-20 18:18 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
4#
发表于 2024-2-20 20:20 来自手机 | 只看该作者
这种基于 AI 的其实早就有了,现在在做大模型的,最好的还是 OpenAI 的 Whisper,不过翻译目前仅限于翻译到英文,或者输出原文。现在应用层基本上是让输出原文然后让 GPT 去翻译,配套用准确度都奇高,我自己主要是中日英三语场景(普通话),识别率都相当好

而且介入大模型可以更好生成对话回复
回复

使用道具 举报

     
5#
发表于 2024-2-20 20:31 | 只看该作者
iOS上有本地的whisper模型语音转文字app,试了下准确度不错

论坛助手,iPhone
回复

使用道具 举报

     
6#
发表于 2024-2-20 23:57 来自手机 | 只看该作者
请问有没有可以翻译视频对白生成ai字幕的,即时或者延时都行

—— 来自 Xiaomi 23049RAD8C, Android 13上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
7#
发表于 2024-2-21 00:21 | 只看该作者
FML2009 发表于 2024-2-20 23:57
请问有没有可以翻译视频对白生成ai字幕的,即时或者延时都行

—— 来自 Xiaomi 23049RAD8C, Android 13上 ...

联想语音,收费的
之前看一些主播拿来看直播live,根据语音实时生成字幕
回复

使用道具 举报

8#
发表于 2024-2-21 00:28 来自手机 | 只看该作者
去年就有人把whisper搞了个本地傻瓜包,识别英文语音挺彪悍的,特别是阿三的口音

音|视频转文字|字幕小工具V1.2,新增whisper-large-V3模型,支持100多种语言,自动翻译,解压即用! UP主: 万能君的软件库 https://www.bilibili.com/video/BV1d34y1F7qA
回复

使用道具 举报

     
9#
发表于 2024-2-21 00:30 | 只看该作者
FasterWhisperGUI 更快更强更好用的 whisper
https://www.bilibili.com/read/cv25312969
中日文都没问题

实时翻译的有推荐的吗
回复

使用道具 举报

     
10#
发表于 2024-2-21 00:36 | 只看该作者
本帖最后由 黄泉川此方 于 2024-2-21 00:39 编辑

一体式感觉,不如AR眼镜连手机
我用小爱翻译的实时字幕,监听麦克风还是漏字严重
监听系统声音到还凑合能用用


回复

使用道具 举报

     
11#
发表于 2024-2-21 01:58 来自手机 | 只看该作者
FML2009 发表于 2024-2-20 23:57
请问有没有可以翻译视频对白生成ai字幕的,即时或者延时都行

—— 来自 Xiaomi 23049RAD8C, Android 13上 ...

whisper 导出 srt
回复

使用道具 举报

     
12#
发表于 2024-2-21 02:07 来自手机 | 只看该作者
那么有离线的全文/长句翻译吗?
回复

使用道具 举报

     
13#
发表于 2024-2-21 03:07 来自手机 | 只看该作者
三星的那个如何呢?是不是真的可以用来打电话?

—— 来自 samsung SM-G9860, Android 13上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
14#
发表于 2024-2-21 03:12 来自手机 | 只看该作者
实时翻译我用的一个felo还是可以。ios的
回复

使用道具 举报

     
15#
发表于 2024-2-21 04:45 来自手机 | 只看该作者
Herreimu 发表于 2024-2-21 02:07
那么有离线的全文/长句翻译吗?

已经转成文字了?那gpt或者开源lllm都行啊。量化4bit模型,游戏级gpu也能跑
回复

使用道具 举报

头像被屏蔽
     
16#
 楼主| 发表于 2024-2-21 09:30 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
17#
 楼主| 发表于 2024-2-21 09:30 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
18#
发表于 2024-2-22 07:48 来自手机 | 只看该作者
微软能像felo那样自动朗读么?ios
回复

使用道具 举报

19#
发表于 2024-2-22 11:23 | 只看该作者
早就能用了吧,成本问题
回复

使用道具 举报

     
20#
发表于 2024-2-22 14:17 | 只看该作者
华为手机现在也有视频实时翻译
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|Archiver|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|stage1st 沪ICP备13020230号-1 沪公网安备 31010702007642号

GMT+8, 2024-5-8 05:19 , Processed in 0.028339 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表