找回密码
 立即注册
搜索
查看: 5579|回复: 29

[怀旧] 试了下拿OCR机翻玩心跳回忆2, 感觉还凑合

[复制链接]
     
发表于 2023-3-15 09:10 | 显示全部楼层 |阅读模式
陆陆续续试了国内制作的团子翻译器, MisakaTranslator. 韩国的MORT. MisakaTranslator和MORT都能调用经典的OCR工具Tesseact5, 结果就是就连日文原文都识别出大量错误. MORT号称能调用Windows OCR,MisakaTranslator的github里也提到了Windows OCR, 但是需要系统设置里添加日文语言, 我在添加日文和相应组件后还是只能调用中文和英文的windows OCR, 而且MORT作为一个原版韩文UI提供的英文UI让人各种看不懂. 综合下来团子翻译器的本地OCR是自己移植的百度开发的超轻量模型Paddleocr, 在把背景设为不透明后识别效果还不错. 它还提供一个月均15-20的在线翻译OCR订阅服务, 可惜我这里连不上它的服务器. 翻译我用的是百度API和腾讯API, 照着团子翻译器给的说明一步步做, 10分钟多就能搞好, 这样就不需要用经常停止相应的公共翻译了. 另外团子翻译器还提供多个识别区域快速切换. 对于心跳2这种时不时对话框会变个位置范围的还比较有用. 目前下来最大的问题之一就是对于选择枝的识别问题了. 这时候我一般用百度翻译的划屏翻译功能, 等个几秒钟就行. 接下来就是玩一会游戏再想想怎么折腾图像后处理了. 虽然现在的像素画很有味道, 但是尝试下用anime4k或者waifu4k后会变成啥样子.  以及强烈推荐玩一会就存个实时存档, 心跳2用默认设置会在第一次放影片时候无限loading或者闪退. 害的我又从童年开始玩, 结果模拟器快进多了, 对话又卡住了.MisakaTranslator


团子翻译器




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2023-3-15 09:22 | 显示全部楼层
我也用的团子的本地OCR+百度API,拿来玩gal感觉效果很一般啊,很多错翻

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2023-3-15 09:35 | 显示全部楼层
我用网易的拍照翻译来试过《心跳回忆2》和《想见你》,偏差得太离谱,只能看个大概的意思而已,所以我只在关键事件的时候用这个来试一下。
回复

使用道具 举报

     
发表于 2023-3-15 09:57 | 显示全部楼层
我现在用的是LunaTranslator,主要是方便
试了试楼主的图




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2023-3-15 09:58 来自手机 | 显示全部楼层
至少对话窗口比较固定,我以前玩鬼兰时那叫一个痛苦
回复

使用道具 举报

     
发表于 2023-3-15 09:58 | 显示全部楼层
用的lunatranslator,本地ocr识别准确率很高,字节火山ocr和windowsocr也还可以,最准确的应该是有道ocr,然而有限额。
luna除了ocr还可以用hook直接提取原文。
翻译接口luna提供的太多了,感觉彩云比较好用还不用申请api。
回复

使用道具 举报

     
发表于 2023-3-15 10:01 | 显示全部楼层
尘落樱飞 发表于 2023-3-15 09:58
至少对话窗口比较固定,我以前玩鬼兰时那叫一个痛苦

玩shrift的时候,文字可能会出现在下方,中间,和上方,导致我一共开了三个OCR窗口来应对
回复

使用道具 举报

     
 楼主| 发表于 2023-3-15 10:07 | 显示全部楼层
saberserker 发表于 2023-3-15 09:57
我现在用的是LunaTranslator,主要是方便
试了试楼主的图

多谢,我去试下. 这种效果才比较符合我对OCR机翻的期待, 毕竟也不是啥人都难认出来的文字
回复

使用道具 举报

发表于 2023-3-15 10:35 | 显示全部楼层
OCR机翻玩游戏是否点难受,拿来学语言可能有点用。
看了看VNDB里7分以上的一千多部70%左右有中文,8分以上好像100%有中文,先把这些都看了岂不美哉。有中文的也正好质量口碑上乘
回复

使用道具 举报

     
 楼主| 发表于 2023-3-15 10:49 | 显示全部楼层
フカミ 发表于 2023-3-15 09:58
用的lunatranslator,本地ocr识别准确率很高,字节火山ocr和windowsocr也还可以,最准确的应该是有道ocr, ...

和曾经的百度OCR一样, 字节火山ocr也提供无限量服务. 不知道啥时候会被砍, 能用一天算一天
回复

使用道具 举报

     
 楼主| 发表于 2023-3-15 10:59 | 显示全部楼层
Lunamos 发表于 2023-3-15 10:35
OCR机翻玩游戏是否点难受,拿来学语言可能有点用。
看了看VNDB里7分以上的一千多部70%左右有中文,8分以上 ...

比较好校园恋爱这一口
回复

使用道具 举报

     
发表于 2023-3-15 11:09 | 显示全部楼层
saberserker 发表于 2023-3-15 09:57
我现在用的是LunaTranslator,主要是方便 试了试楼主的图

请问下这是哪家翻译源
luna提供的翻译源太多了,不知道哪个翻译质量比较好。
回复

使用道具 举报

     
发表于 2023-3-15 11:41 | 显示全部楼层
フカミ 发表于 2023-3-15 11:09
请问下这是哪家翻译源
luna提供的翻译源太多了,不知道哪个翻译质量比较好。
...

可以把每个翻译设置成不同颜色一起比较下,我之前玩东方同人百度和有道3或5翻译的比较好
回复

使用道具 举报

     
发表于 2023-3-15 12:07 | 显示全部楼层
心跳2里面打群架的小游戏蛮好玩的
回复

使用道具 举报

     
发表于 2023-3-15 13:29 | 显示全部楼层
有支持英文的OCR么
回复

使用道具 举报

     
发表于 2023-3-15 13:46 来自手机 | 显示全部楼层
Lunamos 发表于 2023-3-15 10:35
OCR机翻玩游戏是否点难受,拿来学语言可能有点用。
看了看VNDB里7分以上的一千多部70%左右有中文,8分以上 ...

其实大部分可以用hook解决,实在不行才上ocr的

至于机翻需求,主要针对是小黄油和新作的缺口。

—— 来自 OPPO PCLM10, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
 楼主| 发表于 2023-3-15 14:11 | 显示全部楼层

OCR模型和翻译那里都改成英文就可以了
回复

使用道具 举报

     
发表于 2023-3-15 14:33 | 显示全部楼层
泰坦失足 发表于 2023-3-15 14:11
OCR模型和翻译那里都改成英文就可以了

还真是,那个团子翻译器还支持DEEPL
这下舒服了
回复

使用道具 举报

     
 楼主| 发表于 2023-3-15 17:34 | 显示全部楼层

用了下火山OCR, 识别效果挺不错的. 就是ChatGPT的api用不了. 而且Chatgpt也只是单纯的输入, 要是在prompt里让它意识到输入本身就会有问题让它自己纠正应该会好很多.

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
 楼主| 发表于 2023-3-15 17:43 | 显示全部楼层
zzy516232108 发表于 2023-3-15 14:33
还真是,那个团子翻译器还支持DEEPL
这下舒服了

试下lunatranslator也不错, OCR能力更强
回复

使用道具 举报

     
发表于 2024-1-26 14:53 | 显示全部楼层
厉害。现在这个工具还可以吗
回复

使用道具 举报

     
 楼主| 发表于 2024-1-26 15:07 | 显示全部楼层
moontype 发表于 2024-1-26 14:53
厉害。现在这个工具还可以吗

目前最好的解决方案是LunaTranslator+GPT4 API 翻译
回复

使用道具 举报

     
发表于 2024-1-26 15:11 | 显示全部楼层
可以试试Sakura-13B-Galgame
https://github.com/SakuraLLM/Sakura-13B-Galgame

基于一系列开源大模型构建,在通用日文语料与轻小说/Galgame等领域的中日语料上进行继续预训练与微调,旨在提供性能接近GPT3.5且完全离线的Galgame/轻小说翻译大语言模型。

目前仍为实验版本,v0.9版本模型在文风、流畅度与准确性上均强于GPT-3.5,但词汇量略逊于GPT-3.5(主观评价)

LunaTranslator已经支持Sakura API,可以通过本地部署API后端,并在LunaTranslator中配置Sakura API来使用Sakura模型进行Galgame实时翻译。



评分

参与人数 1战斗力 +1 收起 理由
翼宿一 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2024-1-26 15:20 | 显示全部楼层
黄泉川此方 发表于 2024-1-26 15:11
可以试试Sakura-13B-Galgame
https://github.com/SakuraLLM/Sakura-13B-Galgame

配置要求也太高了,玩不起。
回复

使用道具 举报

     
发表于 2024-1-26 16:56 | 显示全部楼层
机翻现在的水平远不如gpt3.5以上的翻译了
回复

使用道具 举报

     
发表于 2024-1-26 18:47 | 显示全部楼层
本帖最后由 Tring 于 2024-1-26 18:48 编辑

试了下LUNA的OCR模式翻英文GAL,
用自动更新就乱漏字,句子长一点的最后1~2个词肯定不全。
用周期更新倒是能用,但是周期开短了CPU利用率就吃得高,开长了一句话等半天也很烦。
我看帮助手册里还有个OCR横版漏字优化,结果现在下的版本里根本没这个选项。
阈值也改了试了,改到0.999甚至1.0都没用,明明后面显示的图片差分是0.998但就是不触发更新识别。
也试了二值化预处理,该漏的还是漏。

折腾下来感觉还不如直接有道自己截屏好用……
你们是怎么用的?
回复

使用道具 举报

     
 楼主| 发表于 2024-1-26 18:53 | 显示全部楼层
Tring 发表于 2024-1-26 18:47
试了下LUNA的OCR模式翻英文GAL,
用自动更新就乱漏字,句子长一点的最后1~2个词肯定不全。
用周期更新倒是 ...

用GPT API然后写prompt
你将OCR识别结果的日文翻译成流畅的中文,并且只需要给出最终结果。这些文本来自某个Gal游戏/AVG游戏,开头可能会有几个日文名表示说话人且没有标点符号分割后面的说话文本。这些文本可能含有不正确的断行,错误的OCR结果或者缺失标点符号。
回复

使用道具 举报

     
发表于 2024-1-26 18:55 | 显示全部楼层
本帖最后由 Tring 于 2024-1-26 18:59 编辑
泰坦失足 发表于 2024-1-26 18:53
用GPT API然后写prompt
你将OCR识别结果的日文翻译成流畅的中文,并且只需要给出最终结果。这些文本来自 ...

现在都没有到翻译这一步,
OCR读出来的原文就漏字。

我玩的英文游戏。
应该是OCR刷新的问题,让他自动刷新最后几个字就总是漏掉。(游戏里的文本是一个字一个字出来的,相当于文本还没出完的时候他就停止读图了,最后就漏掉了后面几个字)
但是手动刷新或者周期刷新,就没有问题。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2024-1-26 18:57 | 显示全部楼层
黄泉川此方 发表于 2024-1-26 15:11
可以试试Sakura-13B-Galgame
https://github.com/SakuraLLM/Sakura-13B-Galgame

我试了,作为有大量GPT3.5翻译游戏游玩经验的我来说的话,
比GPT3.5强得多,3.5爱胡说八道的问题很少出现,准确度极高,
另外,作者说在升级人名提示辞典功能,还能更上一层楼。
真的很感谢有这样的作者做出这么好的免费开源模型来造福玩家。
GPT3.5贵死了。
回复

使用道具 举报

     
发表于 2024-1-27 02:31 | 显示全部楼层
有没有支持漫画的?看你们的讨论都要指定窗口区域才能翻译
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-5-24 20:59 , Processed in 0.096390 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表