找回密码
 立即注册
搜索
查看: 10629|回复: 75

[漫画] 【讨论下自动汉化】

[复制链接]
     
发表于 2023-6-14 18:24 | 显示全部楼层 |阅读模式
目前自动汉化工具开发进度大概到我预期的70%左右了。

1、很好用,走默认流程可以以极少的人工干预获得正确率90%以上的翻译和填字。(注意:目前的流程并不处理框外字、艺术字、修图。)

2、当我想要在此基础上提高正确率和美观度,仍然需要消耗不少时间精力。这就使得批量出产汉化成品不再可能,除非我愿意接受固定在90%左右的准确率。

3、假如我公开这个工具,既可以提高汉化者工作效率,也可以方便个人用户啃生肉,但是因为这个工具对讲漫up也有很明显的用处,我担心耗心血写出的程序成为逼死自己的工具,不敢全部公开。话虽如此,我准备写完下个功能后更新一下前半功能的公开代码。

我想讨论的问题如下:
1、以低人工干预获得的约90%正确率(不修图也不处理框外)的汉化草稿,有发布意义吗?虽然这是可以降低啃生肉难度的一个终极方案。

2、翻译上使用GPT4辅助,一话会消耗大概10条额度,openai会员一天不眠不休才能达到上限200条。识别对话框会有部分错误需要人工校准,识别文字必定会有一部分错误需要人工修改,虽然是用于批量的工具,实际上过程中每个步骤都有自动化的上限和人力成本。

3、实际体验中GPT4翻译的问题是,有时候会把短句翻译很长造成难以填字必须人工处理,有时候因为缺乏图像上下文会有部分理解错误,有时候缺乏对角色背景的了解,有时候语气词不合适。受限于生成式ai的特性,它无法达成完全自动化。

4、有考虑招募人手或者分发工具,但如何控制使用范围避免落入讲漫手中呢?只要有这个威胁在我就不敢全开源。

评分

参与人数 13战斗力 +15 收起 理由
蚊仔蚊仔蚊仔 + 1 大佬
car123 + 1
白鲸之影 + 1 好评加鹅
DET + 1
feliznavidad + 2 二次元普罗米修斯!
螺旋的小夜曲 + 1 虽然会有这样那样的问题,还是期待面世那天.
BarryAllen + 1
三尖酸努努 + 1 好评加鹅
xxxcc + 1 好评加鹅
真心为你air + 1 在正联吧久闻墨问大佬大名,今难得一见.
ardito + 1 好评加鹅
k1no + 1 好评加鹅
Racyjackman + 2 看过您汉的烽火世家和不义联盟,加个鹅.

查看全部评分

回复

使用道具 举报

     
发表于 2024-3-13 01:35 | 显示全部楼层
给大佬提供一点新思路,在llama之后,逐渐形成了一批llm的小社区,现在也有可以直接加载.gguf的量化模型的前端LMstudio,如果大佬担心token的花销的话,可以试试看本地部署llm+调用openai的api来达成本地llm翻译,现在sakura13b的日语翻译效果据说可以媲美gpt3.5,做英语翻译也可以用qwen1.5,本地的llm选择很多,重要的是不用花钱,而且因为是本地翻译,整个自动化流程就可以脱离线上了
回复

使用道具 举报

     
 楼主| 发表于 2023-6-15 18:21 | 显示全部楼层

可不可以不要把英文昵称理解成拼音……
回复

使用道具 举报

头像被屏蔽
发表于 2023-6-15 18:06 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
发表于 2023-6-15 18:03 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-6-15 17:10 | 显示全部楼层
本帖最后由 镜面の云 于 2023-6-15 17:13 编辑
404489039 发表于 2023-6-15 11:10
嵌字PS做个模板很快,
现在PS beta有AI对修图也能AI补全

让嵌字头大的永远是在气泡框外的字
在加上半透明、彩色、艺术字体等情况后更是看着就头疼
前阵子ai绘图风潮下,我们组有试过用ai来去掉无框字,得到的效果只能用尴尬来形容
怎么说呢,修过的图就像把ai画图和人工画图的两张图镶嵌到一张图上奇怪
回复

使用道具 举报

     
 楼主| 发表于 2023-6-15 13:08 | 显示全部楼层
azbhg1 发表于 2023-6-15 13:02
不用显卡的话是不是未来的开发目标中基本放弃处理框外字了?
处理框外字应该还是比较依赖AI的 ...

我的意思是你可以用显卡,也可以不用显卡,缺N卡不会让程序变得整体不可用而已。
回复

使用道具 举报

     
发表于 2023-6-15 13:02 来自手机 | 显示全部楼层
本帖最后由 azbhg1 于 2023-6-15 13:05 编辑
墨问非名 发表于 2023-6-15 10:00
psd+可以不需要显卡。

不用显卡的话是不是未来的开发目标中基本放弃处理框外字了?
处理框外字应该还是比较依赖AI的
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-6-15 11:10 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-6-15 10:56 | 显示全部楼层
我觉得吧,AI嵌字需要的技术力比AI汉化还要高
回复

使用道具 举报

     
 楼主| 发表于 2023-6-15 10:52 | 显示全部楼层
刘震云 发表于 2023-6-15 10:18
这个和VNR没本质区别啊
这个翻翻黄漫还行,其他人家可能看不上

恰恰相反,这个适合汉化组用不适合纯本子。
回复

使用道具 举报

     
 楼主| 发表于 2023-6-15 10:51 | 显示全部楼层
swrrt 发表于 2023-6-15 10:34
那lz你把自己的repo链接放上来看看呗
互联网时代起码开源精神还是有人认同的 ...

在我GitHub上,搜我英文昵称。但是我只开源了前半部分并且不想宣传。
回复

使用道具 举报

     
发表于 2023-6-15 10:34 | 显示全部楼层
墨问非名 发表于 2023-6-15 10:00
我是第一次听说16年的项目撞20年、21年项目的车。

那lz你把自己的repo链接放上来看看呗
互联网时代起码开源精神还是有人认同的
回复

使用道具 举报

     
发表于 2023-6-15 10:32 来自手机 | 显示全部楼层
不知为什么,我突然觉得我原来真的已经生活在“未来”了

—— 来自 OPPO PGT110, Android 13上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2023-6-15 10:25 | 显示全部楼层
自动汉化工具,其实开发量没那么复杂,这是一个在现阶段对汉化组很有用,但完全没法商业化的东西,因为汉化其实不需要高精尖的人才,翻译和嵌字的人力成本太低了,搭建生态的钱说不定还不如直接用人力翻。

未来的趋势应该是
商业侧:随着ai列入基建,自动汉化越来越便宜和好用,雇1个人做5~6个人的活;
消费侧:读者直接看生肉,有插件一键翻译,类似微信等的一键翻译

所以我觉得没必要想太多,直接分享就行了。
现阶段的工作都是早期的用爱发电,只要有利可图,大公司马上就会入场,然后不断迭代优化;
至于讲漫,他们总是在嫖东西,嫖的不是A就是B,不用多想,都一样
回复

使用道具 举报

     
发表于 2023-6-15 10:18 | 显示全部楼层
这个和VNR没本质区别啊
这个翻翻黄漫还行,其他人家可能看不上
回复

使用道具 举报

     
发表于 2023-6-15 10:04 | 显示全部楼层
十六方 发表于 2023-6-15 02:46
讲漫不都用生肉吗?

真用生肉,自己翻译没有汉化组汉化过的漫画甚至自己写稿,就不是大家唾弃的“讲漫UP主”了。现在有不要脸直接盗汉化组作品连水印都不消放抖音的,画面生肉翻译照汉化组的,完全自翻自己写稿分析不讲全建议购买正版的,这些差距太大了。
回复

使用道具 举报

     
 楼主| 发表于 2023-6-15 10:03 | 显示全部楼层
alecwong 发表于 2023-6-15 09:54
有个不是思路的思路:
申请专利,分发,发现无耻的盗用者后发律师函。
好处是也许能稍微扼制一下讲漫们的嚣 ...

主要难度是证明对方确实侵权,毕竟之前盗我译稿做视频的那些讲漫up我也没举报成功。
回复

使用道具 举报

     
 楼主| 发表于 2023-6-15 10:00 | 显示全部楼层
大江户战士 发表于 2023-6-15 07:44
https://github.com/zyddnys/manga ... b/main/README_CN.md

已经有现成的开源项目了,楼主撞车了(而且这 ...

我是第一次听说16年的项目撞20年、21年项目的车。
回复

使用道具 举报

     
 楼主| 发表于 2023-6-15 10:00 | 显示全部楼层
azbhg1 发表于 2023-6-15 03:54
没懂,楼主现在在做的项目和已经开源的几个比如
https://github.com/zyddnys/manga-image-translator
https ...

psd+可以不需要显卡。
回复

使用道具 举报

     
 楼主| 发表于 2023-6-15 09:59 | 显示全部楼层
十六方 发表于 2023-6-15 02:46
讲漫不都用生肉吗?

骗哥们可以,别把你自己也骗到了就行。
回复

使用道具 举报

     
发表于 2023-6-15 09:54 | 显示全部楼层
有个不是思路的思路:
申请专利,分发,发现无耻的盗用者后发律师函。
好处是也许能稍微扼制一下讲漫们的嚣张气焰,缺点是必然会被扣上各种“违背互联网开放共享精神”的帽子,而且就国内的知识产权保护力度来说估计也起不到太大作用。
而且,专利能不能顺利申请下来也是个谜。
回复

使用道具 举报

     
发表于 2023-6-15 09:07 | 显示全部楼层
我想问一下有没有可以直接在readcomiconline网站上直接在线翻译漫画图片的工具,普通读者自用的那种。上述的工具要么收费,要么需要下载配置选择气泡后使用。
回复

使用道具 举报

发表于 2023-6-15 08:08 | 显示全部楼层
私下提供给汉化组就行了,公开分发只会助长劣币驱逐良币
回复

使用道具 举报

头像被屏蔽
发表于 2023-6-15 07:44 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2023-6-15 07:09 | 显示全部楼层
墨问非名 发表于 2023-6-14 23:13
框外字需要更多的开发时间处理,而且因其特性必须人工修正

日文漫画的话,谷歌翻译出来的不能用,就算gpt也经常有错。虽然确实可以节省一些翻译的时间,但其实嵌字比翻译耗时更多,更枯燥。如果要提升汉化组效率那还得是超级嵌字ai。
回复

使用道具 举报

     
发表于 2023-6-15 03:54 来自手机 | 显示全部楼层
没懂,楼主现在在做的项目和已经开源的几个比如
https://github.com/zyddnys/manga-image-translator
https://github.com/dmMaze/BallonsTranslator
https://github.com/jtl1207/comic-translation
之类的独特性在哪里?能生成psd?
回复

使用道具 举报

     
发表于 2023-6-15 02:46 | 显示全部楼层
讲漫不都用生肉吗?
回复

使用道具 举报

     
 楼主| 发表于 2023-6-15 00:56 | 显示全部楼层
BarryAllen 发表于 2023-6-15 00:10
不太可能阻挡讲漫及其僵尸粉丝之流, 但可以列个黑名单把不良用户事迹曝光一下 (虽然对于反制讲漫实质作用不 ...

我担心成为反向引流
回复

使用道具 举报

发表于 2023-6-15 00:10 | 显示全部楼层
不太可能阻挡讲漫及其僵尸粉丝之流, 但可以列个黑名单把不良用户事迹曝光一下 (虽然对于反制讲漫实质作用不大但真正的作用是让使用楼主工具的人都有认知
回复

使用道具 举报

     
 楼主| 发表于 2023-6-14 23:13 | 显示全部楼层
lasrotel 发表于 2023-6-14 22:22
只有基本框内字机器翻译嵌字功能的话,其实对汉化组用处不算很大吧。翻译能省点力气,但解决不了嵌字受到的 ...

框外字需要更多的开发时间处理,而且因其特性必须人工修正
回复

使用道具 举报

     
 楼主| 发表于 2023-6-14 23:12 | 显示全部楼层
亚瑟邓特 发表于 2023-6-14 22:49
讲漫受众和你开发所面对的受众根本不是一个世界,我觉得只能无视,但也许会有垃圾人做出和举报网盘资源类似 ...

他们对我做的事比这严重多了,我是受不了讲漫对我的网暴+性骚扰+泼脏水才害怕工具落入他们手中
回复

使用道具 举报

     
发表于 2023-6-14 22:49 来自手机 | 显示全部楼层
讲漫受众和你开发所面对的受众根本不是一个世界,我觉得只能无视,但也许会有垃圾人做出和举报网盘资源类似的行为,这种还真没啥好法子

—— 来自 Xiaomi 2112123AC, Android 13上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

头像被屏蔽
发表于 2023-6-14 22:48 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2023-6-14 22:22 | 显示全部楼层
只有基本框内字机器翻译嵌字功能的话,其实对汉化组用处不算很大吧。翻译能省点力气,但解决不了嵌字受到的折磨。
回复

使用道具 举报

     
 楼主| 发表于 2023-6-14 22:07 | 显示全部楼层
M乔梦 发表于 2023-6-14 22:05
你这就错了,大部分听讲漫的只是刷短视频刷到觉得有意思,然后点个关注听后续。实际看的只是短视频解闷。 ...

这是很大一部分了,还有更可怕的,看了漫画以后专门去吹捧讲漫up,然后我去评论区指出视频侮辱角色的问题的时候被这些人性骚扰、辱骂。
回复

使用道具 举报

     
发表于 2023-6-14 22:05 | 显示全部楼层
真心为你air 发表于 2023-6-14 21:39
大佬,你看这样行不行,chatgpt token获取难度高,直接调用谷歌百度网页翻译,把过程傻瓜化,牺牲部分准确 ...

这就错了,大部分听讲漫的只是刷短视频刷到觉得有意思,然后点个关注听后续。实际看的只是短视频解闷。和漫画受众区别很大的
回复

使用道具 举报

     
发表于 2023-6-14 22:05 | 显示全部楼层
我有印象很多年前好像lz在S1发过帖
回复

使用道具 举报

     
发表于 2023-6-14 21:46 | 显示全部楼层
墨问非名 发表于 2023-6-14 21:37
https://ismanga.com/ 我没用过,不过简介符合需求

嗯,包括这个在内,老外开发的漫画翻译基本都是中日韩转英,而不是汉化。
回复

使用道具 举报

     
 楼主| 发表于 2023-6-14 21:41 | 显示全部楼层
真心为你air 发表于 2023-6-14 21:39
大佬,你看这样行不行,chatgpt token获取难度高,直接调用谷歌百度网页翻译,把过程傻瓜化,牺牲部分准确 ...

旧版有,但是有GPT4以后我懒得做其他翻译源了,只留谷歌和GPT4
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-5-26 13:19 , Processed in 0.114391 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表