电话 发表于 2024-3-30 21:19

【OCR】Abbyy总在章节号中识别出空格(如1 . 1 . 1),影响搜索

测试了abbyy finereader16的ocr。
此软件经常在数字和小数点之间识别出空格,如1.1.1会识别成 1 . 1 . 1。
而空格会干扰搜索,降低效率,是一个大问题。

请问有无办法让abbyy按以下逻辑运行?:
1.不在数字和小数点之间识别出空格?
2.不在两个汉字之间识别出空格?
谢谢!

Hint 发表于 2024-3-31 03:34

我觉得你可以写个脚本把 Abbyy 的结果修正一下,可能更快

天地一机成化育 发表于 2024-3-31 05:37

这种闭源商业软件一般都是傻瓜化操作而不提供很多的定制化选项,我觉得这软件大概率是不会有这种功能的, 所以我建议结果保存到txt然后自己写个脚本处理

win8 发表于 2024-3-31 11:04

天地一机成化育 发表于 2024-3-31 05:37
这种闭源商业软件一般都是傻瓜化操作而不提供很多的定制化选项,我觉得这软件大概率是不会有这种功能的,...

你这话说的,开源ocr软件也不提供这种选项。
想解决问题,前提你是付费用户,然后反馈给官方说经常有这种困扰。
页: [1]
查看完整版本: 【OCR】Abbyy总在章节号中识别出空格(如1 . 1 . 1),影响搜索