|
|
导航: |
论坛 -> DELPHI技术
斑竹:liumazi,sephil |
|
作者: |
|
2023/5/4 9:43:02 |
标题: |
|
加入我的收藏 |
楼主: |
请问,如何识别图片的中的文字呢?
----------------------------------------------
- |
作者: |
bdsclub (重庆专业做Delphi的老人。) |
★☆☆☆☆ |
-
|
普通会员 |
|
2023/5/4 10:15:18 |
1楼: |
OCR
----------------------------------------------
逐梦DELPHI的重庆仔儿!
|
作者: |
|
2023/5/4 10:25:10 |
2楼: |
uses tesseractocr;
procedure TForm1.Button1Click(Sender: TObject); var Tesseract: TTesseractOCR; ImageFile, OutputText: string; begin // 创建TTesseractOCR对象 Tesseract := TTesseractOCR.Create; try // 设置语言 Tesseract.Language := 'eng'; // 设置图像 ImageFile := 'test.jpg'; Tesseract.SetImage(ImageFile); // 获取识别结果 OutputText := Tesseract.GetUTF8Text; // 显示结果 Memo1.Lines.Clear; Memo1.Lines.Add(OutputText); finally // 释放对象 Tesseract.Free; end; end;
https://github.com/tesseract-ocr/tesseract
----------------------------------------------
-
|
作者: |
|
2023/5/4 16:00:10 |
3楼: |
k3man (嗯哼) 请问,这个是需要封装吗?
----------------------------------------------
-
|
作者: |
cxg417 (cxg417) |
★☆☆☆☆ |
-
|
盒子活跃会员 |
|
2023/5/5 22:17:22 |
4楼: |
tesseractocr识别率很差吧?
----------------------------------------------
-
|
作者: |
|
2023/5/6 7:38:51 |
5楼: |
用PaddleOCR.
----------------------------------------------
-
|
作者: |
|
2023/5/6 9:30:40 |
6楼: |
@cxg417 (cxg417) tesseractocr确实对中英文混排识别不高
----------------------------------------------
-
|
作者: |
|
2023/5/6 13:58:03 |
7楼: |
不是Delphi的OCR
----------------------------------------------
他们总是取笑失败者,以酷似智者;他们也总是为成功者喝采,以取得赏金。
|
作者: |
cxg417 (cxg417) |
★☆☆☆☆ |
-
|
盒子活跃会员 |
|
2023/5/7 0:08:28 |
8楼: |
@shenghua PaddleOCR怎么用呢?
有没有内网或单机版的识别率比较高的OCR?
----------------------------------------------
-
|
作者: |
|
2023/5/7 7:37:42 |
9楼: |
tesseractocr 可以用5 不一定要用 4。 但不管用哪一個版本,都跟你的TRAINING DATA 有關。 而這兩個版本的TRAININ DATA 都有OPEN 的,可以下載。 基本上算是對書/報/電腦等 字體辨識度好。手寫基本要自己TRAIN 中英混合的,選對LANGUAGE 即可。 你不可能用ENGLISH 的要能識別中文。
PADDLE OCR 要LICENSE ??? https://zhuanlan.zhihu.com/p/37813115 還有 https://github.com/DayBreak-u/chineseocr_lite
但不管是用哪一個,你多數時候都是在做, IMAGE PROCESSING,而不是OCR。
----------------------------------------------
-
|
作者: |
cxg417 (cxg417) |
★☆☆☆☆ |
-
|
盒子活跃会员 |
|
2023/5/7 8:55:56 |
10楼: |
https://github.com/RapidAI/RapidOCR 这个我测试了一下效果也还不错,但是没有Delphi的支持库
----------------------------------------------
-
|
作者: |
|
2023/5/7 10:18:02 |
11楼: |
楼主,你可以考虑找一个基于 Tensorflow 的这种使用 AI 的识别。只要有训练好的识别模型文件就可以。Delphi 调用识别库是没问题的。
----------------------------------------------
-
|
作者: |
|
2023/5/7 13:56:12 |
12楼: |
如果你有錢, 有閒,是可以自己TRAIN 的,不管tesseractocr 還是 PADDLE OCR 或是 chineseocr_lite 都有提供你自己TRAIN 的方法。 好處是,讓你針對你的應用字體來調準。 壞處是,你真的要有錢,有閒。
----------------------------------------------
-
|
|