5 milhões de parâmetros para igualar modelos de 10 bilhões de parâmetros: Baidu PaddleOCR supera Tesseract e conquista o topo do GitHub OCR

BlockBeatNews

据 1M AI News 监测,
百度飞桨开源 OCR 工具库 PaddleOCR
以 73,300 GitHub 星标超越谷歌维护的老牌 OCR 引擎 Tesseract(73,200),
成为 GitHub 上星标最高的 OCR 项目。
排名第三的 MinerU 为 57,500 星标。
PaddleOCR 于 2020 年开源,
支持 100+ 语言,覆盖 160+ 国家和地区。

PaddleOCR 近期密集更新,
上周发布的 PP-OCRv5 仅 500 万参数,
在标准 OCR 基准上达到与十亿参数级视觉语言大模型相当的精度;
PaddleOCR-VL-1.5 在文档解析基准 OmniDocBench v1.5 上
以 94.5% 准确率刷新纪录。

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário