NBA篮球下注app官方最新版 百度最强视觉识别模子来了!仅0.9B,文档分解身手罕见Gemini、GPT


智东西6月2日报说念,近日,肃穆发布文心滋生视觉识别模子PaddleOCR-VL-1.6。
在巨擘文档分解身手评测集OmniDocBench v1.6上,PaddleOCR-VL-1.6总道路达到96.33%,罕见Gemini-3-Pro、GPT-5.2、MinerU-2.5-Pro、GLM-OCR等,玄虚性能第一。
在面向的确复杂场景构建的Real5-OmniDocBench评测中,PaddleOCR-VL-1.6总道路达到93.19%,较 Gemini-3-Pro进步近4%,在扫描件、弯折文档、屏幕拍照、光照变化及歪斜文档等五大的确场景下均阐扬较优。

实测数据标明,相较于市面主流开源、闭源识别模子,PaddleOCR-VL-1.6在惯例翰墨、数学公式、表格三大基础识别维度玄虚阐扬更优。
针对表格分解、繁体古籍、冷僻用字等高难度识别场景,该模子后果较上一代较着优化,印记甄别、翰墨定位、图表信息索求等细分任务性能也同步改善,不错适配各类文档数字化落地场景的现实使用条款。
2026世界杯中国滚球app官网入口
现在,NBA篮球投注app官网下载PaddleOCR-VL-1.6已上线PaddleOCR官网,撑捏网页端和API调用。同期,模子代码及权重已同步开源至GitHub和Hugging Face。
PaddleOCR官网:paddleocr.com
Github:github.com/PaddlePaddle/PaddleOCR
HuggingFace:huggingface.co/PaddlePaddle/PaddleOCR-VL-1.6
据文心团队先容,PaddleOCR基于文心大模子磨真金不怕火而来,是文心大模子多模态身手的进军部分,撑捏超100种话语识别,用户障翳170多个国度和地区。
这次发布的PaddleOCR-VL-1.6,基于PaddleOCR-VL-1.5校正通过模子开动的数据构建机制和渐进式磨真金不怕火优化,在保捏0.9B轻量化架构的情况下,模子准确率和复杂场景合乎身手进一步进步。
由于两代模子模子结构一致,成就者和企业用户无需进行特地适配,即可平滑搬动。
频年来,百度先后推出PaddleOCR-VL、PaddleOCR-VL-1.5等多款模子。PaddleOCR的GitHub星数已打破79.2K,越过谷歌开源OCR花式Tesseract OCR。