头条 科技 产经 家电 智能 手机 芯片 数码 电商 English
中国IT产经新闻网-移动互联网与智能搜索领域是未来IT产业发展的趋势!
中国IT产经新闻/行业聚焦/正文
百度最新开源模型PaddleOCR-VL登顶HuggingFace Trending全球第一
来源:
2025-10-17
编辑:晓露

10月17日消息,HuggingFace官网显示,百度昨晚发布的自研多模态文档解析模型PaddleOCR-VL,发布20小时内即登顶HuggingFace Trending全球第一。

  

据了解,该模型核心参数仅0.9B,轻量高效,能以极低计算开销精准识别文本、手写汉字、表格、公式、图表等复杂元素,支持109种语言。在权威榜单OmniBenchDoc V1.5中,它以92.6分获综合性能全球第一,四大核心能力全线SOTA,超越GPT-4o等模型,刷新OCR VL模型性能纪录。

  

作为文心4.5衍生模型,PaddleOCR-VL融合了NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型,实现精度与效率双突破。

  

       

产业点评更多
厂商动态更多
热门综合更多
CopyRight @ 2008-2025 IT产经新闻网 All Right Reserved 违者必究 湘ICP备2022017330号-2