云知声(09678)U1-OCR架构范式升级 开放标准化API 重构OCR 3.0时代

5979525 1 2026-04-21 13:15:08

智通财经APP获悉,云知声(09678)于2月26日发布首个工业级文档智能基础大模型Unisound U1-OCR ,开启了OCR 3.0时代 ,为后续U1-OCR系列模型的迭代升级奠定了坚实基础 。今天(4月21日),历经底层架构重构与海量真实场景打磨,云知声U1-OCR能力实现再度进化 ,推出系列模型 。同时,该模型同步全量上线云知声Token Hub大模型服务平台,开放标准化API ,支持一键接入 、按需调用,采用Token计费模式,大幅降低企业接入成本与部署门槛 ,让OCR 3.0时代的文档智能能力惠及更多行业。

云知声(09678)U1-OCR架构范式升级 开放标准化API 重构OCR 3.0时代-第1张图片

云知声U1-OCR架构范式升级,抛弃传统NMS,用统一结构精修解决级联误差 ,复杂版面解析质的飞跃。技术实力经权威认证,公司多篇核心论文入选ACL2026,双权威数据集登顶 ,性能可验可追溯 。此外 ,行业全场景适配,支持金融 、医疗、教育、交通等复杂文档处理,结构理解+顺序恢复一步到位。

云知声(09678)U1-OCR架构范式升级 开放标准化API 重构OCR 3.0时代-第2张图片

复杂文档解析的典型难点在于 ,结构信息未被稳定整理,难以高效交付给下游模块。U1-OCR的目标远不只是“把文字识别出来 ”,更要切实解决复杂文档页面中的结构理解与阅读顺序恢复难题 。针对这一行业普遍存在的问题 ,云知声在U1-OCR中采用了面向复杂文档场景的解析设计,从本质上可拆解为两个核心子任务:一是结构识别,即判断页面中每个区域的内容类型 、确定需保留的区域;二是顺序推理 ,即规划保留区域的合理阅读路径。

云知声(09678)U1-OCR架构范式升级 开放标准化API 重构OCR 3.0时代-第3张图片

围绕这两个任务设计专属关键技术,U1-OCR不仅在多个公开权威数据集上取得了领先成绩,更为真实业务场景中最容易被忽略的检测器与解析器交接环节(detector-to-parserhandoff) ,提供了更稳定、更可靠的处理方式。

实验结果同样表明,在结构更复杂、布局变化更丰富的页面中,U1-OCR模型矩阵能更高效地处理区域边界判定 、类别区分与整体结构恢复问题 ,精准实现“将竞争候选假设稳定为解析器可用结构输入 ”的设计目标 。

这也意味着 ,文档解析正从单纯的OCR文字识别,升级为更贴合真实业务需求的文档理解能力。此次U1-OCR全量上线云知声TokenHub大模型服务平台,同步开放标准化API和一键调用功能 ,将进一步降低文档智能技术的使用门槛,为医疗、交通、金融 、教育等多个行业,提供高效、精准的文档解析服务 ,助力各行业顺利实现数字化转型升级。

上一篇:【江燮元,江燮元】
下一篇:酒价内参4月21日费用 发布:五粮液普五八代下跌3元
相关文章