Appearance
记录文档智能相关的技术细节
HunyuanOCR是混元原生多模态端到端 OCR 专家模型,依托于混元原生多模态架构打造,凭借仅有1B的轻量化参数,高效斩获多项业界OCR应用榜单SOTA成绩
一个端到端的智能文档解析系统,能够自动识别PDF文档中的文字、表格、公式、图表等复杂元素,并将其转换为结构化的Markdown格式.
一站式、开源、高质量的数据提取工具,支持多种功能,如提取 PDF、markdown 等格式的内容.