10月20日,DeepSeek上传了一篇名为《DeepSeek-OCR:Contexts Optical Compression》的论文。
论文提到,通过“把长文本内容渲染成一张图片,再让模型去”看”这张图,从而实现对文本信息的压缩。”显著减少计算和存储开销。
文中介绍,在实验中,DeepSeek-OCR的表现优异。压缩比为10倍时,OCR精度可达97%;20倍压缩时仍有60%精度。这些结果表明,模型在压缩文本的同时仍能保持相对高的准确性,尤其是在处理长文档时,效果尤为突出。
据华创证券,光学字符识别(OCR)技术是指通过电子设备(如扫描仪或数码相机)识别纸质文档中的字符并将其转换为计算机可处理的文本格式的过程,被广泛应用于文档数字化、信息检索和数据分析等领域。
近年来,OCR技术与人工智能的结合成为新的发展趋势。通过深度学习和神经网络模型的应用,OCR系统在复杂场景下的识别精度得到显著提升。目前,基于深度学习的OCR已成为行业主流,未来的发展方向包括一体化的端到端模型、高效轻量化模型,以及向更高智能化的OCR发展,实现从“感知”到“认知”的跃升。
另外,据YHResearch预计,2024年全球人工智能驱动的OCR市场规模约81.7亿元,到2031年市场规模将接近136.9亿元。
相关公司中,合合信息:公司扫描全能王产品是业内标杆性产品,产品OCR识别率显著领先市场同类产品。在复杂场景下(如多语言、多版式、多曲面等),公司的平均字符识别率为81.9%,领先于百度的70.0%、腾讯的65.0%和阿里的66.9%。业务涵盖识别性能、AI核心能力、数据安全性和可靠性。
汉王科技:公司的OCR技术曾经获得国家科学技术进步二等奖,在手写体识别、满文识别、藏文识别、复杂场景、复杂版面识别等技术优势突出。
*免责声明:文章内容仅供参考,不构成投资建议
*风险提示:股市有风险,入市需谨慎
本资讯中的内容来自持牌证券机构,意见仅供参考,并不构成对所述证券买卖做出保证。投资者不应将本资讯作为投资决策的唯一参考因素。亦不应以本资讯取代自己的判断。
本文内容和观点不代表牛策略APP平台观点,请独立判断和决策。在任何情况下,牛策略APP不对任何人因使用本平台中的内容所引致的任何损失负任何责任。










暂无评论内容