Китайский ИИ DeepSeek-OCR может обработать 200 тыс. страниц документов в день на одном чипе Nvidia A100
Китайская компания DeepSeek представила революционную модель DeepSeek-OCR, которая уже названа одной из самых эффективных в мире систем оптического распознавания текста.
В отличие от решений OpenAI и Google, её обучение обходится значительно дешевле, а сама технология работает быстрее и экономичнее.
Модель способна сжимать длинные документы, преобразуя их в изображения с точностью распознавания до 97% при коэффициенте сжатия меньше 10. Это означает, что вместо девяти и более текстовых токенов используется всего один визуальный, что резко снижает нагрузку на вычислительные ресурсы.
Даже при 20-кратном сжатии сохраняется 60% точности распознавания – показатель, которого ранее никто не достигал.

Система способна обрабатывать до 200 тысяч страниц в день на одном графическом процессоре Nvidia A100. Кластер из двадцати таких узлов может анализировать свыше 33 миллионов страниц ежедневно, что кардинально меняет подход к обучению языковых моделей на больших объёмах текстов.
DeepSeek-OCR уже опередил конкурентов, включая GOT-OCR2.0 и MinerU2.0, по эффективности использования визуальных токенов.
Модель обучалась на 30 миллионах страниц на почти ста языках, включая научные статьи, рукописи, газеты и диссертации. Эксперты считают, что новая архитектура может стать ключом к следующему поколению искусственного интеллекта.
Новости партнеров
Похожие публикации
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.








