Как сжать PDF до 100 КБ для индийских государственных форм (UPSC, GST, приём в колледж)
- tutorial
- compress-pdf
- india
- government-forms
Проблема 100 КБ
Индийские государственные порталы создавались тогда, когда загрузка в 100 КБ считалась щедрой. Телефоны, которыми мы пользуемся сегодня, выдают PDF на 3-5 МБ в тот же миг, когда Вы сканируете один табель оценок. Портал по-прежнему пишет «максимум 100 КБ» и отказывается принимать Вашу загрузку. Форма не изменится. Изменить придётся PDF.
Это самая частая причина, по которой индийские пользователи приходят искать способ сжать PDF до 100 КБ. Портал UPSC DAF требует фото в PDF до 40 КБ и подпись до 40 КБ. Портал отчётности GST ограничивает вложения счетов 100 КБ или 500 КБ в зависимости от формы. Портал приёма DU просит табели до 200 КБ. Зачисление на NEET ограничивает документы 200 КБ. Цифры разнятся, но шаблон один: маленький потолок, файл с телефона, превышающий его, и срок в конце недели.
Хорошая новость: сжать PDF до 100 КБ реально достижимо для большинства таких документов, если понимать, какой рычаг тянуть.
Кого это касается (три основных сценария)
Кандидаты на UPSC. Анкета на государственную службу просит фото на паспорт примерно 20-40 КБ, подпись 10-40 КБ, и сопроводительные документы в PDF обычно до 100-300 КБ. Этап DAF (Detailed Application Form) добавляет сертификаты касты, EWS и PwBD, каждый до 200 КБ. Не попали в размер — загрузка молча проваливается или показывает красный баннер через три страницы формы.
Подающие отчёты GST и малый бизнес. Отчёты GSTR-1 и GSTR-9 позволяют загружать счета, и лимит на файл обычно 100 КБ или 500 КБ в зависимости от раздела. Бухгалтерские конторы и малый бизнес, каждый квартал загружающие десятки PDF со счетами, постоянно с этим сталкиваются.
Приём в колледжи. Портал UG DU, IIT JEE Advanced, зачисление на NEET, а также порталы инженерных и медицинских вузов штатов — все просят фото, подпись, табели за 10-й и 12-й класс и сертификат категории, каждый с лимитом от 20 КБ (подпись) до 500 КБ (табель). Попытка сжать PDF до 100 КБ на телефоне во время окна зачисления — самая стрессовая версия этой задачи.
Почему PDF получаются огромными
Скан с телефона выглядит маленьким на экране, но PDF за ним делает много. Изображение встроено в полном разрешении камеры — часто 4000 на 3000 пикселей — даже если видимая страница имеет размер A4. Сканер-приложения по умолчанию ставят 300 DPI в цвете. Шрифты, когда они есть, встраиваются целиком, а не подмножествами. Каждая страница лежит в PDF как JPEG или PNG, не пересжатый под документ.
В итоге получается PDF на 3-5 МБ, тогда как реально читаемое содержимое уместилось бы в 80 КБ при правильной обработке. Портал не ведёт себя неразумно — это сканер-приложение ленится.
Три подхода, которые действительно работают
1. Браузерные сжиматели. Инструменты вроде страницы сжатия PDF docuconverter берут готовый PDF, уменьшают разрешение встроенных изображений, снижают глубину цвета там, где это уместно, удаляют метаданные и пересжимают потоки. Для типичного отсканированного с телефона табеля это даёт переход с 4 МБ к 80-200 КБ в зависимости от пресета. Самый быстрый путь, когда у Вас уже есть PDF, который Вы сами не делали.
2. Снизить DPI до сканирования. Если Вы управляете процессом сканирования, это лучший ход. Поставьте в приложении 150 DPI в градациях серого вместо 300 DPI в цвете. Табель, отсканированный так, часто выходит из приложения сразу 60-90 КБ с полностью читаемым текстом. Adobe Scan, Microsoft Lens и CamScanner — все дают доступ к этим настройкам, они просто запрятаны.
3. Нативный Preview на macOS или экспорт из Adobe Acrobat. На macOS откройте PDF в Preview, Файл > Экспорт, выберите фильтр Reduce File Size. В Acrobat Pro есть Save As Other > Reduced Size PDF. Для пользователей десктопа подходит, на телефоне в очереди в колледж — менее полезно.
Качество против размера, по сценариям
Не каждый файл требует одного и того же компромисса. Правильная настройка зависит от того, что проверяет форма.
- Фото для UPSC. Здесь важно распознавание лица — фотография должна выглядеть как Вы. Качество JPG 70-80 — оптимум. Ниже 60 лицо начинает компрессироваться в блоки, и биометрическое сравнение может его отметить. Потолок 40 КБ тесный, но достижим при 600 на 800 пикселей.
- Скан табеля. Важна читаемость текста, цвет — нет. 150 DPI в градациях серого почти всегда достаточно. Можно сжать PDF до 100 КБ для одностраничного табеля без потери ни одного символа.
- Подпись. Редко собственно проблема — подписи обычно весят несколько КБ изначально. Если Ваш скан подписи 200 КБ, что-то не так со способом захвата, а не с компрессией.
Пошагово по сценариям
Поток для фото UPSC. Сделайте фото на однотонном фоне, обрежьте под пропорции паспорта, затем прогоните через конвертер изображения в PDF с качеством JPG около 75. Если получившийся PDF больше 40 КБ, пересжмите через компрессор PDF на самом сильном пресете. Проверьте, что лицо по-прежнему чётко узнаваемо при 100% увеличении.
Поток для счетов GST. Большинство счетов изначально сгенерированы как PDF, а не отсканированы. Прогоните через сжатие с пресетом Recommended — текстовые PDF обычно падают с 300 КБ до 60-80 КБ без видимых изменений. Если у Вас пачка счетов, сначала обрабатывайте самые крупные, мелкие часто уже под лимитом.
Поток для табеля колледжа. Если есть доступ к оригиналу, пересканируйте на 150 DPI в градациях серого. Если есть только существующий скан на 4 МБ, сжимайте на пресете Strong. Для одной страницы табеля это должно дать меньше 100 КБ. Если не выходит, исходный скан, вероятно, был цветным на 600 DPI, и контраст фона борется с компрессором — попробуйте путь пересборки (пересканирование в градациях серого).
Проверьте перед отправкой
Перед загрузкой откройте сжатый файл при 100% увеличении на телефоне или ноутбуке. Проверьте, что текст читается от начала до конца, включая мелкий шрифт внизу. Проверьте, что подписи и печати по-прежнему видны. Для PDF с фото проверьте, что лицо чётко узнаваемо — не просто присутствует, а узнаваемо для незнакомца, сравнивающего фото с Вами. Порталы не всегда отбраковывают загрузки низкого качества в момент отправки — они отбраковывают их позже, при верификации, а к тому моменту окно уже закрыто.
Честная оговорка
Иногда требования формы откровенно тесные до неразумности. Потолок 20 КБ на цветное фото в паспортных пропорциях — на грани физически возможного при полезном разрешении. Пытаться выйти дальше — значит загрузить файл, но фото будет размытым месивом, которое всё равно могут отклонить на этапе верификации. Когда Вы боретесь с компрессором, чтобы сжать PDF до 100 КБ на файле, который явно не дотянется чисто, правильный ход — снизить исходное разрешение до сборки PDF, а не продолжать выжимать выходной файл.
Для распространённых случаев — документы UPSC, счета GST, табели для колледжей — цель 100 КБ достижима без порчи файла. Хитрость в том, чтобы подобрать подход под документ, сканировать умнее, когда это возможно, и проверить результат до того, как доверить его порталу, который может не дать второго шанса.
Sheo