Руководства для начинающих
Как перевести документ без потери форматирования и разметки
DocTranslating переводит ваши файлы PDF, Word, PowerPoint, Excel, исходный код и субтитры на более чем 100 языков, сохраняя исходную разметку, шрифты, таблицы и изображения на своих местах. Просто загрузите файл, выберите язык и один из четырех систем перевода (DeepL, Microsoft Azure, Google Cloud или Gemini), а затем скачайте готовую копию, которая выглядит точно так же, как оригинал. В этом руководстве описан весь процесс от загрузки до скачивания, а также разобраны сложные реальные случаи: отсканированные PDF-файлы, сноски и текстовые блоки, согласованность терминологии, лимиты на размер файлов и особенности языков с письмом справа налево (RTL).
Updated 23 мая 2026 г. · 11 min read
Большинство инструментов для перевода либо превращают ваш документ в простой текст, либо полностью ломают его исходную разметку. DocTranslating работает иначе: сервис извлекает текст, переводит его и аккуратно интегрирует обратно в точную копию вашего исходного документа. Это гарантирует, что абзацы, таблицы, заголовки и изображения останутся ровно там, где вы их разместили. Ниже представлено честное и подробное руководство — от загрузки до скачивания — с разбором технических нюансов, с которыми сталкиваются пользователи: какой движок выбрать, как сохраняются сноски и текстовые блоки, что происходит со сканами, как добиться единообразия терминов и каковы текущие ограничения системы.
Какие типы файлов можно переводить
Каждая система перевода поддерживает определенный набор форматов. В таблице ниже показана совместимость типов файлов: просто загрузите свой документ, и DocTranslating автоматически покажет только те движки, которые могут с ним работать.
| Тип файла | Совместимые движки |
|---|---|
| PDF (.pdf) | DeepL, Google Cloud, Gemini |
| Word (.docx) | DeepL, Azure, Google Cloud |
| PowerPoint (.pptx) | DeepL, Azure, Google Cloud |
| Excel (.xlsx) | DeepL, Azure, Google Cloud |
| Простой текст (.txt) | DeepL, Azure, Google Cloud |
| Старые форматы Office (.doc, .ppt, .xls) | DeepL |
| Файлы исходного кода (20+ языков) | Gemini |
| Изображения (.png, .jpg) | DeepL |
| Субтитры (.srt) | DeepL, Gemini |
| Файлы локализации (.xliff, .po, .vtt) | Gemini; .xliff также поддерживается в DeepL и Azure |
Пошагово: перевод вашего первого документа
- 1
Загрузите документ
Перетащите файл в зону загрузки или кликните, чтобы выбрать его на компьютере. DocTranslating автоматически определит формат и отобразит только подходящие движки перевода.

- 2
Выберите исходный и целевой языки
Укажите язык, на котором написан ваш документ (или используйте автоопределение), и выберите язык, на который его нужно перевести. Начните вводить название, чтобы быстро отфильтровать список из 100+ языков.

- 3
Выберите движок перевода
Выберите между DeepL, Microsoft Azure, Google Cloud и Gemini. У каждого из них свои преимущества, поддерживаемые форматы и лимиты — в следующем разделе мы подробно разберем, когда какой использовать.

- 4
Запустите перевод
Нажмите кнопку 'Translate'. Сервис извлечет текст, переведет его через выбранный API и вернет обратно в структуру документа, сохраняя визуальный макет. Обработка больших файлов занимает чуть больше времени, так как каждая страница анализируется индивидуально на наших серверах.
- 5
Скачайте переведенный файл
По завершении процесса скачайте готовый документ в том же формате, в каком вы его загрузили. Откройте его, чтобы убедиться, что перевод корректен, а верстка совпадает с оригиналом.
Выбор правильного движка перевода
Хотя все четыре движка стремятся сохранить исходную разметку, они различаются по качеству перевода, поддержке форматов, ограничениям на размер файлов и точности обработки сложных элементов. Ниже приведена сравнительная таблица, за которой следуют практические рекомендации.
| Движок | Для чего лучше всего подходит | Макс. размер файла | Лимит по страницам |
|---|---|---|---|
| DeepL | Естественный стиль, файлы Office, изображения | 30 MB | Без ограничений |
| Microsoft Azure | Максимальная точность разметки в документах Office | 20 MB | Без ограничений |
| Google Cloud | Самый широкий охват редких языков | 10 MB | Без ограничений |
| Gemini | PDF со сложной версткой, код, контроль контекста | 100 MB | Макс. 25 страниц |
DeepL
DeepL обеспечивает наиболее живой и естественный перевод для поддерживаемых европейских и основных мировых языков. Он работает с самым широким спектром повседневных файлов: PDF, все форматы Office, простой текст, изображения и субтитры. Его главные ограничения — лимит в 30 МБ и посегментный (попредложенческий) принцип перевода, что может влиять на общую связность текста (подробнее в разделе о терминологии).
Microsoft Azure
Azure — самый надежный вариант для работы с документами Office. Текстовые блоки, встроенное форматирование (жирный, курсив, ссылки) и сноски сохраняются здесь в неизменном виде. Единственный нюанс заключается в том, что в режиме документов он принимает только современные форматы Office (.docx, .pptx, .xlsx), TXT и некоторые разметочные файлы. Он не поддерживает нативные PDF или старые форматы .doc / .ppt / .xls.
Google Cloud
Google Cloud охватывает колоссальный список языков и отлично справляется как с PDF, так и с файлами Office. Однако учитывайте два момента: у него самый низкий порог веса файла (10 МБ), а алгоритмы его рендеринга добавляют едва заметный водяной знак на переведенные страницы PDF.
Gemini
Gemini — это наш движок на базе больших языковых моделей (LLM). Он идеален для PDF со сложным графическим дизайном, файлов исходного кода и локализации. Его уникальная особенность: вы можете задать системный промпт (кастомные инструкции) на панели управления, чтобы жестко контролировать терминологию, стиль и контекст перевода (см. ниже). Он принимает файлы до 100 МБ, но имеет строгое ограничение до 25 страниц на файл и не поддерживает прямую загрузку .docx, .pptx или .xlsx.
Насколько точно сохраняется форматирование?
Результат во многом зависит от внутренней структуры файла и выбранного движка. Четкое понимание того, что сохраняется идеально, а что может сместиться, сбережет ваше время:
- Word и PowerPoint изначально передают системе свою внутреннюю кодовую структуру. Благодаря этому текстовые фреймы, инлайн-стили (жирный, курсив, ссылки) и сноски безошибочно определяются и заменяются логикой обработки. В этой категории Azure демонстрирует наивысшую точность, за ним следуют DeepL и Google Cloud.
- Файлы PDF — это гораздо более сложная задача, и это объективная реальность всей софтверной индустрии, а не проблема конкретного сервиса. Формат PDF не имеет встроенной семантической структуры, он фиксирует элементы по абсолютным координатам. Из-за этого плавающие блоки, подписи к графикам и сноски могут смещаться в зависимости от того, в каком порядке автор исходного документа генерировал слои. Простые PDF переводятся идеально, но в плотных дизайнерских макетах и буклетах смещение элементов — частая проблема.
Перевод отсканированных PDF и изображений (OCR)
Отсканированные документы не содержат живого текстового слоя — по сути это просто фотографии страниц. DocTranslating автоматически запускает этап оптического распознавания символов (OCR) для извлечения букв перед отправкой в API перевода. Движок DeepL также поддерживает перевод файлов изображений (.png, .jpg) напрямую. Помните: качество перевода напрямую зависит от точности распознавания. Если скан размыт и OCR допустил ошибки в словах, перевод сделает результат еще менее читаемым.
Как сохранить единство терминов, стиля и рода
Это вечная проблема автоматического перевода. Традиционные движки, такие как DeepL, делят текст на отдельные предложения и имеют узкое контекстное окно. Это значит, что информация не передается между абзацами. В итоге один и тот же технический термин в начале и в конце документа может быть переведен по-разному. Кроме того, при переводе на языки без выраженных гендерных местоимений (или наоборот, при переходе с них) часто теряется пол главного героя, что приводит к грамматическим ошибкам. Классические глоссарии не всегда спасают, так как они не умеют правильно изменять слова по падежам и формам.
Движок Gemini решает эту задачу иначе. Будучи большой языковой моделью, он обладает огромным окном контекста и видит документ целиком, удерживая общую логику повествования. Более того, у вас есть поле для кастомных инструкций, где можно указать: 'Главный герой документа — женщина', 'Строго переводить термин jurisdiction как юрисдикция', 'Использовать официальный деловой стиль' или 'Форматировать даты строго как ДД.ММ.ГГГГ'. Эти правила применяются ко всем страницам, что на голову превосходит возможности стандартных глоссариев.
Документы на языках с письмом справа налево (арабский, иврит, персидский)
Перевод на языки RTL (справа налево) работает отлично: макет автоматически зеркалируется, а выравнивание подстраивается. Однако перевод с языков RTL, когда источником служит PDF, имеет серьезное ограничение. Из-за особенностей формата PDF слой извлечения текста часто возвращает слова в визуальном порядке (как они расположены на экране), а не в логическом (как их читает человек). В результате в API перевода отправляется хаотичный набор слов. Верстка готового файла будет выглядеть нормально, но сам перевод превратится в несвязный набор фраз. Обратите внимание: файлы Word и PowerPoint имеют нативную логическую структуру и этой проблеме не подвержены — она касается исключительно PDF-источников на языках RTL.
Субтитры, локализация и обменные форматы
Помимо офисных документов, DocTranslating поддерживает форматы, необходимые разработчикам и профессиональным переводчикам: файлы субтитров (.srt в DeepL и Gemini, .vtt в Gemini), файлы локализации gettext (.po и .pot в Gemini), а также промышленный стандарт обмена переводами XLIFF (.xliff, .xlf в DeepL, Azure и Gemini) и структурированные таблицы .csv / .tsv. Тяжелые закрытые издательские форматы (например, FrameMaker .mif) в настоящее время не поддерживаются. Для проектов локализации стандартный XLIFF остается самым надежным и рекомендуемым форматом.
Золотые правила для идеального перевода
- По возможности всегда переводите редактируемые исходники (Word, PowerPoint) — замена текста в них происходит гораздо чище, чем в плоских PDF-файлах.
- Перед переводом отсканированных PDF убедитесь, что текст распознан без грубых ошибок: некачественные исходные данные гарантируют плохой результат перевода.
- Для PDF-файлов со сложной структурой или строгими требованиями к стилю выбирайте движок Gemini и детально прописывайте инструкции в текстовом поле.
- Учитывайте эффект 'расширения текста': перевод на некоторые языки (например, немецкий или русский) может быть значительно длиннее оригинала, поэтому в плотной верстке может потребоваться небольшая ручная корректировка размеров блоков после скачивания.
- Всегда проверяйте финальный файл перед отправкой в работу — обращайте особое внимание на границы таблиц, сноски и области с текстом RTL.