Руководства для начинающих

Как перевести документ без потери форматирования и разметки

DocTranslating переводит ваши файлы PDF, Word, PowerPoint, Excel, исходный код и субтитры на более чем 100 языков, сохраняя исходную разметку, шрифты, таблицы и изображения на своих местах. Просто загрузите файл, выберите язык и один из четырех систем перевода (DeepL, Microsoft Azure, Google Cloud или Gemini), а затем скачайте готовую копию, которая выглядит точно так же, как оригинал. В этом руководстве описан весь процесс от загрузки до скачивания, а также разобраны сложные реальные случаи: отсканированные PDF-файлы, сноски и текстовые блоки, согласованность терминологии, лимиты на размер файлов и особенности языков с письмом справа налево (RTL).

Updated 23 мая 2026 г. · 11 min read

Большинство инструментов для перевода либо превращают ваш документ в простой текст, либо полностью ломают его исходную разметку. DocTranslating работает иначе: сервис извлекает текст, переводит его и аккуратно интегрирует обратно в точную копию вашего исходного документа. Это гарантирует, что абзацы, таблицы, заголовки и изображения останутся ровно там, где вы их разместили. Ниже представлено честное и подробное руководство — от загрузки до скачивания — с разбором технических нюансов, с которыми сталкиваются пользователи: какой движок выбрать, как сохраняются сноски и текстовые блоки, что происходит со сканами, как добиться единообразия терминов и каковы текущие ограничения системы.

Какие типы файлов можно переводить

Каждая система перевода поддерживает определенный набор форматов. В таблице ниже показана совместимость типов файлов: просто загрузите свой документ, и DocTranslating автоматически покажет только те движки, которые могут с ним работать.

Тип файлаСовместимые движки
PDF (.pdf)DeepL, Google Cloud, Gemini
Word (.docx)DeepL, Azure, Google Cloud
PowerPoint (.pptx)DeepL, Azure, Google Cloud
Excel (.xlsx)DeepL, Azure, Google Cloud
Простой текст (.txt)DeepL, Azure, Google Cloud
Старые форматы Office (.doc, .ppt, .xls)DeepL
Файлы исходного кода (20+ языков)Gemini
Изображения (.png, .jpg)DeepL
Субтитры (.srt)DeepL, Gemini
Файлы локализации (.xliff, .po, .vtt)Gemini; .xliff также поддерживается в DeepL и Azure
Поддерживаемые типы файлов по системам перевода

Пошагово: перевод вашего первого документа

  1. 1

    Загрузите документ

    Перетащите файл в зону загрузки или кликните, чтобы выбрать его на компьютере. DocTranslating автоматически определит формат и отобразит только подходящие движки перевода.

    Загрузка PDF-файла на платформу DocTranslating
  2. 2

    Выберите исходный и целевой языки

    Укажите язык, на котором написан ваш документ (или используйте автоопределение), и выберите язык, на который его нужно перевести. Начните вводить название, чтобы быстро отфильтровать список из 100+ языков.

    Выбор исходного и целевого языков в DocTranslating
  3. 3

    Выберите движок перевода

    Выберите между DeepL, Microsoft Azure, Google Cloud и Gemini. У каждого из них свои преимущества, поддерживаемые форматы и лимиты — в следующем разделе мы подробно разберем, когда какой использовать.

    Выбор движка перевода в интерфейсе DocTranslating
  4. 4

    Запустите перевод

    Нажмите кнопку 'Translate'. Сервис извлечет текст, переведет его через выбранный API и вернет обратно в структуру документа, сохраняя визуальный макет. Обработка больших файлов занимает чуть больше времени, так как каждая страница анализируется индивидуально на наших серверах.

  5. 5

    Скачайте переведенный файл

    По завершении процесса скачайте готовый документ в том же формате, в каком вы его загрузили. Откройте его, чтобы убедиться, что перевод корректен, а верстка совпадает с оригиналом.

Выбор правильного движка перевода

Хотя все четыре движка стремятся сохранить исходную разметку, они различаются по качеству перевода, поддержке форматов, ограничениям на размер файлов и точности обработки сложных элементов. Ниже приведена сравнительная таблица, за которой следуют практические рекомендации.

ДвижокДля чего лучше всего подходитМакс. размер файлаЛимит по страницам
DeepLЕстественный стиль, файлы Office, изображения30 MBБез ограничений
Microsoft AzureМаксимальная точность разметки в документах Office20 MBБез ограничений
Google CloudСамый широкий охват редких языков10 MBБез ограничений
GeminiPDF со сложной версткой, код, контроль контекста100 MBМакс. 25 страниц
Сравнение систем перевода

DeepL

DeepL обеспечивает наиболее живой и естественный перевод для поддерживаемых европейских и основных мировых языков. Он работает с самым широким спектром повседневных файлов: PDF, все форматы Office, простой текст, изображения и субтитры. Его главные ограничения — лимит в 30 МБ и посегментный (попредложенческий) принцип перевода, что может влиять на общую связность текста (подробнее в разделе о терминологии).

Microsoft Azure

Azure — самый надежный вариант для работы с документами Office. Текстовые блоки, встроенное форматирование (жирный, курсив, ссылки) и сноски сохраняются здесь в неизменном виде. Единственный нюанс заключается в том, что в режиме документов он принимает только современные форматы Office (.docx, .pptx, .xlsx), TXT и некоторые разметочные файлы. Он не поддерживает нативные PDF или старые форматы .doc / .ppt / .xls.

Google Cloud

Google Cloud охватывает колоссальный список языков и отлично справляется как с PDF, так и с файлами Office. Однако учитывайте два момента: у него самый низкий порог веса файла (10 МБ), а алгоритмы его рендеринга добавляют едва заметный водяной знак на переведенные страницы PDF.

Gemini

Gemini — это наш движок на базе больших языковых моделей (LLM). Он идеален для PDF со сложным графическим дизайном, файлов исходного кода и локализации. Его уникальная особенность: вы можете задать системный промпт (кастомные инструкции) на панели управления, чтобы жестко контролировать терминологию, стиль и контекст перевода (см. ниже). Он принимает файлы до 100 МБ, но имеет строгое ограничение до 25 страниц на файл и не поддерживает прямую загрузку .docx, .pptx или .xlsx.

Насколько точно сохраняется форматирование?

Результат во многом зависит от внутренней структуры файла и выбранного движка. Четкое понимание того, что сохраняется идеально, а что может сместиться, сбережет ваше время:

Перевод отсканированных PDF и изображений (OCR)

Отсканированные документы не содержат живого текстового слоя — по сути это просто фотографии страниц. DocTranslating автоматически запускает этап оптического распознавания символов (OCR) для извлечения букв перед отправкой в API перевода. Движок DeepL также поддерживает перевод файлов изображений (.png, .jpg) напрямую. Помните: качество перевода напрямую зависит от точности распознавания. Если скан размыт и OCR допустил ошибки в словах, перевод сделает результат еще менее читаемым.

Как сохранить единство терминов, стиля и рода

Это вечная проблема автоматического перевода. Традиционные движки, такие как DeepL, делят текст на отдельные предложения и имеют узкое контекстное окно. Это значит, что информация не передается между абзацами. В итоге один и тот же технический термин в начале и в конце документа может быть переведен по-разному. Кроме того, при переводе на языки без выраженных гендерных местоимений (или наоборот, при переходе с них) часто теряется пол главного героя, что приводит к грамматическим ошибкам. Классические глоссарии не всегда спасают, так как они не умеют правильно изменять слова по падежам и формам.

Движок Gemini решает эту задачу иначе. Будучи большой языковой моделью, он обладает огромным окном контекста и видит документ целиком, удерживая общую логику повествования. Более того, у вас есть поле для кастомных инструкций, где можно указать: 'Главный герой документа — женщина', 'Строго переводить термин jurisdiction как юрисдикция', 'Использовать официальный деловой стиль' или 'Форматировать даты строго как ДД.ММ.ГГГГ'. Эти правила применяются ко всем страницам, что на голову превосходит возможности стандартных глоссариев.

Документы на языках с письмом справа налево (арабский, иврит, персидский)

Перевод на языки RTL (справа налево) работает отлично: макет автоматически зеркалируется, а выравнивание подстраивается. Однако перевод с языков RTL, когда источником служит PDF, имеет серьезное ограничение. Из-за особенностей формата PDF слой извлечения текста часто возвращает слова в визуальном порядке (как они расположены на экране), а не в логическом (как их читает человек). В результате в API перевода отправляется хаотичный набор слов. Верстка готового файла будет выглядеть нормально, но сам перевод превратится в несвязный набор фраз. Обратите внимание: файлы Word и PowerPoint имеют нативную логическую структуру и этой проблеме не подвержены — она касается исключительно PDF-источников на языках RTL.

Субтитры, локализация и обменные форматы

Помимо офисных документов, DocTranslating поддерживает форматы, необходимые разработчикам и профессиональным переводчикам: файлы субтитров (.srt в DeepL и Gemini, .vtt в Gemini), файлы локализации gettext (.po и .pot в Gemini), а также промышленный стандарт обмена переводами XLIFF (.xliff, .xlf в DeepL, Azure и Gemini) и структурированные таблицы .csv / .tsv. Тяжелые закрытые издательские форматы (например, FrameMaker .mif) в настоящее время не поддерживаются. Для проектов локализации стандартный XLIFF остается самым надежным и рекомендуемым форматом.

Золотые правила для идеального перевода

Frequently asked questions

Можно ли перевести PDF без потери форматирования?

Да. Технология DocTranslating извлекает текст из PDF, переводит его и встраивает обратно на те же позиции, сохраняя структуру, шрифты, таблицы и изображения. Для простых документов результат идеален; для файлов со сложным дизайном лучше всего подходит движок Gemini, который точнее удерживает общую сетку макета.

Какие форматы файлов поддерживает DocTranslating?

Мы поддерживаем перевод PDF, Word, PowerPoint, Excel и TXT через DeepL, Azure и Google Cloud; исходный код программ на различных языках через Gemini; изображения (PNG, JPG) через DeepL; субтитры SRT через DeepL и Gemini; а также файлы локализации XLIFF и gettext PO. Система автоматически подбирает доступные движки под ваш файл.

Сохраняются ли текстовые блоки, сноски и стили (жирный/курсив)?

В файлах Word и PowerPoint — практически идеально, так как эти форматы имеют четкую кодовую структуру. Движок Azure здесь наиболее строг и точен. В PDF 100% гарантия невозможна: у формата нет семантического слоя, поэтому в сложных дизайнерских макетах сноски и плавающие блоки могут незначительно смещаться. Это фундаментальное ограничение всей индустрии.

Поддерживает ли DocTranslating перевод отсканированных PDF?

Да. Отсканированные PDF проходят автоматический этап OCR (оптического распознавания) для создания текстового слоя. Поскольку качество перевода напрямую зависит от точности распознавания, мы рекомендуем сначала извлечь и проверить текст с помощью инструментов вроде PDFEquips, чтобы избежать искажения смысла из-за опечаток в скане.

Как обеспечить единство терминов, стиля и правильный грамматический род?

Используйте движок Gemini. Он обладает широким контекстным окном и формой для ввода инструкций, где вы можете прописать требования: 'использовать деловой стиль', 'всегда переводить конкретный термин определенным образом' или указать пол персонажа. Традиционный движок DeepL из-за попредложенческого перевода в таких сценариях часто допускает смысловые противоречия.

Каков максимальный размер файла и можно ли переводить длинные PDF?

Лимиты составляют: DeepL — 30 МБ, Azure — 20 МБ, Google Cloud — 10 МБ, Gemini — 100 МБ. У Gemini также есть ограничение — не более 25 страниц на файл. Если ваш файл слишком тяжелый, сожмите его на PDFEquips. Если PDF превышает 25 страниц для Gemini, разбейте его там же на части, переведите их по отдельности, а затем объедините.

Будет ли на переведенном PDF водяной знак?

Только движок Google Cloud добавляет небольшой технический водяной знак на страницы переведенного PDF. Если вам нужен абсолютно чистый документ, выберите любой из трех других движков или предварительно переведите PDF в формат Word на PDFEquips, а затем отправьте на перевод редактируемую версию — в ней водяных знаков не будет.

Поддерживается ли перевод с арабского, иврита и других RTL-языков?

Перевод НА языки RTL работает отлично, макет автоматически зеркалируется. Однако перевод С языков RTL в формате PDF имеет ограничение: извлечение текста часто путает визуальный и логический порядок слов, из-за чего на перевод уходят перепутанные фразы. Для файлов Word и PowerPoint этой проблемы нет. С RTL PDF-исходниками будьте внимательны.

Принимает ли сервис профессиональные форматы вроде XLIFF и SRT?

Да. Формат XLIFF (.xliff, .xlf) полностью совместим с DeepL, Azure и Gemini; субтитры SRT поддерживаются в DeepL и Gemini; а форматы VTT и gettext PO/POT доступны в Gemini. Редкие издательские форматы (например, FrameMaker MIF) не поддерживаются. Для локализации XLIFF остается основным и лучшим выбором.

Можно ли протестировать инструмент на паре страниц перед оплатой?

Да. Мы полностью отказались от навязывания автоматических подписок. Вместо этого мы предлагаем разовую покупку тестовых пакетов баланса. Вы можете спокойно протестировать сервис на своих сложных документах, не опасаясь скрытых списаний в следующем месяце. Далее тарификация идет строго по факту использования: вы платите только за то, что реально перевели.

← All guides