शुरुआती गाइड

बिना फॉर्मेटिंग और लेआउट खोए किसी डॉक्यूमेंट का अनुवाद कैसे करें

DocTranslating आपके PDF, Word, PowerPoint, Excel, कोड और सबटाइटल्स फ़ाइलों का 100 से अधिक भाषाओं में अनुवाद करता है, जबकि आपके मूल लेआउट, फ़ॉन्ट, टेबल और इमेज को उनके स्थान पर बनाए रखता है। बस फ़ाइल अपलोड करें, भाषा और चार अनुवाद इंजनों (DeepL, Microsoft Azure, Google Cloud, या Gemini) में से एक चुनें, और फिर एक ऐसी अनुवादित कॉपी डाउनलोड करें जो बिल्कुल मूल जैसी दिखती है। यह गाइड पूरी प्रक्रिया के साथ-साथ वास्तविक दुनिया के विशेष मामलों — स्कैन की गई PDF, फुटनोट और टेक्स्ट बॉक्स, शब्दावली की निरंतरता, फ़ाइल आकार की सीमाएं, और दाएं-से-बाएं लिखी जाने वाली भाषाओं (RTL) को कवर करती है।

Updated 23 मई 2026 · 11 min read

अधिकांश अनुवाद टूल या तो आपके डॉक्यूमेंट को साधारण टेक्स्ट में बदल देते हैं या उसके पूरे लेआउट को बिगाड़ देते हैं। DocTranslating अलग तरह से काम करता है: यह टेक्स्ट को एक्सट्रैक्ट करता है, उसका अनुवाद करता है, और फिर उसे आपके मूल डॉक्यूमेंट की एक सटीक कॉपी में वापस डाल देता है, जिससे पैराग्राफ, टेबल, हेडिंग और इमेज बिल्कुल वहीं रहते हैं जहाँ आपने उन्हें रखा था। यह एक पूरी गाइड है — अपलोड से लेकर डाउनलोड तक — साथ ही उन सवालों के ईमानदार जवाब जो उपयोगकर्ताओं के सामने आते हैं: कौन सा इंजन चुनना है, फुटनोट और टेक्स्ट बॉक्स कैसे बचते हैं, स्कैन की गई PDF का क्या होता है, शब्दावली को कैसे सुसंगत रखा जाए, और वर्तमान सीमाएं क्या हैं।

आप किन फ़ाइलों का अनुवाद कर सकते हैं

अलग-अलग इंजन अलग-अलग फ़ाइल प्रकारों को स्वीकार करते हैं। नीचे दी गई तालिका दिखाती है कि प्रत्येक फॉर्मेट किसके साथ संगत है — पहले अपना फ़ाइल प्रकार चुनें, और DocTranslating आपको केवल वही इंजन दिखाएगा जो उसका समर्थन करते हैं।

फ़ाइल प्रकारसमर्थित इंजन
PDF (.pdf)DeepL, Google Cloud, Gemini
Word (.docx)DeepL, Azure, Google Cloud
PowerPoint (.pptx)DeepL, Azure, Google Cloud
Excel (.xlsx)DeepL, Azure, Google Cloud
प्लेन टेक्स्ट (.txt)DeepL, Azure, Google Cloud
पुराने Office फॉर्मेट (.doc, .ppt, .xls)DeepL
कोड फ़ाइलें (20+ भाषाएँ)Gemini
इमेज (.png, .jpg)DeepL
सबटाइटल्स (.srt)DeepL, Gemini
लोकलाइज़ेशन फ़ाइलें (.xliff, .po, .vtt)Gemini; .xliff DeepL और Azure के साथ भी
अनुवाद इंजन के अनुसार समर्थित फ़ाइल प्रकार

स्टेप-बाय-स्टेप: अपने पहले डॉक्यूमेंट का अनुवाद करें

  1. 1

    अपना डॉक्यूमेंट अपलोड करें

    अपनी फ़ाइल को ड्रैग-एंड-ड्रॉप करें या अपने कंप्यूटर पर इसे खोजने के लिए क्लिक करें। DocTranslating स्वचालित रूप से फ़ाइल प्रकार का पता लगा लेता है और केवल संगत अनुवाद इंजन दिखाता है।

    DocTranslating डॉक्यूमेंट ट्रांसलेटर पर PDF फ़ाइल अपलोड करना
  2. 2

    स्रोत और लक्षित भाषा चुनें

    वह भाषा सेट करें जिसमें आपका डॉक्यूमेंट लिखा गया है (या ऑटो-डिटेक्ट का उपयोग करें), और वह भाषा चुनें जिसमें आप अनुवाद करना चाहते हैं। 100+ भाषाओं की सूची को फ़िल्टर करने के लिए बस टाइप करना शुरू करें।

    DocTranslating में स्रोत और लक्षित भाषा का चयन
  3. 3

    एक अनुवाद इंजन चुनें

    DeepL, Microsoft Azure, Google Cloud और Gemini में से चुनें। प्रत्येक की अपनी ताकत, समर्थित फ़ाइल प्रकार और सीमाएं हैं — अगला भाग बताता है कि कब किसका उपयोग करना सबसे अच्छा है।

    DocTranslating में अनुवाद इंजन का चयन
  4. 4

    अनुवाद शुरू करें

    'Translate' पर क्लिक करें। DocTranslating टेक्स्ट को एक्सट्रैक्ट करेगा, उसका अनुवाद करेगा, और विज़ुअल लेआउट को बनाए रखते हुए उसे आपके मूल डॉक्यूमेंट की एक कॉपी में वापस डाल देगा। बड़ी फ़ाइलों में थोड़ा अधिक समय लगता है क्योंकि प्रत्येक पेज को व्यक्तिगत रूप से प्रोसेस किया जाता है।

  5. 5

    अपनी अनुवादित फ़ाइल डाउनलोड करें

    प्रक्रिया पूरी होने के बाद, अनुवादित डॉक्यूमेंट को उसी फॉर्मेट में डाउनलोड करें जिसमें आपने इसे अपलोड किया था। इसका उपयोग करने से पहले यह जांचने के लिए इसे खोलें कि लेआउट मूल से मेल खाता है या नहीं।

सही अनुवाद इंजन का चयन करना

चारों इंजन लेआउट को सुरक्षित रखते हैं, लेकिन वे गुणवत्ता, समर्थित फ़ाइल प्रकार, आकार की सीमाओं और जटिल संरचनाओं के प्रबंधन में भिन्न हैं। यहाँ एक त्वरित संदर्भ तालिका दी गई है, जिसके बाद प्रत्येक की सीमाओं और समाधानों का विवरण है।

इंजनकिसके लिए सर्वश्रेष्ठ हैअधिकतम फ़ाइल आकारपेज की सीमा
DeepLप्राकृतिक गुणवत्ता, Office फ़ाइलें, इमेज30 MBअसीमित
Microsoft AzureOffice फ़ाइलों में उच्चतम लेआउट सटीकता20 MBअसीमित
Google Cloudसबसे व्यापक भाषा कवरेज10 MBअसीमित
Geminiजटिल लेआउट वाली PDF, कोड, निरंतरता नियंत्रण100 MB25 पेज
इंजनों का तुलनात्मक विवरण

DeepL

DeepL समर्थित यूरोपीय भाषाओं के लिए सबसे प्राकृतिक परिणाम देता है और रोज़मर्रा की फ़ाइलों की सबसे विस्तृत श्रृंखला स्वीकार करता है — PDF, सभी Office फॉर्मेट, प्लेन टेक्स्ट, इमेज और सबटाइटल्स। इसकी मुख्य सीमाएँ 30 MB की आकार सीमा और टेक्स्ट को वाक्यों में विभाजित करने का तरीका है (नीचे निरंतरता अनुभाग में विवरण देखें)।

Microsoft Azure

Office डॉक्यूमेंट्स के लिए Azure सबसे भरोसेमंद इंजन है — टेक्स्ट बॉक्स, इनलाइन फॉर्मेटिंग (बोल्ड, इटैलिक) और फुटनोट यहाँ बहुत अच्छी तरह सुरक्षित रहते हैं। एकमात्र कमी यह है कि यह केवल आधुनिक Office फॉर्मेट (.docx, .pptx, .xlsx), प्लेन टेक्स्ट और कुछ मार्कअप फॉर्मेट स्वीकार करता है; यह PDF या पुराने .doc / .ppt / .xls फ़ाइलों का समर्थन नहीं करता है।

Google Cloud

Google Cloud भाषाओं की सबसे बड़ी सूची को कवर करता है और PDF तथा Office फ़ाइलों दोनों को प्रोसेस करता है। दो बातें ध्यान में रखें: इसकी आकार सीमा सबसे कम (10 MB) है और यह अनुवादित PDF पर एक छोटा वॉटरमार्क जोड़ता है।

Gemini

Gemini हमारा LLM-आधारित इंजन है। यह जटिल लेआउट वाली PDF, सोर्स कोड और लोकलाइज़ेशन फ़ाइलों के लिए सबसे अच्छा विकल्प है। विशिष्ट रूप से, यह आपको शब्दों और टोन की निरंतरता सुनिश्चित करने के लिए कस्टम निर्देश पास करने की अनुमति देता है (नीचे देखें)। यह 100 MB तक की फ़ाइलें स्वीकार करता है, लेकिन प्रत्येक फ़ाइल को अधिकतम 25 पेजों तक सीमित करता है, और केवल PDF, कोड और अनुवाद/सबटाइटल्स फॉर्मेट को प्रोसेस करता है — कोई .docx, .pptx या .xlsx नहीं।

फॉर्मेटिंग वास्तव में किस हद तक सुरक्षित रहती है?

यह काफी हद तक फ़ाइल प्रकार और चुने गए इंजन पर निर्भर करता है, इसलिए यह जानना उचित है कि क्या पूरी तरह सुरक्षित रहता है और क्या कभी-कभी खिसक सकता है।

स्कैन किए गए PDF और इमेज का अनुवाद (OCR)

स्कैन किए गए PDF में कोई वास्तविक टेक्स्ट लेयर नहीं होती है — वे अनिवार्य रूप से टेक्स्ट की इमेज होते हैं। DocTranslating अनुवाद से पहले टेक्स्ट को एक्सट्रैक्ट करने के लिए ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) स्टेप चलाता है। DeepL इंजन सीधे इमेज फ़ाइलों (.png, .jpg) का भी अनुवाद कर सकता है। एकमात्र सीमा यह है कि अनुवाद पूरी तरह से OCR की गुणवत्ता पर निर्भर करता है: अनुवाद के साथ संयुक्त एक खराब OCR परिणाम में त्रुटियों को बढ़ा देगा।

शब्दावली, टोन और जेंडर की निरंतरता बनाए रखना

डॉक्यूमेंट अनुवाद में यह सबसे बड़ी चुनौती है। DeepL टेक्स्ट को वाक्य-दर-वाक्य विभाजित करके एक छोटे संदर्भ विंडो के साथ अनुवाद करता है, जिसका अर्थ है कि यह एक वाक्य से दूसरे वाक्य में जानकारी को भरोसेमंद रूप से स्थानांतरित नहीं कर सकता है। इसके दो व्यावहारिक परिणाम हैं: एक तकनीकी शब्द का एक ही डॉक्यूमेंट के भीतर अलग-अलग तरीकों से अनुवाद किया जा सकता है, और सर्वनामों का जेंडर उन भाषाओं में खो जाता है जो इसे व्याकरणिक रूप से चिह्नित नहीं करती हैं (जैसे तुर्की, फिनिश या हंगेरियन में अनुवाद करते समय एक आम समस्या)। पारंपरिक ग्लॉसरी इसे पूरी तरह से हल नहीं कर पाती हैं क्योंकि वे अक्सर शब्दों के रूपों के बदलाव पर विफल हो जाती हैं।

Gemini इंजन इसे अलग तरह से संभालता है। बहुत व्यापक संदर्भ विंडो वाले LLM पर आधारित होने के कारण, यह उत्कृष्ट समग्र निरंतरता बनाए रखता है। इसके अलावा, यह आपके लिए एक वैकल्पिक निर्देश फ़ील्ड उपलब्ध कराता है जहाँ आप मॉडल को गाइड कर सकते हैं — उदाहरण के लिए: डॉक्यूमेंट का विषय एक पुरुष है, पूरे टेक्स्ट में 'jurisdiction' शब्द का एक ही तरह से अनुवाद करें, औपचारिक टोन का उपयोग करें, या तारीखों को DD/MM/YYYY फॉर्मेट में रखें। ये निर्देश प्रत्येक पेज पर लागू होते हैं, जो केवल ग्लॉसरी-आधारित दृष्टिकोणों की तुलना में बहुत बेहतर एकरूपता प्रदान करते हैं।

दाएं-से-बाएं लिखे जाने वाले मूल डॉक्यूमेंट (अरबी, हिब्रू, फारसी)

दाएं-से-बाएं लिखी जाने वाली भाषा (RTL) में अनुवाद करना पूरी तरह से काम करता है — परिणाम सही ढंग से उलटा और संरेखित होता है। हालाँकि, RTL भाषा से अनुवाद करने में वर्तमान में एक सीमा है, जो विशेष रूप से PDF के लिए है: PDF की एक्सट्रैक्शन लेयर टेक्स्ट को विज़ुअल उपस्थिति के क्रम में लौटाती है न कि पढ़ने के तार्किक क्रम में। इससे अनुवाद शुरू होने से पहले ही शब्द आपस में मिल सकते हैं। समग्र लेआउट सही लगेगा, लेकिन अंदर का टेक्स्ट अव्यवस्थित होगा। RTL Word और PowerPoint फ़ाइलें इससे प्रभावित नहीं होती हैं क्योंकि उनकी संरचना मूल है; यह विशेष रूप से RTL PDF स्रोतों को प्रभावित करता है। यह एक वास्तविक तकनीकी सीमा है जिसे उद्योग में अभी तक पूरी तरह से हल नहीं किया गया है।

सबटाइटल्स, लोकलाइज़ेशन और अनुवाद फ़ाइलें

ऑफिस डॉक्यूमेंट्स के अलावा, DocTranslating उन फॉर्मेट्स का भी समर्थन करता है जिनके साथ अनुवादक और डेवलपर्स काम करते हैं: सबटाइटल्स फ़ाइलें (DeepL और Gemini पर .srt, Gemini पर .vtt), gettext लोकलाइज़ेशन फ़ाइलें (Gemini पर .po, .pot), और DeepL, Azure तथा Gemini पर XLIFF (.xliff, .xlf), इसके अलावा टैबुलर .csv / .tsv फ़ाइलें। FrameMaker .mif जैसे अत्यधिक विशिष्ट व्यावसायिक संपादन फॉर्मेट समर्थित नहीं हैं। यदि आपके पास एक मानक एक्सचेंज फॉर्मेट में लोकलाइज़ेशन फ़ाइल है, तो XLIFF आपका सबसे सुरक्षित विकल्प है।

सर्वोत्तम परिणामों के लिए सुझाव

Frequently asked questions

क्या मैं फॉर्मेटिंग खोए बिना PDF का अनुवाद कर सकता हूँ?

हाँ। DocTranslating आपके PDF से टेक्स्ट एक्सट्रैक्ट करता है, उसका अनुवाद करता है, और उसे मूल की एक सटीक कॉपी में वापस डाल देता है ताकि लेआउट, फ़ॉन्ट, टेबल और इमेज अपने स्थान पर रहें। साधारण PDF बहुत साफ निकलते हैं; जटिल और डिज़ाइन-भारी संरचनाओं के लिए, Gemini इंजन समग्र लेआउट को सबसे अच्छी तरह सुरक्षित रखता है।

DocTranslating किन फ़ाइल प्रकारों का अनुवाद कर सकता है?

DeepL, Azure और Google Cloud के माध्यम से PDF, Word, PowerPoint, Excel और प्लेन टेक्स्ट; Gemini पर सोर्स कोड; DeepL पर इमेज (PNG, JPG); DeepL और Gemini पर सबटाइटल्स (SRT); साथ ही XLIFF और gettext PO जैसी लोकलाइज़ेशन फ़ाइलें। उपलब्ध इंजन अपलोड की गई फ़ाइल के अनुसार स्वचालित रूप से समायोजित हो जाते हैं।

क्या यह टेक्स्ट बॉक्स, फुटनोट और बोल्ड/इटैलिक का समर्थन करता है?

Word और PowerPoint के लिए, हाँ — टेक्स्ट बॉक्स, रिच फॉर्मेटिंग (बोल्ड, इटैलिक, लिंक) और फुटनोट पूरी तरह से सुरक्षित रहते हैं क्योंकि फ़ाइल की मूल संरचना उन्हें स्पष्ट रूप से उजागर करती है, जिसमें Azure इस मामले में सबसे सटीक इंजन है। PDF के लिए यह कम निश्चित है: एक PDF में कोई सिमेंटिक स्ट्रक्चर नहीं होता है, इसलिए जटिल लेआउट में फुटनोट और फ्लोटिंग ब्लॉक खिसक सकते हैं, जो पूरे बाजार की एक सीमा है।

क्या DocTranslating स्कैन किए गए PDF का अनुवाद कर सकता है?

हाँ। स्कैन किए गए PDF अनुवाद से पहले टेक्स्ट लेयर बनाने के लिए OCR प्रक्रिया से गुजरते हैं। चूंकि अंतिम गुणवत्ता पूरी तरह से इस OCR पर निर्भर करती है, इसलिए यह अनुशंसा की जाती है कि पहले OCR को अलग से चलाएं (उदाहरण के लिए, PDFEquips पर) और अनुवाद करने से पहले एक्सट्रैक्ट किए गए टेक्स्ट को सत्यापित करें, क्योंकि अनुवाद के साथ संयुक्त एक खराब OCR त्रुटियों को बढ़ाता है।

मैं शब्दावली, टोन और जेंडर की निरंतरता कैसे बनाए रखूं?

Gemini इंजन का उपयोग करें। इसमें एक विस्तृत संदर्भ विंडो और एक निर्देश फ़ील्ड है जहाँ आप विषय का जेंडर, किसी मुख्य शब्द के लिए एक निश्चित अनुवाद, एक औपचारिक टोन या एक विशिष्ट तिथि फॉर्मेट जैसे मानदंड निर्दिष्ट कर सकते हैं। ये निर्देश प्रत्येक पेज पर लागू होते हैं। इसके विपरीत, DeepL एक वाक्य-आधारित विभाजन का उपयोग करता है जो तुर्की या फिनिश जैसी भाषाओं में वैश्विक निरंतरता बनाए रखने या जेंडर की पहचान करने में संघर्ष करता है।

अधिकतम फ़ाइल आकार क्या है और क्या मैं बड़ी PDF का अनुवाद कर सकता हूँ?

सीमाएं DeepL पर 30 MB, Azure पर 20 MB, Google Cloud पर 10 MB और Gemini पर 100 MB हैं, जिसमें Gemini प्रति फ़ाइल 25 पेजों तक भी सीमित है। यदि कोई डॉक्यूमेंट बहुत भारी है, तो उसे PDFEquips पर PDF कंप्रेशन टूल से कंप्रेस करें; यदि कोई PDF Gemini की 25-पेज की सीमा को पार करता है, तो उसे PDFEquips पर कई हिस्सों में विभाजित करें, उनका अनुवाद करें और फिर उन्हें वापस जोड़ें।

क्या मेरी अनुवादित PDF में वॉटरमार्क होगा?

केवल Google Cloud इंजन अनुवादित PDF पर एक छोटा वॉटरमार्क जोड़ता है। पूरी तरह से साफ डॉक्यूमेंट प्राप्त करने के लिए, कोई अन्य इंजन चुनें या अपने PDF को PDFEquips पर Word में बदलें ताकि उस संपादन योग्य संस्करण का अनुवाद किया जा सके।

क्या मैं अरबी, हिब्रू या अन्य दाएं-से-बाएं लिखी जाने वाली भाषाओं से अनुवाद कर सकता हूँ?

RTL भाषाओं में अनुवाद पूरी तरह से काम करता है। RTL भाषा से अनुवाद करना Word और PowerPoint के लिए अच्छा काम करता है, लेकिन वर्तमान में PDF के लिए एक सीमा प्रस्तुत करता है: PDF टेक्स्ट एक्सट्रैक्शन सामग्री को विज़ुअल क्रम में लौटाता है न कि पढ़ने के क्रम में, जिससे शब्द आपस में मिल सकते हैं। यदि आपके पास मूल संपादन योग्य फ़ाइल उपलब्ध है तो उसका उपयोग करें।

क्या यह XLIFF, SRT और अन्य लोकलाइज़ेशन फॉर्मेट स्वीकार करता है?

हाँ। XLIFF (.xliff, .xlf) DeepL, Azure और Gemini पर समर्थित है; SRT सबटाइटल्स DeepL और Gemini पर; साथ ही Gemini पर VTT और gettext PO/POT। FrameMaker MIF जैसे बहुत विशिष्ट संपादन फॉर्मेट समर्थित नहीं हैं — लोकलाइज़ेशन के लिए, XLIFF सबसे व्यापक रूप से उपयोग किया जाने वाला एक्सचेंज फॉर्मेट बना हुआ है।

क्या मैं भुगतान करने से पहले कुछ पेजों के साथ टूल का परीक्षण कर सकता हूँ?

हाँ। हम आवर्ती सदस्यता के बजाय एक बार भुगतान करने का परीक्षण विकल्प प्रदान करते हैं। इस तरह, आप स्वचालित नवीनीकरण के डर के बिना अपने स्वयं के डॉक्यूमेंट्स के साथ समाधान का परीक्षण कर सकते हैं। इसके बाद, मॉडल आपके वास्तविक उपभोग पर आधारित होता है, इसलिए आप केवल उसी के लिए भुगतान करते हैं जिसका आप अनुवाद करते हैं।

← All guides