শিক্ষানবিস গাইড
মূল ফরম্যাট ও লেআউট ঠিক রেখে কীভাবে যেকোনো ডকুমেন্ট অনুবাদ করবেন
DocTranslating আপনার PDF, Word, PowerPoint, Excel, কোড এবং সাবটাইটেল ফাইলের মূল লেআউট, ফন্ট, টেবিল এবং ইমেজগুলোর অবস্থান ঠিক রেখে ১০০টিরও বেশি ভাষায় অনুবাদ করে। শুধু ফাইলটি আপলোড করুন, ভাষা সিলেক্ট করুন এবং আমাদের চারটি অনুবাদ ইঞ্জিনের (DeepL, Microsoft Azure, Google Cloud, অথবা Gemini) যেকোনো একটি বেছে নিয়ে হুবহু মূল ফাইলের মতো দেখতে অনুবাদ করা ফাইলটি ডাউনলোড করে নিন। এই নির্দেশিকায় ফাইল আপলোড থেকে ডাউনলোড পর্যন্ত সম্পূর্ণ প্রক্রিয়া এবং বাস্তব জীবনের কিছু জটিল ক্ষেত্র—যেমন স্ক্যান করা পিডিএফ (Scan PDF), ফুটনোট ও টেক্সট বক্স, পরিভাষার ধারাবাহিকতা, ফাইলের সাইজ লিমিট এবং ডান-থেকে-বামে লেখা ভাষা (RTL) সংক্রান্ত সমস্যার সঠিক সমাধান নিয়ে বিস্তারিত আলোচনা করা হয়েছে।
সর্বশেষ পরিমার্জন ২৩ মে, ২০২৬ · 12 মিনিট পড়ার সময়
সাধারণত যেকোনো অনুবাদক টুল ব্যবহার করলে ডকুমেন্টের মূল লেআউট ভেঙে যায় অথবা ফাইলটি সাধারণ টেক্সটে রূপান্তরিত হয়। কিন্তু DocTranslating সম্পূর্ণ ভিন্নভাবে কাজ করে: এটি প্রথমে ডকুমেন্ট থেকে টেক্সট এক্সট্রাক্ট (আলাদা) করে, সেটি অনুবাদ করে এবং পুনরায় মূল ডকুমেন্টের হুবহু একটি কপির নিখুঁত কাঠামোতে টেক্সটটি বসিয়ে দেয়। এর ফলে প্যারাগ্রাফ, টেবিল, হেডিং এবং ইমেজগুলো আপনার নির্ধারিত স্থানেই থাকে। এটি একটি সম্পূর্ণ নির্দেশিকা—যেখানে ফাইল আপলোড থেকে ডাউনলোড করার প্রক্রিয়ার পাশাপাশি ব্যবহারকারীদের মুখোমুখি হওয়া বিভিন্ন প্রযুক্তিগত চ্যালেঞ্জের সৎ উত্তর দেওয়া হয়েছে: কোন ইঞ্জিনটি আপনার জন্য সেরা, কীভাবে ফুটনোট ও টেক্সট বক্স সুরক্ষিত থাকে, স্ক্যান করা পিডিএফ-এর ক্ষেত্রে কী ঘটে, পরিভাষার মিল কীভাবে বজায় রাখবেন এবং বর্তমান সিস্টেমের সীমাবদ্ধতাগুলো কী কী।
কোন ধরনের ফাইলগুলো আপনি অনুবাদ করতে পারবেন
প্রতিটি অনুবাদ ইঞ্জিন আলাদা আলাদা ফাইল ফরম্যাট সাপোর্ট করে। নিচের টেবিলে কোন ইঞ্জিনের সাথে কোন ফরম্যাটটি সামঞ্জস্যপূর্ণ তা দেখানো হলো—DocTranslating ইন্টারফেসে আপনার ফাইলটি সিলেক্ট করার সাথে সাথে সিস্টেম স্বয়ংক্রিয়ভাবে শুধুমাত্র সামঞ্জস্যপূর্ণ ইঞ্জিনগুলোই প্রদর্শন করবে।
| ফাইলের ধরন | সামঞ্জস্যপূর্ণ ইঞ্জিনসমূহ |
|---|---|
| PDF (.pdf) | DeepL, Google Cloud, Gemini |
| Word (.docx) | DeepL, Azure, Google Cloud |
| PowerPoint (.pptx) | DeepL, Azure, Google Cloud |
| Excel (.xlsx) | DeepL, Azure, Google Cloud |
| Plain Text (.txt) | DeepL, Azure, Google Cloud |
| পুরোনো অফিস ফরম্যাট (.doc, .ppt, .xls) | DeepL |
| কোড ফাইল (২০টিরও বেশি প্রোগ্রামিং ল্যাঙ্গুয়েজ) | Gemini |
| ইমেজ বা ছবি (.png, .jpg) | DeepL |
| সাবটাইটেল (.srt) | DeepL, Gemini |
| লোকালাইজেশন ফাইল (.xliff, .po, .vtt) | Gemini; .xliff ফাইলটি DeepL এবং Azure-এর সাথেও সামঞ্জস্যপূর্ণ |
ধাপ অনুসারে গাইড: আপনার প্রথম ডকুমেন্ট যেভাবে অনুবাদ করবেন
- 1
আপনার ডকুমেন্ট আপলোড করুন
আপনার ফাইলটি ড্র্যাগ অ্যান্ড ড্রপ (টেনে এনে ছেড়ে দিন) করুন অথবা আপনার কম্পিউটার থেকে ফাইল সিলেক্ট করতে নির্দিষ্ট বক্সে ক্লিক করুন। DocTranslating ফাইলের ধরন সনাক্ত করে স্বয়ংক্রিয়ভাবে শুধুমাত্র কার্যকরী ইঞ্জিনগুলো দেখাবে।

- 2
সোর্স এবং টার্গেট ল্যাঙ্গুয়েজ সিলেক্ট করুন
আপনার ডকুমেন্টের আসল ভাষাটি সিলেক্ট করুন (অথবা অটো-ডিটেক্ট ফিচার ব্যবহার করুন), তারপর যে ভাষায় অনুবাদ করতে চান সেটি বেছে নিন। ১০০+ ভাষার তালিকা থেকে আপনার কাঙ্ক্ষিত ভাষাটি দ্রুত খুঁজে পেতে সার্চ বক্সে টাইপ করুন।

- 3
অনুবাদ ইঞ্জিন বেছে নিন
DeepL, Microsoft Azure, Google Cloud, অথবা Gemini-এর মধ্যে যেকোনো একটি বেছে নিন। প্রতিটি ইঞ্জিনের নিজস্ব সুবিধা, ফাইল সাপোর্ট এবং কিছু সীমাবদ্ধতা রয়েছে—পরবর্তী অংশে আমরা আলোচনা করেছি কখন কোন ইঞ্জিনটি ব্যবহার করা উচিত।

- 4
অনুবাদ প্রক্রিয়া শুরু করুন
সহজেই 'Translate' বাটনে ক্লিক করুন। আমাদের সিস্টেম ডকুমেন্ট থেকে টেক্সট আলাদা করে API-এর মাধ্যমে অনুবাদ সম্পন্ন করবে এবং ভিজ্যুয়াল লেআউট ঠিক রাখতে পুনরায় মূল কাঠামোতে টেক্সট স্থাপন করবে। বড় ফাইলের ক্ষেত্রে প্রতিটি পেজ সার্ভারে আলাদাভাবে প্রসেস হওয়ায় কিছুটা সময় লাগতে পারে।
- 5
অনূদিত ফাইলটি ডাউনলোড করুন
প্রসেসিং শেষ হওয়ার পর, আপনি যে ফরম্যাটে ফাইল আপলোড করেছিলেন ঠিক সেই ফরম্যাটেই অনূদিত ডকুমেন্টটি ডাউনলোড করে নিন। ফাইলের লেআউট ও ফরম্যাট ঠিক আছে কি না তা যাচাই করতে ফাইলটি ওপেন করে দেখে নিন।
সঠিক অনুবাদ ইঞ্জিনটি যেভাবে নির্বাচন করবেন
যদিও এই চারটি ইঞ্জিনই লেআউট বজায় রাখতে সক্ষম, তবে অনুবাদের মান, ফাইল ফরম্যাট সাপোর্ট, সাইজ লিমিট এবং জটিল কাঠামোর প্রসেসিং একুরেসি বা নির্ভুলতার ক্ষেত্রে এদের মধ্যে পার্থক্য রয়েছে। মূল আলোচনা ও সমাধানে যাওয়ার আগে নিচের কুইক রেফারেন্স টেবিলটি দেখে নিন।
| ইঞ্জিন | যে কাজের জন্য সেরা | সর্বোচ্চ ফাইল সাইজ | পেজ লিমিট |
|---|---|---|---|
| DeepL | স্বাভাবিক ও সাবলীল অনুবাদ, অফিস ফাইল, ইমেজ | 30 MB | কোনো সীমাবদ্ধতা নেই |
| Microsoft Azure | অফিস ডকুমেন্টের ক্ষেত্রে সর্বোচ্চ লেআউট একুরেসি | 20 MB | কোনো সীমাবদ্ধতা নেই |
| Google Cloud | বিরল বা কম প্রচলিত ভাষার ক্ষেত্রে সবচেয়ে বড় ডাটাবেজ | 10 MB | কোনো সীমাবদ্ধতা নেই |
| Gemini | জটিল লেআউটের পিডিএফ, কোড, কাস্টম প্রম্পট কন্ট্রোল | 100 MB | সর্বোচ্চ ২৫ পেজ |
DeepL
ইউরোপীয় এবং এর সমর্থিত প্রধান ভাষাগুলোর জন্য DeepL সবচেয়ে সাবলীল এবং প্রাকৃতিক অনুবাদ প্রদান করে। এই ইঞ্জিনটি দৈনন্দিন ব্যবহারের প্রায় সব ধরনের ফাইল ফরম্যাট সাপোর্ট করে—যেমন PDF, সব ধরনের অফিস ফাইল, প্লেইন টেক্সট, ছবি এবং সাবটাইটেল। এর প্রধান সীমাবদ্ধতা হলো ফাইল সাইজ সর্বোচ্চ ৩০ মেগাবাইট (30 MB) হতে পারবে এবং এটি বাক্য ধরে ধরে (sentence-by-sentence) টেক্সট প্রসেস করে (যার প্রভাব নিয়ে নিচে পরিভাষার ধারাবাহিকতা অংশে আলোচনা করা হয়েছে)।
Microsoft Azure
অফিস ডকুমেন্টের যেকোনো উপাদান—যেমন টেক্সট বক্স, বিল্ট-ইন রিচ ফরম্যাটিং (বোল্ড, ইটালিক, লিঙ্ক) এবং ফুটনোটগুলোর মূল ফরম্যাট বজায় রাখার জন্য Azure অত্যন্ত নির্ভরযোগ্য। এর একমাত্র ঘাটতি হলো এটি ডকুমেন্ট মোডে শুধুমাত্র আধুনিক অফিস ফরম্যাট (.docx, .pptx, .xlsx), প্লেইন টেক্সট এবং কিছু মার্কআপ ফরম্যাট সাপোর্ট করে; এটি সরাসরি কোনো পিডিএফ (PDF) বা পুরোনো অফিস ফরম্যাট (.doc / .ppt / .xls) সাপোর্ট করে না।
Google Cloud
Google Cloud-এর ল্যাঙ্গুয়েজ ডাটাবেজ অত্যন্ত বিশাল, যা কম প্রচলিত ভাষাগুলোকেও নিখুঁতভাবে অনুবাদ করতে পারে এবং এটি PDF ও অফিস ফাইল বেশ ভালোভাবেই প্রসেস করে। তবে দুটি বিষয় মাথায় রাখা জরুরি: এর ফাইল সাইজ লিমিট সবচেয়ে কম (১০ মেগাবাইট) এবং এটি অনুবাদের পর PDF পেজের নিচে একটি ছোট টেকনিক্যাল ওয়াটারমার্ক (Watermark) যুক্ত করে।
Gemini
Gemini হলো আমাদের লার্জ ল্যাঙ্গুয়েজ মডেল (LLM) ভিত্তিক ইঞ্জিন। অত্যন্ত জটিল ডিজাইনের পিডিএফ লেআউট, সোর্স কোড এবং লোকালাইজেশন ফাইলের জন্য এটি সেরা পছন্দ। বিশেষ সুবিধা হলো, Gemini ইঞ্জিনে আপনি কাস্টম প্রম্পট বা নির্দেশনা লিখে দিয়ে অনুবাদের পরিভাষা, লেখার ধরন এবং কনটেক্সট সম্পূর্ণ নিজের মতো নিয়ন্ত্রণ করতে পারবেন। এটি সর্বোচ্চ ১০০ মেগাবাইট পর্যন্ত ফাইল আপলোড সাপোর্ট করলেও, একটি ফাইলে সর্বোচ্চ ২৫টি পেজ প্রসেস করতে পারে। তাছাড়া এটি সরাসরি .docx, .pptx, বা .xlsx ফরম্যাট সাপোর্ট করে না—শুধুমাত্র PDF, কোড এবং নির্দিষ্ট সাবটাইটেল ফরম্যাট সাপোর্ট করে।
ডকুমেন্টের ফরম্যাট এবং লেআউট কতটা নিখুঁত থাকে?
এটি মূলত ফাইলের অভ্যন্তরীণ কাঠামো এবং নির্বাচিত ইঞ্জিনের ওপর নির্ভর করে। কোন উপাদানটি নিখুঁত থাকবে আর কোনটি কিছুটা স্থানচ্যুত হতে পারে তা আগে থেকে জানা থাকলে আপনার সময় বাঁচবে:
- Word এবং PowerPoint ফাইলের কোডিং স্ট্রাকচার আমাদের সিস্টেম সরাসরি পড়তে পারে। এর ফলে টেক্সট বক্স, রিচ ফরম্যাটিং (বোল্ড, ইটালিক, লিঙ্ক) এবং ফুটনোটগুলো আমাদের প্রসেসিং লজিক অত্যন্ত নিখুঁতভাবে সনাক্ত করে প্রতিস্থাপন করতে পারে। এই ক্ষেত্রে Microsoft Azure সবচেয়ে নিখুঁত ফলাফল দেয়, যার পরেই রয়েছে DeepL এবং Google Cloud।
- PDF ফাইলের অনুবাদ একটি অত্যন্ত জটিল প্রযুক্তিগত চ্যালেঞ্জ—এবং এটি বৈশ্বিক সফটওয়্যার ইন্ডাস্ট্রির একটি সাধারণ বাস্তব সত্য, কোনো নির্দিষ্ট টুলের একক ত্রুটি নয়। পিডিএফ ফাইলে কোনো ধারাবাহিক টেক্সট স্ট্রাকচার থাকে না, বরং এটি প্রতিটি অক্ষর বা শব্দকে নির্দিষ্ট কোঅর্ডিনেট (স্থানাঙ্ক) অনুযায়ী পেজে বসায়। তাই ফ্লোটিং টেক্সট বক্স, গ্রাফিক্সের ভেতরের টেক্সট এবং ফুটনোটগুলো মূল ফাইল তৈরির সময় এক্সপোর্ট করার লেয়ারের ওপর ভিত্তি করে কিছুটা স্থানচ্যুত হতে পারে। সাধারণ স্ট্রাকচারের পিডিএফ কোনো সমস্যা ছাড়াই সুন্দরভাবে অনূদিত হয়, তবে অত্যন্ত জটিল ক্যাটালগ বা ম্যাগাজিনের ক্ষেত্রে লেআউট কিছুটা এদিক-ওদিক হতে পারে।
স্ক্যান করা পিডিএফ এবং ইমেজ অনুবাদ (OCR সীমাবদ্ধতা)
স্ক্যান করা পিডিএফ-এ কোনো টেক্সট লেয়ার থাকে না—সেগুলো মূলত ছবির একটি সমষ্টি মাত্র। DocTranslating স্বয়ংক্রিয়ভাবে অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) প্রযুক্তির মাধ্যমে প্রথমে সেই ছবি থেকে টেক্সট রিড বা এক্সট্রাক্ট করে এবং তারপর অনুবাদে পাঠায়। DeepL ইঞ্জিন সরাসরি ছবি ফাইল (.png, .jpg) অনুবাদ করতে সক্ষম। তবে একটি বিষয় অত্যন্ত পরিষ্কার হওয়া জরুরি: অনুবাদের মান সম্পূর্ণ নির্ভর করে OCR কতটা নিখুঁতভাবে টেক্সট পড়তে পেরেছে তার ওপর। ছবি যদি ঝাপসা হয় এবং OCR কোনো শব্দ ভুল পড়ে, তবে অনুবাদের ফলাফলও ভুল বা অর্থহীন হবে।
পরিভাষা, লেখার শৈলী এবং জেন্ডার বা লিঙ্গ সমতা বজায় রাখার উপায়
স্বয়ংক্রিয় ডকুমেন্ট অনুবাদের ক্ষেত্রে এটি একটি বড় চ্যালেঞ্জ। ট্র্যাডিশনাল ইঞ্জিন যেমন DeepL পুরো ডকুমেন্ট একসাথে না দেখে বাক্য ধরে ধরে অনুবাদ করে, যার ফলে একটি প্যারাগ্রাফের তথ্যের সাথে অন্য প্যারাগ্রাফের সংযোগ থাকে না। এর দুটি বড় অসুবিধা হলো: ডকুমেন্টের শুরুতে একটি টেকনিক্যাল টার্ম বা পরিভাষা যেভাবে অনুবাদ হয়েছে, শেষে গিয়ে তা বদলে যেতে পারে; এবং জেন্ডার-নিরপেক্ষ ভাষা (যেমন তুর্কি বা ফিনিশ) থেকে অনুবাদ করার সময় মূল চরিত্রের লিঙ্গ (পুরুষ/মহিলা) ওলটপালট হয়ে যেতে পারে। সাধারণ গ্লসারি বা শব্দকোষ অনেক সময় শব্দের বিভক্তি বা ব্যাকরণগত পরিবর্তনের কারণে সঠিকভাবে কাজ করতে পারে না।
এই সমস্যার চমৎকার সমাধান দেয় Gemini ইঞ্জিন। এটি একটি অ্যাডভান্সড এলএলএম (LLM) হওয়ায় এর কনটেক্সট উইন্ডো অত্যন্ত বিশাল, যা পুরো ডকুমেন্টটিকে সামগ্রিকভাবে বুঝতে পারে। সবচেয়ে বড় সুবিধা হলো, এর কাস্টম প্রম্পট বক্সে আপনি নির্দিষ্ট নির্দেশনা দিতে পারেন—যেমন: 'এই ডকুমেন্টের মূল চরিত্র একজন নারী', 'সমগ্র ডকুমেন্টে jurisdiction শব্দটির অনুবাদ সর্বদা যুরিডিকশন রাখুন', 'সম্পূর্ণ অনুবাদে প্রাতিষ্ঠানিক ফরমাল ভাষা ব্যবহার করুন'। এই কাস্টম রুলস বা নিয়মগুলো প্রতিটি পেজে কঠোরভাবে প্রয়োগ করা হয়, যা সাধারণ শব্দকোষের চেয়ে অনেক বেশি কার্যকর ও নির্ভুল।
ডান-থেকে-বামে লেখা সোর্স ডকুমেন্ট (আরবি, হিব্রু, ফার্সি)
যেকোনো ডকুমেন্টকে আরটিএল (RTL) ভাষায় অনুবাদ করার প্রক্রিয়াটি অত্যন্ত নিখুঁত—সিস্টেম স্বয়ংক্রিয়ভাবে পেজের লেআউট এবং টেক্সট ডিরেকশন উল্টে দিয়ে সঠিক বিন্যাস তৈরি করে। তবে সমস্যা হয় যখন আপনার মূল সোর্স ফাইলটি একটি RTL ভাষার PDF এবং আপনি সেটি ইংরেজিতে অনুবাদ করতে চান। এটি বৈশ্বিক সফটওয়্যার শিল্পের একটি মৌলিক সীমাবদ্ধতা: পিডিএফ এক্সট্রাকশন ইঞ্জিনগুলো অনেক সময় টেক্সটকে মানুষের পড়ার ক্রম (Logical Order) অনুযায়ী না পড়ে পর্দায় যেভাবে দেখায় (Visual Order) সেই অনুযায়ী রিড করে। ফলে অনুবাদের API-এ যাওয়ার আগেই বাক্যের শব্দগুলো উল্টে যায়। অনূদিত ফাইলের লেআউট ঠিক থাকলেও ভেতরের বাক্যগুলো অর্থহীন শোনায়। মনে রাখবেন: Word বা PowerPoint ফাইলে এই সমস্যা হয় না; এটি শুধুমাত্র RTL ভাষার PDF সোর্স ফাইলের একটি সীমাবদ্ধতা।
সাবটাইটেল, লোকালাইজেশন এবং প্রফেশনাল ফাইল ফরম্যাট
অফিস ডকুমেন্টের পাশাপাশি প্রফেশনাল ডেভেলপার এবং অনুবাদকদের প্রয়োজনীয় ফরম্যাটগুলোও DocTranslating সাপোর্ট করে। এর মধ্যে রয়েছে সাবটাইটেল ফাইল (.srt ফাইল DeepL ও Gemini-তে এবং .vtt ফাইল Gemini-তে), গেটটেক্সট লোকালাইজেশন ফাইল (.po এবং .pot ফাইল Gemini-তে), ইন্ডাস্ট্রি স্ট্যান্ডার্ড অনুবাদ ফরম্যাট XLIFF (.xliff, .xlf ফাইল DeepL, Azure এবং Gemini-তে) এবং স্ট্রাকচার্ড টেবিল .csv / .tsv। তবে অত্যন্ত বিশেষায়িত ও ক্লোজড পাবলিশিং ফরম্যাট (যেমন FrameMaker .mif) বর্তমানে সমর্থিত নয়। লোকালাইজেশন প্রজেক্টের ক্ষেত্রে প্রফেশনাল আদান-প্রদানের জন্য স্ট্যান্ডার্ড XLIFF ফরম্যাট ব্যবহার করাই সবচেয়ে নিরাপদ।
সেরা অনুবাদের জন্য ৫টি গোল্ডেন রুলস
- সম্ভব হলে সর্বদা এডিটেবল সোর্স ফাইল (Word, PowerPoint) অনুবাদ করুন—এতে টেক্সট বক্সগুলো পিডিএফ-এর চেয়ে অনেক বেশি নিখুঁত ও পরিচ্ছন্ন থাকে।
- স্ক্যান করা পিডিএফ অনুবাদের আগে নিশ্চিত হয়ে নিন যে OCR করা টেক্সটটি সঠিক আছে; ভুল বা অস্পষ্ট সোর্স ডাটা কখনো ভালো অনুবাদ দিতে পারে না।
- অত্যন্ত ঘন বা জটিল লেআউটের পিডিএফ এবং নির্দিষ্ট রাইটিং স্টাইলের ক্ষেত্রে Gemini ইঞ্জিন সিলেক্ট করুন এবং কাস্টম প্রম্পট বক্সে আপনার প্রয়োজনীয় নিয়মগুলো স্পষ্ট করে লিখুন।
- টেক্সট এক্সপেনশন বা শব্দ বৃদ্ধির বিষয়টি মাথায় রাখুন: কিছু ভাষায় অনুবাদ করার পর শব্দের দৈর্ঘ্য বেড়ে যায়, তাই অনূদিত ফাইল ডাউনলোডের পর প্রয়োজনে টেক্সট বক্সের সাইজ ম্যানুয়ালি একটু এডজাস্ট করে নিতে হতে পারে।
- যেকোনো গুরুত্বপূর্ণ কাজে ব্যবহারের আগে অনূদিত ফাইলটি অবশ্যই একবার ওপেন করে চেক করুন—বিশেষ করে টেবিল বর্ডার, ফুটনোট এবং RTL টেক্সট এরিয়াগুলো ভালো করে দেখে নিন।
সচরাচর জিজ্ঞাস্য প্রশ্নাবলী (FAQ)
আমি কি ফরম্যাট ঠিক রেখে পিডিএফ অনুবাদ করতে পারব?
হ্যাঁ, অবশ্যই। DocTranslating প্রযুক্তি পিডিএফ থেকে টেক্সট এক্সট্রাক্ট করে, সেটি অনুবাদ করে এবং পুনরায় মূল পজিশনে বসিয়ে দেয়—যার ফলে ফন্ট, টেবিল এবং ইমেজের অবস্থান ঠিক থাকে। সাধারণ কাঠামোর ডকুমেন্টে এটি চমৎকার কাজ করে; আর অত্যন্ত জটিল ডিজাইনের ক্ষেত্রে ম্যাক্রো লেআউট বজায় রাখতে Gemini ইঞ্জিন সবচেয়ে ভালো পারফর্ম করে।
DocTranslating কোন কোন ফাইল ফরম্যাট সাপোর্ট করে?
আমরা DeepL, Azure এবং Google Cloud-এর মাধ্যমে PDF, Word, PowerPoint, Excel এবং TXT ফাইল সাপোর্ট করি। এছাড়া Gemini-এর মাধ্যমে সোর্স কোড; DeepL-এর মাধ্যমে ছবি (PNG, JPG); DeepL ও Gemini-তে SRT সাবটাইটেল এবং Gemini-তে XLIFF ও PO লোকালাইজেশন ফাইল সাপোর্ট করি। ফাইল আপলোড করার পর সিস্টেম নিজেই মানানসই ইঞ্জিন সাজেস্ট করবে।
এটি কি টেক্সট বক্স, ফুটনোট এবং বোল্ড/ইটালিক ফরম্যাটিং ধরে রাখতে পারে?
Word এবং PowerPoint ফাইলের ক্ষেত্রে উত্তর হলো শতভাগ হ্যাঁ। এই ফাইলগুলোর অভ্যন্তরীণ কোডিং স্ট্রাকচার স্পষ্ট হওয়ায় আমাদের প্রসেসিং লজিক টেক্সট বক্স, রিচ ফরম্যাটিং (বোল্ড, ইটালিক, লিঙ্ক) এবং ফুটনোটগুলো খুব নিখুঁতভাবে बजाय রাখে (Microsoft Azure এই ক্ষেত্রে সবচেয়ে এগিয়ে)। তবে পিডিএফ-এর কোনো নির্দিষ্ট সেম্যান্টিক লেয়ার না থাকায় জটিল লেআউটে ফুটনোট বা ফ্লোটিং এলিমেন্ট সামান্য স্থানচ্যুত হতে পারে।
DocTranslating কি স্ক্যান করা পিডিএফ অনুবাদ করতে পারে?
হ্যাঁ, পারে। স্ক্যান করা পিডিএফ ফাইল আপলোড করা হলে সিস্টেম স্বয়ংক্রিয়ভাবে OCR (অপটিক্যাল ক্যারেক্টার রিকগনিশন) প্রক্রিয়ার মাধ্যমে প্রথমে একটি টেক্সট লেয়ার তৈরি করে নেয়। যেহেতু অনুবাদের মান সম্পূর্ণ নির্ভর করে OCR রিডিং-এর ওপর, তাই খারাপ কোয়ালিটির স্ক্যান ফাইলের ক্ষেত্রে প্রথমে PDFEquips দিয়ে টেক্সট চেক করে নেওয়া ভালো, যাতে ভুল রিডিং-এর কারণে আপনার অনুবাদ কোটা নষ্ট না হয়।
আমি কীভাবে নির্দিষ্ট পরিভাষা, লেখার স্টাইল এবং জেন্ডার বা লিঙ্গ ঠিক রাখব?
এই কাজের জন্য Gemini ইঞ্জিনটি বেছে নিন। এটি একটি অ্যাডভান্সড এলএলএম (LLM) হওয়ায় এর কনটেক্সট উইন্ডো বড় এবং এতে একটি কাস্টম প্রম্পট বক্স রয়েছে। সেখানে আপনি লিখে দিতে পারেন যে 'অনুবাদে প্রাতিষ্ঠানিক ভাষা ব্যবহার করুন' বা 'নির্দিষ্ট শব্দের অনুবাদ সর্বদা অমুক রাখুন' কিংবা মূল চরিত্রের জেন্ডার উল্লেখ করে দিতে পারেন। ট্র্যাডিশনাল ইঞ্জিনগুলো বাক্য ধরে অনুবাদ করায় এই ধারাবাহিকতা রাখতে পারে না।
সর্বোচ্চ কত বড় ফাইল আপলোড করা যাবে এবং দীর্ঘ পিডিএফ কীভাবে অনুবাদ করব?
আমাদের ফাইল সাইজ লিমিট হলো: DeepL 30 MB, Azure 20 MB, Google Cloud 10 MB এবং Gemini 100 MB। তবে Gemini ইঞ্জিনে প্রতি ফাইলে সর্বোচ্চ ২৫টি পেজ প্রসেস করা যায়। আপনার ফাইল বড় হলে PDFEquips দিয়ে কমপ্রেস করে নিন; আর ২৫ পেজের বেশি হলে PDFEquips দিয়ে ফাইলটি স্প্লিট (Split) বা খণ্ড করে আলাদাভাবে অনুবাদ করার পর আবার মার্জ (Merge) করে নিন।
অনূদিত পিডিএফ ফাইলে কি কোনো ওয়াটারমার্ক থাকবে?
শুধুমাত্র Google Cloud ইঞ্জিনটি অনুবাদের পর পিডিএফ পেজের নিচে একটি ছোট টেকনিক্যাল ওয়াটারমার্ক যুক্ত করে। আপনার যদি একদম ওয়াটারমার্ক ছাড়া ফ্রেশ ফাইল প্রয়োজন হয়, তবে বাকি তিনটি ইঞ্জিনের যেকোনো একটি ব্যবহার করুন। অথবা PDFEquips দিয়ে পিডিএফ ফাইলটি প্রথমে ওয়ার্ডে রূপান্তর করে অনুবাদ করুন—কারণ অনূদিত ওয়ার্ড ফাইলে কোনো ওয়াটারমার্ক থাকে না।
এটি কি আরবি, হিব্রু বা অন্য কোনো আরটিএল (RTL) ভাষা থেকে অনুবাদ সাপোর্ট করে?
যেকোনো ভাষা থেকে আরটিএল (RTL) বা ডান-থেকে-বামে লেখা ভাষায় অনুবাদ করা অত্যন্ত নিখুঁত এবং লেআউট স্বয়ংক্রিয়ভাবে বিন্যস্ত হয়। তবে আরটিএল (RTL) ভাষার পিডিএফ থেকে ইংরেজিতে অনুবাদ করার ক্ষেত্রে বৈশ্বিক টেকনিক্যাল সীমাবদ্ধতা রয়েছে; পিডিএফ ইঞ্জিন অনেক সময় ভিজ্যুয়াল এবং লজিক্যাল অর্ডার গুলিয়ে ফেলে শব্দ ওলটপালট করে ফেলে। তবে Word বা PowerPoint ফাইলের ক্ষেত্রে এই সমস্যা হয় না।
এটি কি XLIFF এবং SRT-এর মতো প্রফেশনাল লোকালাইজেশন ফরম্যাট সাপোর্ট করে?
হ্যাঁ। ইন্ডাস্ট্রি স্ট্যান্ডার্ড XLIFF (.xliff, .xlf) ফরম্যাটটি DeepL, Azure এবং Gemini তিনটি ইঞ্জিনেই সমর্থিত। সাবটাইটেল SRT ফাইলটি DeepL ও Gemini-তে এবং VTT ও PO/POT ফাইলগুলো Gemini-তে সাপোর্ট করে। তবে অত্যন্ত প্রোপাইটরি বা ক্লোজড পাবলিশিং ফরম্যাট (যেমন FrameMaker MIF) সমর্থিত নয়। লোকালাইজেশনের জন্য XLIFF ফরম্যাট ব্যবহার করাই সবচেয়ে নিরাপদ।
টাকা পরিশোধ করার আগে আমি কি কয়েকটি পেজ টেস্ট বা পরীক্ষা করে দেখতে পারব?
হ্যাঁ, অবশ্যই। আমরা কোনো অটো-রিনিউয়াল সাবস্ক্রিপশন সিস্টেম ব্যবহার করি না যা ব্যবহারকারীদের জন্য উদ্বেগের কারণ হতে পারে। আমরা ওয়ান-টাইম পে বা ক্রেডিট প্যাক সিস্টেম অফার করি। এর ফলে আপনি কোনো লুকানো চার্জের ভয় ছাড়াই সম্পূর্ণ নিশ্চিন্তে আপনার নিজস্ব ডকুমেন্ট দিয়ে আমাদের সার্ভিস টেস্ট করতে পারবেন এবং সন্তুষ্ট হলে প্রয়োজন অনুযায়ী টপ-আপ করতে পারবেন।