বাংলা ভাষার উন্নয়নে তথ্য-প্রযুক্তি প্রকল্প

ছবি: মুহাম্মদ মাসুদ আলম, নাগরিক বার্তা.কম

বাংলায় লেখা চিঠি পড়ে আপনার মনের কথা বুঝে ফেলতে পারবে ডিভাইস। ইন্টারনেট বা ওয়েবে বাংলা কথামালার ভেতরে থাকা আবেগ-অনুভূতিগুলোও ধরে ফেলতে সক্ষম এমন সব সফটওয়্যারও তৈরি হচ্ছে এ দেশেই। কাজ হচ্ছে ‘গবেষণা ও উন্নয়নের মাধ্যমে তথ্য-প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ’ প্রকল্পের আওতায়। প্রকল্পটির বিস্তারিত লিখেছেন, ইমরান হোসেন মিলন

বাংলায় লেখা চিঠি পড়ে মনের কথা তো বুঝতে পারাসহ বাকহীনদের ভাষা বুঝতে পারবে এই সফটওয়্যার। ইশারা রূপান্তর হয়ে শুনতে পাবেন শ্রুতিমধুর বাংলা। তথ্য-প্রযুক্তিতে বাংলা ভাষা নিয়ে এমন উদ্যোগ বাস্তবায়নে শুরু হয়েছে এক যজ্ঞ। ‘গবেষণা ও উন্নয়নের মাধ্যমে তথ্য-প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ’ নামের এক প্রকল্প বাস্তবায়ন করছে বাংলাদেশ কম্পিউটার কাউন্সিল (বিসিসি)।

২০১৭ সালের ৩ জানুয়ারি জাতীয় অর্থনৈতিক পরিষদের নির্বাহী কমিটির সভায় (একনেক) অনুমোদন পায় এই প্রকল্প। এরই মধ্যে এগিয়েছে এর কিছু কাজ। সভা, সেমিনার ও বিশেষজ্ঞ কমিটির সুপারিশ হয়েছে। চলছে গবেষণা।

প্রকল্পের আদ্যোপান্ত: প্রধানমন্ত্রী শেখ হাসিনার সভাপতিত্বে ২০১৭ সালে একনেক সভায় অনুমোদনের এক মাস পর ৪ ফেব্রুয়ারি প্রকল্পটি প্রশাসনিক অনুমোদন পায়। ১৫ মে প্রকল্প বাস্তবায়ন কমিটি প্রথম সভা করে। স্টিয়ারিং কমিটি সভা করে ২৪ মে। এরপর ২০১৭ সালের জুন থেকে বাস্তবায়ন মেয়াদ দুই বছর ধরে প্রকল্পটি শেষ হওয়ার কথা রয়েছে চলতি বছরের জুনে। প্রকল্পটির ব্যয় ধরা হয়েছে ১৫৯ কোটি দুই লাখ টাকা।

প্রকল্পের উদ্দেশ্য কী? কেন এমন প্রকল্প? জানতে চাইলে প্রকল্প পরিচালক মো. জিয়াউদ্দিন বলেন, এর মূল উদ্দেশ্য হচ্ছে আন্তর্জাতিক পরিসরে নেতৃস্থানীয় ভাষা হিসেবে বাংলাকে প্রতিষ্ঠা করা। বিশেষ করে কম্পিউটিং ও আইটিসিতে বাংলা ভাষাকে খাপ খাইয়ে নেওয়া। এ জন্য তথ্য-প্রযুক্তিকে বাংলা ভাষাসমৃদ্ধকরণ করে বিভিন্ন প্রযুক্তির মাধ্যমে ব্যবহারযোগ্য সফটওয়্যার, টুলসের উন্নয়ন করা, যাতে করে বাংলা ভাষায় কম্পিউটার ও ওয়েব ব্যবহারে কোনো অসুবিধা না হয়। প্রকল্পটির মাধ্যমে মোট ষোলটি টুলস বা সফটওয়্যার উন্নয়নের কাজ করা হবে।

যত অগ্রগতি : প্রকল্পটি অনুমোদন পাওয়ার পর একজন প্রকল্প পরিচালক ও একটি সহকারী প্রকল্প পরিচালক নিয়োগ করা হয়েছে। এ ছাড়া সাতজন পরামর্শক নিয়োগ রয়েছেন প্রকল্পটিতে। প্রকল্পের প্রথম, দ্বিতীয় ও তৃতীয় কিস্তির বরাদ্দও দেওয়া হয়েছে। সরাসরি পদ্ধতিতে দুইজন অফিস সহকারী কাম কম্পিউটার অপারেটর এবং একজন হিসাবরক্ষক নিয়োগ করা হয়েছে। এর বাইরে আউটসোর্সিংয়ে নিয়োগ পেয়েছেন চারজন। প্রকল্পটি বাস্তবায়নে কয়েকটি অভ্যন্তরীণ এবং বিশেষজ্ঞ কমিটির সভা হয়েছে। সেসব কমিটি ঢাকাসহ দেশের বিভিন্ন স্থানে মোট আটটি সেমিনার ও কর্মশালা করেছে।

গবেষণা ও উন্নয়নের মাধ্যমে বাংলা ভাষা সমৃদ্ধকরণে যে ১৬টি টুলস তৈরি করা হবে। সেগুলোর জন্য এরই মধ্যে দরপত্র আহ্বান করা হয়েছে।

প্রকল্প পরিচালক মো. জিয়াউদ্দিন আহমদ বলেন, প্রতিটি সেমিনার থেকে আমরা অনেক রিসোর্স পেয়ে থাকি। যা পরে আলোচনার মাধ্যমে সুপারিশ হিসেবে গণ্য করা হয়।

বর্তমানে প্রকল্পটি বাস্তবায়নের জন্য রাজধানীর আগারগাঁওয়ের আইসিটি টাওয়ারের নবম তলায় একটি কার্যালয় করা হয়েছে। তবে ভবনের চৌদ্দতম তলার উত্তরাংশে এর জন্য ২৫০০ বর্গফুট জায়গা বরাদ্দ দেওয়া হয়েছে। প্রকল্পটির স্থায়ী ঠিকানা সেখানেই।

আছে চ্যালেঞ্জ: প্রকল্পটি বাস্তবায়নে সবচেয়ে বড় চ্যালেঞ্জ হলো এর নতুনত্ব। প্রকল্পে যে ১৬টি টুলস উন্নয়ন করার কথা বলা হয়েছে, সেগুলো একেবারেই নতুন বলা যায়। কিছু আছে পুরনো। তবে সেগুলোর কাজ আবার এতটাই কম হয়েছে যে তা আবার প্রথম থেকেই করতে হচ্ছে। ফলে এটি মূল চ্যালেঞ্জ হিসেবে দেখছেন প্রকল্প পরিচালক জিয়াউদ্দিন আহমদ। তিনি বলেন, ‘এটা শুধু একটা প্রযুক্তিগত উন্নয়ন হলে হয়তো কম সময়ে খুব সহজেই করা যেত। কিন্তু এতে ভাষার বিভিন্ন দিক, এর অর্থসহ নানা বিষয় দেখতে হচ্ছে। তাই এই প্রকল্পটি সময়সাপেক্ষ এবং চ্যালেঞ্জেরও বটে।’

একই কথা এটির বিশেষজ্ঞ কমিটির সদস্যের দায়িত্ব পেয়ে বলেছিলেন টেলিযোগাযোগ মন্ত্রী মোস্তাফা জব্বারও। তিনি এত বিশাল এবং গুরুত্বপূর্ণ কাজের সক্ষমতার প্রশ্ন তুলেছিলেন। তখন তিনি বলেছিলেন, এত দিন তথ্য-প্রযুক্তিতে বাংলা ভাষার উন্নয়নে অর্থসংস্থানের শঙ্কা থাকলেও এখন সবাই ভাবছেন, এই কাজগুলো সম্পন্ন হবে কেমন করে?

বাংলার ভাষাবিজ্ঞানী ও তথ্য-প্রযুক্তি বিজ্ঞানী উভয়ের সমন্বিত প্রচেষ্টায় প্রকল্পের সফলতার দৃঢ় আশাবাদ জানিয়েছেন মোস্তাফা জব্বার।

প্রকল্পের বিশেষজ্ঞ কমিটিতে যাঁরা রয়েছেন: বিশেষজ্ঞ কমিটি করার সময় সেখানে সদস্য হিসেবে ছিলেন তথ্য-প্রযুক্তিবিদ মোস্তাফা জব্বার। বর্তমানে তিনি ডাক, টেলিযোগযোগ ও তথ্য-প্রযুক্তি মন্ত্রী।

এ ছাড়া বিশেষজ্ঞ কমিটিতে রয়েছেন কম্পিউটারবিজ্ঞানী, শিক্ষাবিদ ড. মুহম্মদ জাফর ইকবাল, আন্তর্জাতিক মাতৃভাষা ইনস্টিটিউটের মহাপরিচালক ড. জিনাত ইমতিয়াজ আলী, তথ্য-প্রযুক্তি বিভাগের প্রতিনিধি সুশান্ত কুমার সরকার, বুয়েটের প্রতিনিধি মো. মনিরুল ইসলাম, বাংলা একাডেমির প্রতিনিধি অপরেশ কুমার ব্যানার্জী ও প্রকল্প পরিচালক জিয়াউদ্দিন আহমদ।

যেসবের জন্য এত আয়োজন:  বাংলা ওসিআর : কৃত্রিম বুদ্ধিমত্তার সাহায্যে মুদ্রিত বা হাতে লেখা বর্ণমালা শনাক্ত করা যায়। এই পদ্ধতিতে পিডিএফ থাকা বর্ণগুলোকে কম্পিউটারের মাধ্যমে দ্রুত শনাক্ত করা ও সেগুলোকে টেক্সটে রূপান্তর বা লিখিত রূপ দেওয়ার কাজও করা হবে।

বাংলা স্পিচ টু টেক্সট এবং টেক্সট টু স্পিচ : এর মাধ্যমে বাংলা কথাকে লেখায় এবং লেখাকে কথায় রূপান্তরের কাজ করা যাবে। রেকর্ড বা কারো কথাকে তাত্ক্ষণিক লেখায় রূপান্তর করা যাবে। এর ফলে অনেক কাজে সময় কমে আসবে।

জাতীয় কি-বোর্ডের আধুনিকায়ন : কম্পিউটারে কম্পোজ আরো সহজ করতে জাতীয় কি-বোর্ডকে আরো সহজ করা হবে এই প্রকল্পের মাধ্যমে। এর ফলে বিভিন্ন অপারেটিং সিস্টেম যেমন—উইন্ডোজ, ম্যাক, অ্যানড্রয়েড, আইওএসে একই ধরনের কি-বোর্ড ব্যবহার করা যাবে।

বাংলা স্টাইল গাইড : প্রযুক্তির সঙ্গে ভাষার সম্মিলনের প্রথম শর্ত হলো, ভাষার রীতি এবং ভাষা ব্যবহারের মান ও নীতি ঠিক করা। ভাষার এই মান ও নীতির সংগ্রহ হলো বাংলা স্টাইল গাইড। এটিও তৈরি করার কাজ করা হবে।

বাংলা বানান ও ব্যাকরণ সংশোধন : এতে যে সফটওয়্যার তৈরি হবে তার মাধ্যমে বাংলা ভাষার শব্দ, বানান, বাক্য স্বয়ংক্রিয়ভাবে সম্পাদনা করা যাবে। এটি যে শুধু ভুল বানান ধরবে তা নয়, বরং তা স্বয়ংক্রিয়ভাবে সংশোধন করার পরামর্শ দেবে। এটি দিয়ে মোবাইল, কম্পিউটার ও অন্যান্য মাধ্যমে বাংলা বানান সংশোধন করা সম্ভব হবে।

বাংলা ভাষাংশ : বিশ্বের অন্যতম ভাষা হলেও বাংলা এখনো তথ্য-প্রযুক্তির বিবেচনায় সমৃদ্ধ ভাষা হয়ে ওঠেনি। আর এ জন্য দরকার ভাষাংশ বা করপাস তৈরি করা। যেটি হবে প্রতিনিধিত্বমূলক ও ভারসাম্যপূর্ণ। এটি তৈরিতে নানা প্রক্রিয়া জড়িত। সেগুলোর কাজ চলছে।

বাংলা থেকে আইপিএ কনভার্টার : বাংলা ইউনিকোড টেক্সটকে স্বয়ংক্রিয়ভাবে ‘ইন্টারন্যাশনাল ফোনেটিক অ্যালফাবেট’ বা ‘আইপিএ’তে প্রকাশ করবে এই সফটওয়্যার। আইপিএ আন্তর্জাতিক ধ্বনিমূলক বর্ণমালা মানুষের দ্বারা উচ্চারিত প্রায় সব ধ্বনি লিখিত রূপে প্রকাশ করা যায়। সাধারণত অভিধান রচয়িতা, বিদেশি ভাষার শিক্ষার্থী-শিক্ষক, ভাষাবিদ, গায়ক, অনুবাদক এই বর্ণমালা ব্যবহার করে থাকে। এটি তৈরি হলে বাংলা ভাষার উচ্চারিত রূপকে আন্তর্জাতিক মান অনুসারে লেখা যাবে।

বাংলা মেশিন ট্রান্সলেটর ডেভেলপমেন্ট : যান্ত্রিক অনুবাদের মাধ্যমে বাংলা ভাষাকে বিভিন্ন ভাষায় স্বয়ংক্রিয়ভাবে অনুবাদ করা। এর অনুবাদকের মাধ্যমে তথ্যমূলক বাংলা, দৈনিন্দন বাংলা, প্রাতিষ্ঠানিক রচনা, সংবাদ বিজ্ঞপ্তি, আবহাওয়া সংবাদসহ আরো অনেক কিছু দ্রুত নির্ভুলভাবে অনুবাদ করা সম্ভব হবে।

দৃষ্টিপ্রতিবন্ধীদের জন্য স্ক্রিন রিডার সফটওয়্যার : এর উন্নয়নের মাধ্যমে দৃষ্টিপ্রতিবন্ধী বা স্বল্পদৃষ্টির ব্যক্তিরা কম্পিউটার বা মোবাইল ফোন ব্যবহার করতে পারবে। স্ক্রিনে ভেসে ওঠা লেখা পড়ে শোনাবে এই সফটওয়্যার।

বাক ও শ্রবণ প্রতিবন্ধীদের জন্য সফটওয়্যার বা ডিজিটাল ইশারা ভাষা : এটি মূলত সাইট টু স্পিচ সফটওয়্যার। এর মাধ্যমে কোনো কম্পিউটার বা মোবাইলের ক্যামেরার সামনে সাইন ল্যাঙ্গুয়েজ বা ইশারার ভাষায় কথা বললে সেটি স্পিচ বা কথা হিসেবে অনুবাদ হয়ে বলে দেবে। এটি এমনকি ইউনিকোডে টেক্সটেও রূপান্তর হবে।

সেন্টিমেন্ট অ্যানালিসিস টুলস উন্নয়ন : এর মাধ্যমে কোনো কাগজপত্রে লেখা বিশ্লেষণ করে বলে দিতে পারবে সেটি ইতিবাচক, নেতিবাচক নাকি নিরপেক্ষ। এর মাধ্যমে ওয়েবসাইটের মন্তব্য বিশ্লেষণ করা যাবে। যা যেকোনো ধরনের জরিপের কাজে ব্যবহার করা যাবে।

বাংলা ফন্ট কনভার্টার : অনেক সময় বাংলা ফন্ট বিভিন্ন অপারেটিং সিস্টেমে স্থানান্তরের সময় ভেঙে যায়। এমনকি কখনো একটি অ্যাপ্লিকেশন থেকে অন্য অ্যাপ্লিকেশনে নিলেও ফন্ট ভেঙে যায়। সেটা থেকে মুক্তি দেবে এই সফটওয়্যার।

ক্ষুদ্র-নৃগোষ্ঠী ভাষার কি-বোর্ড ও শব্দভাণ্ডার : দেশে ক্ষুদ্র-নৃগোষ্ঠীর ভাষাগুলো তথ্য-প্রযুক্তিক্ষেত্রে খুব একটা ব্যবহার হয় না। বেশির ভাগ ক্ষেত্রে ভাষার মানসম্মত দালিলিক ও প্রামাণ্য উপাদান নেই। আবার এদের মধ্যে কিছু ভাষা বিপন্ন অবস্থায় রয়েছে। অনেক ভাষার পর্যাপ্ত তথ্য, নেই ফন্টের এনকোডিংও। সেগুলোকে লিপিতে রূপ দেওয়া থেকে নানা ধরনের কাজ করা হবে।

বাংলা ইউনিকোড : ইউনিকোড-লিপি কম্পিউটারে লিখনপদ্ধতির একটি আন্তর্জাতিকভাবে স্বীকৃত মান। বিশ্বের প্রায় সব প্রধান ভাষায় কম্পিউটার-লিপির জন্য বিভিন্ন দেশের প্রতিনিধি ও বিজ্ঞানীদের সমন্বয়ে গঠিত সংস্থা এই মান নির্ধারণ করে। এই সংস্থার মাধ্যমে বাংলাদেশের পক্ষে বাংলা ও অন্যান্য ভাষার ইউনিকোড মান নির্ধারণে সব ধরনের সমর্থন প্রদান করা হবে।

ভাষা-প্রযুক্তির সমন্বিত প্ল্যাটফর্ম : এই প্রকল্পের সবগুলো সার্ভিসের মিলনবিন্দু হিসেবে কাজ করবে এই প্ল্যাটফর্মটি। এখানে ওসিআর, হাতের লেখা শনাক্তকরণ, যান্ত্রিক অনুবাদসহ অন্য সব সার্ভিস একসঙ্গে থাকবে। একজন ব্যবহারকারী ব্রাউজারের মধ্যমে এই প্ল্যাটফর্মে প্রবেশ করে উল্লিখিত সার্ভিস ব্যবহার করতে পারবেন। এ ছাড়া এখানে থাকবে প্রোডাক্ট শোকেস, যা থেকে সার্ভিস ছাড়া ডকুমেন্টও ডাউনলোড করা যাবে।

মেয়াদ বাড়ানোর আবেদন: গুরুত্বপূর্ণ এই প্রকল্পটি বাস্তবায়নের মেয়াদ নিয়ে প্রথম থেকেই সন্দেহ করে আসছিলেন সংশ্লিষ্টরা। তখনই তাঁরা ধারণা করেছিলেন, এই প্রকল্পের কাজের গভীরতা অনুযায়ী এই নির্দিষ্ট সময়ের মধ্যে হয়তো প্রকল্পের কাজ শেষ করা যাবে না। আর বাস্তবে হয়েছেও তাই। প্রকল্পের মেয়াদ আর মাস চারেক রয়েছে। এখন পর্যন্ত শতকরা হিসেবে মাত্র পাঁচ শতাংশের মতো কাজ হয়েছে। ফলে এর মেয়াদ আরো দুই বছর বাড়ানোর আবেদন করেছেন প্রকল্প পরিচালক জিয়াউদ্দিন আহমেদ।

এটি বাড়ানো হতে পারে বলে তিনি ইঙ্গিতও দিয়েছেন। এর আগে অবশ্য বর্তমান ডাক, টেলিযোগাযোগ ও তথ্য-প্রযুক্তি মন্ত্রী বিশেষজ্ঞ কমিটির সদস্য হিসেবে বলেছিলেন, কাজটি বিশাল ও ব্যাপক। সময়টা খুবই কম। তবে কাজটি শুরু করে সফলতা অর্জন করা গেলে সময় বাড়ানো হয়তো তেমন কঠিন কাজ হবে না।

প্রকল্প পরিচালক মো. জিয়াউদ্দীন বলেন, কাজটি এত ব্যাপক যে, এর জন্য পর্যাপ্ত গবেষণা না হলে তা করা সম্ভব নয়। কারণ যে টুলসগুলো তৈরি করা হবে, সেসবই নতুন। ফলে সময়ের প্রয়োজন হবেই।

এমএমএ/