কৃত্রিম বুদ্ধিমত্তা এআই যেভাবে কাজ করে

2024-06-23T22:30:51.612Z

কিছু কিছু ক্ষেত্রে মানুষের চেয়ে মেশিন বেশি দক্ষ এবং আস্থাভাজন, যার ফলে বর্তমানে ব্যক্তিজীবন থেকে শুরু করে শিল্প- সব ক্ষেত্রেই মেশিনের ব্যবহার রয়েছে। অটোমেটিক রোবট নির্দিষ্ট একটি কাজ মানুষের তুলনায় অতি দ্রুত নির্ভুলভাবে সম্পন্ন করতে পারে। বর্তমানে এমন অনেক কাজই মেশিন দিয়ে করানো হচ্ছে, যা আগে মানুষ করত। এখন প্রশ্ন হচ্ছে মেশিন কিংবা রোবট আসলে কীভাবে কাজ করে?

উত্তর খুবই সহজ, মেশিনের মধ্যে একটি প্রোগ্রাম দেয়া থাকে এবং সেই প্রোগ্রামে থাকা নির্দেশনা অনুযায়ী মেশিন শুধু সক্রিয় থাকে। তার মানে নিজ থেকে কোনো একটি সিদ্ধান্ত নেয়ার মতো সক্ষমতা মেশিনের থাকে না; কিন্তু বর্তমানে মেশিনের জন্য এমন প্রোগ্রাম তৈরি করা হচ্ছে, যার মাধ্যমে মেশিন নিজ থেকে সিদ্ধান্ত নিতে পারে এবং একে বলা হচ্ছে কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টেলিজেন্স (AI)। একজন মানুষ যেমন সময়ের সঙ্গে সঙ্গে তার ভুল থেকে শিক্ষা নিয়ে সঠিক সিদ্ধান্ত নিতে শিখে, আর্টিফিশিয়াল ইন্টেলিজেন্স ও তার ভুল থেকে শিক্ষা নিয়ে নিজেকে ক্রমাগত পরিপক্ব করে। ফলে বর্তমানে আর্টিফিশিয়াল ইন্টেলিজেন্সের ব্যবহার ক্রমাগতই বাড়ছে।

আমরা যারা ইন্টারনেট ব্যবহার করি, তারা নিজের অজান্তেই আর্টিফিশিয়াল ইন্টেলিজেন্স এর অনেক সুবিধা ভোগ করছি। এমনকি কিছু কিছু ক্ষেত্রে আর্টিফিশিয়াল ইন্টেলিজেন্স দ্বারা নিয়ন্ত্রিতও হচ্ছি। যেমন আমরা যখন ইউটিউব কিংবা ফেসবুকে ভিডিও দেখি তখন রিকমেন্ডেশনে কোন ভিডিও আসবে, তা আর্টিফিশিয়াল ইন্টেলিজেন্স নির্ধারণ করে। অর্থাৎ কোনো একজন ব্যক্তি কোন ধরনের ভিডিও দেখেন, তা স্টাডি করে আর্টিফিশিয়াল ইন্টেলিজেন্স ওই ব্যক্তির জন্য ভিডিও রিকমেন্ট করে। এ ছাড়া টাইপ করার সময় টেক্সট সাজেস্ট করা, ভয়েসকে টেক্সটে রূপান্তর করা, টেক্সট থেকে ভয়েস তৈরি করা, আপনার প্রশ্নের উত্তর দেয়া, ইমেজ থাকা অবজেক্ট আইডেন্টিফাই করা, আপনার নির্দেশনা অনুযায়ী ইমেজ জেনারেট করাসহ আধুনিক প্রযুক্তির সব ক্ষেত্রেই এআই ব্যবহার করা হয়।

আসলে এআই-এর ব্যবহার পরিধি সুবিশাল। বর্তমানের আর্টিফিশিয়াল ইন্টেলিজেন্স এতটাই দক্ষ যে কিছু ক্ষেত্রে এটি হিউম্যান ইন্টেলিজেন্স কেউও পেছনে ফেলে দেয়। যেমন- চায়নার একটি প্রাচীন জনপ্রিয় বোর্ড গেম হচ্ছে গো (go)। ২০১৬ সালে এই গো গেম আয়োজন করা হয় যেখানে Alpha go আর্টিফিশিয়াল ইন্টেলিজেন্সের বিপরীতে ছিলেন পৃথিবীর শ্রেষ্ঠ গো প্লেয়ার Lee Sedo। তাদের মধ্যে মোট পাঁচটি গেম অনুষ্ঠিত হয়, যেখানে Alpha go চারটি ম্যাচ জিতেছিল এমনকি Alpha go এমন কিছু চাল দিয়েছিল, যা আগের কেউ চিন্তাও করিনি। এখন কথা হচ্ছে এই আর্টিফিশিয়াল ইন্টেলিজেন্সের সূচনা হলো কীভাবে? এবং এটি কীভাবে কাজ করে?

আর্টিফিশিয়াল ইন্টেলিজেন্সের ধারণা প্রাচীন হলেও আর্টিফিশিয়াল ইন্টেলিজেন্স নিয়ে কাজ শুরু হয় ২০ শতকের মাঝামাঝি সময়ে। ১৯৫৭ সালে সাইকোলজিস্ট Frank Rosenblatt প্রথম নিউরাল নেটওয়ার্ক রিসেপ্টন তৈরি করেন, যা ছেলে এবং মেয়ে আলাদা করতে পারত। এবং এই বিষয়টি তখনকার মিডিয়ার কারণে যথেষ্ট হাইপ তৈরি করেছিল। ১৯৯৮ সালে নিউইয়র্ক টাইমস পত্রিকায় একটি লেখা পাবলিস্ট করা হয়, যেখানে বলা হয়, ভবিষ্যতে কম্পিউটার নিজে হাঁটতে পারবে, কথা বলতে পারবে, দেখতে পারবে, লিখতে পারবে, এমনকি তার অস্তিত্ব সম্পর্কে সচেতন অনুভূতি থাকবে এবং রিপ্রোডিউস করতে পারবে যদিও ওই সময়ের হাইপ অনুযায়ী নিউরাল নেটওয়ার্ক সিস্টেম ততটা সফল হতে পারেনি।

ফলে এর পরবর্তী সময়ে স্বল্প পরিসরে আর্টিফিশিয়াল ইন্টেলিজ নিয়ে কাজ চলতে থাকে। ১৯৮০-এর দশকে প্রথম সেলফ ড্রাইভিং কার (self driving car) তৈরি করা হয়, যা ঘণ্টায় ২ কিলোমিটার গতিতে নিজে নিজে চলতে সক্ষম ছিল। ১৯৯৪ সালে Yann Lecun প্রথম এমন নিউরাল নেটওয়ার্ক তৈরি করেন, যা হাতে লেখা সংখ্যা শনাক্ত করতে পারতো। এভাবে সময়ের সঙ্গে সঙ্গে আর্টিফিশিয়াল ইন্টেলিজেন্স এগোতে থাকে এবং বর্তমানে আর্টিফিশিয়াল ইন্টেলিজেন্স কোথায় এসে দাঁড়িয়েছে, তা বুঝতেই পারছেন।

এখন প্রশ্ন হচ্ছে আর্টিফিশিয়াল ইন্টেলিজেন্স কীভাবে কাজ করে?
আর্টিফিশিয়াল ইন্টেলিজেন্স কীভাবে কাজ করে, এ প্রশ্নের উত্তর সহজভাবে দেয়া সম্ভব না, কারণ আর্টিফিশিয়াল ইন্টেলিজেন্স বিষয়টি একটি বিশাল ধারণা এবং এর পেছনে রয়েছে কমপ্লেক্স সব গাণিতিক বিষয়।

এআই বুঝতে হলে আমাদের মেশিন লার্নিং বুঝতে হবে। মেশিন লার্নিং হচ্ছে, মেশিনকে শেখানো কীভাবে একটি টাস্ক সম্পূর্ণ করতে হয় অর্থাৎ কীভাবে ছবিতে থাকা অবজেক্টটি কি, তা শনাক্ত করবে কিংবা কীভাবে ভয়েসের মাধ্যমে কি বলা হচ্ছে, তা বুঝবে ইত্যাদি।

মেশিনকে শেখানোর বিষয়টি অনেকটা মানুষের মতোই, একজন বাচ্চা যেমন ছোটকাল থেকে মানুষকে দেখে শিখে, ভুল থেকে শিখে, আমাদের দেয়া নির্দেশনা থেকে শিখে আবার নিজের অভিজ্ঞতা থেকে শেখে। মেশিনকেও ঠিক একইভাবে শেখানো হয়। মেশিনকে শেখানোর পদ্ধতি মূলত তিন ধরনের।

1. Supervised learning
2. Unsupervised learning
3. Reinforcement learning

Supervised learning:
এই পদ্ধতিতে মেশিনকে প্রথমে অনেক স্যাম্পল দেয়া হয় এবং বলে দেয়া হয় যে স্যাম্পলে থাকা জিনিসটি কি, এর মাধ্যমে মেশিন ওই জিনিস সম্পর্কে ধারণা পায়। যেমন মনে করুন, আপনি মেশিনকে বিভিন্ন অ্যাঙ্গেলে তোলা ১০ হাজার গাড়ির ছবি ইনপুট হিসেবে দিয়ে বলে দিয়েছেন এটি গাড়ি। এখন মেশিন এসব ছবিকে বিশ্লেষণ করে বুঝতে পারবে গাড়ি আসলে কেমন। তখন মেশিনকে এই ১০ হাজার ছবির বাইরে অন্য একটি গাড়ির ছবি দিলে মেশিন বলে দিতে পারবে যে, এটি একটি গাড়ি। অর্থাৎ আমরা বাচ্চাদের যেমন বিভিন্ন জিনিস দেখিয়ে সেটা কি, তা শেখায়, supervised learning বিষয়টি অনেকটা সেরকম।

Unsupervised learning:
এই পদ্ধতিতে মেশিন সিমিলার প্যাটার্ন আলাদা করতে শিখে। অর্থাৎ এই পদ্ধতিতে ইনপুট থেকে পাওয়া তথ্যগুলোকে মেশিন বিভিন্ন গ্রুপে ভাগ করতে পারে। যেমন- মনে করুন, আপনি মেশিনে অনেক মানুষের ছবি এবং গরুর ছবি দিয়েছেন। তবে মেশিন এসব ছবির প্যাটার্ন বিশ্লেষণ করে মানুষ এবং গাড়ির ছবিগুলো আলাদা করতে শিখবে। এক্ষেত্রে মেশিন আপনাকে এটা বলবে না যে, ‘একটি গ্রুপ আছে মানুষ এবং অন্য গ্রুপ হচ্ছে গরু’-এর বিপরীতে মেশিন এই দুই ধরনের জিনিসকে শুধু দুটি গ্রুপে আলাদা করবে।

Reinforcement learning:
এক্ষেত্রে মেশিন নিজের ভুল থেকে শিখে। যেমন- মনে করুন, মেশিন তার নিজের সঙ্গে দাবা খেলছে। এখন এই দাবা খেলার সময় মেশিন তার ভুল থেকে সে শিখবে। অর্থাৎ এই ক্ষেত্রে মেশিনকে যত ট্রেনিং দেয়া হবে, মেশিন ততই দক্ষ হয়ে উঠবে। প্রথমে বলা Alpha go এআইকে এই reinforcement learning পদ্ধতিতে ট্রেইন করতে করতে গো গেমের জন্য দক্ষ করে তোলা হয়েছিল।

মেশিনকে শেখানোর পদ্ধতিগুলো থেকে আমরা বলতে পারি, মানুষ এবং মেশিনের শেখার পদ্ধতি প্রায় একই রকম। তবে মানুষের শেখার জন্য দীর্ঘ সময় লাগে, মানুষ বয়সের সঙ্গে সঙ্গে বিভিন্ন অভিজ্ঞতার মধ্য দিয়ে শেখে। অন্যদিকে মেশিনকে কম সময়ে শেখানো যায়। মেশিনকে শেখানোর জন্য প্রয়োজন প্রচুর পরিমাণ ডেটা এবং ট্রেনিং। মেশিনকে আপনি যত বেশি ডেটা এবং ট্রেনিং দেবেন মেশিন ততই দক্ষ হয়ে উঠবে।

এখন প্রশ্ন হচ্ছে, মেশিনকে শেখানোর পদ্ধতিগুলো কি কি, তা বোঝা গেল কিন্তু মেশিনের তো মানুষের মতো ব্রেইন নেই, তাহলে মেশিন শেখে কীভাবে? এর উত্তর হচ্ছে নিউরাল নেটওয়ার্ক।

বর্তমানে এআই এতটাই এগিয়েছে যে, কিছু ক্ষেত্রে তা মানুষের চেয়েও ভালো রেজাল্ট দেয়। যেমন ২০১৫ সালের Res Net (Residual neural network) কোনো একটি ছবি দেখে মানুষের চেয়ে বেশি দক্ষতার সঙ্গে ছবিটিতে কি রয়েছে, তা বলে দিতে পারে। কোনো একটি বস্তু দেখে তা কি হতে পারে, এমন পাঁচটি অনুমান করলে এর মধ্যে সঠিক উত্তর না থাকাকে বলে টপ ফাইভ এরর (Top Five Error)।

মানুষের টপ ফাইভ এরর রেট ৫ দশমিক ১ শতাংশ অন্যদিকে Res Net এর স্কোর ৩ দশমিক ৫৭ শতাংশ। Chatgpt তো সবাই চিনেন, একে ইন্টারনেটে অ্যাভেলেবেল প্রায় সব ধরনের টেক্সটের মাধ্যমে ট্রেইন করা হয়েছে, যার ফলে এটি যে কোনো কথার বিপরীতে কিছু ক্ষেত্রে মানুষের চেয়ে গুছিয়ে দ্রুত উত্তর দিতে পারে। এ ছাড়া রয়েছে বিভিন্ন ইমেজ জেনারেটর, যেখানে আপনার নির্দেশনা অনুযায়ী এআই ইমেজ তৈরি করে। এ ক্ষেত্রে অবশ্য নিউরাল নেটওয়ার্ককে Diffusion পদ্ধতিতে ট্রেইন করানো হয়। অর্থাৎ প্রথমে মেশিনকে ব্লার বা নয়েজযুক্ত ছবি দিয়ে তা ক্লিয়ার করার নির্দেশনা দেয়া হয়। পরে মেশিন এই কাজ কতটা ভালো করেছে, তার বিপরীতে ফিডব্যাক দেয়া হয় এবং এই ফিডব্যাক এর মাধ্যমে মেশিন তার গাণিতিক হিসাব-নিকাশের পরিবর্তন আনে এবং সময় সঙ্গে সঙ্গে দক্ষ হয়।

এ ছাড়াও রয়েছে ভয়েস জেনারেটর, যা বর্তমানে এতটা শক্তিশালী যে, এটিকে যদি আপনার কণ্ঠস্বর দিয়ে ট্রেইন করা হয়, তবে তা একদম আপনার কণ্ঠস্বরের মতো করে যে কোনো লিখা পড়তে পারবেন। তার মানে এআই দিয়ে এমন কাজ করানো সম্ভব, যা মানুষ করতে গেলে বেশি সময় লাগবে কিংবা কিছু কিছু ক্ষেত্রে ওই কাজটি করতেই পারবে না। যেমন- ইমেজ জেনারেটর এআই চিকিৎসা ক্ষেত্রে ব্যবহার হচ্ছে।

এআইকে কোটি কোটি এক্স-রে রিপোর্ট এবং সেখানে কি সমস্যা রয়েছে, তা দিয়ে ট্রেইন করা হয়েছে। ফলে ওই এআই একজন অভিজ্ঞ চিকিৎসকের মতোই অতি সহজেই নতুন এক্স-রে দেখে সেখানে কী কী সমস্যা থাকতে পারে, তা অনুমান করতে পারে। বর্তমানে মেডিকেল সেক্টরে নতুন ওষুধ তৈরির ক্ষেত্রেও আর্টিফিশিয়াল ইন্টেলিজেন্স ব্যবহার হচ্ছে।

একটি নতুন প্রযুক্তি যেমন বিভিন্ন সুবিধা নিয়ে আসে, তেমনি নতুন কিছু সমস্যাও নিয়ে আসে এবং সেটা হয়ে থাকে মানুষের মিসইউজের কারণে। যেমন- আর্টিফিশিয়াল ইন্টেলিজেন্স ব্যবহার করে মানুষকে হয়রানি করার সুযোগ তৈরি হয়েছে। সেটা হতে পারে আপনার ছবিকে আপত্তিকরভাবে উপস্থাপন করে কিংবা আপনার কণ্ঠস্বর নকল করে প্রতারণা ইত্যাদি। এর বাইরে আরেকটি অসুবিধা রয়েছে এবং তা হচ্ছে অনেক মানুষ চাকরি হারাবে। অবশ্য একে ঠিক অসুবিধা বলা যাবে না। কারণ আর্টিফিশিয়াল ইন্টেলিজেন্স যেমন কিছু মানুষের কাজ দখল করবে, তেমনি কিন্তু নতুন কিছু কাজের সুযোগও তৈরি করবে।

মো. জুম্মান ভূইয়া: বিজ্ঞানবিষয়ক লেখক, কনটেন্ট ক্রিয়েটর ও শিক্ষক।