রোবোটিক্স ও এআই

যেভাবে চ্যাটজিপিটিকে ছাড়িয়ে গেছে জিপিটি-৪

বণিক বার্তা ডেস্ক

ছবি: টেকক্রান্স

ওপেনএআইয়ের সর্বশেষ কৃত্রিম বুদ্ধিমত্তা (এআই) সংস্করণ জিপিটি-৪। সফটওয়্যারটির আত্মপ্রকাশ প্রযুক্তি জগতের নতুন দ্বার উন্মোচন করেছে এবং আগের চ্যাটজিপিটির ফিচারকে পেছনে ফেলেছে। দৃষ্টিপ্রতিবন্ধীদের জন্য ভার্চুয়াল পরিষেবা থেকে শুরু করে ভাষা দক্ষতা যাচাই প্লাটফর্ম ডুয়োলিঙ্গো—সবখানেই নেতৃত্ব দেয়ার আভাস দিয়েছে জিপিটি-৪। কিন্তু এআইয়ের আগের সংস্করণ যেমন চ্যাটজিপিটি এবং জিপিটি-৩.৫ থেকে এর আলাদা বিশেষত্ব কী সে বিষয়ে জানিয়েছে প্রযুক্তিবিষয়ক সংবাদমাধ্যম টেকক্রান্স।

জিপিটি-৪ ছবি দেখতে ও বুঝতে পারে

বহুমুখী মেশিন লার্নিং সিস্টেমের সবচেয়ে উল্লেখযোগ্য পরিবর্তন হলো এটি মাল্টিমোডাল। অর্থাৎ এটি ইনপুট করা ডাটার একাধিক বিষয় বিশ্লেষণ করতে পারে। চ্যাটজিপিটি ও জিপিটি-৩.৫ শুধু টেক্সের মধ্যে সীমাবদ্ধ ছিল। তুলনামূলক পুরনো ওই প্রযুক্তি পড়তে ও লিখতে পারত। কিন্তু জিপিটি-৪ সংস্করণটি চিত্রের পুঙ্খানুপুঙ্খ বিশ্লেষণ করে থাকে। সফটওয়্যারটি ছবিতে কী আছে সেটি বলার পাশাপাশি ছবি সম্পর্কিত প্রাসঙ্গিক তথ্যও তৈরি করতে পারে। এর মাধ্যমে ব্যবহারকারীকে ছবি সম্পর্কে প্রায় কাছাকাছি ধারণা দিতে সক্ষম জিপিটি-৪। এজন্য দৃষ্টিপ্রতিবন্ধীদের জন্য সফটওয়্যারটি সহায়ক হবে।

এক ভিডিওতে দেখা যায়, জিপিটি-৪ একটি পোশাকের প্যাটার্ন বর্ণনা করছে। গাছ চিহ্নিত করতে পারছে। ব্যায়ামাগারে একটি নির্দিষ্ট মেশিন কীভাবে ব্যবহার করতে হয় সেটি ব্যাখ্যা করছে। রান্নার রেসিপি দিচ্ছে। মানচিত্র সম্পর্কে ধারণা দিচ্ছে। পাশাপাশি এমন অনেক কাজ করছে যাতে বোঝা যায় সফটওয়্যারটি সত্যিই একটি ছবিতে যা আছে সে বিষয়ে বিশ্লেষণ করতে পারছে। তবে এক্ষেত্রে প্রশ্ন সঠিক বা যথাযথ হতে হবে।

জিপিটি-৪-কে বিভ্রান্ত করা কঠিন

বর্তমানের চ্যাটবটগুলো যতই সঠিক কাজ করুক না কেন, এগুলো সহজেই বিভ্রান্ত হয়ে যায়। অন্যদিকে, জিপিটি-৪ অত্যন্ত দক্ষ। অনেকগুলো বিষয়ে সফটওয়্যারটিকে প্রশিক্ষিত করা হয়েছে। ব্যবহারকারীরা এক-দুবছর ধরে ওপেনএআইকে সহযোগিতা করেছে, যাতে অপরাধমূলক কোনো পরামর্শ না দেয়া হয়। এজন্য নতুন মডেলটি এর আগের তুলনায় বাস্তবসম্মত এবং পরিচালনযোগ্য। ওপেনএআই জানিয়েছে, জিপিটি-৩.৫ একটি নতুন পরীক্ষণ সংস্করণ ছিল। এর যাচাই-বাছাই শেষে জিপিটি-৪ তৈরি করা হয়েছে। ফলে এটি অধিক সক্ষমতা অর্জন করতে পেরেছে।

জিপিটি-৪-এর স্মৃতিশক্তি বেশি

জিপিটি-৩.৫ এবং চ্যাটজিপিটির পুরনো সংস্করণে চ্যাটের সীমা ছিল ৪ হাজার ৯৬টি টোকেন, যা প্রায় আট হাজার শব্দের চ্যাট করতে পারে। অথবা একটি বইয়ের প্রায় চার থেকে পাঁচ পৃষ্ঠা মনে রাখতে পারে। সুতরাং এর অধিক টেক্সট চ্যাটজিপিটি ভুলে যায়। অথচ জিপিটি-৪-এর সর্বোচ্চ টোকেন সংখ্যা ৩২ হাজার ৭৬৮। এটি প্রায় ৬৪ হাজার শব্দের বা ৫০ পৃষ্ঠার টেক্সট মনে রাখতে সক্ষম। অর্থাৎ কথোপকথন বা টেক্সট তৈরিতে এটি ৫০ পৃষ্ঠার বেশি মনে রাখতে পারে। 

জিপিটি-৪ অন্যান্য মডেলের তুলনায় বহুভাষী

এআই জগতে ইংরেজিভাষীদের আধিপত্য বেশি। তথ্য থেকে শুরু করে পরীক্ষা এবং গবেষণাপত্র পর্যন্ত সবকিছুই ইংরেজিতে। তবে অবশ্যই আরো অধিক ভাষার মডেলের ক্ষমতা যেকোনো লিখিত ভাষায় প্রযোজ্য। সেগুলোর জন্যও এআইকে প্রস্তুত থাকা উচিত। জিপিটি-৪ ইতালিয়ান, ইউক্রেনীয় ও কোরিয়ানসহ ২৬টি ভাষায় নির্ভুলভাবে হাজার হাজার এমসিকিউ প্রশ্নের উত্তর দিতে সক্ষম। 

জিপিটি-৪-এর ভিন্ন ব্যক্তিত্ব রয়েছে

এআইয়ের একটি আকর্ষণীয় ধারণাই হলো নিয়ন্ত্রিত আচরণ ক্ষমতা। ব্যবহারকারীর চাহিদা অনুযায়ী আচরণ পরিবর্তন করার ক্ষমতা রয়েছে জিপিটি-৪-এর। এটি বেশ কার্যকর হতে পারে। যেমন সহানুভূতিশীল শ্রোতার ভূমিকা পালন করা। ডেভেলপাররা প্রথম থেকেই এটি সমাধানের চেষ্টা করেছেন। পাশাপাশি এর কথোপকথন শৈলী, টোন বা মিথস্ক্রিয়ার পদ্ধতি আকর্ষণীয় করা হয়েছে।

এই বিভাগের আরও খবর

আরও পড়ুন