মাইক্রোসফট নিয়ে এলো নতুন এআই
আইটি ডেস্ক, এবিসিনিউজবিডি, ঢাকা (৭ এপ্রিল) : সহজলভ্য এআই মডেল নিয়ে নতুন করে আলোচনায় এলো মাইক্রোসফট। যার নাম মেই ট্রান্সক্রাইব ওয়ান। এটি সরাসরি গুগল উদ্ভাবিত জেমেনি ৩.১ ফ্ল্যাশ সংস্করণকে চ্যালেঞ্জ ছুড়েছে। বলতে গেলে, মাইক্রোসফটের নতুন এআই ট্রান্সক্রিপশন মডেলের সমীকরণে বিশ্বের সবচেয়ে মানোন্নত এআই স্পিচ-টু- টেক্সট মডেল। শুধু ভয়েস পরিষেবায় নয়; বেশ কিছু বিষয়ে জেমিনিকে প্রতিযোগিতায় ফেলবে মাইক্রোসফট।
নতুন মাইলফলক
কিছুদিনের মধ্যেই মাইক্রোসফট তিনটি নতুন এআই মডেল উন্মোচন করেছে। যার মধ্যে রয়েছে মেই সিরিজের ট্রান্সক্রাইব ওয়ান, ভয়েস ওয়ান আর ইমেজ টু সংস্করণ। এসব যথাক্রমে স্পিচ-টু- টেক্সট রূপান্তর; বাস্তবের সঙ্গে মিল রেখে কণ্ঠস্বর তৈরি আর ইমেজ জেনারেশন তৈরি করতে পারে। এটি ট্রান্সক্রাইবের তৃতীয় এআই সংস্করণ।
মাইক্রোসফট কতটা এগিয়ে
নতুন সংস্করণে ট্রান্সক্রাইব ওয়ানের স্পিচ-টু- টেক্সট মডেলটি ৩.৯ শতাংশ গড় শব্দ ত্রুটি হারে ইংরেজি, জার্মান, ফরাসি, ইতালিয়ান, স্প্যানিশ, হিন্দি ছাড়া এখন ২৫টি ভাষায় কাজ করতে পারদর্শী। হিসাব বলছে, গুগলের জেমিনি ৩.১ ফ্ল্যাশ লাইট সংস্করণ ২২টি ভাষায় কাজ করতে পারে। এই হিসাবে শুরুতে গুগলের চেয়ে এগিয়েছে মাইক্রোসফট।
গতি ও সাশ্রয়ী
মেই ট্রান্সক্রাইব ওয়ান অ্যাজুর ফাস্টের চেয়ে ২.৫ গুণ দ্রুত ও ঘণ্টায় ০.৩৬ মার্কিন ডলার খরচ করতে হয় এই পরিষেবা পেতে।
মাইক্রোসফটের কৃত্রিম বুদ্ধিমত্তা (এআই) বিভাগের প্রধান মুস্তাফা সুলেমান জানান, মডেলটি অন্যসব অত্যাধুনিক মডেলের তুলনায় মাত্র অর্ধেক জিপিইউ খরচে পরিচালিত হয়। এ ছাড়া ২৫টি ভাষায় বিশেষ উচ্চারণ বা কথা বলার ক্ষেত্রে গুগল জেমিনির বিবেচনায় তুলনামূলক নির্ভরযোগ্য।
টিমস ও কোপাইলট
নতুন সিরিজে ট্রান্সক্রাইব ওয়ান সংস্করণে রয়েছে কোপাইলটের ভয়েস মোড। বর্তমানে এটি কোপাইলটে অডিও এক্সপ্রেশন্স আর কোপাইলট পডকাস্ট প্ল্যাটফর্মে ব্যবহৃত হচ্ছে। মাইক্রোসফট টিমসে কথা বলতে ট্রান্সক্রিপশন সুবিধার জন্য
এটি সক্রিয় করা হয়েছে।
অন্যদিকে মিটিং আর্কাইভ, সাবটাইটেল তৈরি, পডকাস্ট ট্রান্সক্রিপশন করতেও এটি ব্যবহৃত হয়। ভয়েস ওয়ান মাত্র এক সেকেন্ডে ৬০ সেকেন্ডের অডিও তৈরি করতে সক্ষম।
বিশেষজ্ঞরা বলছেন, মাইক্রোসফটের এমন উদ্ভাবন সত্যিকার অর্থেই এআইর জগতে ওপেনএআই আর গুগলের মতো টেক সংস্থাকে দারুণ প্রতিযোগিতার মুখোমুখি করবে।
মনোয়ারুল হক/
