সামাজিক যোগাযোগ মাধ্যম, ব্যবসায়িক ওয়েবসাইট এবং অন্যান্য অনলাইন প্রতিষ্ঠানের সামনে থাকা সবচেয়ে বড় চ্যালেঞ্জগুলির একটি হলো হয়রানি এবং ট্রলিং। অনলাইন প্লাটফর্মের ব্যবহারকারীরা প্রতি মুহূর্তেই প্রচুর পরিমাণ কনটেন্ট তৈরি করছেন। এর ফলে কোনটি গ্রহণযোগ্য এবং কোনটি নয়, তা বাছাই করতে হিমশিম খাচ্ছে কর্তৃপক্ষ।
এই দ্বিধাদ্বন্দ্বের মূল কারণগুলির মধ্যে একটি হলো, প্রচলিত পদ্ধতিতে অগ্রহণযোগ্য কনটেন্ট দ্রুত শনাক্ত করার জন্য যেই প্রযুক্তি প্রয়োজন, তার অভাব রয়েছে। তাছাড়া বিদ্যমান ব্যবস্থায় কনটেন্ট ফিল্টারিং করতে সময়ও অনেক বেশি লাগে।
ইন্টারনেট ব্যবহারকারীদের অনেকে অনাকাঙ্ক্ষিত এবং আক্রমণাত্মক প্রতিক্রিয়া থেকে বাঁচতে সোশ্যাল নেটওয়ার্কিং সাইট ব্যবহার বাদ দিচ্ছেন। বিষয়টি নিয়ন্ত্রণে রাখার জন্যে কিছু ওয়েবসাইট কমেন্ট অপশন মডারেশন করছে বা ডিজেবল করে রাখছে। তবে এর ফলে গ্রাহকদের অনলাইন কমিউনিটি ভিত্তিক ব্যবসায়িক মডেলগুলি যোগাযোগ এবং নিজেদের ব্র্যান্ডের প্রচারের সুযোগ হারাচ্ছে। মেশিন লার্নিং অ্যালগরিদমকে আরো উন্নত করার মাধ্যমেই কনটেন্ট ফিল্টারিংয়ের এই চ্যালেঞ্জগুলির সমাধান সম্ভব।
মেশিন লার্নিং ভিত্তিক কনটেন্ট ফিল্টারিং যেভাবে কাজ করে-
কেন মেশিন লার্নিংয়ের হাতেই এ সমস্যার সমাধানের চাবিকাঠি, তা বোঝার জন্য কনটেন্ট ফিল্টারিং কীভাবে কাজ করে, তা আগে বুঝতে হবে। মূলত কৃত্রিম বুদ্ধিমত্তা (এআই) ভিত্তিক সিস্টেমগুলিকে মানুষের মস্তিষ্কের মতোই ডেটা থেকে শেখা এবং প্রসেস করার জন্য প্রশিক্ষণ দেয়া হয়। মানুষের মস্তিষ্কের কাজের প্রক্রিয়া নকল করে তারা টেক্সট, ছবি এবং শব্দ আকারে প্রাপ্ত তথ্য থেকে পদক্ষেপ নেয়ার জন্যে কারণ খুঁজে বের করে এবং সেই অনুসারে প্রতিক্রিয়া জানায়।
এআই ভিত্তিক সিস্টেমগুলি সম্ভাব্য অগ্রহণযোগ্য কনটেন্ট খুঁজে বের করে সেসব শনাক্ত করার জন্য চিত্রের পাশাপাশি টেক্সট স্ক্যান করতে সক্ষম। এই পদ্ধতিতে গ্রহণযোগ্য এবং অগ্রহণযোগ্য, উভয় ধরনের কনটেন্ট-এর বাস্তব উদাহরণ তাদের সামনে তুলে ধরা হয়। এই প্রক্রিয়ার মাধ্যমে কম্পিউটারাইজড সিস্টেমকে সাধারণ কৌতুক এবং প্রকৃত হয়রানিমূলক কনটেন্টের মধ্যে পার্থক্য করতে সক্ষম করে তোলা হয়।
এটা করার জন্যে এই জাতীয় সিস্টেমের প্রচুর পরিমাণে ডেটার প্রয়োজন হয়। এসব ডেটা থেকে ব্যবহৃত শব্দের পাশাপাশি টেক্সট-এর পরিমাণ এবং অন্যান্য বিষয়ের ওপর ভিত্তি করে আক্রমণাত্মক কনটেন্ট শনাক্ত করে ফিল্টার করতে পারে কম্পিউটারাইজড সিস্টেম।
এ ধরনের সিস্টেমে যত বেশি পরিমাণ ডেটা দেয়া হয়, তত ভালো পারফরমেন্স সম্ভব হয়। তবে কনটেন্ট ফিল্টারিং-এর ক্ষেত্রে সফটওয়্যারের ডেভেলপাররাই সিদ্ধান্ত নিতে পারেন যে, কীভাবে ট্রলিং বা আক্রমণাত্মক কনটেন্ট ম্যানেজ করা হবে। আর অগ্রহণযোগ্য কনটেন্ট শনাক্ত করে চিহ্নিত করার পরে মডারেটররা পর্যালোচনা করে সেগুলি রাখা হবে কিনা, তা নির্ধারণ করতে পারেন। আবার, এই সিস্টেমে একজন মন্তব্যকারীকে তার মন্তব্য পোস্ট করার আগেও সেই মন্তব্যের সম্ভাব্য নেতিবাচক দিকগুলি দেখানো যেতে পারে। ফলে মন্তব্যকারী তার মন্তব্যটি ভিন্নভাবে করতে পারেন।
যাই হোক, এ ধরনের যেকোনো পদক্ষেপ নেয়ার আগে সিস্টেমে স্বয়ংক্রিয়ভাবে সন্দেহজনক কনটেন্ট ব্লক করা যায়। এতে করে যেমন সম্ভাব্য ক্ষতি প্রতিরোধ করা যায়, তেমন টার্গেটেড ভিকটিমরা নেতিবাচক কন্টেন্ট এড়িয়ে চলতে পারে।
কন্টেন্ট ফিল্টারিং প্রযুক্তির সুবিধা-
মেশিন লার্নিংয়ের ওপর ভিত্তি করে কন্টেন্ট ফিল্টারিং প্রযুক্তি প্রচলিত মডেলের তুলনায় বাড়তি কিছু সুবিধা দেয়। সংক্ষেপে সেগুলি জেনে নেয়া যাক এবার।
প্রচুর কনটেন্ট বা মন্তব্যের চাপ সহ্য করার সক্ষমতা-
এই সিস্টেমের সবচেয়ে বড় সুবিধাগুলির মধ্যে একটি হলো, এটি তাৎক্ষণিকভাবে অসংখ্য মন্তব্য পর্যবেক্ষণ করতে সক্ষম, যা মানুষের পক্ষে সম্ভব নয়। অর্থাৎ এতে কম খরচে দ্রুত মডারেশন করার সক্ষমতা তৈরি হয়।
সেন্সরশিপ সমস্যার সমাধান-
স্বয়ংক্রিয় মডেল ব্যবহারের মাধ্যমে একটি ওয়েবসাইট ক্রমাগত ব্যবহারকারীদের মন্তব্য বা আলাপ থেকে সুবিধা পেতে পারে। কারণ এটি কার্যকরভাবে ইউজারদের মধ্যে আলাপ বা কথোপকথন ম্যানেজ করতে পারে। এতে যেমন সেন্সরশিপের নেতিবাচক প্রভাব পড়ে না, তেমনি অনেক সময় মন্তব্য করারই কোনো সুযোগ রাখা হয় না।
ক্রমাগত উন্নতি করার সক্ষমতা-
মানুষের মতো মেশিন লার্নিং সিস্টেমও যে পরিমাণ ডেটা পায়, তার ওপর ভিত্তি করে ক্রমাগত উন্নতি করতে থাকে। সময়ের সাথে সাথে নির্ভুলতার মাত্রা বৃদ্ধি পায় এবং অগ্রহণযোগ্য টেক্সট এবং কনটেন্ট সরানোর ক্ষেত্রে আরো দক্ষ হয়ে ওঠে সিস্টেম।
প্রেডিক্টিভ বনাম রিয়্যাক্টিভ পদ্ধতি-
স্বয়ংক্রিয় ব্যবস্থার আরেকটি বড় সুবিধা হলো রিয়্যাক্টিভ বা প্রতিক্রিয়ামূলক পদ্ধতির পরিবর্তে অনুমানমূলক বা প্রেডিক্টিভ পদ্ধতি কাজে লাগানোর সক্ষমতা। প্রচলিত কনটেন্ট ফিল্টারিং সিস্টেম প্রায়ই প্রতিক্রিয়ামূলক হয়। অর্থাৎ, প্রচলিত ব্যবস্থায় ক্ষতি হয়ে যাওয়ার পরে পদক্ষেপ নেয়া হয়। কিন্তু মেশিন লার্নিং মডেলে যথাযথ প্রশিক্ষণ দেয়ার ফলে বাস্তবে ঘটার আগেই সম্ভাব্য খারাপ পরিস্থিতি অনুমান করা যায়। আর তা করতে গিয়েই নিউরাল নেটওয়ার্কগুলি যেসব আলাপ নিয়ন্ত্রণের বাইরে চলে যাচ্ছে, সেখান থেকে ডেটা সংগ্রহ করে।
মেশিন লার্নিং অ্যালগরিদম যেকোনো কনটেন্ট-এর বিষয়বস্তু ফিল্টার করার একটি কার্যকর এবং টেকসই সমাধান দিতে পারে। ফলে যেকোনো প্ল্যাটফর্মেই অনলাইন ট্রলের বিরুদ্ধে কার্যকর ব্যবস্থা নেয়া যেতে পারে।