Reading Time: 3 minutes

২০২২ সালে এসে লিখে দেওয়া নির্দেশনা থেকে বর্তমানে মিডিয়া কনটেন্ট নির্মাণের এআই প্রযুক্তি ল্যাবরেটরির গন্ডি পেরিয়ে সাধারণ ব্যবহারকারীদের হাতে নাগালে এসেছে। লেনসা ফটো-ভিডিও এডিটিং অ্যাপ টানা কয়েক সপ্তাহ ধরে সামাজিক মাধ্যমে আলোচনায় আছে। এতে এআই নির্ভর ডিজিটাল পোর্ট্রেট তৈরির ফিচার যোগ হওয়ার পর পরই প্রশ্ন উঠেছে যে লেনসার এআই মানব শিল্পীদের শিল্পকর্ম চুরি করছে কি না। সমসায়ময়িক শিল্প শৈলির ধাঁচে ডিজিটাল পোর্ট্রেট নির্মাণের জন্য নিজের ১০ থেকে ২০টি ছবি আপলোড করতে হয় ব্যবহারকারীকে।

তবে, সে ক্ষেত্রে একটি নির্দিষ্ট মূল্যের ফী এর বিষয়টাও আসে। বিজ্ঞান ও প্রযুক্তিবিষয়ক সাইট সায়েন্সঅ্যালার্টের ভাষ্যে, কার্যত হালের ভিজুয়াল সংস্কৃতিতে ঔপনিবেশিক শক্তির মতো উপস্থিতি গড়ে নিয়েছে এআই, আর এর সবচেয়ে কৌশলী বাণিজ্যিক ব্যবহারটি করেছে লেনসা। সামাজিক মাধ্যমে ভিন্ন আঙ্গিকে নিজের উপস্থিতি জানান দিতে চান এমন ইনফ্লুয়েন্সারদের মধ্যে অ্যাপটি যেমন আলোড়ন তুলেছে, ঠিক তেমনি আলোড়ন সৃষ্টি হয়েছে ডিজিটাল শিল্পীদের মধ্যে।

বছরের শুরুতেই মিডজার্নি, ওপেনএআই এর ডাল-ই এবং স্টেবল ডিফিউশনের মতো এআইগুলো দৃশ্যপটে আসার পর থেকেই এ প্রযুক্তির মাধ্যমে ভিন্ন ভিন্ন শিল্পীর কাজের ধরন সহজে নকল করার সক্ষমতা নিয়ে চলছে তুমুল বিতর্ক। শিল্পীদের অনেকেই মনে করছেন তাদের বুদ্ধিবৃত্তিক সম্পদ এবং সৃজনশীলতার অপব্যবহার করছে এআই প্রযুক্তি। কিন্তু পশ্চিমা বাজারের কপিরাইট আইন বলছে ভিন্ন কথা। অস্ট্রেলিয়ার শিল্পী কিম লুটওয়াইলার ব্রিটিশ দৈনিক দ্যা গার্ডিয়ানকে বলেছেন, এআই তৈরি পোট্রেটে কেবল ভিন্ন ভিন্ন শিল্পীর আঁকার ধরন খুঁজে পাননি তিনি, বরং নিজের কাজের নকলও খুঁজে পেয়েছেন।

যে কারনে বেড়েছে লেনসার জনপ্রিয়তা

লেনসায় নিজের প্রয়োজন মতো নির্দিষ্ট কোনো ধাঁচের ছবি বানানোর সুযোগ নেই। কিন্তু এর বিপরীত দিক হচ্ছে, ব্যবহারকারী এতো বৈচিত্রময় ছবি পান যাতে চমকে যাওয়ার সুযোগই বেশি। এই ছবিগুলো অন্যান্য শিল্পীর শিল্পকর্ম থেকে সৃজনশীল ভাবনা ধার করলেও সরাসরি কোনো কিছু চুরি করে না। এমনকি অস্ট্রেলিয়ার কপিরাইট আইনেও স্পষ্ট বলা আছে। একক শিল্পকর্মের ওপর কপিরাইট থাকতে পারে, কিন্তু শিল্প শৈলির ওপর এবং ভাবনার ওপর কারও কপিরাইট হতে পারে না।

স্টেবল ডিফিউশনের মূল প্ল্যাটফর্মের সঙ্গে লেনসার পার্থক্য হচ্ছে, স্টেবল ডিফিউশন লিখে দেওয়া নির্দেশনার ভিত্তিতে ছবি বানালেও লেনসা ছবি বানায় ব্যবহারকারীর আপলোড করা ছবি বিশ্লেষণ করে। ‘টেক্সুয়াল ইনভার্সশন’ প্রক্রিয়াকে সহজ করতে পারা লেনসার সবচেয়ে বড় উদ্ভাবনী কাজগুলোর একটি ছিল বলে মন্তব্য করেছে সায়েন্স অ্যালার্ট। ব্যবহারকারীর ছবি নিয়ে স্টেবল ডিফিউশনের বিদ্যমান ডেটাবেইজে সরবরাহ করে লেনসা। এর মধ্যে ছবি থেকে ব্যবহারকারীর মুখের খুঁটিনাটি নানা বৈশিষ্ট কীভাবে চিহ্নিত করতে হবে, সেটাও স্টেবল ডিফউশনের ডিপ লার্নিং মডেলকে শিখিয়ে দেয় অ্যাপটি।

স্টেবল ডিফিউশনের মূল প্ল্যাটফর্মেও সরাসরি এ কাজটি করার সুযোগ আছে। তবে, তা বেশ জটিল প্রক্রিয়া।

বিজ্ঞাপন (কেন?)

লেনসা নিয়ে যে কারনে ক্ষুব্ধ শিল্পীগণ

আঁকার ধরন আর কৌশলগুলো যে এত সহজেই এআই নকল করতে পারছে, এ বিষয়গুলো নিয়েই খেপেছেন শিল্পীরা। লেনসার মতো প্রযুক্তি মূল ধারায় যতোই গ্রহণযোগ্যতা পাচ্ছে, ততোই তাদের অসহায়ত্বের সুযোগ নেওয়া হচ্ছে বলে ভাবছেন শিল্পীরা। এ পরিস্থিতিতে কপিরাইট আইনে বড় পরিবর্তনের দাবি উঠলেও তাতে অবাক হওয়ার কিছু থাকবে না। বিশেষ করে ছোট পরিসরে ডিজিটাল ইলাস্ট্রেশন বানিয়ে জীবিকা নির্বাহ করেন যে শিল্পীরা, তাদের জন্য ভবিষ্যৎ অনেক বেশি অনিশ্চিত বলে লিখেছে সায়েন্স অ্যালার্ট।

তবে এখানে খেয়াল রাখার বিষয় হচ্ছে, এআই শিল্পকর্ম তৈরি একেবারেই সহজ হলেও, নির্দিষ্ট কোনো ভাবনার দৃশ্যায়ন চাইলে সেখানেই বিপত্তি। এআইকে মূল বিষয় এবং পারিপার্শিক খুঁটিনাটি বাতলে দিলেও, ব্যবহারকারী ঠিক যা ভাবছেন, এআই যে ঠিক সেটাই বানিয়ে দেখাতে পারবে না, তা একশ ভাগ নিশ্চিত। তবে, দৃশ্যপটে এআই প্রযুক্তির কেবল অভিষেক হয়েছে। সামনের এক দশকে এক্ষেত্রে আরও অনেক পরিবর্তন আসবে। শিল্পের স্রষ্টা আর ভোক্তা উভয়ের জন্যই নতুন অনেক কিছু অপেক্ষা করছে সামনের দিনগুলোতে।

লেনসার কার্যক্রম চুরি না হলে সেটি আসলে কি?

লিখে দেওয়া নির্দশনা থেকে মিডিয়া কনটেন্ট নির্মাণ করে যে এআইগুলো, তার কার্যপ্রণালী খুবই জটিল। কিন্তু চেষ্টা করলে কম্পিউটার প্রুযুক্তিতে সিদ্ধহস্ত নন এমন মানুষকেও বোঝানো সম্ভব বিষয়টি। তবে, তার আগে লেনসার কার্যপ্রণালী বোঝা প্রয়োজন। লেনসা কার্যত স্টেবল ডিফিউশনের ডিপ লার্নিং মডেলের একটি সোজাসাপ্টা সংস্করণ। এক্ষেত্রে নির্দিষ্ট কোনো সূত্রের নাম, শিল্পকর্মের ধরন, সময়, এমনকি ওয়েবসাইটের নাম উল্লেখ করে দিলেও এআইয়ের কাজ অনেক সহজ হয়ে যায়।

নির্দেশনার কাছাকাছি ছবি বানিয়ে দেখাতে পারে এআই। তাই, বহুল পরিচিতি শিল্প শৈলি বা নির্দিষ্ট কোনো শিল্পীর সৃজনশীলতার ছাপ হরহামেশাই চলে আসে এআইয়ের তৈরি ছবিতে। স্টেবল ডিফিউশন নির্মাণের সময় এআইটিকে লাখ লাখ ছবি আর টেক্সট দিয়ে প্রশিক্ষণ দিয়েছিলেন এর নির্মাতারা। আর এভাবেই ছবি আর ক্যাপশনের মধ্যে অসংখ্য উপায়ে যোগসূত্র টানতে শিখেছিল এআইটি। এটাই স্টেবল ডিফিউশনের শিল্প জ্ঞানের আধার, যার সিংহভাগ একা একজন মানুষের বোধগম্য হওয়া সম্ভব নয়।

একজন শিল্পকলার ভক্ত দর্শক হয়ত ছবিতে মডার্নিজম এর চিহ্ন দেখবেন বা রঙের ধরন বা প্রকৃতি দেখে কোনো শিল্পীর শিল্পকর্মের সঙ্গে যোগসূত্র টানবেন, কিন্তু এআই কেবল এক-দুটি যোগসূত্র দেখে না। বরং এমন অসংখ্য যোগসূত্র দেখে। আর এর সব আসে জটিল গাণিতিক হিসাব থেকে যে হিসাবের সংখ্যাগুলো এসেছে অসংখ্য ছবি আর টেক্সট বিশ্লেষণ করে। এআই টেক্সট এবং ছবি দুটোই বিশ্লেষণ করে খুঁটিনাটি তথ্য সংগ্রহ করে বলেই অর্থবহ নির্দেশনার ভিত্তিতে অসংখ্যা সম্ভাব্য আউটপুট থেকে কয়েকটি নির্দিষ্ট ফলাফল বেছে নিয়ে মানুষকে দেখাতে পারে।

সাবস্ক্রাইব করুন The Penguins Club খবরপত্রিকায়

প্রতি শুক্রবার বিশেষ খবর এবং আলোচনায় অংশগ্রহন করতে আপনার ইমেইল দিন।


Tagged:
About the Author

বিগত প্রযুক্তি বিষয়ক লেখালেখি করছি - বাংলা লেখিকা

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.