গ্রেপার শিখে ... পরীক্ষা এবং ত্রুটির মাধ্যমে

Dec 26, 2019

মানুষের হাত দ্বারা অনুপ্রাণিত, লার্নিংগ্রিপারের চারটি আঙুল রয়েছে। মেশিন লার্নিং সফটওয়্যার থেকে সহায়তায়, এই গ্রিপার একটি নিবন্ধ বাছাই এবং ওরিয়েন্টিংয়ের মতো জটিল ক্রিয়ায় দক্ষতা অর্জন করতে পারে। আঙুলের প্রাথমিক অবস্থানগুলি এবং পরিবেশের প্রতিক্রিয়া ফাংশনটি আগে থেকেই সংজ্ঞায়িত করা দরকার; গ্রিপার পরীক্ষা এবং ত্রুটির দ্বারা অন্যান্য সমস্ত গতির ক্রমগুলি শিখতে থাকে।

লিবারিংগ্রিপারের কাজটি যেমন চিত্রিত হয়েছে, লোগোটি শীর্ষে না আসা পর্যন্ত বলটি ঘুরিয়ে দেওয়া ছিল। শুরুতে গ্রিপার বল এলোমেলোভাবে সরল। বলের একটি অবস্থান সেন্সর গ্রিপারের "তালু" থেকে লোগোটি কতদূর ছিল তার প্রতিক্রিয়া জানিয়েছিল provided লার্নিংগ্রিপার একটি পয়েন্ট সিস্টেমের ভিত্তিতে একটি পুরষ্কার পেয়েছিল; পয়েন্টগুলি মেশিন লার্নিং সফ্টওয়্যারটিতে প্রক্রিয়া করা হয়। সময়ের সাথে সাথে, সফ্টওয়্যারটি একটি চলাচলের কৌশল তৈরি করেছিল এবং গ্রিপার একটি নির্দিষ্ট সময়ে কী পদক্ষেপ নেবে তা শিখেছে। এটি যথাসম্ভব ইতিবাচক প্রতিক্রিয়া গ্রহণের জন্য তার গতি পরিবর্তন করে এবং শেষ পর্যন্ত তার কার্যটির একটি নির্ভরযোগ্য সমাধান খুঁজে পায়। যদি একটি গ্রিপারের কৌশল অন্যটিতে স্থানান্তরিত হয়, তবে দ্বিতীয় গ্রিপার তার কৌশলটি আরও দক্ষতার সাথে শিখতে জ্ঞানের ভিত্তি হিসাবে ব্যবহার করে।

লার্নিংগ্রিপার প্রদর্শন করে যে ভবিষ্যতে সিস্টেমগুলি কীভাবে জটিল প্রোগ্রামিং ছাড়াই স্বায়ত্তশাসিত জটিল কাজগুলি সমাধান করতে সক্ষম হবে। লার্নিংগ্রিপের মতো স্ব-শিক্ষার সিস্টেমগুলি একটি উত্পাদন লাইনে ইনস্টল করা যেতে পারে এবং তারপরে তাদের আচরণকে স্বাধীনভাবে অনুকূলিতকরণের অনুমতি দেওয়া হয়েছিল