مؤتمر SIGGRAPH2020

٢٧ يوليو ٢٠٢٠
#تعلم_الآلة   #التعلم_العميق   

في هذه السلسلة نستعرض مختارات من بعض الابحاث المتميزة التي نشرت في مؤتمر #SIGGRAPH2020 - المؤتمر المتخصص بالأعمال الإبداعية في رسوم الحاسب

منذ بدايتها في عام 1974 كمجموعة صغيرة من المتخصصين في مجال لم يكن معروفًا من قبل، تطورت ACM SIGGRAPH لتصبح مجتمعًا دوليًا من الباحثين والفنانين والمطورين وصانعي الأفلام والعلماء والمهنيين في مجال الأعمال الذين يشاركون اهتمامًا برسومات الكمبيوتر والتقنيات التفاعلية.

البحث الأول DeepFaceDrawing والذي يستعرض ما يسمى sketch-to-image synthesis والذي يحول رسومات خط اليد الى صورة بشرية  عبر تعلم feature embeddings لأهم ملامح الوجه وبعد ذلك استخدام شبكات GAN لبناء الصورة البشرية. أحد أهم تطبيقات هذه التقنيات:  Face Morphing التي تدمج بين صورتين، وكذلك تقنيات  Face Copy-Paste. نعتقد كذلك في منظور أن هذه التطبيقات مفيدة لتحويل رسومات أوصاف المشتبه بهم في الجرائم إلى صورة واقعية. رابط الورقة

البحث الثاني RoboCut وهو عن روبوت "نحات" يقوم بالتقاط وتحريك بقاطع الفلين الحراري لنحت قطع الفلين بدقة عالية جدا وفقا للنموذج المعطى له.  يقدم البحث اطار حاسوبي لنمذجة حركة الروبوت وسلسلة حركات النحت التي تؤدي إلى خلق الشكل المطلوب عبر مسارات حركة خالية من التصادم. يندرج هذا البحث تحت مظلة نمذجة السطوح الفيزيائية. رابط الورقة

البحث الثالث One Shot 3D Photography الذي قدمه فريق بحثي من فيسبوك، فكرة البحث ببساطة أنها تعمل على تحويل الصورة العادية إلى صورة ثلاثية الأبعاد في ثواني (1,098 ملي ثانية بالتحديد) هذه الخاصية كانت متاحة في تطبيق فيسبوك أواخر عام ٢٠١٨. أضاف الفريق خوارزمية لتقدير عمق الصورة من صورة ثنائية الأبعاد بغرض تحويلها إلى صورة ثلاثية الأبعاد دون الحاجة إلى التقاط صور بمواصفات معينة بحيث يمكن استخدام التقنية على أي جهاز محمول. قام الباحثون بتدريب شبكة عصبية تلافيفية (CNN) على ملايين الصور ثلاثية الأبعاد المتاحة، هذا الأمر لم يتسنى لهم إلا عن طريق الاستفادة من تقنيات الحوسبة على الهاتف المحمول التي تم تطويرها بواسطة Facebook AI. رابط مقال صحفي عن البحث

البحث الأخير الذي عمل عليه باحثين من جامعة التشيك التقنية و سناب شات، يستخدم التعلم العميق ليتمكن الفنان من نقل النمط style من عدد قليل من الإطارات frames في الفيديو إلى الفيديو كامل. ميزة هذا البحث أنه لا يتطلب عملية تدريب مسبق طويلة ولا عدد كبير من بيانات التدريب. يستعرض الباحثون ثلاثة سيناريوهات ممكنة في الفيديو المرفق. المثير للدهشة في السيناريو الثاني أنه يمكن تعديل الفيديو أثناء البث. نتخيل في منظور أن هذه التقنية ستشكل ثوره في عالم البث التلفزيوني المباشر، هل سيتمكن المخرج من عمل تعديلات على مظهر المذيع في البث المباشر؟ رابط البحث

رابط لجميع الأبحاث المبهرة التي تم نشرها في هذا المؤتمر 

رابط لصفحة تحتوي على جميع المواد التي نشرت لجميع الأبحاث (أوراق علمية، برمجيات، فيديوهات)

منظور ٢٠٢٠ © جميع الحقوق محفوظة

‭‬تحتفظ‭ ‬منصة منظور ‬بحقوق‭ ‬ملكيتها‭ ‬للمواد‭ ‬المنشورة‭ ‬فيها،‭ ‬ويتطلب‭ ‬إعادة‭ ‬نشر‭ ‬أي‭ ‬مادة ‬إلكترونيًّا‭ ‬أو‭ ‬ورقيًّا‭ ‬الحصول‭ ‬على‭ ‬موافقة‭ ‬منظور ‬مع‭ ‬الإشارة‭ ‬إلى‭ ‬المصدر‭.‬