loading...

azaval

بازدید : 249
يکشنبه 11 خرداد 1399 زمان : 10:59

دو محقق در دانشگاه انرژی شانگهای اخیراً مدلهای جدید شبکه عصبی را برای تشخیص چهره (FER) در طبیعت تهیه و ارزیابی کرده اند. مطالعه آنها ، که در مجله Neurocomputing Elsevier منتشر شده است ، سه مدل از شبکه های عصبی کانونشن (CNN) را ارائه می دهد: یک Light-CNN ، یک CNN دو شاخه و یک CNN از قبل آموزش دیده.


Qian Yongsheng یکی از محققانی که این تحقیق را انجام داده است ، گفت: به دلیل عدم اطلاع رسانی در مورد چهره های غیر جلو ، FER در طبیعت نقطه دشواری در بینایی کامپیوتر است. "روشهای تشخیص چهره طبیعی موجود بر اساس شبکه های عصبی کانونشنال عمیق (CNNs) چندین مشکل از جمله مناسب بودن ، پیچیدگی محاسباتی بالا ، ویژگی های منفرد و نمونه های محدود را ایجاد می کند."

اگرچه بسیاری از محققان رویکردهای CNN را برای FER ایجاد کرده اند ، اما تاکنون ، تعداد کمی از آنها سعی کرده اند تعیین کنند که کدام نوع شبکه برای این کار خاص مناسب است. با آگاهی از این شکاف در ادبیات ، یونگ شنگ و همکارش Shao Jie سه CNN مختلف برای FER ایجاد کردند و یک سری ارزیابی ها را برای شناسایی نقاط قوت و ضعف آنها انجام دادند.

Yongsheng گفت: "مدل اول ما CNN کم عمق است که ماژول جداشده از عمق را با ماژول شبکه باقیمانده معرفی می کند و پارامترهای شبکه را با تغییر روش پیچش کاهش می دهد." "دومین CNN دو شاخه ای است ، که ترکیبی از ویژگی های جهانی و ویژگی های بافت محلی ، تلاش برای به دست آوردن ویژگی های غنی تر و جبران عدم تغییر چرخش از نتیجه گیری است. سومین CNN از قبل آموزش دیده از وزنه های آموزش دیده در همان پایگاه داده بزرگ توزیع شده استفاده می کند. برای آموزش مجدد در پایگاه داده کوچک خود ، کاهش زمان آموزش و بهبود میزان شناخت. "

چارچوب CNN دو شاخه. اعتبار: جی و یونگشنگ.
محققان ارزیابی های گسترده ای از مدل های CNN خود را بر روی سه مجموعه داده که معمولاً برای FER استفاده می شوند ، انجام دادند: مجموعه داده های عمومی CK + ، چند دیدگاه BU-3DEF و FER2013. اگرچه سه مدل CNN اختلاف نظر را در عملکرد نشان دادند ، اما همه آنها به نتایج امیدوارکننده دست یافتند ، و از چندین رویکرد پیشرفته برای FER بهتر بودند.

یونگشنگ توضیح داد: در حال حاضر از سه مدل CNN جداگانه استفاده می شود. وی ادامه داد: شبکه کم عمق برای سخت افزارهای تعبیه شده مناسب تر است. CNN از قبل آموزش دیده می تواند به نتایج بهتری دست یابد اما به وزنهای از قبل آموزش دیده نیاز دارد. شبکه دو شاخه چندان کارآمد نیست .البته می توان سعی کرد از سه مدل با یکدیگر."

محققان در ارزیابی های پمپ وکیوم خود مشاهده کردند که با ترکیب ماژول شبکه باقیمانده و ماژول قابل تفکیک عمق ، همانطور که برای اولین مدل CNN خود انجام دادند ، می توان پارامترهای شبکه را کاهش داد. این در نهایت می تواند برخی از کاستی های سخت افزار محاسباتی را برطرف کند. علاوه بر این، آنها دریافتند که از قبل آموزش دیده سی ان ان مدل یک پایگاه داده بزرگ به پایگاه داده خود را منتقل شود و از می تواند با نمونه های محدود آموزش داده می شود.

چارچوب CNN از پیش آماده شده. اعتبار: جی و یونگشنگ.
سه CNN برای FER که توسط Yongsheng و Jie ارائه شده اند می توانند کاربردهای بیشماری داشته باشند ، برای مثال ، به ساخت روبات هایی کمک می کند که می توانند بیان صورت انسانهایی را که با آنها در تعامل هستند شناسایی کنند. محققان اکنون قصد دارند تعدیل های بیشتری را برای مدل های خود انجام دهند تا بیشتر عملکرد آنها بهبود یابد.



یونگشنگ گفت: "در کار آینده ما ، ما سعی خواهیم کرد ویژگی های مختلف دستی سنتی را برای پیوستن به CNN دو شاخه و تغییر حالت فیوژن اضافه کنیم." "ما همچنین از پارامترهای شبکه آموزش پایگاه داده متقاطع برای به دست آوردن قابلیت های تعمیم بهتر و اتخاذ یک روش یادگیری انتقال موثر عمیق تر استفاده خواهیم کرد."

دو محقق در دانشگاه انرژی شانگهای اخیراً مدلهای جدید شبکه عصبی را برای تشخیص چهره (FER) در طبیعت تهیه و ارزیابی کرده اند. مطالعه آنها ، که در مجله Neurocomputing Elsevier منتشر شده است ، سه مدل از شبکه های عصبی کانونشن (CNN) را ارائه می دهد: یک Light-CNN ، یک CNN دو شاخه و یک CNN از قبل آموزش دیده.


Qian Yongsheng یکی از محققانی که این تحقیق را انجام داده است ، گفت: به دلیل عدم اطلاع رسانی در مورد چهره های غیر جلو ، FER در طبیعت نقطه دشواری در بینایی کامپیوتر است. "روشهای تشخیص چهره طبیعی موجود بر اساس شبکه های عصبی کانونشنال عمیق (CNNs) چندین مشکل از جمله مناسب بودن ، پیچیدگی محاسباتی بالا ، ویژگی های منفرد و نمونه های محدود را ایجاد می کند."

اگرچه بسیاری از محققان رویکردهای CNN را برای FER ایجاد کرده اند ، اما تاکنون ، تعداد کمی از آنها سعی کرده اند تعیین کنند که کدام نوع شبکه برای این کار خاص مناسب است. با آگاهی از این شکاف در ادبیات ، یونگ شنگ و همکارش Shao Jie سه CNN مختلف برای FER ایجاد کردند و یک سری ارزیابی ها را برای شناسایی نقاط قوت و ضعف آنها انجام دادند.

Yongsheng گفت: "مدل اول ما CNN کم عمق است که ماژول جداشده از عمق را با ماژول شبکه باقیمانده معرفی می کند و پارامترهای شبکه را با تغییر روش پیچش کاهش می دهد." "دومین CNN دو شاخه ای است ، که ترکیبی از ویژگی های جهانی و ویژگی های بافت محلی ، تلاش برای به دست آوردن ویژگی های غنی تر و جبران عدم تغییر چرخش از نتیجه گیری است. سومین CNN از قبل آموزش دیده از وزنه های آموزش دیده در همان پایگاه داده بزرگ توزیع شده استفاده می کند. برای آموزش مجدد در پایگاه داده کوچک خود ، کاهش زمان آموزش و بهبود میزان شناخت. "

چارچوب CNN دو شاخه. اعتبار: جی و یونگشنگ.
محققان ارزیابی های گسترده ای از مدل های CNN خود را بر روی سه مجموعه داده که معمولاً برای FER استفاده می شوند ، انجام دادند: مجموعه داده های عمومی CK + ، چند دیدگاه BU-3DEF و FER2013. اگرچه سه مدل CNN اختلاف نظر را در عملکرد نشان دادند ، اما همه آنها به نتایج امیدوارکننده دست یافتند ، و از چندین رویکرد پیشرفته برای FER بهتر بودند.

یونگشنگ توضیح داد: در حال حاضر از سه مدل CNN جداگانه استفاده می شود. وی ادامه داد: شبکه کم عمق برای سخت افزارهای تعبیه شده مناسب تر است. CNN از قبل آموزش دیده می تواند به نتایج بهتری دست یابد اما به وزنهای از قبل آموزش دیده نیاز دارد. شبکه دو شاخه چندان کارآمد نیست .البته می توان سعی کرد از سه مدل با یکدیگر."

محققان در ارزیابی های پمپ وکیوم خود مشاهده کردند که با ترکیب ماژول شبکه باقیمانده و ماژول قابل تفکیک عمق ، همانطور که برای اولین مدل CNN خود انجام دادند ، می توان پارامترهای شبکه را کاهش داد. این در نهایت می تواند برخی از کاستی های سخت افزار محاسباتی را برطرف کند. علاوه بر این، آنها دریافتند که از قبل آموزش دیده سی ان ان مدل یک پایگاه داده بزرگ به پایگاه داده خود را منتقل شود و از می تواند با نمونه های محدود آموزش داده می شود.

چارچوب CNN از پیش آماده شده. اعتبار: جی و یونگشنگ.
سه CNN برای FER که توسط Yongsheng و Jie ارائه شده اند می توانند کاربردهای بیشماری داشته باشند ، برای مثال ، به ساخت روبات هایی کمک می کند که می توانند بیان صورت انسانهایی را که با آنها در تعامل هستند شناسایی کنند. محققان اکنون قصد دارند تعدیل های بیشتری را برای مدل های خود انجام دهند تا بیشتر عملکرد آنها بهبود یابد.



یونگشنگ گفت: "در کار آینده ما ، ما سعی خواهیم کرد ویژگی های مختلف دستی سنتی را برای پیوستن به CNN دو شاخه و تغییر حالت فیوژن اضافه کنیم." "ما همچنین از پارامترهای شبکه آموزش پایگاه داده متقاطع برای به دست آوردن قابلیت های تعمیم بهتر و اتخاذ یک روش یادگیری انتقال موثر عمیق تر استفاده خواهیم کرد."

نظرات این مطلب

تعداد صفحات : -1

درباره ما
موضوعات
لینک دوستان
آمار سایت
  • کل مطالب : 43
  • کل نظرات : 0
  • افراد آنلاین : 1
  • تعداد اعضا : 0
  • بازدید امروز : 7
  • بازدید کننده امروز : 1
  • باردید دیروز : 15
  • بازدید کننده دیروز : 0
  • گوگل امروز : 0
  • گوگل دیروز : 0
  • بازدید هفته : 24
  • بازدید ماه : 28
  • بازدید سال : 37
  • بازدید کلی : 15769
  • <
    پیوندهای روزانه
    آرشیو
    اطلاعات کاربری
    نام کاربری :
    رمز عبور :
  • فراموشی رمز عبور؟
  • خبر نامه


    معرفی وبلاگ به یک دوست


    ایمیل شما :

    ایمیل دوست شما :



    کدهای اختصاصی