راهکار تازه برای تولید داده های مصنوعی و آموزش یک مدل یادگیری ماشین

اچ پی: محققان دانشگاه های تهران و قم روشی برای تولید داده های مصنوعی ارائه کرده اند که می تواند تحولی در یادگیری ماشین، امنیت سایبری و جرم شناسی دیجیتال بوجود آورد.

به گزارش اچ پی به نقل از دانشگاه تهران، در پژوهشی که به سرپرستی دکتر مهدی تیموری، دانشیار دانشکده سامانه های هوشمند دانشکدگان علوم و فناوری های میان رشته ای دانشگاه تهران و محقق هایی از دانشگاه قم انجام شده است، راه حل تازه ای برای تولید داده های مصنوعی و آموزش یک مدل یادگیری ماشین با استفاده از این داده ها پیشنهاد شده است.
دکتر مهدی تیموری، سرپرست این تیم تحقیقاتی درباره ی اهمیت این پژوهش اظهار داشت: «یکی از چالش های اساسی در کاربردهای عملی یادگیری ماشین، مسئله ی تعمیم پذیری است؛ یعنی این که یک مدل آموزش دیده چقدر می تواند در وضعیت و داده های متفاوت، از داده های آموزشی، عملکرد مطلوبی عرضه نماید. این مشکل خصوصاً در عرصه هایی مانند امنیت شبکه که داده های برچسب خورده کمیاب و اغلب محرمانه هستند، اهمیت بیشتری پیدا می کند. مطالعه اخیر برای پاسخ به همین چالش طراحی شده است.»
وی اضافه کرد: «در این پژوهش، با تمرکز بر پروتکلهای جغرافیایی مانند NMEA و KLV، روشی مبتنی بر مهندسی خاصیت ها و مدل سازی آماری-تحلیلی توزیع خاصیت ها معرفی و با استفاده از آن، مجموعه داده ای مصنوعی تولید شده است. سپس، یک مدل یادگیری ماشین تنها با همین داده های مصنوعی آموزش داده شده و عملکرد آن با داده های واقعی مورد ارزیابی قرار گرفته است. نتایج نشان داده است که مدل آموزش دیده، حتی زمانی که داده ها دارای نویز هستند، دقت بالایی در شناسایی پروتکل ها دارد.»
عضو هیات علمی دانشکدگان علوم و تکنولوژی های جدید دانشگاه تهران اظهار داشت: «از خاصیت های برجسته ی این پژوهش، قابلیت تعمیم روش پیشنهادی به سایر حوزه های مبتنی بر یادگیری ماشین است. بااینکه مطالعه ی حاضر بطور دقیق تر بر شناسایی پروتکلهای جغرافیایی تمرکز دارد، اما رویکرد ارائه شده در تولید داده های مصنوعی می تواند در عرصه هایی مانند تشخیص نفوذ، تحلیل رفتار کاربران، تصویربرداری پزشکی، یا حتی در صنایع هوشمند مانند کشاورزی، لجستیک و حمل و نقل نیز کاربرد داشته باشد؛ خصوصاً در مواردی که داده های واقعی به علت محدودیت های حریم خصوصی، امنیتی یا هزینه بر بودن، در دسترس نیستند.»
وی با اشاره به اینکه یکی از مهم ترین دستاوردهای این پژوهش، کاهش وابستگی به داده های واقعی برچسب خورده است، عنوان کرد: «این مزیت نه فقط از نظر صرفه جویی در منابع و زمان اهمیت دارد، بلکه از نظر یافتن چاره ای عملی برای حفظ حریم خصوصی کاربران و شناسایی پروتکلهای نادر یا جدید مهمست.»
یافته های این پژوهش بتازگی از طرف الزویر در نشریه Forensic Science International: Digital Investigation انتشار یافته و بوسیله این لینک در دسترس می باشد.

منبع: newhp.ir

1404/02/14

10:26:55

5.0 / 5

614

تگهای خبر: تكنولوژی , تولید , دیجیتال , سایبر

این مطلب را می پسندید؟

(1)

(0)

تازه ترین مطالب مرتبط

نظرات بینندگان در مورد این مطلب

نظر شما در مورد این مطلب

نام:

ایمیل:

نظر:

سوال:

= ۳ بعلاوه ۱