طراحی مسیر مأموریت ملاقات مداری صفحه‌ای فضاپیمای تراست پایین با استفاده از روش یادگیری تقویتی
کد مقاله : 1254-AERO2024
نویسندگان
علی الله بخشی هفشجانی *1، مجید بختیاری2
1دانشگاه علم و صنعت ایران
2عضو هیئت علمی دانشگاه علم و صنعت ایران
چکیده مقاله
پس از ورود به سامانه در این پژوهش به بررسی یک روش نوین برای طراحی مسیر فضاپیما به صورت صفحه‌ای می‌پردازد. .در این مسئله، فضاپیمای پیرو که از نوع تراست پایین است، به فضاپیمای هدف نزدیک می‌شود تا در فاصله‌ی مناسب برای مأموریت اتصال آماده شود. با استفاده از روش یادگیری تقویتی، مأموریت ملاقات مداری شبیه سازی شده است و توانایی این روش برای حل مسئله ملاقات مداری بررسی گردید. در این پژوهش نشان داده شد که روش یادگیری تقویتی به خوبی توانست این ماموریت را به انجام رساند که در این روش، از یک الگوریتم یادگیری تقویتی مبتنی بر گرادیان‌های بهینه‌سازی سیاست تقریبی استفاده شده‌است تا مسیر فضاپیمای تراست پایین بهینه شود. این الگوریتم شامل دو شبکه عصبی بازیگر و منتقد می‌باشد. بازیگر با توجه به وضعیت فعلی فضاپیما، زاویه‌ تراست را تنظیم می‌کند تا به نقطه‌ای مشخص در مدار فضاپیمای هدف در مدت زمان بهینه یا نزدیک به بهینه برسد. شبکه منتقد، عملکرد بازیگر را ارزیابی می‌کند. در فرآیند آموزش، این الگوریتم در محیط شبیه‌سازی‌شده، توانایی پیدا کرد تا مسیر مناسبی برای ملاقات با فضاپیمای هدف را بدون داشتن دانش قبلی از دینامیک محیط پیدا کند. همچنین تاثیر تعیین بازه مشخص برای تراست در این مسئله مورد ارزیابی قرار گرفته است.
کلیدواژه ها
ملاقات مداری، یادگیری تقویتی، رانشگر تراست پایین‌، بهینه‌سازی سیاست تقریبی، شبکه عصبی بازیگر – منتقد
وضعیت: پذیرفته شده برای ارائه شفاهی