طراحی مسیر مأموریت ملاقات مداری صفحهای فضاپیمای تراست پایین با استفاده از روش یادگیری تقویتی |
کد مقاله : 1254-AERO2024 |
نویسندگان |
علی الله بخشی هفشجانی *1، مجید بختیاری2 1دانشگاه علم و صنعت ایران 2عضو هیئت علمی دانشگاه علم و صنعت ایران |
چکیده مقاله |
پس از ورود به سامانه در این پژوهش به بررسی یک روش نوین برای طراحی مسیر فضاپیما به صورت صفحهای میپردازد. .در این مسئله، فضاپیمای پیرو که از نوع تراست پایین است، به فضاپیمای هدف نزدیک میشود تا در فاصلهی مناسب برای مأموریت اتصال آماده شود. با استفاده از روش یادگیری تقویتی، مأموریت ملاقات مداری شبیه سازی شده است و توانایی این روش برای حل مسئله ملاقات مداری بررسی گردید. در این پژوهش نشان داده شد که روش یادگیری تقویتی به خوبی توانست این ماموریت را به انجام رساند که در این روش، از یک الگوریتم یادگیری تقویتی مبتنی بر گرادیانهای بهینهسازی سیاست تقریبی استفاده شدهاست تا مسیر فضاپیمای تراست پایین بهینه شود. این الگوریتم شامل دو شبکه عصبی بازیگر و منتقد میباشد. بازیگر با توجه به وضعیت فعلی فضاپیما، زاویه تراست را تنظیم میکند تا به نقطهای مشخص در مدار فضاپیمای هدف در مدت زمان بهینه یا نزدیک به بهینه برسد. شبکه منتقد، عملکرد بازیگر را ارزیابی میکند. در فرآیند آموزش، این الگوریتم در محیط شبیهسازیشده، توانایی پیدا کرد تا مسیر مناسبی برای ملاقات با فضاپیمای هدف را بدون داشتن دانش قبلی از دینامیک محیط پیدا کند. همچنین تاثیر تعیین بازه مشخص برای تراست در این مسئله مورد ارزیابی قرار گرفته است. |
کلیدواژه ها |
ملاقات مداری، یادگیری تقویتی، رانشگر تراست پایین، بهینهسازی سیاست تقریبی، شبکه عصبی بازیگر – منتقد |
وضعیت: پذیرفته شده برای ارائه شفاهی |