مقطع کارشناسی ارشد : پژوهش های انجام شده با موضوع مطالعه QSAR بر … – منابع مورد نیاز برای مقاله و پایان نامه : دانلود پژوهش های پیشین |
![]() |
- randic moiecular profiles (41) 12. Geometrical descriptors (74)
- RDF descriptors (150) 14. 3D-MoRSE descriptors (160)
- WHIM descriptors (99) 16. GETAWAY descriptors (197)
- Functional groups counts (121) 18. Atom-centered fragments (120)
- Charge descriptors (14) 20. Molecular Properties (29)
- ۲D binary fingerprints (780) 22. 2D frequency fingerprints (780)
۲-۱-۳- ساختن ماتریس و غربالگری توصیفگرها برای مشتقات
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
با اضافه کردن توصیفگرها برای ۴۰ ساختار از مشتقات مورد نظر در مرحله قبل و با بهره گرفتن از نرم افزار اس پی اس اس با (version 17.0)به یک ماتریس ۱۴۹۷×۴۰ دست پیدا می کنیم، حال باید از تعداد توصیفگرها کاست، بدین صورت که باید ماتریس را از سه صافی پی در پی عبور داد تا بدین طریق به توصیفگرهای مناسب برای مرحله بعد محاسبات دست پیدا نمود، که صافی های ذکر شده به شرح زیرمی باشند:
- با بهره گرفتن از نرم افزار اس پی اس اس و انجام محاسبات فراوانی[۸۱]برای ماتریس مورد نظر توصیفگرهایی که فراوانی ۷۵% به بالا داشتند حذف گردیدند که با این محاسبات توصیفگرهای تکراری و نامناسب برای مشتقات حذف می شوند و ماتریس به صورت ۱۳۹۶×۴۰ تبدیل می شود.
نیمه حداکثر غلظت مهاری[۸۲] (۵۰IC) اندازه گیری اثر یک ترکیب در مهار عملکرد بیولوژیکی و یا بیوشیمیایی است، این اندازه گیری کمی است و نشان می دهد که تا چه حد از یک داروی خاص و یا مواد دیگر (مهار کننده) مورد نیاز است. ۵۰IC یعنی مهار یک فرایند بیولوژیکی (و یا جزئی از یک فرایند، یعنی یک آنزیم، سلول، گیرنده، همراه و یا میکرو ارگانیسم) نصف شده است، به عبارت دیگر نصف حداکثر غلظت مهار کننده از ماده است و معمولا به عنوان معیاری از قدرت آنتاگونیست دارو در تحقیقات دارویی استفاده می شود. گاهی اوقات برای وارد کردن ۵۰IC به سیستم، آن را به مقیاس ۵۰pIC (یا (۵۰IC/1)log)، تبدیل می کنند. با توجه به تعریف FDA، ۵۰IC نشان دهنده غلظت دارویی مورد نیاز برای مهار ۵۰ درصدی در شرایط آزمایشگاهی است ]۴۳[.
- در این مرحله با اضافه کردن هدف به صورت (۵۰IC /1)log به ماتریس ایجاد شده در مرحله اول، ماتریس به صورت ۱۳۹۷×۴۲ تبدیل می شود. این محاسبات همبستگی[۸۳]توصیفگرهای انتخاب شده را با هدف نشان می دهند. هر ماتریس با توجه به این ویژگی با هدف به صورت ۰٫۳ به بالا و ۰٫۴ به بالا تقسیم می شود که به ترتیب ماتریس به صورت ۸۳۹×۴۰، ۴۷۱×۴۰، بدست می آید. ماتریس های فوق برای مرحله بعد آماده می باشند .
- در این مرحله همبستگی توصیفگرها با یکدیگر مورد بررسی قرار می گیرد و توصیفگرهایی که همبستگی کمتری دارند حذف می گردند، این محاسبات توسط برنامه [۸۴]MATLAB با (version 7.1) انجام می شود. حال ماتریس های بدست آمده در این بخش، برای انجام محاسبات GA و بقیه روش های پیشرفته وترکیبی آماری آماده می شوند. همچنین انجام مکرر این محاسبات برای هر ماتریس نمودار فراوانی توصیفگرهای انتخاب شده نسبت به لایه های مختلف را بدست می دهد.
۲-۱-۴- محاسبات GA
ابتدا به طور جداگانه برای هر ماتریس یک محاسبه اولیه انجام می شود و سپس GAرا با نرم افزار MATLAB و بر اساس ویژگی های خاصی انجام می دهیم که در نهایت خروجی آن به صورت۰ و ۱ بوده و نمودارهایی برای هر ماتریس حاصل می شود که شامل موارد زیر است:
- Best Fitness 6. Selection Function
- Expectation 7. The Average Distance Between Individuals
- Fitness Individual 8. The Score Histogram
- Best Individual 9. Stopping Criteria
- The Mean Scores Each Generation
ویژگی های خاصی که در GA مورد استفاده قرار می گیرد بدین صورت است که: نوع جمعیت به صورت رشته بیت[۸۵] و در قسمت انتخاب تابع از چرخ رولت[۸۶] استفاده می شود به گونه ای که برای هر توصیفگر عدد ۰ و ۱ را تعریف می نماید، که متناسب با خصوصیات هر بخش به شبیه سازی برای ماتریس می پردازد. در قسمت جهش، از یکنواختی[۸۷] که یک فرایند دو مرحله ایی است استفاده می شود. در مرحله اول بخشی از نوشته های بردار یک فرد که در آن احتمال ورود با سرعت وجود دارد برای الگوریتم ژنتیک انتخاب شده و در مرحله دوم جهش یا همان جایگزینی نوشته ها انجام می شود. در قسمت ترکیبات متقاطع، دونقطه[۸۸] انتخاب می شود که این دو نقطه دو عدد صحیح تصادفی m و n بین ۱ و تعداد متغیرهاست که GA های انتخاب شده برای اولین والدین تعدادش کمتر یا مساوی با m و در والدین دوم از m+1 تا n باید تعدادش از n بزرگتر باشد سپس این الگوریتم ها به نسل های بعد منتقل می شوند.
p1 =
p2 = [۱ ۲ ۳ ۴ ۵ ۶ ۷ ۸] crossover points (at random) = 3, 6 child =
شکل (۲-۱)
در نهایت GA به صورتی که حداکثر تکرار و با محدودیت زمانی و تناسب تنظیم شده است متوقف میشود.
۲-۱-۵- محاسبات GA-ANN
در این مرحله ۰ و ۱ های بدست آمده از مرحله قبل را برای هر توصیفگر در ماتریس های مختلف تعریف و بااستفاده از نرم افزار MATLAB محاسبات ANN را انجام می دهیم که در نهایت از خروجی این محاسبات [۸۹]RMSE بدست می آید، که به دو صورتRMSEtest و RMSEtrainمی باشد. بررسی اثر لایه ها در شبکه عصبی مصنوعی مهم می باشند به طوری که برای هر لایه و هر ماتریس RMSEجداگانه ایی حاصل می شود. لایه های بررسی شده در این آزمایش از ۲ تا ۱۱ بوده .
۲-۱-۶- محاسبات جک نایف
در این بخش با بهره گرفتن از نرم افرار MATLAB محاسبات جک نایف انجام می شود، بدین صورت است که مشابه مرحله قبل ابتدا ۰ و ۱ را برای هر توصیفگر تعریف می کنیم سپس با انجام محاسبات به صورت جداگانه برای هر لایه (۲ تا ۱۱)، خروجی حاصل می شود. خروجی بدست آمده، تنها تفاوتی که با مرحله قبل دارد این است که علاوه بر وجود RMSE ها گزینه دیگری به نام ۲R نیز درآن مشاهده می شود، همچنین باید ذکر شود که این محاسبات پیش بینی نسبت به هدف انجام می دهند و نشان می دهند که کدام ساختار با توجه به این محاسبات اختلاف کمتری دارند و مناسب تر می باشند.
۲-۱-۷- محاسبات GA –MLR
در روش گام به گام[۹۰] شما می توانید به نظم داده های وارد شده و یا گنجاندن سطوح حذف شده در تجزیه و تحلیل ها کنترل داشته باشید. در این محاسبات ابتدا توصیفگرهایی که در GAبرای آنها عدد ۰ بدست آمده را حذف کرده و به یک ماتریس کوچکتر با توصیفگرهای مناسب برای مشتقات کیواینولیزیدیل دست پیدا می کنیم، حال با بهره گرفتن از نرم افزار اس پی اس اس محاسباتMLR با روش گام به گام برای هر ماتریس و با هدف مختلف مورد بررسی قرار می گیرد. سرانجام بهترین توصیفگرها را از بین توصیفگرهای انتخاب شده معرفی می کند و پارامتر های چونR ، R-Squareو F را به همراه نمودارهایی برای ماتریسهای جداگانه معرفی می کند.
۲-۱-۸- تجزیه و تحلیل با روش هایPLS ، PCR[91] و MLR
در این بخش ماتریس های حاصل از مرحله دوم غربالگری را بدون آنکه GA بر روی آن انجام شود را با بهره گرفتن از نرم افزاز آن اسکرم بلر[۹۲] با (version 9.7) برای انجام محاسبات با روش های جداگانه PLS، PCR، MLR و RS آماده می کنیم که این محاسبات با هدف سنجیده و انجام می شود.
خروجی داده ها در این روش ها متفاوت می باشد به گونه ایی که:
- در دو روش PLS و PCR پارامترهایی چون شیب[۹۳]، همبستگی، [۹۴]R-Square، [۹۵]RMSEC، [۹۶]RMSEP و[۹۷] B0بدست می آید، همچنین نمودارهای برای تجزیه وتحلیل از این دو روش حاصل می شود.
- در روش MLR یک تفاوت جزئی با دو روش دیگر دارد و آن نبود پارامتر RMSEP درخروجی اش است. دراین روش نیز نمودار هایی بدست می آید.
- در روش MCR فقط نمودار هایی برای تجزیه و تحلیل بدست می آید.
۲-۱-۹- تجزیه و تحلیل با روش های GA-MCR،GA-PLS ،GA-PCR ، GA-MLR و GA-RS
در این بخش از ماتریس های حاصل از مرحله سوم غربالگری که GAنیز برای آنها انجام شده استفاده میشود و سپس با بهره گرفتن از نرم افزار آن اسکرم بلر محاسبات و تجزیه و تحلیل را برای هر ماتریس، با هدف مختلف انجام می دهیم، پارامترهای بدست آمده در این بخش مشابه خروجی مرحله قبل است. این روش ها به علت اینکه دو روش به طور پی در پی در تجزیه و تحلیل بکار برده می شود به روش های ترکیبی معروف شده اند، که شامل روش های GA-MCR، GA-PLS، GA-PCR و GA-MLR می باشند.
۲-۱-۱۰- پیش بینی ساختار
در این مرحله با بهره گرفتن از نرم افزار آن اسکرم بلر و روش های PLS، PCR، MLR، GA-PLS، GA-PCR و GA-MLR بر روی ماتریس های ایجاد شده محاسباتی انجام می شود که در نهایت پیش بینی و انحراف[۹۸] نسبت به هدف برای مشتقات مورد نظر حاصل می شود.
بخش دوم
بحث و نتیجه گیری
۲-۲- بحث و نتیجه گیری
فرم در حال بارگذاری ...
[دوشنبه 1401-04-13] [ 06:10:00 ب.ظ ]
|