پروژه متلب بهینه سازی و پیش بینی ساختار دوم پروتئین با الگوریتم کلونی زنبورعسل(ABC)

350,000 تومان

توضیحات

پروژه متلب بهینه سازی و پیش بینی ساختار دوم پروتئین با الگوریتم کلونی زنبورعسل(ABC)

 

دانلود مقاله مرجع

 

پیش بینی ساختار پروتئین:

پروتئین زنجیره‌ای متشکل از 20 نوع اسیدآمینه است که با پیوند پپتیدی به هم متصل شده‌اند، این زنجیره در فضای سه‌بعدی به‌گونه‌ای تا می‌خورد که پایین‌ترین سطح انرژی را دارد. تعیین ساختار دقیق پروتئین با روش‌های آزمایشگاهی به‌سادگی و در زمانی محدود امکان‌پذیر نیست؛ به‌هرحال، خود پیش‌بینی یک مسئله‌ی دشوار بهینه‌سازی دارد با هزاران درجه آزادی، و با تنوع انرژی بسیار پیچیده مرتبط است. ساختار پروتئین را توالی آن مشخص می‌کند؛ تاکنون درک تمام قوانینی که منجر به هدایت زنجیره پروتئین به سمت تاخوردگی نهایی آن می‌شوند میسر نبوده است. این مساله ارتباط تنگاتنگی با بسیاری از گرایشات علوم مختلف از جمله پزشکی، داروسازی و بیوتکنولوژی دارد، بنابراین روش‌های تقریبی فراوانی در حال شکل‌گیری و رشد هستند. در حال حاضر ابزارهای محاسباتی زیادی برای پیش‌گویی ساختار سه‌بعدی پروتئین وجوددارند که از سهم عمده‌ای در پیشرفت علوم‌زیستی برخوردارند. هریک از این ابزارها محدودیت های خاص خود را دارد و همین نکته است که کاربرد مدل ساخته‌شده با روش‌های مذکور را تعیین می‌کند.

پیش بینی ساختار پروتئین از اهمیت بالایی در شاخه ی بیوانفورماتیک برخوردار است. با توجه به کاربردهای متنوع آن در بیوتکنولوژی، امروزه توجه ویژه ای به این بخش می شود. منظور از پیش بینی ساختار پروتئین، تعیین ساختار سه بعدی آن می باشد، که از ساختار اول پروتئین پیش بینی انجام می گیرد. دلیل استفاده از روش های وابسته به کامپیوتر و الگوریتم وار این است که به طور متوسط سریع تر و ارزان تر از روش های آزمایشگاهی می باشند. مسئله پیش بینی ساختار پروتئین در زمره روش های چندجمله ای غيرقطی سخت قرار می گیرد، بنابراین در این پروژه برای حل این مسئله از الگوریتم بهینه سازی کلونی زنبورعسل(ABC) ارائه شده است.

پروتئین ها از مولکول های مهم زیستی به شمار می آیند و اکثر پردازش های زیستی را در موجود زنده اداره می­کنند. از جمله نقش های زیستی بسیار متنوعی که بر عهده دارند می توان به ترجمه اطلاعات و انتقال آنها، انتقال فرمان های مختلف دستگاه های بدن به یکدیگر (هورمون ها)، تسریع فعالیت های شیمیایی، انتقال و نگهداری مواد، و انجام کارهای مکانیکی (حرکت و تحمل بار) اشاره کرد. دامنه گسترش فعالیت های بالا، اهمیت زیستی این مولکول ها را نشان می دهد.

هر مولکول پروتئین، متشکل از رشته ای از آمینواسیدها است، و در محیط آبی، شکلی سه بعدی به خود می گیرد. به زنجیره خطی تشکیل شده از آمینواسیدها ساختار اولیه پروتئین گفته می شود. به بیانی دیگر ساختار اول، توالی آمینواسیدهای سازنده ی پروتئین است. هر زنجيره با یک ساختار سه بعدی مرتبط است که نحوه کار آن پروتئین به وسیله این ساختار مشخص می گردد. رابطه ساختار اولیه و ساختار سه بعدی پیچیدگی خاصی دارد که تاکنون این رابطه به خوبی تجزیه و تحلیل نشده است. طیف سنج مدور، بلورنگاری ، پرتو ایکس، طیف سنج مادون قرمز و طیف سنج مغناطیسی هسته ای روش های آزمایشگاهی معمول برای پیدا کردن ساختار دوم و سوم پروتئین با استفاده از ساختار اولیه می باشند. با وجود این مسئله، معایب و محدودیت های این روش ها غیر قابل اجتناب است، چرا که روش های آزمایشگاهی علاوه بر زمان بر بودن، هزینه های زیادی نیز در پی دارد. لذا برای از بین بردن فاصله بین ساختار اولیه و شکل سه بعدی پروتئین، از علوم کامپیوتر و الگوریتم های خاص و مرتبط با آن استفاده می شود.

پیش بینی ساختار پروتئین کاربردهای زیادی دارد، می تواند برای فهم اطلاعات بیوشیمی و عملکرد زیستی و در تشخیص ناحیه ای که پروتئین دستخوش تغییراتی شده است، استفاده شود، همچنین در مهندسی پروتئین، ارزیابی و طراحی دارو، مطالعات ایمنی شناسی، تولید سوخت های زیستی، بیوتکنولوژی و غیره نقش بسیار مهمی ایفا می کند. لذا ارائهی روشی که بتواند بهترین جواب را برای مسائل پیش بینی ساختار پروتئین در کمترین زمان ممکن به ما بدهد، مهم ترین چالش محققان در این حوزه می باشد. منظور از حل مسأله پیش بینی ساختار پروتئین به دست آوردن یک ساختار سه بعدی بهینه برای این پروتئین می باشد، که منجر به انتخاب بهترین و کم انرژی ترین ساختار میان ساختارهای تولید شده می گردد. به بیانی دیگر کاربر با انتخاب ساختار اول پروتئین موردنظر براساس جوابی که از طریق حل این مسأله به دست آمده است، مطمئن می گردد که این پروتئین عملکرد موردنظر او را ارائه می کند. مسأله پیش بینی ساختار پروتئین چنین مطرح می شود که با فرض دانستن ساختار اولیه یک پروتئین، حل مسأله باید مشخص کند که آمینواسیدها در چه جهت هایی نسبت به هم بایستی قرار بگیرند و ساختار سه بعدی بهینه به چه شکلی است.

مسأله پیش بینی ساختار پروتئین یا مسأله یافتن جهت های آمینواسیدها است، که موجب کمینه شدن انرژی ساختار سه بعدی با توجه به مدل آب – دوست-آب گریز گردد. نکته ای که باید به آن توجه داشت، این است که نباید هیچ دو آمینواسیدی در شبکه جواب روی یک نقطه یکسان قرار گیرند. به عبارتی جهت هایی که برای آمینواسیدها تولید می شوند، می توانند آنها را روی نقاط مشترک انتقال دهند. به همین دلیل در پیش بینی ساختار پروتئین، به گونه ای عمل کرد که هیچ کدام از نقاط در شبکه با یکدیگر اشتراکی نداشته باشند.

پیش بینی ساختار ثانویه پروتیین گام بسیار مهمی در جهت روشن شدن ساختار سه بعدی به علاوه شناسایی عملکرد آن است.

پیش بینی ساختار دوم پروتئین یکی از چالش برانگیز ترین و موثرترین مباحث در زمینه تحقیقان بیوانفورماتیک است که با پیش بینی و تجزیه و تحلیل از مولکولهای بزرگ یعنی RNA DNA و پروتئین به دست می آید.

پروتئین ها مولکول های اساسی تمام موجودات زنده است. آنها در زنجیره های منحصر به فرد از اسیدهای آمینه هستند که ساختار سه بعدی منحصر به فرد آنها اجازه انجام توابع پیچیده بیولوژیکی را می دهد و مشخصات هر یک از پروتئین بر اساس ترتیب و توالی اسیدهای آمینه ایجاد شده اند به شهر آمینو اسید یک کد یکتا اختصاص داده شده است.

اساساً پروتئین ها در سه ساختار یافت می شوند که شامل ساختار اوليه، ثانویه و ثالثيه می باشند. توالی اسیدهای آمینه ساختارهای اولیه نامیده می شوند. ساختار ثانوية آرایش فضایی و منظم و با قاعدہ ای است از اسیدهای آمینه که نسبت به یکدیگر ایجاد می شوند.

ساختار ثانوية به ۳ فرم هستند: مارپیچ، ورقه ای و حلقه ها و یا چرخش معکوس و یا سیم پیچ از ساختار ثانویه یک ساختار سه بعدی حاصل می شود که به آن ساختار ثالثيه می گویند این ساختار های سه بعدی مسئول ویژگی های عملکردی پروتئین هستند و از آنها ۳۲٪ آلفا، 21% ورق بتا و ٪۴۷ از حلقه یا غیرمنظم هستند.

از لحاظ تئوری، این امکان وجود دارد ساختار تقریبی پروتئین را پیش بینی کنیم به خاطر این واقعیت که تعداد آنها ۲۰ عدد آمینو اسیدهای مختلف و در نتیجه تعداد راه هایی برای تولید مشابه ساختار پروتئین ها اسیدهای آمینه مختلف بسیار بیشتر است

پیش بینی ساختار دوم پروتئین ها از روی توالی آمینواسیدها یک امر مهم و اساسی در دانش پروتئین ها و زیست محاسباتی است که نقش مهمی در تعیین ساختار سه بعدی و در نتیجه عملکرد پروتئین ها دارد. به همین دلیل در چند دهه اخیر، تلاش های فراوانی در این زمینه صورت گرفته و روش های زیادی برای پیش بینی ساختار دوم پروتئین ها ارایه شده است. از جمله در طبقه بندی پروتئین ها، ردیف بندی بهتر توالی ها، ردیف بندی ساختمان پروتئین ها و مدل سازی ساختمان سه بعدی به کار می روند. بنابراین وجود روش هایی که بتوانند ساختمان دوم را از مختصات سه بعدی اتم ها تعیین کنند، ضروری می باشد.

ساختار دوم پروتئین ها، به نظم های موضعی گفته می شود که پروتئین در حین تاشدگی به خود می گیرد و به دلیل برقراری پیوند هیدروژنی بین اسیدهای آمینه بر اساس یک الگوی خاص به وجود می آید. ساختار دوم پروتئین ها، به ۳ دسته تقسیم می شوند:

١. مارپیچ آلفا: یکی از ساده ترین و رایج ترین ساختارهای دوم موجود در پروتئین ها می باشد. ساختار پیچشی دارد و آمینواسیدهایی هم که مارپیچ آلفا را تشکیل می دهند با استحکام در کنار هم قرار گرفتند.

۲. صفحات بتا: دومین عنصر ساختمانی اصلی که در پروتئین های کردی پیدا می شود، صفحات بتا هستند. ساختار صفحات بتا بسیار کشیده و چین دار می باشد. رشته های بتا معمولا بین ۵ تا ۱۰ آمینواسید طول دارند.

٣. ساختار چرخشی: ناحیه ای کوتاه از زنجیره پروتئینی هستند که ساختارهای مارپیچ آلفا و صفحات بتا را به هم متصل می کنند.

 

الگوریتم بهینه سازی کلونی زنبورعسل(ABC):

الگوریتم کلونی زنبور عسل مصنوعی (ABC)، یک راهکار بهینه‌سازی است که رفتار یک کلونی زنبور عسل را شبیه‌سازی می‌کند و برای اولین بار در سال ۲۰۰۵ توسط «کارابوگا برای بهینه‌سازی پارامتر واقعی ارائه شد. در این مدل ریاضی، کلونی زنبور عسل مصنوعی دارای سه نوع زنبور است. زنبورهای کارگر روی گردآوری غذا و آوردن آن به کندو از یک منبع غذایی خاص کار می‌کنند. زنبورهای ناظر در میان کارگرها گشت می‌زنند تا تشخیص دهند یک منبع غذایی همچنان ارزش استفاده دارد یا خیر و در نهایت زنبورهای دیده‌بان که به‌دنبال کشف منابع غذایی جدید هستند.

در الگوریتم ABC، یک منبع غذایی به عنوان حالتی در فضای جست‌و‌جو تعریف می‌شود (یک راهکار برای مساله بهینه‌سازی)، و تعداد منابع غذایی در ابتدا برابر با تعداد زنبورهای موجود در کندو است. کیفیت منابع غذایی توسط مقدار تابع هدف در آن موقعیت (مقدار تناسب) تعیین می‌شود.

رفتار هوشمند ناپایدار زنبورهای عسل را می‌توان در چند گام زیر خلاصه کرد:

  • زنبورها تلاش می‌کنند تا به صورت تصادفی در محیط به‌دنبال منابع غذایی خوب بگردند (مقدار تناسب).
  • پس از یافتن یک منبع غذایی، آن‌ها تبدیل به زنبورهای کارگر می‌شوند و شروع به استخراج غذا از منبع یافت شده می‌کنند.
  • زنبور کارگر با شهد به کندو باز می‌گردد و بار شهد خود را خالی می‌کند. پس از خالی کردن آن، می‌تواند مستقیما به منبع کشف شده خود باز گردد یا اطلاعاتی که درباره منبع غذاییش دارد را با اجرای یک رقص گردون در ناحیه رقص به اشتراک بگذارد.
  • اگر یک منبع غذایی خالی شد، زنبوران کارگر به دیده‌بان مبدل شده و به جست و جوی تصادفی برای منابع غذایی می‌پردازند.
  • زنبورهای ناظر در کندو منتظر مانده و زنبورهای کارگر را در منابع غذایی گردآوری کرده‌شان مورد نظارت قرار می‌دهند و از میان منابع غذایی موجود با بیشترین سود، یک منبع را انتخاب می‌کنند.
  • انتخاب منابع غذایی متناسب با کیفیت آن منبع (مقدار تناسب) است.

 

شرح پروژه:

پروتئین‌ها، زنجیرهای خطی از اسیدهای آمینه هستند. آنها ساختارهای سه بعدی تاخوردهای را اتخاذ می کنند تا وظایف مشخصی را انجام دهند. پیش بینی ساختار پروتئین یکی از موضوعات تحقیقاتی مهم در بیوانفورماتیک می باشد و کاربردهای مهمی در زمینه ای متفاوت از قبیل طراحی دارو و پیش بینی بیماری دارد.

امروزه استفاده از دانش رایانه در مسایل زیست شناسی مولکولی، منجر به تولد شاخه جدیدی به نام زیست انفورماتیک شده است. زیست انفورماتیک یا بیوانفورماتیک دانش استفاده از علوم کامپیوتر و آمار و احتمالات در شاخه زیست شناسی مولکولی است. یکی از زمینه های مهم بیوانفورماتیک پیش بینی ساختار دوم و سوم پروتیین می باشد. پروتیین ها مواد آلی بزرگ و یکی از انواع درشت مولکول های زیستی هستند که از زیرواحدهایی به نام اسید آمینه ساخته و مثل یک زنجیر خطی توسط پیوند پپتیدی بهم متصل شده اند و در مجموع 20 نوع اسید آمینه وجود دارد.

این زنجیره در فضای سه بعدی به گونه ای تا می خورد که پایین ترین سطح انرژی را دارد. تعیین ساختار دقیق پروتیین با روش های آزمایشگاهی به سادگی و در زمانی محدود امکان پذیر نیست. در حالی که تا به حال روش­های محاسباتی زیادی برای حل این مساله در فضاهای دوبعدی و سه بعدی ارایه شده است. دانستن ساختار دوم و سوم پروتیین بسیار مهم است چراکه مستقیما به عملکرد آن مرتبط می شود و رفتار سلولی و تمام فعالیت هایی که در سلول انجام می شود بر عهده پروتئین ها است.

در این پروژه جهت پیش بینی ساختار ثانویه پروتئین روش بهینه سازی کلونی زنبورعسل استفاده شده است.  هوش جمعی شاخه ای از پژوهش بر اساس جمعیت است که مدل های جمعیتی از عوامل مورد تداخل یا ازدحام که می توانند خودسازماندهی کنند. کلونی مورچه، ازدحام پرندگان و یا زنبورها یک نمونه ساده ای از سیستم جمعیتی است. دیگر نمونه ای از هوش جمعی کلونی زنبور عسل در اطراف کندو است. هوش کلونی زنبورعسل (ABC) یک الگوریتم است که یک الگوریتم بهینه سازی براساس رفتار هوشمندانه جمعیت زنبورعسل است. توالی آمینواسیدهای یک پروتئین داده شده است، پیش بینی ساختار سه بعدی پروتئین به عنوان مسأله تاخوردگی پروتئین شناخته می شود. مسأله تاخوردگی پروتئین در مدل مشبکه آب گریز-قطبی، پیداکردن ترکیبی با کم ترین انرژی آزاد است که یک مسأله NP-سخت می باشد. الگوریتم های تکاملی گزینه های مناسبی برای حل مسائل NP-سخت هستند.

در این پروژه، الگوریتم کلونی زنبورعسل ABC برای بهینه سازی و پیش بینی ساختار دوم پروتئین ها استفاده شده است.

 

نتایج برای توالی های مختلف آمینواسید