آموزش هوش مصنوعی

بیوانفورماتیک چیست؟

بیوانفورماتیک
عمومی خبری

بیوانفورماتیک چیست؟

بیوانفورماتیک چیست؟

بیوانفورماتیک ترکیبی از زیست شناسی و فناوری اطلاعات است. اساساً، بیوانفورماتیک علمی است که اخیراً توسعه یافته و از فناوری اطلاعات برای درک پدیده بیولوژیکی استفاده می‌کند. بیوانفورماتیک به طور گسترده‌ای شامل ابزارها و روش‌های محاسباتی است که برای مدیریت، تجزیه و تحلیل و ادراه کردن داده‌های حجیم بیولوژیکی استفاده می‌شود. بیوانفورماتیک همچنین ممکن است به عنوان بخشی از زیست شناسی محاسباتی در نظر گرفته شود. زیست شناسی محاسباتی با استفاده از تکنیک‌های تحلیلی کمی در مدل‌سازی و حل مشکلات در سیستم‌های بیولوژیکی درگیر است. بیوانفورماتیک یک رویکرد میان رشته‌ای است که به دانش پیشرفته علوم کامپیوتر، ریاضیات و روش‌های آماری برای درک پدیده‌های بیولوژیکی در سطح مولکولی نیاز دارد.

تاریخچه

پایه‌های بیوانفورماتیک در اوایل دهه 1960 با استفاده از روش‌های محاسباتی برای تجزیه و تحلیل توالی پروتئین به ویژه، مونتاژ توالی‌های جدید، پایگاه داده‌های توالی بیولوژیکی و مدل‌های جایگزینی گذاشته شد. بعدا از آن، تجزیه و تحلیل DNA نیز به دلیل پیشرفت موازی روش‌های زیست شناسی مولکولی (که دستکاری آسان‌تر DNA و همچنین توالی آن را فراهم می‌کند) و همچنین پیشرفت در علوم کامپیوتر و ظهور رایانه‌های کوچک (که قدرتمندتر بوده و دارای نرم افزارهای جدیدتر و مناسب‌تر برای انجام کارهای بیوانفورماتیک بود) ساده‌تر شد. اصطلاح بیوانفورماتیک، برای اولین بار در دهه 1990 مطرح شد. در اصل، این کار با مدیریت و تجزیه و تحلیل داده‌های مربوط به توالی DNA ، RNA و پروتئین بود.

از آنجایی که داده‌های بیولوژیکی با سرعت بی سابقه‌ای تولید می‌شوند، مدیریت و تفسیر آن‌ها به بیوانفورماتیک نیازمند است. بنابراین، بیوانفورماتیک اکنون انواع مختلفی از داده‌های بیولوژیکی را نیز شامل می‌شود. اولین پایگاه اطلاعاتی بیوانفورماتیک / بیولوژیکی چند سال پس از در دسترس بودن اولین توالی‌های پروتئینی ساخته شد. اولین توالی پروتئین گزارش شده مربوط به انسولین گاوی در سال 1956 بود که از 51 اسیدآمینه تشکیل شده بود. تقریباً یک دهه بعد، اولین توالی یابی اسید نوکلئیکی گزارش شد که مربوط به tRNA آلانین مخمر با 77 باز بود. فقط یک سال بعد، مارگارت دیلوف (1925–1983) که یک شیمی – فیزیک دان آمریکایی بود تمام داده‌های توالی‌های موجود را برای ایجاد اولین پایگاه داده بیوانفورماتیک جمع آوری کرد. پروتئین Data Bank در سال 1972 با جمع آوری ده پروتئین کریستالوگرافی شده با اشعه ایکس توالی‌یابی شد و در سال 1987 تاسیس اولین پایگاه داده توالی پروتئین به نام The SWISS PROT آغاز شد.

اولین سیستم بیوانفورماتیک
در این تصویر COMPROTEIN، اولین نرم افزار بیوانفورماتیک نشان داده شده است. (الف) یک فریم مرکزی IBM 7090 که برای اجرای آن COMPROTEIN ساخته شده است. (ب) کارت پانچ حاوی یک خط کد FORTRAN (زبان COMPROTEIN با آن نوشته شده است). (ج) کد منبع کامل یک برنامه در کارت‌های پانچ. (د) یک نمای کلی از ورودی COMPROTEIN (یعنی توالی پپتید Edman) و خروجی (یک توالی پروتئین کلی).

معرفی فیلم آموزش مقدماتی بیوانفورماتیک (Bioinformatics)

همانطور که پیش‌تر بیان شد بیوانفورماتیک یک دانش نوین بین رشته‌ای است که در آن با استفاده از علوم کامپیوتر، ریاضی، ژنتیک، شیمی، فیزیک، آمار و احتمالات در شاخه زیست شناسی مولکولی اهداف مختلفی دنبال می‌شود. پیشرفت‌های انجام شده در زیست شناسی و فناوری‌های جدید در ذخیره و بازیابی اطلاعات زیستی موجب شده این دو علم به هم گره بخورند. در این راستا فرادرس دوره‌های متعدد بیوانفورماتیکی را با همکاری مدرسین برجسته کشوری تهیه و تدوین کرده است.

این فرادرس توسط آقای دکتر فرشید شیرافکن دانشجوی دکتری تخصصی بیوانفورماتیک دانشگاه تهران (ایشان از مدرسین نمونه در زمینه ارائه و آموزش دروس دانشگاهی انتخاب شده اند) تدریس شده است. این دوره شامل ۹ فصل تحت عناوین مروری بر زیست مولکولی، مقدمات بیوانفورماتیک (Bioinformatics)، پایگاه داده‌های زیستی، انطباق دوتایی توالی‌ها، جستجوی تشابه در پایگاه داده‌ها، انطباق چندگانه توالی‌ها، ‎HMM‎ – PSSM‎ – پیشگویی دمین و موتیف، فیلوژنتیک (Phylogenetics) و آموزش برنامه نویسی R تهیه و تدوین شده است و برای تمامی دانشجویان رشته‌های بیوانفورماتیک،
زیست‌شناسی، مهندسی کامپیوتر و تمام علاقمندان به این حوزه پرکاربرد مناسب است.

 

داده های بیوانفورماتیکی

داده‌های کلاسیک بیوانفورماتیک شامل توالی DNA ژن‌ها یا ژنوم‌های کامل، توالی اسیدهای آمینه پروتئین‌ها، ساختارهای سه بعدی پروتئین‌ها و اسیدهای نوکلئیک و مجموعه‌های اسید نوکلئیک – پروتئین است. جریان داده‌های فرعی یا omics عبارتند از: Transcriptomics که به معنی الگوی سنتز RNA از DNA است، پروتئومیکس که توزیع پروتئین در سلول‌ها بوده،  Interactomics که الگوهای فعل و انفعالات پروتئین – پروتئین و پروتئین – اسید نوکلئیک و Metabolomics که طبیعت و الگوهای ترافیکی تبدیل مولکول‌های کوچک توسط مسیرهای بیوشیمیایی فعال در سلول‌ها تعریف شده است. در هر حالت علاقه به دستیابی به داده‌های دقیق و جامع برای انواع خاصی از سلول‌ها و شناسایی الگوهای تغییر در داده‌ها وجود دارد.

به عنوان مثال، بسته به نوع سلول، زمان جمع آوری اطلاعات (در طول چرخه سلولی یا تغییرات روزانه، فصلی یا سالانه)، مرحله رشد و شرایط مختلف محیطی ممکن است داده‌ها در نوسان باشند. متاژنومیکس و متاپروتومیکس این اندازه گیری‌ها را به شرح جامعی از ارگانیسم‌های موجود در یک نمونه گرفته شده از محیط مانند یک سطل آب اقیانوس یا یک نمونه خاک گسترش می‌دهد. بیوانفورماتیک با شتاب زیاد فرآیندهای تولید داده در زیست شناسی را به جلو می‌برد. روش‌های تعیین توالی ژنوم شاید بارزترین اثرات آن را نشان دهند. در سال 1999 بایگانی توالی اسید نوکلئیک حاوی 3/5 میلیارد نوکلئوتید بود که کمی بیشتر از طول یک ژنوم انسانی است. یک دهه بعد این اطلاعات حاوی بیش از 283 میلیارد نوکلئوتید یعنی طولی به اندازه 95 عدد ژنوم انسانی بودند.

ذخیره و بازیابی داده ها

در بیوانفورماتیک، از بانک‌های داده برای ذخیره و سازماندهی داده‌ها استفاده می‌شوند و محققان توالی DNA و RNA بسیاری از این موجودات را از مقالات علمی و پروژه‌های ژنوم جمع آوری می‌کنند. بسیاری از پایگاه‌های اطلاعاتی در اختیار کنسرسیوم‌های بین المللی است. به عنوان مثال، یک کمیته مشورتی متشکل از اعضای بانک اطلاعاتی توالی نوکلئوتید آزمایشگاه زیست شناسی مولکولی اروپا (EMBL-Bank) در انگلستان، بانک داده DNA ژاپن (DDBJ)، و GenBank از مرکز ملی اطلاعات بیوتکنولوژی در ایالات متحده (NCBI) بر «همکاری بین المللی بانک اطلاعات توالی نوکلئوتیدی» (INSDC) نظارت می‌کنند.

برای اطمینان از در دسترس بودن و آزاد بودن داده‌های توالی‌یابی، مجلات علمی لازم است که توالی‌های نوکلئوتیدی جدید افراد را به عنوان شرط انتشار مقاله در یک پایگاه داده در دسترس عموم قرار دهند. شرایط مشابه در اسیدهای نوکلئیک برای ساختارهای پروتئینی نیز اعمال می‌شود، همچنین مرورگرهای ژنوم وجود دارند و پایگاه داده‌هایی که تمام اطلاعات ژنومی و مولکولی موجود، در مورد یک گونه خاص را با هم جمع می‌کنند. پایگاه داده اصلی ساختار ماکرومولکولی بیولوژیکی بانک اطلاعات پروتئین در سراسر جهان PDB است که حاصل یک تلاش و همکاری مشترک تحقیقات بیوانفورماتیکِ ساختاری (RCSB) در ایالات متحده، بانک اطلاعات پروتئین (PDBe) در انستیتوی بیوانفورماتیک اروپا در انگلستان و بانک اطلاعات پروتئین ژاپن در دانشگاه اُساکا است.

صفحات اصلی همکار PDB حاوی پیوندهایی به خود فایل‌های داده و مطالب گویا و آموزشی (از جمله اخبار)، تسهیلات برای ذخیره مطالب جدید و نرم افزار جستجوی تخصصی برای بازیابی ساختارها هستند. بازیابی اطلاعات از بایگانی داده‌ها از ابزارهای استاندارد برای شناسایی داده توسط کلمه کلیدی استفاده می‌کند. الگوریتم های دیگر، بانک های داده را جستجو می کنند تا شباهت‌های موردی داده‌ها را تشخیص دهند. به عنوان مثال، یک مسئله قابل کاوش در یک پایگاه توالی داده، استفاده از توالی ژنی یا پروتئینی مورد نظر به منظور شناسایی موجوداتی با توالی مشابه است.

داده های بیوانفورماتیکی

اهداف بیوانفورماتیک

توسعه الگوریتم‌های کارآمد برای اندازه گیری تشابه توالی، هدف مهم بیوانفورماتیک است. الگوریتم Needleman – Wunsch، که مبتنی بر برنامه نویسی پویا است، یافتن چینش بهینه جفت توالی‌ها را تضمین می‌کند. این الگوریتم اساساً یک مسئله بزرگ (دنباله کامل) را به مجموعه‌ای از مسائل کوچک‌تر (بخش‌های توالی کوتاه) تقسیم می‌کند و از راه حل‌های مسئله‌های کوچک‌تر برای راه حل مسئله بزرگ استفاده می‌کند. شباهت در توالی‌ها در یک ماتریکس امتیاز بندی می‌شوند و الگوریتم امکان تشخیص شکاف‌ها در «تراز بندی توالی‌ها» (Sequence Alignment) را فراهم می‌کند. اگرچه الگوریتم Needleman – Wunsch موثر است، اما به عنوان کاوش یک پایگاه داده توالی‌یابی بزرگ بسیار کند است.

بنابراین، توجه زیادی به یافتن الگوریتم‌های بازیابی سریع اطلاعات شده است که می‌توانند با مقادیر زیادی از داده‌ها در بایگانی‌ها سر و کار داشته باشند. که برنامه «بلاست» (BLAST) یا Basic Local Alignment Search Tool یکی از آن‌ها است. یک بخش پیشرفته از BLAST، شناخته شده به عنوان موقعیت خاص تکرار شونده یا PSIBLAST که برگرفته از position-specific iterated BLAST است، باعث استفاده از الگوهای حفاظت‌شده در توالی‌های مرتبط می‌شود و ترکیبی از سرعت بالای BLAST همراه حساسیت بسیار بالا برای یافتن توالی‌های مرتبط است.

هدف دیگر بیوانفورماتیک، گسترش داده‌های تجربی توسط پیش‌بینی‌ها است. یک هدف اساسی از زیست شناسی محاسباتی، پیش بینی ساختار پروتئین از یک توالی اسید آمینه است. پیشرفت در توسعه روش‌های پیش بینی «حالات قرارگیری فضایی» (Folding) پروتئین توسط برنامه‌های ارزیابی حیاتی، پیش بینی ساختار (CASP) طی دو سال اندازه‌گیری می‌شود که شامل آزمون‌های کور روش‌های پیش بینی ساختار است. از بیوانفورماتیک برای پیش بینی تعاملات بین پروتئین‌ها با توجه به ساختارهای فردی آمینواسیدها نیز استفاده می‌شود. این نوع پژوهش به عنوان داکینگ پروتئین‌ها شناخته می‌شود. مجموعه‌های پروتئین – پروتئین مکمل بودن خوبی با هم در شکل سطحی و قطبیت دارند و عمدتا توسط فعل و انفعالات ضعیف مانند پیوندهای سطح آبگریز، پیوندهای هیدروژنی و نیروهای وان در والس تثبیت می‌شوند.

برنامه‌های نرم افزاری رایانه‌ای این تعاملات را برای پیش بینی رابطه فضایی مطلوب بین زیرواحدهای متصل به هم شبیه‌سازی می‌کند. یک چالشی که می‌تواند کاربردهای درمانی مهمی داشته باشد، طراحی آنتی بادی‌هایی است که با میل زیاد به پروتئین هدف متصل شوند. در ابتدا، بسیاری از تحقیقات بیوانفورماتیک، تمرکز نسبتاً کمی بر الگوریتم‌هایی برای تجزیه و تحلیل انواع خاصی از داده‌ها، مانند توالی ژن‌ها یا ساختارهای پروتئینی داشته است. با این حال، اکنون، اهداف بیوانفورماتیکی یکپارچه هستند و هدف آن‌ها این است که دریابند چگونه می‌توان از ترکیب انواع مختلف داده‌ها برای درک بهتر پدیده‌های طبیعی، از جمله ارگانیسم‌ها و بیماری‌ها استفاده کرد.

شبیه سازی پروتئین
در این تصویر شبیه سازی ساختار پروتئین هموگلوبین و بررسی سطح انرژی‌های آن با استفاده از نرم‌افزارهای بیوانفورماتیکی نشان داده شده است.

ابزارهای بیوانفورماتیکی چه هستند؟

ابزار اصلی یک «بیوانفورماتیست» (فردی که بر روی بیوانفورماتیک مطالعه و پژوهش انجام می‌دهد) برنامه‌های نرم افزاری رایانه‌ای و اینترنتی است. یکی از فعالیت‌های اصلی در این زمینه، تجزیه و تحلیل توالی DNA و پروتئین‌ها با استفاده از نرم افزارها و پایگاه‌های اطلاعاتی مختلف موجود در شبکه جهانی وب است. همه افراد، از پزشکان گرفته تا زیست شناسان مولکولی، با دسترسی به اینترنت و وب سایت‌های مربوطه اکنون می‌توانند با استفاده از ابزارهای بیوانفورماتیک اصلی، ترکیب مولکول‌های بیولوژیکی مانند اسیدهای نوکلئیک و پروتئین‌ها را آزادانه کشف کند. این بدان معنا نیست که دستیابی و تجزیه و تحلیل داده‌های ژنومی خام می‌تواند به راحتی توسط همه انجام شود.

بیوانفورماتیک یک رشته در حال تکامل است و اکنون متخصصان بیوانفورماتیک از برنامه‌های نرم افزاری پیچیده‌ای برای بازیابی، مرتب سازی، تجزیه و تحلیل، پیش بینی و ذخیره داده‌های توالی DNA و پروتئین استفاده می‌کنند. بنگاه‌های تجاری بزرگ مانند شرکت‌های دارویی برای انجام و حفظ نیازهای بیوانفورماتیک مقیاس بزرگ و پیچیده این صنایع، از بیوانفورماتیک استفاده می‌کنند. با افزایش نیاز روز افزون به ورودی مداوم از متخصصان بیوانفورماتیک، اکثر آزمایشگاه‌های زیست پزشکی ممکن است به زودی متخصص بیوانفورماتیک داخلی خود را داشته باشند.

یک بیوانفورماتیست به تنهایی، فراتر از فراگیری اولیه و تجزیه و تحلیل داده‌های ساده، مطمئناً برای هر تجزیه و تحلیل پیچیده‌ای به مشاوره بیوانفورماتیک خارجی نیاز دارد. رشد بیوانفورماتیک با ایجاد شبکه‌های رایانه‌ای امکان دسترسی آسان به داده‌های بیولوژیکی و امکان توسعه برنامه‌های نرم افزاری برای تجزیه و تحلیل بی دردسر را فراهم کرده است. چندین پروژه بین المللی با هدف ارائه پایگاه داده‌های ژنی و پروتئینی از طریق اینترنت به طور رایگان در دسترس کل جامعه علمی است. ابزارهای بیوانفورماتیکی مختلفی برای اهداف متفاوت گسترش یافته‌اند که در ادامه به بررسی برخی از  این اهدف پرداخته‌ایم.

  • تحلیل توالی. «تجزیه و تحلیل توالی» (Sequence analysis) قرار دادن RNA، توالی پپتید و DNA به انواع مختلف روش‌های تحلیلی است. این کار برای شناسایی منشا، تکامل و ساختار پایگاه‌های اطلاعاتی بیولوژیکی انجام می‌شود.
تحلیل توالی
  • مدل سازی مولکولی. «مدل سازی مولکولی» (Molecular modelling) از روش‌های محاسباتی و نظری برای تجزیه و تحلیل رفتار مولکول‌ها استفاده می‌کند. بهترین ابزارهای بیوانفورماتیک با منبع باز و رایگان از روش شبیه سازی برای انجام مدل سازی مولکولی استفاده می‌کنند.
  • دینامیک مولکولی. کاربرد «دینامیک مولکولی» (Molecular dynamics) در بیوانفورماتیک در تعیین حرکت فیزیکی اتم‌ها مهم است. این روش برای محیط‌های سلول مانند در زمینه بیوانفورماتیکِ ساختاری مهم است. اندازه گیری‌های استفاده شده در این روش‌ها شامل نظریه‌های نمودار، روابط پویای بین مولکولی و بررسی پاسخ آشفتگی اتم‌ها و مولکول‌ها است.
  • FASTA در بیوانفورماتیک. FASTA قالبی است که ماهیت آن متن محور است و برای نشان دادن توالی پپتید و نوکلئوتید استفاده می‌شود. بسته‌های نرم افزاری FASTA برای ابزارهای بیوانفورماتیک و برای تعیین توالی ترازهای پروتئین و DNA کمک می کنند.
  • تجزیه و تحلیل فیلوژنتیک در بیوانفورماتیک. «تجزیه و تحلیل فیلوژنتیک» (Phylogenetic analysis) توسط ابزارهای بیوانفورماتیک نمودارهای شاخه‌ای را برای نشان دادن رابطه یا تاریخچه تکاملی بین ارگانیسم‌های گونه‌های مختلف فراهم می‌کند. این نمودارهای شاخه‌ای درختان فیلوژنتیک نامیده می‌شوند و به شناسایی خصوصیاتی مانند ژن‌ها، اندام‌ها و پروتئین‌ها در ارگانیسم‌ها کمک می‌کنند.
تجزیه و تحلیل فیلوژنیک
تجزیه و تحلیل فیلوژنتیک و رسم درخت فیلوژنتیکی با استفاده از نرم افزارهای بیوانفورماتیکی امکان پذیر است.
  • پایگاه‌های اطلاعاتی بیولوژیک در بیوانفورماتیک. «پایگاه داده‌های بیولوژیک» (Biological databases) در بیوانفورماتیک را می‌توان با تجزیه و تحلیل سه دسته موجود، درک کرد. این سه گروه عبارتند از: عملکرد، ساختار و توالی. توالی پروتئین و اسید نوکلئیک در پایگاه داده توالی ذخیره می‌شود در حالی که پروتئین و RNA در پایگاه داده‌های ساختاری وجود دارند. نقش فیزیولوژیکی محصولات ژنی توسط پایگاه‌های داده عملکردی فراهم می‌شود.

ابزارهای مختلف بیوانفورماتیکی شامل پایگاه‌های داده و همچنین نرم‌افزارهای رایگان و پولی مختلفی هستند که افراد بسته به نیاز خود از آن‌ها استفاده می‌کنند. بسیاری از پایگاه‌های داده بزرگ در دنیا تمامی اطلاعات خود را به صورت رایگان در اختیار کاربران و پژوهشگران قرار می‌دهند و به این ترتیب اطلاعات جدید دیگری مانند انواع توالی‌های جدید شناسایی شده به اطلاعات ذخیره شده آن‌ها اضافه خواهد شد. در ادامه مثال‌هایی از هر کدام را که در حال حاضر وجود دارند ارائه می‌دهیم.

پایگاه های داده

پایگاه‌های داده برای تحقیقات و کاربردهای بیوانفورماتیک، ضروری هستند. بسیاری از پایگاه‌های داده‌ای وجود دارند که انواع مختلفی از اطلاعات را در بر می‌گیرند به عنوان مثال، توالی DNA و پروتئین، ساختارهای مولکولی، فنوتیپ‌ها و اطلاعات تنوع‌های زیستی. پایگاه‌های اطلاعاتی ممکن است حاوی داده‌های تجربی (مستقیماً از آزمایشات بدست آمده)، داده‌های پیش بینی شده (حاصل از تجزیه و تحلیل) یا هر دو باشد. این اطلاعات ممکن است مخصوص ارگانیسم، مسیر یا مولکول مورد علاقه خاص باشند یا آن‌ها می‌توانند داده‌های جمع آوری شده از چندین پایگاه داده دیگر را ترکیب کنند. این پایگاه‌های داده از نظر قالب، سازوکار دسترسی و عمومی بودن یا نبودن متفاوت هستند. برخی از پایگاه‌های اطلاعاتی که معمولاً مورد استفاده قرار می‌گیرند در ادامه توضیح داده شده اند.

  • پایگاه‌های داده مورد استفاده در تجزیه و تحلیل توالی بیولوژیکی: Genbank ، UniProt.
  • پایگاه‌های داده مورد استفاده در تجزیه و تحلیل ساختار: بانک داده پروتئین یا PDB.
  • پایگاه‌های داده مورد استفاده در یافتن خانواده‌های پروتئینی و یافتن موتیف‌های (ساختارهای ثانویه) پروتئینی: InterPro ، Pfam.
  • پایگاه‌های داده‌ای که برای تعیین توالی نسل بعدی استفاده می‌شوند: «بایگانی توالی‌های خواندنی» (Sequence Read Archive).
  • پایگاه‌های داده‌ای مورد استفاده در تجزیه و تحلیل شبکه: پایگاه داده‌های متابولیک (KEGG ، BioCyc)، پایگاه‌های تجزیه و تحلیل تعاملات و برهم کنش‌ها، شبکه‌های عملکردی.
  • پایگاه‌های داده‌ای مورد استفاده در طراحی مدارهای ژنتیکی مصنوعی: GenoCAD.

معرفی فیلم آموزش پایگاه‌ داده های بیوانفورماتیکی پروتئین

همانطور که می‌دانید پروتئین‌ها محصولات ژنی هستند. بنابراین با توجه به اینکه ژن‌ها تاثیرات خود را در داخل سلول با تولید پروتئین‌ها اعمال می‌کنند، دریافت اطلاعات پیرامون ویژگی‌های مختلف پروتئین‌ها برای دستکاری‌‌های ژنتیکی به اهدف مختلف علمی می‌تواند بسیار ارزشمند باشد. تولید حجم زیاد داده‌های زیستی نیاز به مدیریت، ذخیره و استخراج اطلاعات از این داده‌ها را ایجاد نمود بنابراین شاخه بیوانفورماتیک به میان آمد تا محققان با ابداع ابزارهایی با کمک داده‌های ذخیره شده در پایگاه داده‌ها به انجام آنالیزهای مختلف بر روی مولکول‌های زیستی مانند پروتئین‌ها بپردازند.

این فرادرس که توسط خانم مهسا سالیانی دانشجوی دکتری بیوشیمی در دانشگاه فردوسی مشهد طی ۳ فصل شامل پایگاه داده UniProt و EMBL-EBI، پایگاه داده NCBI، بلاست و هم‌ ترازی توالی‌ های پروتئینی و معرفی سایت ExPASy و پایگاه داده KEGG تهیه و تدوین شده است. این فرادرس برای کلیه دانشجویان رشته‌های زیست شناسی، پزشکی، داروسازی، مهندسی کشاورزی و بیوتکنولوژی و سایر علاقمندان به حوزه‌های بیوانفورماتیک مناسب است. (این دوره تضمین کیفیت و گارانتی بازگشت هزینه را از طرف وب سایت فرادرس دارد)

 

نرم افزارهای بیوانفورماتیک

نرم افزارهای بیوانفورماتیک از ابزارهای پیرو خط فرمان کوتاه، تا برنامه‌های گرافیکی پیچیده‌تر متفاوت هستند. این نرم‌افزارها شامل انواع رایگان و نیازمند پرداخت هزینه و همچنین نرم افزارهای تحت وب هستند که هر کدام کاربردهای مختلفی بر عهده دارند. در ادامه به همه آن‌ها پرداخته‌ایم.

نرم افزارهای منبع باز

بسیاری از ابزارهای نرم افزاری رایگان و با منبع آزاد از دهه 1980 تاکنون وجود داشته و در حال رشد هستند. ترکیبی از نیاز مستمر به الگوریتم های جدید برای تجزیه و تحلیل انواع نوظهور بازخوانی‌های بیولوژیکی، پتانسیل ابتکاری در آزمایشات «درون رایانه‌ای» (In Silico) و پایگاه‌های «کد – باز» (Open – Code) در دسترس که به ایجاد فرصت برای همه گروه‌های تحقیقاتی کمک کرده‌اند تا صرف نظر از تمهیدات مالی آن‌ها هم به بیوانفورماتیک و هم به دامنه نرم افزار منبع باز موجود کمک کنند. ابزارهای رایگان اغلب به عنوان پرورش‌دهنده ایده‌ها یا پلاگین‌های پشتیبانی شده توسط جامعه در نرم‌افزارهای تجاری عمل می‌کنند. طیف وسیعی از بسته‌های نرم افزاری رایگان شامل موارد زیر هستند.

  • Bioconductor. یک پروژه نرم افزاری توسعه یافته و رایگان برای تجزیه و تحلیل و درک داده‌های ژنومی تولید شده توسط تست‌های آزمایشگاهی در زیست شناسی مولکولی است. Bioconductor بر اساس زبان آماری برنامه نویسی R استوار است، اما حاوی سایر زبان‌های برنامه نویسی دیگر نیز است.
  • BioPerl. یک پروژه نرم افزاری فعال است که توسط بنیاد Open Bioinformatics پشتیبانی می‌شود. از این پایگاه برای رفع اشکالات موجود در پروژه توالی‌یابی ژنوم انسان استفاده شد.
  • Biopython. پروژه Biopython مجموعه‌ای از ابزارهای غیر تجاری Python برای زیست شناسی محاسباتی و بیوانفورماتیک است که توسط یک انجمن بین المللی توسعه دهندگان ایجاد شده است. این ابزار شامل طبقه‌بندی‌هایی برای نشان دادن توالی‌های بیولوژیکی و حاشیه نویسی توالی‌ها است و قادر به خواندن و نوشتن در انواع قالب‌های فایل‌ها است. همچنین این ابزار امکان دستیابی بصورت برنامه‌ای برای راه‌یابی به پایگاه داده‌های آنلاین اطلاعات بیولوژیکی، مانند آن‌هایی که در NCBI وجود دارد را فراهم می‌کند.
  • BioJava. یک پروژه نرم افزاری است که برای ارائه ابزارهای جاوا برای پردازش داده‌های بیولوژیکی اختصاص داده شده است. این ابزار مجموعه‌ای از توابع کتابخانه‌ای است که در زبان برنامه نویسی جاوا برای دستکاری توالی‌ها، ساختارهای پروتئینی، سیستم توزیع حاشیه نویسی (DAS)، دسترسی به AceDB، برنامه نویسی پویا و سیستم‌های آماری ساده نوشته شده است.
  • BioJS. یک پروژه برای داده‌های بیوانفورماتیک در وب است، هدف آن توسعه یک کتابخانه منبع باز از اجزای JavaScript برای تجسم داده‌های بیولوژیکی است.
  • BioRuby. مجموعه ای از کد روبی (یک زبان برنامه نویسی پیشرفته) است که شامل کلاس‌هایی برای زیست شناسی مولکولی محاسباتی و بیوانفورماتیک است. این ابزار شامل کلاس‌هایی برای تجزیه و تحلیل توالی DNA و پروتئین، ترازبندی توالی، تجزیه پایگاه داده بیولوژیکی، زیست شناسی ساختاری و سایر کارهای بیوانفورماتیک است.
  • Bioclipse. یک پلتفرم بصری مبتنی بر جاوا، منبع باز و بر پایه شیمی و بیوانفورماتیک در بستر نرم افزاری Eclipse Rich Client (RCP) است.
  • EMBOSS. یک نرم افزار تجزیه و تحلیل رایگان بوده که برای نیازهای جامعه کاربران زیست شناسی مولکولی و بیوانفورماتیک تهیه شده است. این نرم افزار به طور خودکار با داده‌ها در قالب‌های مختلف کنار می‌آید و حتی امکان بازیابی شفاف داده‌های توالی را از وب فراهم می‌کند.
  • NET Bio. یک کتابخانه بیوانفورماتیک و ژنومیک منبع باز است که برای امکان بارگذاری، ذخیره و تجزیه و تحلیل داده‌های بیولوژیکی ایجاد شده است.
  • Orange. یک مجموعه ابزار تجسم داده‌ها، یادگیری ماشین و داده کاوی است. این نرم افزار دارای یک برنامه نویسی بصری front-end برای تجزیه و تحلیل سریع داده‌های کیفی و تجسم داده‌های تعاملی است.
  • UGENE. یک نرم افزار رایانه‌ای برای بیوانفورماتیک بوده که بر روی انواع سیستم عامل‌ها قابل استفاده است. UGENE به زیست شناسان کمک می‌کند تا داده‌های مختلف ژنتیکی بیولوژیک، مانند توالی‌ها، حاشیه نویسی‌ها، ترازبندی‌های متعدد، درختان فیلوژنتیک، سرهم بندی‌های NGS و موارد دیگر را تجزیه و تحلیل کنند.
  • GenoCAD. یکی از اولین ابزارهای طراحی به کمک رایانه برای زیست شناسی مصنوعی است که در طراحی وکتورهای بیانی انتقال ژن، شبکه‌های مصنوعی ژنی و سایر ساختارهای مورد استفاده در مهندسی ژنتیک کاربرد دارد.

معرفی فیلم آموزش آشنایی با نرم افزار Clustal X و کاربردهای آن در بیوانفورماتیک

 

نرم افزار Clustal X می‌تواند با هم ردیف سازی توالی‌های ژن، میزان تشابه یا تفاوت دو موجود را از نظر یک ناحیه ژنی نشان دهد. علاوه بر این، اگر محقق بخواهد ناحیه ژنی مناسب برای تکثیر ژن را پیدا کند، این نرم افزار بسیار سودمند خواهد بود. گاهی پژوهشگران نیاز دارند تا روابط بین گروهی از موجودات زنده را به صورت درخت فیلوژنتیکی نشان دهند. در این صورت نیز این نرم افزار می تواند کمک کننده باشد.

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پروتوکلهای امن
عمومی خبری
حملات فعال و غیرفعال در امنیت اطلاعات

مفیدترین محافظت در برابر تجزیه و تحلیل ترافیک، رمزگذاری ترافیک SIP است. برای انجام این کار، یک مهاجم باید به پروکسی SIP (یا گزارش تماس آن) دسترسی داشته باشد تا مشخص کند چه کسی تماس را برقرار کرده است.

عمومی خبری
انواع ویروس ها

ویروس قطعه ای از کد است که در یک برنامه قانونی جاسازی شده است. ویروس ها خود تکثیر می شوند و برای آلوده کردن برنامه های دیگر طراحی شده اند. آنها می توانند با تغییر یا از بین بردن فایل ها که باعث خرابی سیستم و اختلال در عملکرد برنامه می شود، سیستم را خراب کنند. با رسیدن به دستگاه هدف، یک قطره چکان ویروس (معمولاً یک اسب تروجان) ویروس را وارد سیستم می کند. 

رمزنگاری و استگانوگرافی
عمومی خبری
استگانوگرافی تصویر در رمزنگاری

رمزنگاری و استگانوگرافی هر دو روش هایی هستند که برای مخفی کردن یا محافظت از داده های مخفی استفاده می شوند. با این حال، آنها از این نظر تفاوت دارند که رمزنگاری داده ها را ناخوانا می کند یا معنای داده ها را پنهان می کند، در حالی که استگانوگرافی وجود داده ها را پنهان می کند.