بیوانفورماتیک چیست؟
- بهدست: Admingfars
- دستهبندی: عمومی خبری

بیوانفورماتیک چیست؟
بیوانفورماتیک چیست؟
بیوانفورماتیک ترکیبی از زیست شناسی و فناوری اطلاعات است. اساساً، بیوانفورماتیک علمی است که اخیراً توسعه یافته و از فناوری اطلاعات برای درک پدیده بیولوژیکی استفاده میکند. بیوانفورماتیک به طور گستردهای شامل ابزارها و روشهای محاسباتی است که برای مدیریت، تجزیه و تحلیل و ادراه کردن دادههای حجیم بیولوژیکی استفاده میشود. بیوانفورماتیک همچنین ممکن است به عنوان بخشی از زیست شناسی محاسباتی در نظر گرفته شود. زیست شناسی محاسباتی با استفاده از تکنیکهای تحلیلی کمی در مدلسازی و حل مشکلات در سیستمهای بیولوژیکی درگیر است. بیوانفورماتیک یک رویکرد میان رشتهای است که به دانش پیشرفته علوم کامپیوتر، ریاضیات و روشهای آماری برای درک پدیدههای بیولوژیکی در سطح مولکولی نیاز دارد.
تاریخچه
پایههای بیوانفورماتیک در اوایل دهه 1960 با استفاده از روشهای محاسباتی برای تجزیه و تحلیل توالی پروتئین به ویژه، مونتاژ توالیهای جدید، پایگاه دادههای توالی بیولوژیکی و مدلهای جایگزینی گذاشته شد. بعدا از آن، تجزیه و تحلیل DNA نیز به دلیل پیشرفت موازی روشهای زیست شناسی مولکولی (که دستکاری آسانتر DNA و همچنین توالی آن را فراهم میکند) و همچنین پیشرفت در علوم کامپیوتر و ظهور رایانههای کوچک (که قدرتمندتر بوده و دارای نرم افزارهای جدیدتر و مناسبتر برای انجام کارهای بیوانفورماتیک بود) سادهتر شد. اصطلاح بیوانفورماتیک، برای اولین بار در دهه 1990 مطرح شد. در اصل، این کار با مدیریت و تجزیه و تحلیل دادههای مربوط به توالی DNA ، RNA و پروتئین بود.
از آنجایی که دادههای بیولوژیکی با سرعت بی سابقهای تولید میشوند، مدیریت و تفسیر آنها به بیوانفورماتیک نیازمند است. بنابراین، بیوانفورماتیک اکنون انواع مختلفی از دادههای بیولوژیکی را نیز شامل میشود. اولین پایگاه اطلاعاتی بیوانفورماتیک / بیولوژیکی چند سال پس از در دسترس بودن اولین توالیهای پروتئینی ساخته شد. اولین توالی پروتئین گزارش شده مربوط به انسولین گاوی در سال 1956 بود که از 51 اسیدآمینه تشکیل شده بود. تقریباً یک دهه بعد، اولین توالی یابی اسید نوکلئیکی گزارش شد که مربوط به tRNA آلانین مخمر با 77 باز بود. فقط یک سال بعد، مارگارت دیلوف (1925–1983) که یک شیمی – فیزیک دان آمریکایی بود تمام دادههای توالیهای موجود را برای ایجاد اولین پایگاه داده بیوانفورماتیک جمع آوری کرد. پروتئین Data Bank در سال 1972 با جمع آوری ده پروتئین کریستالوگرافی شده با اشعه ایکس توالییابی شد و در سال 1987 تاسیس اولین پایگاه داده توالی پروتئین به نام The SWISS PROT آغاز شد.

معرفی فیلم آموزش مقدماتی بیوانفورماتیک (Bioinformatics)
همانطور که پیشتر بیان شد بیوانفورماتیک یک دانش نوین بین رشتهای است که در آن با استفاده از علوم کامپیوتر، ریاضی، ژنتیک، شیمی، فیزیک، آمار و احتمالات در شاخه زیست شناسی مولکولی اهداف مختلفی دنبال میشود. پیشرفتهای انجام شده در زیست شناسی و فناوریهای جدید در ذخیره و بازیابی اطلاعات زیستی موجب شده این دو علم به هم گره بخورند. در این راستا فرادرس دورههای متعدد بیوانفورماتیکی را با همکاری مدرسین برجسته کشوری تهیه و تدوین کرده است.
این فرادرس توسط آقای دکتر فرشید شیرافکن دانشجوی دکتری تخصصی بیوانفورماتیک دانشگاه تهران (ایشان از مدرسین نمونه در زمینه ارائه و آموزش دروس دانشگاهی انتخاب شده اند) تدریس شده است. این دوره شامل ۹ فصل تحت عناوین مروری بر زیست مولکولی، مقدمات بیوانفورماتیک (Bioinformatics)، پایگاه دادههای زیستی، انطباق دوتایی توالیها، جستجوی تشابه در پایگاه دادهها، انطباق چندگانه توالیها، HMM – PSSM – پیشگویی دمین و موتیف، فیلوژنتیک (Phylogenetics) و آموزش برنامه نویسی R تهیه و تدوین شده است و برای تمامی دانشجویان رشتههای بیوانفورماتیک،
زیستشناسی، مهندسی کامپیوتر و تمام علاقمندان به این حوزه پرکاربرد مناسب است.
داده های بیوانفورماتیکی
دادههای کلاسیک بیوانفورماتیک شامل توالی DNA ژنها یا ژنومهای کامل، توالی اسیدهای آمینه پروتئینها، ساختارهای سه بعدی پروتئینها و اسیدهای نوکلئیک و مجموعههای اسید نوکلئیک – پروتئین است. جریان دادههای فرعی یا omics عبارتند از: Transcriptomics که به معنی الگوی سنتز RNA از DNA است، پروتئومیکس که توزیع پروتئین در سلولها بوده، Interactomics که الگوهای فعل و انفعالات پروتئین – پروتئین و پروتئین – اسید نوکلئیک و Metabolomics که طبیعت و الگوهای ترافیکی تبدیل مولکولهای کوچک توسط مسیرهای بیوشیمیایی فعال در سلولها تعریف شده است. در هر حالت علاقه به دستیابی به دادههای دقیق و جامع برای انواع خاصی از سلولها و شناسایی الگوهای تغییر در دادهها وجود دارد.
به عنوان مثال، بسته به نوع سلول، زمان جمع آوری اطلاعات (در طول چرخه سلولی یا تغییرات روزانه، فصلی یا سالانه)، مرحله رشد و شرایط مختلف محیطی ممکن است دادهها در نوسان باشند. متاژنومیکس و متاپروتومیکس این اندازه گیریها را به شرح جامعی از ارگانیسمهای موجود در یک نمونه گرفته شده از محیط مانند یک سطل آب اقیانوس یا یک نمونه خاک گسترش میدهد. بیوانفورماتیک با شتاب زیاد فرآیندهای تولید داده در زیست شناسی را به جلو میبرد. روشهای تعیین توالی ژنوم شاید بارزترین اثرات آن را نشان دهند. در سال 1999 بایگانی توالی اسید نوکلئیک حاوی 3/5 میلیارد نوکلئوتید بود که کمی بیشتر از طول یک ژنوم انسانی است. یک دهه بعد این اطلاعات حاوی بیش از 283 میلیارد نوکلئوتید یعنی طولی به اندازه 95 عدد ژنوم انسانی بودند.
ذخیره و بازیابی داده ها
در بیوانفورماتیک، از بانکهای داده برای ذخیره و سازماندهی دادهها استفاده میشوند و محققان توالی DNA و RNA بسیاری از این موجودات را از مقالات علمی و پروژههای ژنوم جمع آوری میکنند. بسیاری از پایگاههای اطلاعاتی در اختیار کنسرسیومهای بین المللی است. به عنوان مثال، یک کمیته مشورتی متشکل از اعضای بانک اطلاعاتی توالی نوکلئوتید آزمایشگاه زیست شناسی مولکولی اروپا (EMBL-Bank) در انگلستان، بانک داده DNA ژاپن (DDBJ)، و GenBank از مرکز ملی اطلاعات بیوتکنولوژی در ایالات متحده (NCBI) بر «همکاری بین المللی بانک اطلاعات توالی نوکلئوتیدی» (INSDC) نظارت میکنند.
برای اطمینان از در دسترس بودن و آزاد بودن دادههای توالییابی، مجلات علمی لازم است که توالیهای نوکلئوتیدی جدید افراد را به عنوان شرط انتشار مقاله در یک پایگاه داده در دسترس عموم قرار دهند. شرایط مشابه در اسیدهای نوکلئیک برای ساختارهای پروتئینی نیز اعمال میشود، همچنین مرورگرهای ژنوم وجود دارند و پایگاه دادههایی که تمام اطلاعات ژنومی و مولکولی موجود، در مورد یک گونه خاص را با هم جمع میکنند. پایگاه داده اصلی ساختار ماکرومولکولی بیولوژیکی بانک اطلاعات پروتئین در سراسر جهان PDB است که حاصل یک تلاش و همکاری مشترک تحقیقات بیوانفورماتیکِ ساختاری (RCSB) در ایالات متحده، بانک اطلاعات پروتئین (PDBe) در انستیتوی بیوانفورماتیک اروپا در انگلستان و بانک اطلاعات پروتئین ژاپن در دانشگاه اُساکا است.
صفحات اصلی همکار PDB حاوی پیوندهایی به خود فایلهای داده و مطالب گویا و آموزشی (از جمله اخبار)، تسهیلات برای ذخیره مطالب جدید و نرم افزار جستجوی تخصصی برای بازیابی ساختارها هستند. بازیابی اطلاعات از بایگانی دادهها از ابزارهای استاندارد برای شناسایی داده توسط کلمه کلیدی استفاده میکند. الگوریتم های دیگر، بانک های داده را جستجو می کنند تا شباهتهای موردی دادهها را تشخیص دهند. به عنوان مثال، یک مسئله قابل کاوش در یک پایگاه توالی داده، استفاده از توالی ژنی یا پروتئینی مورد نظر به منظور شناسایی موجوداتی با توالی مشابه است.

اهداف بیوانفورماتیک
توسعه الگوریتمهای کارآمد برای اندازه گیری تشابه توالی، هدف مهم بیوانفورماتیک است. الگوریتم Needleman – Wunsch، که مبتنی بر برنامه نویسی پویا است، یافتن چینش بهینه جفت توالیها را تضمین میکند. این الگوریتم اساساً یک مسئله بزرگ (دنباله کامل) را به مجموعهای از مسائل کوچکتر (بخشهای توالی کوتاه) تقسیم میکند و از راه حلهای مسئلههای کوچکتر برای راه حل مسئله بزرگ استفاده میکند. شباهت در توالیها در یک ماتریکس امتیاز بندی میشوند و الگوریتم امکان تشخیص شکافها در «تراز بندی توالیها» (Sequence Alignment) را فراهم میکند. اگرچه الگوریتم Needleman – Wunsch موثر است، اما به عنوان کاوش یک پایگاه داده توالییابی بزرگ بسیار کند است.
بنابراین، توجه زیادی به یافتن الگوریتمهای بازیابی سریع اطلاعات شده است که میتوانند با مقادیر زیادی از دادهها در بایگانیها سر و کار داشته باشند. که برنامه «بلاست» (BLAST) یا Basic Local Alignment Search Tool یکی از آنها است. یک بخش پیشرفته از BLAST، شناخته شده به عنوان موقعیت خاص تکرار شونده یا PSIBLAST که برگرفته از position-specific iterated BLAST است، باعث استفاده از الگوهای حفاظتشده در توالیهای مرتبط میشود و ترکیبی از سرعت بالای BLAST همراه حساسیت بسیار بالا برای یافتن توالیهای مرتبط است.
هدف دیگر بیوانفورماتیک، گسترش دادههای تجربی توسط پیشبینیها است. یک هدف اساسی از زیست شناسی محاسباتی، پیش بینی ساختار پروتئین از یک توالی اسید آمینه است. پیشرفت در توسعه روشهای پیش بینی «حالات قرارگیری فضایی» (Folding) پروتئین توسط برنامههای ارزیابی حیاتی، پیش بینی ساختار (CASP) طی دو سال اندازهگیری میشود که شامل آزمونهای کور روشهای پیش بینی ساختار است. از بیوانفورماتیک برای پیش بینی تعاملات بین پروتئینها با توجه به ساختارهای فردی آمینواسیدها نیز استفاده میشود. این نوع پژوهش به عنوان داکینگ پروتئینها شناخته میشود. مجموعههای پروتئین – پروتئین مکمل بودن خوبی با هم در شکل سطحی و قطبیت دارند و عمدتا توسط فعل و انفعالات ضعیف مانند پیوندهای سطح آبگریز، پیوندهای هیدروژنی و نیروهای وان در والس تثبیت میشوند.
برنامههای نرم افزاری رایانهای این تعاملات را برای پیش بینی رابطه فضایی مطلوب بین زیرواحدهای متصل به هم شبیهسازی میکند. یک چالشی که میتواند کاربردهای درمانی مهمی داشته باشد، طراحی آنتی بادیهایی است که با میل زیاد به پروتئین هدف متصل شوند. در ابتدا، بسیاری از تحقیقات بیوانفورماتیک، تمرکز نسبتاً کمی بر الگوریتمهایی برای تجزیه و تحلیل انواع خاصی از دادهها، مانند توالی ژنها یا ساختارهای پروتئینی داشته است. با این حال، اکنون، اهداف بیوانفورماتیکی یکپارچه هستند و هدف آنها این است که دریابند چگونه میتوان از ترکیب انواع مختلف دادهها برای درک بهتر پدیدههای طبیعی، از جمله ارگانیسمها و بیماریها استفاده کرد.

ابزارهای بیوانفورماتیکی چه هستند؟
ابزار اصلی یک «بیوانفورماتیست» (فردی که بر روی بیوانفورماتیک مطالعه و پژوهش انجام میدهد) برنامههای نرم افزاری رایانهای و اینترنتی است. یکی از فعالیتهای اصلی در این زمینه، تجزیه و تحلیل توالی DNA و پروتئینها با استفاده از نرم افزارها و پایگاههای اطلاعاتی مختلف موجود در شبکه جهانی وب است. همه افراد، از پزشکان گرفته تا زیست شناسان مولکولی، با دسترسی به اینترنت و وب سایتهای مربوطه اکنون میتوانند با استفاده از ابزارهای بیوانفورماتیک اصلی، ترکیب مولکولهای بیولوژیکی مانند اسیدهای نوکلئیک و پروتئینها را آزادانه کشف کند. این بدان معنا نیست که دستیابی و تجزیه و تحلیل دادههای ژنومی خام میتواند به راحتی توسط همه انجام شود.
بیوانفورماتیک یک رشته در حال تکامل است و اکنون متخصصان بیوانفورماتیک از برنامههای نرم افزاری پیچیدهای برای بازیابی، مرتب سازی، تجزیه و تحلیل، پیش بینی و ذخیره دادههای توالی DNA و پروتئین استفاده میکنند. بنگاههای تجاری بزرگ مانند شرکتهای دارویی برای انجام و حفظ نیازهای بیوانفورماتیک مقیاس بزرگ و پیچیده این صنایع، از بیوانفورماتیک استفاده میکنند. با افزایش نیاز روز افزون به ورودی مداوم از متخصصان بیوانفورماتیک، اکثر آزمایشگاههای زیست پزشکی ممکن است به زودی متخصص بیوانفورماتیک داخلی خود را داشته باشند.
یک بیوانفورماتیست به تنهایی، فراتر از فراگیری اولیه و تجزیه و تحلیل دادههای ساده، مطمئناً برای هر تجزیه و تحلیل پیچیدهای به مشاوره بیوانفورماتیک خارجی نیاز دارد. رشد بیوانفورماتیک با ایجاد شبکههای رایانهای امکان دسترسی آسان به دادههای بیولوژیکی و امکان توسعه برنامههای نرم افزاری برای تجزیه و تحلیل بی دردسر را فراهم کرده است. چندین پروژه بین المللی با هدف ارائه پایگاه دادههای ژنی و پروتئینی از طریق اینترنت به طور رایگان در دسترس کل جامعه علمی است. ابزارهای بیوانفورماتیکی مختلفی برای اهداف متفاوت گسترش یافتهاند که در ادامه به بررسی برخی از این اهدف پرداختهایم.
- تحلیل توالی. «تجزیه و تحلیل توالی» (Sequence analysis) قرار دادن RNA، توالی پپتید و DNA به انواع مختلف روشهای تحلیلی است. این کار برای شناسایی منشا، تکامل و ساختار پایگاههای اطلاعاتی بیولوژیکی انجام میشود.

- مدل سازی مولکولی. «مدل سازی مولکولی» (Molecular modelling) از روشهای محاسباتی و نظری برای تجزیه و تحلیل رفتار مولکولها استفاده میکند. بهترین ابزارهای بیوانفورماتیک با منبع باز و رایگان از روش شبیه سازی برای انجام مدل سازی مولکولی استفاده میکنند.
- دینامیک مولکولی. کاربرد «دینامیک مولکولی» (Molecular dynamics) در بیوانفورماتیک در تعیین حرکت فیزیکی اتمها مهم است. این روش برای محیطهای سلول مانند در زمینه بیوانفورماتیکِ ساختاری مهم است. اندازه گیریهای استفاده شده در این روشها شامل نظریههای نمودار، روابط پویای بین مولکولی و بررسی پاسخ آشفتگی اتمها و مولکولها است.
- FASTA در بیوانفورماتیک. FASTA قالبی است که ماهیت آن متن محور است و برای نشان دادن توالی پپتید و نوکلئوتید استفاده میشود. بستههای نرم افزاری FASTA برای ابزارهای بیوانفورماتیک و برای تعیین توالی ترازهای پروتئین و DNA کمک می کنند.
- تجزیه و تحلیل فیلوژنتیک در بیوانفورماتیک. «تجزیه و تحلیل فیلوژنتیک» (Phylogenetic analysis) توسط ابزارهای بیوانفورماتیک نمودارهای شاخهای را برای نشان دادن رابطه یا تاریخچه تکاملی بین ارگانیسمهای گونههای مختلف فراهم میکند. این نمودارهای شاخهای درختان فیلوژنتیک نامیده میشوند و به شناسایی خصوصیاتی مانند ژنها، اندامها و پروتئینها در ارگانیسمها کمک میکنند.

- پایگاههای اطلاعاتی بیولوژیک در بیوانفورماتیک. «پایگاه دادههای بیولوژیک» (Biological databases) در بیوانفورماتیک را میتوان با تجزیه و تحلیل سه دسته موجود، درک کرد. این سه گروه عبارتند از: عملکرد، ساختار و توالی. توالی پروتئین و اسید نوکلئیک در پایگاه داده توالی ذخیره میشود در حالی که پروتئین و RNA در پایگاه دادههای ساختاری وجود دارند. نقش فیزیولوژیکی محصولات ژنی توسط پایگاههای داده عملکردی فراهم میشود.
ابزارهای مختلف بیوانفورماتیکی شامل پایگاههای داده و همچنین نرمافزارهای رایگان و پولی مختلفی هستند که افراد بسته به نیاز خود از آنها استفاده میکنند. بسیاری از پایگاههای داده بزرگ در دنیا تمامی اطلاعات خود را به صورت رایگان در اختیار کاربران و پژوهشگران قرار میدهند و به این ترتیب اطلاعات جدید دیگری مانند انواع توالیهای جدید شناسایی شده به اطلاعات ذخیره شده آنها اضافه خواهد شد. در ادامه مثالهایی از هر کدام را که در حال حاضر وجود دارند ارائه میدهیم.
پایگاه های داده
پایگاههای داده برای تحقیقات و کاربردهای بیوانفورماتیک، ضروری هستند. بسیاری از پایگاههای دادهای وجود دارند که انواع مختلفی از اطلاعات را در بر میگیرند به عنوان مثال، توالی DNA و پروتئین، ساختارهای مولکولی، فنوتیپها و اطلاعات تنوعهای زیستی. پایگاههای اطلاعاتی ممکن است حاوی دادههای تجربی (مستقیماً از آزمایشات بدست آمده)، دادههای پیش بینی شده (حاصل از تجزیه و تحلیل) یا هر دو باشد. این اطلاعات ممکن است مخصوص ارگانیسم، مسیر یا مولکول مورد علاقه خاص باشند یا آنها میتوانند دادههای جمع آوری شده از چندین پایگاه داده دیگر را ترکیب کنند. این پایگاههای داده از نظر قالب، سازوکار دسترسی و عمومی بودن یا نبودن متفاوت هستند. برخی از پایگاههای اطلاعاتی که معمولاً مورد استفاده قرار میگیرند در ادامه توضیح داده شده اند.
- پایگاههای داده مورد استفاده در تجزیه و تحلیل توالی بیولوژیکی: Genbank ، UniProt.
- پایگاههای داده مورد استفاده در تجزیه و تحلیل ساختار: بانک داده پروتئین یا PDB.
- پایگاههای داده مورد استفاده در یافتن خانوادههای پروتئینی و یافتن موتیفهای (ساختارهای ثانویه) پروتئینی: InterPro ، Pfam.
- پایگاههای دادهای که برای تعیین توالی نسل بعدی استفاده میشوند: «بایگانی توالیهای خواندنی» (Sequence Read Archive).
- پایگاههای دادهای مورد استفاده در تجزیه و تحلیل شبکه: پایگاه دادههای متابولیک (KEGG ، BioCyc)، پایگاههای تجزیه و تحلیل تعاملات و برهم کنشها، شبکههای عملکردی.
- پایگاههای دادهای مورد استفاده در طراحی مدارهای ژنتیکی مصنوعی: GenoCAD.
معرفی فیلم آموزش پایگاه داده های بیوانفورماتیکی پروتئین
همانطور که میدانید پروتئینها محصولات ژنی هستند. بنابراین با توجه به اینکه ژنها تاثیرات خود را در داخل سلول با تولید پروتئینها اعمال میکنند، دریافت اطلاعات پیرامون ویژگیهای مختلف پروتئینها برای دستکاریهای ژنتیکی به اهدف مختلف علمی میتواند بسیار ارزشمند باشد. تولید حجم زیاد دادههای زیستی نیاز به مدیریت، ذخیره و استخراج اطلاعات از این دادهها را ایجاد نمود بنابراین شاخه بیوانفورماتیک به میان آمد تا محققان با ابداع ابزارهایی با کمک دادههای ذخیره شده در پایگاه دادهها به انجام آنالیزهای مختلف بر روی مولکولهای زیستی مانند پروتئینها بپردازند.
این فرادرس که توسط خانم مهسا سالیانی دانشجوی دکتری بیوشیمی در دانشگاه فردوسی مشهد طی ۳ فصل شامل پایگاه داده UniProt و EMBL-EBI، پایگاه داده NCBI، بلاست و هم ترازی توالی های پروتئینی و معرفی سایت ExPASy و پایگاه داده KEGG تهیه و تدوین شده است. این فرادرس برای کلیه دانشجویان رشتههای زیست شناسی، پزشکی، داروسازی، مهندسی کشاورزی و بیوتکنولوژی و سایر علاقمندان به حوزههای بیوانفورماتیک مناسب است. (این دوره تضمین کیفیت و گارانتی بازگشت هزینه را از طرف وب سایت فرادرس دارد)
نرم افزارهای بیوانفورماتیک
نرم افزارهای بیوانفورماتیک از ابزارهای پیرو خط فرمان کوتاه، تا برنامههای گرافیکی پیچیدهتر متفاوت هستند. این نرمافزارها شامل انواع رایگان و نیازمند پرداخت هزینه و همچنین نرم افزارهای تحت وب هستند که هر کدام کاربردهای مختلفی بر عهده دارند. در ادامه به همه آنها پرداختهایم.
نرم افزارهای منبع باز
بسیاری از ابزارهای نرم افزاری رایگان و با منبع آزاد از دهه 1980 تاکنون وجود داشته و در حال رشد هستند. ترکیبی از نیاز مستمر به الگوریتم های جدید برای تجزیه و تحلیل انواع نوظهور بازخوانیهای بیولوژیکی، پتانسیل ابتکاری در آزمایشات «درون رایانهای» (In Silico) و پایگاههای «کد – باز» (Open – Code) در دسترس که به ایجاد فرصت برای همه گروههای تحقیقاتی کمک کردهاند تا صرف نظر از تمهیدات مالی آنها هم به بیوانفورماتیک و هم به دامنه نرم افزار منبع باز موجود کمک کنند. ابزارهای رایگان اغلب به عنوان پرورشدهنده ایدهها یا پلاگینهای پشتیبانی شده توسط جامعه در نرمافزارهای تجاری عمل میکنند. طیف وسیعی از بستههای نرم افزاری رایگان شامل موارد زیر هستند.
- Bioconductor. یک پروژه نرم افزاری توسعه یافته و رایگان برای تجزیه و تحلیل و درک دادههای ژنومی تولید شده توسط تستهای آزمایشگاهی در زیست شناسی مولکولی است. Bioconductor بر اساس زبان آماری برنامه نویسی R استوار است، اما حاوی سایر زبانهای برنامه نویسی دیگر نیز است.
- BioPerl. یک پروژه نرم افزاری فعال است که توسط بنیاد Open Bioinformatics پشتیبانی میشود. از این پایگاه برای رفع اشکالات موجود در پروژه توالییابی ژنوم انسان استفاده شد.
- Biopython. پروژه Biopython مجموعهای از ابزارهای غیر تجاری Python برای زیست شناسی محاسباتی و بیوانفورماتیک است که توسط یک انجمن بین المللی توسعه دهندگان ایجاد شده است. این ابزار شامل طبقهبندیهایی برای نشان دادن توالیهای بیولوژیکی و حاشیه نویسی توالیها است و قادر به خواندن و نوشتن در انواع قالبهای فایلها است. همچنین این ابزار امکان دستیابی بصورت برنامهای برای راهیابی به پایگاه دادههای آنلاین اطلاعات بیولوژیکی، مانند آنهایی که در NCBI وجود دارد را فراهم میکند.
- BioJava. یک پروژه نرم افزاری است که برای ارائه ابزارهای جاوا برای پردازش دادههای بیولوژیکی اختصاص داده شده است. این ابزار مجموعهای از توابع کتابخانهای است که در زبان برنامه نویسی جاوا برای دستکاری توالیها، ساختارهای پروتئینی، سیستم توزیع حاشیه نویسی (DAS)، دسترسی به AceDB، برنامه نویسی پویا و سیستمهای آماری ساده نوشته شده است.
- BioJS. یک پروژه برای دادههای بیوانفورماتیک در وب است، هدف آن توسعه یک کتابخانه منبع باز از اجزای JavaScript برای تجسم دادههای بیولوژیکی است.
- BioRuby. مجموعه ای از کد روبی (یک زبان برنامه نویسی پیشرفته) است که شامل کلاسهایی برای زیست شناسی مولکولی محاسباتی و بیوانفورماتیک است. این ابزار شامل کلاسهایی برای تجزیه و تحلیل توالی DNA و پروتئین، ترازبندی توالی، تجزیه پایگاه داده بیولوژیکی، زیست شناسی ساختاری و سایر کارهای بیوانفورماتیک است.
- Bioclipse. یک پلتفرم بصری مبتنی بر جاوا، منبع باز و بر پایه شیمی و بیوانفورماتیک در بستر نرم افزاری Eclipse Rich Client (RCP) است.
- EMBOSS. یک نرم افزار تجزیه و تحلیل رایگان بوده که برای نیازهای جامعه کاربران زیست شناسی مولکولی و بیوانفورماتیک تهیه شده است. این نرم افزار به طور خودکار با دادهها در قالبهای مختلف کنار میآید و حتی امکان بازیابی شفاف دادههای توالی را از وب فراهم میکند.
- NET Bio. یک کتابخانه بیوانفورماتیک و ژنومیک منبع باز است که برای امکان بارگذاری، ذخیره و تجزیه و تحلیل دادههای بیولوژیکی ایجاد شده است.
- Orange. یک مجموعه ابزار تجسم دادهها، یادگیری ماشین و داده کاوی است. این نرم افزار دارای یک برنامه نویسی بصری front-end برای تجزیه و تحلیل سریع دادههای کیفی و تجسم دادههای تعاملی است.
- UGENE. یک نرم افزار رایانهای برای بیوانفورماتیک بوده که بر روی انواع سیستم عاملها قابل استفاده است. UGENE به زیست شناسان کمک میکند تا دادههای مختلف ژنتیکی بیولوژیک، مانند توالیها، حاشیه نویسیها، ترازبندیهای متعدد، درختان فیلوژنتیک، سرهم بندیهای NGS و موارد دیگر را تجزیه و تحلیل کنند.
- GenoCAD. یکی از اولین ابزارهای طراحی به کمک رایانه برای زیست شناسی مصنوعی است که در طراحی وکتورهای بیانی انتقال ژن، شبکههای مصنوعی ژنی و سایر ساختارهای مورد استفاده در مهندسی ژنتیک کاربرد دارد.
معرفی فیلم آموزش آشنایی با نرم افزار Clustal X و کاربردهای آن در بیوانفورماتیک
نرم افزار Clustal X میتواند با هم ردیف سازی توالیهای ژن، میزان تشابه یا تفاوت دو موجود را از نظر یک ناحیه ژنی نشان دهد. علاوه بر این، اگر محقق بخواهد ناحیه ژنی مناسب برای تکثیر ژن را پیدا کند، این نرم افزار بسیار سودمند خواهد بود. گاهی پژوهشگران نیاز دارند تا روابط بین گروهی از موجودات زنده را به صورت درخت فیلوژنتیکی نشان دهند. در این صورت نیز این نرم افزار می تواند کمک کننده باشد.
بدون دیدگاه