4. КОМПЬЮТЕРНЫЙ АНАЛИЗ ГЕНЕТИЧЕСКИХ ТЕКСТОВ.

Выявление и анализ закодированных в последовательностях функци­ональных сигналов требует применения современных методов информа­тики - качественных баз данных с современными средствами управле­ния, новейших методов распознавания образов, статистических иссле­дований, применения специальных алгоритмов для преодоления возни­кающих вычислительных трудностей.

В настоящее время исследование функциональных свойств расшифро­ванных последовательностей нуклеиновых кислот - это новый раздел молекулярной биологии, граничащий с информатикой, с одной стороны, и молекулярной биофизикой - с другой. Можно с уверенностью ска­зать, что в настоящее время анализ последовательности биополимера позволяет извлечь лишь очень небольшую долю закодированной в ней информации. В конечном счете точное выявление функциональных осо­бенностей в последовательностях нуклеиновых кислот будет возможно только после детального исследования соответствующих реакций, осу­ществляемых нуклеиновобелковыми комплексами.

Для оперативной работы с последовательностями создаются специ­альные банки данных. В банке в доступном для пользователя виде хранится каждая рас­шифрованная последовательность и ее паспорт, в котором указаны различные сведения о ней. Это сведения об организме, из которого выделена последовательность, о документе, где она описана, о рас­положении на ней регуляторных участков и белках, которые она кодирует и т.д. В настоящее время созданы три большие базы данных пос­ледовательностей нуклеиновых кислот: "Genbank" (Лос-Аламос, США - более 30 млн. нуклеотидов), база данных нуклеотидных последова­тельностей Европейской молекулярно-биологической лаборатории (EMBL, Гейдельберг, ФРГ - более 30 млн. нуклеотидов) и "Генэкспресс" (СССР, ВИНИТИ-ИМГ АН СССР - более 11 млн. нуклеотидов). Из­вестны также несколько белковых баз данных, наиболее представи­тельной из которой является MBRF-PIR (США). Эти базы данных расп­ространяются на различных носителях - магнитных лентах и дисках, на оптических дисках.

Кроме построения филогенетических древ геномов вирусов компьютерный анализ применяется при поиске гомологий, распознавании кодирующих областей, функциональных сигналов, физическом (рестрикционном) картировании молекул ДНК и для предсказания вторичных структур РНК.

Сейчас в мире создано большое количество программ ( обычно организованных в пакеты ) , предназначенных для анализа последовательностей нуклеиновых кислот и избавляющих исследователей от многих трудоёмких рутинных операций , в том числе: подсчёт числа моно -, ди – и тринуклеотидов, перевод нуклеотидной последовательности в аминокислотную и т.д.

Все программы условно делятся на два класса: общего назначе­ния и специального. Первые осуществляют ряд_ наиболее распростра­ненных операций по сбору и анализу последовательностей и позволя­ют: вводить и редактировать новые последовательности, считывать с помощью сканирующих устройств информацию непосредственно с ав­тографов или гелей', находить участки узнавания эндонуклеаз рестрик­ции и представлять результаты в удобном (табличном или графиче­ском) виде, находить участки с элементами поворотной и зеркальной симметрии (палиндромы), транслировать нуклеотидную последова­тельность в белковую во всех трех рамках считывания, сравнивать две последовательности методом точечных матриц гомологии, сравнивать новую последовательность со всеми данными Ген Банка, находить участки, обогащенные теми или иными нуклеотидами, вычислять гипотетическую температуру плавления ДНК, осуществлять автоматиче­скую сборку секвенированных фрагментов в единую структуру - моле­кулу ДНК, транслировать белковую последовательность в нуклеотидную с учетом неравномерности использования кодонов-синонимов, оп­ределять молекулярную массу НК и белков, предсказывать вторичную структуру белков, вычислять свободную энергию образования шпилек и др.

Программы специального назначения создаются для решения более специальных и часто более сложных задач и представляют инте­рес для более узкого круга специалистов. Так, например, они могут выполнять ряд функций: вычисление длины фрагментов ДНК на осно­вании их электрофоретической подвижности в гелях; выбор гибридизационных зондов; предсказание вторичной структуры РНК; локали­зация нуклеотидов в гене, которые могут быть изменены (без измене­ния аминокислотной последовательности) с целью введения сайта уз­навания эндонуклеазы рестрикции; нахождение участков с потенци­ально возможной структурой Z-формы ДНК; выявление функциональ­но значимых участков в неизвестной вновь расшифрованной структуре на основании ранее выведенного консенсуса (в результате сравнитель­ного анализа ряда известных структур с одинаковой функцией); лока­лизацию участков, кодирующих белки, и т.д.

Для примера представлено меню пакета программ MICROGENIE, из которых следует, какие функции общего или специ­ального назначения может выбрать исследователь при работе с нуклеотидными последовательностями.

Программа общего назначения "COMMON" обеспечивает ввод последовательности в ЭВМ, а также проверку введенных данных в диалоговом режиме. Они позволяют также редактировать нуклеотидные последовательности: вводить замены и вставки, исключать нуклеотиды, вырезать, встраивать и объединять нуклеотидные последова­тельности и таким образом моделировать гибридные и мутантные мо­лекулы ДНК. Ввод последовательностей в память машины можно осу­ществлять вручную с клавиатуры, но в последнее время созданы при­боры для автоматического сканирования авторадиограмм и секвениру-ющих гелей, полученных при использовании флуоресцентных меток , передачи данных сразу в компьютер и последующего анализа последовательности с помощью специальных программ. В не­давно вышедшей в издательстве IRL (Оксфорд) книге "Анализ сиквенса нуклеотидных кислот и белков" подробно описываются как конструк­ция сканирующих устройств, так и программы для чтения авторадиог­рамм. Созданы программы для восстановления первичных структур высокомолекулярных ДНК на базе данных сиквенса фрагментов, полученных при ее Неспецифическом расщеплении (например, ультра­звуком,). Родство между любой парой фрагментов ДНК выявляется на основании совпадения последовательности нуклеотидов в их структурах, причем эти совпадающие последовательности и являются местом перекрывания и такие два фрагмента могут быть объединены в более протяженную структуру. Процесс отбора фрагментов и стыковки продолжается до. тех пор, пока не будет восстановлена вся первичная структура исследуемой ДНК. Одной из такого рода программ является "CONTIG" (существует ее вариант для компьютера IBM PC), созданная в лаборатории Ф.Сангера (Кембридж, Англия). Ниже приводятся основные операции, которые позволяет осуществ­лять программа "CONTIG":

1) хранение сиквенса каждого фрагмента;

2) отбор смежных фрагментов и сборка последовательностей из них;

3) сравнение данных, полученных при чтении новых авторади­ограмм, с уже установленными последовательностями;

4) объединение двух фрагментов с помощью третьего, представ­ляющего собой область перекрывания первых;

5) поиск участков ДНК, комплементарных уже установленным, что является проверкой правильности сборки полной структуры ДНК.

ЗАКЛЮЧЕНИЕ.

Метод Максама-Гилберта и метод Сэнгера основаны на одном принципе. В первом используется специфическое расщепление ДНК, обусловленное природой оснований, во втором - статистический синтез ДНК, заканчивающийся на каком-либо одном из 4 нуклеотидов. Таким образом, основой обоих методов является получение полного (статистического) набора фрагментов ДНК, оканчивающихся на каждом из четырёх нуклеотидов.

Химический метод (метод Максама-Гилберта) проще использовать в том случае, когда исс­ледуемая ДНК не слишком велика (200-500 звеньев). В том случае, если речь идет о секвенировании высокомолекулярной ДНК, лучше применять метод полимеразного копирования (метод Сэнгера) , чтобы не вводить про­цедуру рестриктазного расщепления с выделением индивидуальных фрагментов. При энзиматическом секвенировании протяженных одно­цепочечных ДНК (например, бактериофагов) можно применять набор олигонуклеотидов-затравок, синтез которых в настоящее время не тре­бует больших затрат времени и труда. Для двутяжевых высокополимерных ДНК наиболее удобен метод слепого энзиматического секвенирования с применением универсальной затравки (их вы­пускают многие фирмы) и обработки данных с помощью ЭВМ. Хими­ческий метод также может быть применен, но в этом случае необходи­мо вырезать из вектора исследуемые фрагменты ДНК, и это усложняет всю процедуру.

 

СПИСОК ЛИТЕРАТУРЫ.

1.    Жарких А.А. Методы филогенетического анализа генов и белков //Молек.биология. (Итоги науки и техники. ВИНИТИ; М. 1985)

2.    Компьютерный анализ генетических текстов / А.А.Александров, Н.Н.Александров, М.Ю.Бородовский И ДР. М.: Наука.

3.    Методы молекулярной генетики и генной инженерии. Отв. ред. Р.И.Салганник.-Новосибирск: Наука. Сиб. отд-ние, 1990.

4.    Молекулярная клиническая диагностика.Методы: Пер. С англ. / Под ред. С.Херрингтона, Дж.Макги. – М.: Мир, 1999.

5.    Шабарова З.А., Богданов А.А. Химия нуклеиновых кислот и их компанентов. – М.: Химия, 1978.

6.    Шабарова З.А., Богданов А.А., Золотухин А.С. Химические основы генной инженерии: Учебное пособие . – М.: Изд-во МГУ, 1994.

7.    Экспериментальные методы исследования белков и нуклеиновых кислот / Подред. М.А.Прокофьева. – М.: Изд-во МГУ, 1985.


Информация о работе «Секвенирование (Генная инженерия)»
Раздел: Биология
Количество знаков с пробелами: 37995
Количество таблиц: 0
Количество изображений: 6

Похожие работы

Скачать
31514
2
3

... генно-инженерных исследований. Многие из этих вопросов были подняты самими учеными активно работающих в данной области. В настоящее время большинство исследователей считали, что опасения касающиеся, генной инженерии, не имеют достаточно оснований, но многие этические проблемы остаются нерешенными и продолжают возникать новые. В прошлом генетика и медицинская генетика развивалась как относительно ...

Скачать
96693
1
0

... олигонуклео­тидов—одну полуавтоматическую, а вторую в комплексе с компьютером. В 1982 г. цена этих приборов на американ­ском рынке составляла 36000—39500 долл.[2]. К открытиям связанным с достижениями генной инженерии нужно прибавить то, что огромный генетический «чертеж» многоклеточного существа просчитан полностью. Я думаю это можно назвать достижением века.  После восьми лет работы многих ...

Скачать
29486
0
0

... гистон), и от мыши. Вскоре аналогичная работа была выполнена в нашей стра­не группой специалистов под руководством С. И. Алиханяна и А. А. Баева. Достижения генетики и химии нуклеиновых кислот позво­лили разработать методологию генной инженерии: —открытие явления рестрикции — модификации ДНК и выделение ферментов рестриктаз для получения специфи­ческих ферментов; —создание методов химического ...

Скачать
21073
0
0

... через дыхательные пути человека). Воздушно- капельным путем (за счет образования стойких аэрозолей) распространяются многие респираторные инфекции (грипп, коклюш, дифтерия, корь, туберкулез и др.). Микробиологическая чистота воздуха имеет большое значение в больничных условиях (особо- операционные и другие хирургические отделения). Микрофлора человека и ее значение. Ребенок развивается в ...

0 комментариев


Наверх