Где используются компьютеры в биологии

Глава II. Опытно-экспериментальная работа по применению информационно-компьютерных технологий в обучении биологии.

2.1 Опыт применения учителями информационно-компьютерных технологий

2.2 Опытно-экспериментальная работа по использованию информационно-компьютерных технологий в обучении биологии

« К детям надо относиться бережно, и больше всего следить за методикой своей работы. Следует искать лучших способов, возбуждать внимание в детях и поддерживать их любознательность, пытливость ума, дерзание творчества».

К.Э. Циолковский

Необычайно высокие темпы развития биологии в последнем десятилетии сопровождаются быстро растущим значением ее в жизни человека.

Совершенствование биологического образования требуется на всех уровнях. При этом особое значение приобретает изучение биологии в школе.

Один из наиболее естественных и продуктивных способов вводить новые информационные технологии в школу состоит в том, чтобы непосредственно связать этот процесс с совершенствованием содержания, методов и организации форм обучения, ориентируя всю программу на решение общезначимых педагогических проблем.

Профессор И.В. Роберт отмечает, что компьютерные технологии могут использоваться в качестве:

-средства обучения, совершенствующего процесс преподавания;

-инструмента познания окружающей действительности и самопознания;

-средства развития личности обучаемого;

-средства информационно-методического обеспечения и управления учебно-воспитательным процессом;

-средства коммуникаций в целях распространения передовых педагогических технологий;

-средства автоматизации процессов контроля, коррекции результатов учебной деятельности, компьютерного педагогического тестирования и психодиагностики;

-средства автоматизации процессов обработки результатов эксперимента (лабораторного, демонстрационного) и управления учебным оборудованием;

-средства организации интеллектуального досуга, развивающих игр.

Одним из важнейших направлений модернизации современной школы является ее информатизация. Различные авторы указывают на возможность и даже стратегическую важность использования информационных технологий в обучении биологии, организуются специализированные конференции, посвященные проблемам компьютеризации образования. Наиболее перспективно использование в обучении средств мультимедиа, поскольку мультимедиа позволяет задействовать в процессе обучения все каналы передачи информации, максимально включить все виды памяти. По данным Г. Л. Бордовского, И.Б.Горбуновой и А.С.Кондратьева, «. внимание во время работы с обучающей программой на базе мультимедиа, как правило, удваивается, поэтому освобождается дополнительное время. Экономия времени, необходимого для изучения конкретного материала, в среднем составляет 30%, а приобретенные знания сохраняются в памяти значительно дольше» [8].

Компьютер позволяет создать условия для повышения эффективности процесса обучения, раздвигает возрастные возможности обучения. С развитием мультимедийных технологий компьютер становится средством обучения, способным наглядно представлять самую различную информацию. Как следствие, происходит развитие творческого потенциала обучаемого, способностей к коммуникативным действиям, навыков экспериментально-исследовательской работы; культуры учебной деятельности; интенсификация учебно-воспитательного процесса, повышение его эффективности и качества.

Формирование информационно коммуникативной компетентности школьников, становление их информационной культуры, компьютерной грамотности приобретает в настоящее время особую значимость. Информационное обеспечение уроков биологии открывает перед учителем перспективу реализации принципиально нового дидактического подхода в обучении, так как дает возможность соединения в одном высказывании письменной и устной речи. На этом фоне обучение созданию компьютерного ролика, мультимедийной презентации позволяет учащимся повысить мотивацию к изучению традиционной темы [2; 18].

Задачи современной школы - воспитать и вооружить ученика такими знаниями, чтобы он мог занять достойное место в обществе и приносить ему максимальную пользу. Одним из важнейших направлений решения этой проблемы является интенсификация учебного процесса, т.е. разработка и внедрение таких форм и методов обучения и учебно-методического материала, которые предусматривали бы целенаправленное развитие мыслительных способностей учащихся, развитие у них интереса к учебной работе, самостоятельности и творчества.

Важность и своевременность создания и внедрения программного обеспечения и методики использования средств мультимедиа при обучении биологии определяют актуальность темы дипломной работы: «Использование компьютерных технологий в обучении биологии»

Цель исследования: доказать, что информационно - коммуникационные технологии в обучении биологии способствуют повышению эффективности обучения.

Объект исследования: учебно-воспитательный процесс.

Предметом исследования является компьютерная поддержка уроков биологии;

1. Показать, что компьютер это средство обучения, развития учащихся;

2. Изучить возможности использование ИКТ на различных этапах урока биологии;

3. Провести опытно - экспериментальную работу по использованию компьютерной поддержки уроков биологии.

I. Теоретические аспекты применения информационно-компьютерных технологий в обучении биологии.

1.1.Использование ИКТ в обучении биологии.

Проблема выявления педагогически обоснованных возможностей использования компьютерной техники в качестве эффективного средства обучения, воспитания и развития школьников на материале разных учебных предметов и биологии в частности приобретает все большую актуальность. Компьютер на всех стадиях учебного занятия оказывает значительное влияние на контрольно-оценочные функции урока, придает ему игровой характер, способствуют активизации учебно - познавательной деятельности учащихся. Компьютеры позволяют добиться более высокого уровня наглядности предлагаемого материала, расширяют возможности включения разнообразных упражнений в процессе обучения.

Особую значимость приобретает изучение уже имеющегося опыта компьютерного обучения, анализ сложившегося в практике применения компьютера для решения разнообразных учебно-воспитательных задач.

Современное общество ставит перед учителем ряд задач, которые требуют от учителя определенных знаний, умений и навыков для их решения. Богатейшие возможности для этого предоставляют современные информационные компьютерные технологии (ИКТ). В отличие от обычных технических средств обучения ИКТ позволяют не только насытить обучающегося большим количеством готовых, строго отобранных, соответствующим образом организованных знаний, но и развивать интеллектуальные, творческие способности учащихся, их умение самостоятельно приобретать новые знания, работать с различными источниками информации. Использование ИКТ на уроках биологии позволяет сделать деятельность учителя и школьника наиболее интересной, интенсивной, повысить качество обучения по предмету, отразить существенные стороны биологических объектов, зримо воплотив в жизнь принцип наглядности, выдвинуть на передний план наиболее важные (с точки зрения учебных целей и задач) характеристики изучаемых объектов и явлений природы.

В педагогической и методической литературе отмечены несколько направлений применения информационных компьютерных технологий в образовании. В школьной учебной практике востребованы четыре основных:

· компьютер - как средство контроля знаний;

· лабораторный практикум с применением компьютерного моделирования;

· мультимедиа-технологии, как иллюстративное средство при объяснении нового материала;

· персональный компьютер, средство самообразования.

В тоже время можно использовать компьютер на уроке при работе с электронными учебниками и учебными курсами; обучающими играми и развивающими программами; электронными энциклопедиями; дидактическими материалами, например, сборники задач, диктантов, тестов, а также представленных в электронном виде, обычно в виде простого набора текстовых файлов в форматах doc, txt и объединенных в логическую структуру средствами гипертекста.

Однако, как показывает практика, компьютер пока не стал полноценным средством обучения в школе. Это связано не только с проблемами, обозначенными в научной литературе. В частности, для достижения положительного эффекта от применения информационных технологий необходимо соблюдение определенных условий:

Временное: каждый предмет школьной программы имеет свои организационно - методические и содержательные особенности, в соответствии с которыми должен быть выбран момент "включения" в него информационных компьютерных технологий;

Техническое: технические характеристики персональных компьютеров различны. В зависимости от круга задач, которые предполагается решать, необходимо подобрать компьютер и дополнительные устройства (такие сканер, принтер, модем, наушники, микрофон, колонки и т.п.).

Организационное: при включении информационных технологий в процесс изучения предмета встает вопрос настройки программного обеспечения и наладки оборудования. Далеко не каждый учитель владеет навыками необходимыми для комплексного обслуживания компьютерного оборудования или для самостоятельной разработки образовательных средств. Поэтому очевидна потребность учителя в квалифицированном помощнике (например, в лице лаборанта или учителя информатики).

При соблюдении этих условий, по оценкам специалистов, современные информационные технологии могут служить действенным дидактическим средством. Проблемы применения компьютерных средств в процессе обучения во многом связаны с готовностью современного учителя к восприятию персонального компьютера как дидактического средства.

В связи с этим чаще всего применяются на уроках:

2. Системы виртуального эксперимента – это программные комплексы, позволяющие учащемуся проводить эксперименты в «виртуальной лаборатории». Главное их преимущество – они позволяют проводить такие эксперименты, которые в реальности были бы невозможны по соображениям безопасности, временным характеристикам и т.п. Главный недостаток подобных программ – естественная ограниченность заложенной в них модели, за пределы которой обучаемый выйти не может в рамках своего виртуального эксперимента.

3. Учебные презентации, которые активно применяются в работе. Цель такого представления учебной информации – формирование у школьников системы мыслеобразования. Подача учебного материала в виде мультимедийной презентации сокращает время обучения, высвобождает ресурсы здоровья детей. Текстовая часть презентации представляет собой только основные мысли по теме или термины для усвоения. Использование мультимедийных презентаций целесообразно на любом этапе изучения темы и на любом этапе урока. Например, «Класс Пресмыкающиеся. Особенности внешнего строения», «Класс Пресмыкающиеся. Внутреннее строение», «Класс Птицы. Внешнее строение». Для создания презентаций в основном используется программа Power Point. Это компьютерное средство интересно тем, что его может создать любой учитель, имеющий доступ к персональному компьютеру, причем с минимальными затратами времени на освоение средств создания презентации.

Кроме того, презентации активно используются и для представления ученических проектов. В школах ведётся поиск оптимальных форм использования метода проектов непосредственно на уроках. Авторами создания электронных пособий, которые могут использоваться как источник дополнительного материала или как наглядное пособие в работе, становится учитель и учащиеся, увлеченные предметом.

В последнее время благодаря национальному проекту « Образование» наблюдается массовое внедрение сети Интернет в школьное образование. Увеличивается число информационных ресурсов по всем предметам и по биологии в частности. Интернет действительно становится доступным для использования в образовательном процессе. А в отношении постановки учебных задач вхождение в сети Интернет мало, чем отличается от просмотра учебного видеофильма или учебной экскурсии. Без четкого сценария посещение Интернета не может оказаться полезным и эффективным. При этом главное в сценарии – нацеливание на вопрос: зачем и для чего используется Интернет? Он позволяет реализовать три сценария:

1. Во-первых, может быть поставлена задача найти дополнительную учебную информацию с сохранением её на магнитных носителях для последующего многократного использования разными пользователями. Учащиеся, пользуясь Интернетом, находят много дополнительной очень интересной информации по вопросам.

2. Во-вторых, возможна задача: отыскать принципиально новую информацию, сопоставить её с уже известной, то есть создать проблемную ситуацию, инициирующую конструктивное общение. Тем более этот материал ценен потому, что его нет в учебниках. В ходе обсуждения учащиеся высказывают своё мнение и своё отношение к данной проблеме.

3. В-третьих, может быть поставлена задача сделать обзор (аналитический обзор, реферат, доклад и т.п.) по сформулированной заранее теме, что может оцениваться как проектная работа ученика.

Новые информационные технологии вообще, и использование мультимедийных систем в частности, способны в немалой степени и разгрузить учителя, и повысить заинтересованность школьников в предмете. Будущее образования невозможно без расширения использования современных технических средств в обучении, задача учителя быть «в ногу со временем» [13].

биологии компьютеры используются очень широко — это и моделирование самых разных биологических систем, и организация и хранение всевозможной информации, и документооборот, и обучение, и экологические ГИС, и Интернет-технологии. Однако, говоря о компьютерной биологии, прежде всего имеют в виду три задачи: расшифровка генома, определение пространственной структуры белка и моделирование функционирования биомакромолекул (рис. 1).

Все перечисленные задачи требуют колоссальных вычислительных мощностей, и сама постановка этих проблем немыслима без высокопроизводительных вычислительных систем. Успехи компьютерной биологии, появившиеся на фоне стремительного развития суперкомпьютерных вычислений, привели к возникновению совершенно новых наук: геномики, протеомики, биоинформатики — дисциплин, которые революционизируют наши представления о живых организмах.

Геномика занимается установлением структуры и выяснением механизма функционирования генома в живых системах. Эта наука открывает новое понимание молекулярных механизмов заболеваний, определяет новые подходы в создании лекарств, новые диагностические тесты. Геномика положила начало получению трансгенных растений и животных.

С геномикой тесно связана еще одна новая наука — протеомика. Если геномика исследует информационный материал клетки, то протеомика изучает структуру и функции белков.

Третья наука биоинформатика занимается более широким спектром вопросов, включая анализ биологических текстов, построение структур макромолекул, предсказание их функций и создание новых лекарственных препаратов. Биоинформатика открывает перспективы перед многими научными и прикладными дисциплинами, такими как археология, теория эволюции, экология, сельское хозяйство и т.п.

В данной статье мы кратко остановимся на специфике задач компьютерной биологии, расскажем о том, какие международные проекты создаются для их решения и какие аппаратные вычислительные комплексы используются для осуществления подобных проектов.

Массивным вычислениям мощные компьютеры

асштабы и сложность биологической информации в проекте «Геном человека» диктовали самые высокие требования к вычислительной инфраструктуре обработки данных. Объемы баз данных в биоинформационных проектах увеличиваются с поразительной скоростью, а участие в работе географически распределенных исследовательских групп и растущая сложность запросов к базам данных требуют использования масштабируемых серверов и систем памяти высокого быстродействия. Для компьютерной биологии необходимы сложные инструменты получения данных, средства визуализации данных и управления активами, что предполагает интеграцию всех систем в единый, четко работающий комплекс. Чтобы показать, насколько сложные вычислительные комплексы требуются для решения задач компьютерной биологии, расскажем об оснащении некоторых исследовательских центров, занятых в программе HGP.

Суперкомпьютерный центр Sanger Centre компании Celera Genomics

Ученые из компаний Celera Genomics, Sanger Centre и Whitehead Institute внесли существенный вклад в проект по расшифровке генома человека, используя в своих исследованиях суперкомпьютерные системы Compaq AlphaServer под ОС Tru64 UNIX и ПО TruCluster. В системе было задействовано более 600 процессоров Alpha, выполняющих около триллиона операций в секунду. Итоговые вычисления осуществлялись на новой системе Compaq AlphaServer GS160, так как для успешного решения задачи требовалось 64 Гбайт общей памяти.

Корпорация Compaq поддерживает работы в области расшифровки генома человека с начала реализации данного проекта. Первоначальная конфигурация центра Sanger Centre включала 160 рабочих станций Compaq Alpha, четыре системы Compaq AlphaServer 1200, а впоследствии центр приобрел 250 систем Compaq AlphaServer и рабочих станций под ОС Tru64 UNIX, развернул RAID-систему Compaq StorageWorks емкостью 4 Тбайт, подсистему Network Appliances RAID емкостью 300 Гбайт и 48 компьютеров Compaq Deskpro.

В 1999 году Compaq создала Bioinformatics Expertise Center в Мальборо (шт. Массачусетс), начала исследовательские работы по биоинформатике в своих лабораториях в Кембридже и Массачусетсе, разработав алгоритмы интеллектуального анализа генетических данных. В том же году корпорация Compaq была выбрана институтом Whitehead Institute в качестве поставщика информационной инфраструктуры для работы по расшифровке генома человека. При анализе генетических данных институт использовал серверы Compaq AlphaServer ES40 и системы хранения данных Compaq StorageWorks. В лаборатории Compaq Enterprise System Lab для завершения работ по проекту был инсталлирован кластер серверов AlphaServer ES40 (100 процессоров и дисковая память в 1 Тбайт).

Определение пространственной структуры биологических макромолекул

ще более трудоемкой по сравнению с расшифровкой генома является задача расшифровки пространственной структуры белков, входящих в состав биологического организма. Знание пространственной структуры белков тесно связано с их функционированием, в частности без этого невозможно создание новых типов лекарств. Предсказание пространственной структуры белков по последовательности нуклеотидных пар в ДНК — самая важная и сложная задача компьютерной биологии.

Число известных первичных белковых структур, установленных по известным нуклеотидным последовательностям ДНК, намного превосходит число экспериментально подтвержденных пространственных белковых структур. Цель исследований состоит в нахождении искомой структуры на основе минимизации свободной энергии пространственной системы, но даже для небольшого белка это задача сводится к поиску минимума функции десятков тысяч переменных. Точное решение подобной задачи сегодня невозможно, но уже разработано множество приближенных подходов. Один из самых эффективных — использование в качестве первого приближения информации о пространственной структуре белков, обладающих первичной структурой, близкой к исследуемому белку. В этом случае задача сводится к расчетному уточнению начального приближения.

Знание пространственной структуры белков играет решающую роль для понимания их функционирования (рис. 4). Учитывая, что число различных белков в организме человека составляет сотни тысяч, можно понять, сколь масштабная задача стоит перед исследователями.

Применение в диагностике и лечении

Клеточный компьютер может использоваться для обнаружения биологических сигналов в организме, таких как продукты обмена веществ или химические сигналы, для их обработки и соответствующего реагирования на них. При правильно запрограммированном процессоре клетки могут интерпретировать два разных биомаркера как входные сигналы. Если присутствует лишь биомаркер А, то биокомпьютер отвечает, формируя диагностическую молекулу или фармацевтическое вещество. Если биокомпьютер регистрирует лишь биомаркер B, он запускает синтез иного вещества. Если присутствуют оба биомаркера, это вызывает третью реакцию. Такая система может найти применение в медицине, например, при лечении рака.

«Мы могли бы также интегрировать обратную связь», – говорит Фуссенеггер. Например, если биомаркер B остается в организме в течение более длительного периода времени при определенной концентрации, это может указывать на метастазирование рака. Биокомпьютер произведёт химическое вещество, нацеленное на уничтожение рака.

Токийский суперкомпьютерный биоинформационный центр

Токийский суперкомпьютерный биоинформационный центр (Human Genome Center, HGC), основанный в 1991 году, использует суперкомпьютеры по программе «Анализ генома человека» с 1997 года. Постепенно центру потребовалась большая вычислительная мощность, и в 2002 году HGC приобрел SGI Origin 3900 — новейшую модель серии суперкомпьютеров Origin 3000 компании SGI. На момент сделки это была самая крупная инсталляция системы Origin 3900 в мире.

Данная система служит для исследований в области генома человека, а также для других приложений компьютерной биологии и вычислительной химии в сфере предсказания протеиновых структур.

Центр HGC столкнулся с проблемой нехватки вычислительных ресурсов именно при работе над проектом «Геном человека», что явилось основной причиной для последнего апгрейда. После замены старого оборудования (суперкомпьютер Cray T94 и SGI Origin 2000) вычислительная мощность была увеличена втрое.

В дополнение к последнему апгрейду, который позволил построить систему с 512 процессорами компания SGI также поставила хранилище данных (SGI TP9400 storage system) на 5 Тбайт.

В результате развертывания сервера Origin 3900 (рис. 5) в несколько раз была увеличена мощность системы, причем без изменения площади, занимаемой суперкомпьютером.

Мощная многопоточная обработка информации

Исследователи сделали ещё один шаг: они создали биологический двухъядерный процессор, аналогичный цифровому, интегрировав два ядра в клетку. Для этого они использовали компоненты CRISPR-Cas9 от двух разных бактерий. Фуссенеггер был в восторге от результата, заявив: «Мы создали первый клеточный компьютер с несколькими ядрами».

Этот биологический компьютер не только чрезвычайно мал, но теоретически может быть увеличен до любого возможного размера. «Представьте себе ткань с миллиардами клеток, каждая из которых оснащена собственным двухъядерным процессором. Такие «вычислительные органы» теоретически могут достичь вычислительной мощности, которая намного превосходит вычислительную мощность цифрового суперкомпьютера – и использует лишь небольшую часть энергии», – говорит Фуссенеггер.

Возможны многоядерные процессоры

«Этот клеточный компьютер может показаться очень революционной идеей, но это не так», — подчёркивает Фуссенеггер. Он продолжает: «Само тело человека – это большой компьютер. Его метаболизм использует вычислительную мощь триллионов клеток с незапамятных времён». Эти клетки постоянно получают информацию из внешнего мира или из иных клеток, обрабатывают сигналы и реагируют соответствующим образом – будь то химические сигналы или запуск метаболических процессов. «И в отличие от электронного суперкомпьютера, этому большому компьютеру нужен лишь кусок хлеба», – отмечает Фуссенеггер.

Его новая цель – интегрировать многоядерную компьютерную структуру в клетку. «Это будет иметь большую вычислительную мощность, чем нынешняя двухъядерная структура».

У живого организма и современных компьютеров - много общего. ДНК выступает, фактически, в роли «программного обеспечения», а сам организм это аппаратное обеспечение генетического кода. Но, до последнего времени, технологические ограничения не позволяли ни программировать клетки, ни перестраивать их под выполнение необходимых прикладных функций. Прорывом стало разработка методики редактирования генома CRISPR-Cas9, а также открытие эпигенетических триггеров и направляющих РНК. На их основе стало возможным создание биокомпьютера, умеющего получать, интерпретировать, хранить и передавать информацию, с помощью специфических метаболических молекул. Скорость обработки информации клеткой сравнительно невысока: до 100 000 различных биомолекул в секунду, но, учитывая, что биокомпьютеры работают нее в двоичной логике, а с широким разнообразием «кодовых молекул» скорость обработки, для соответствующих задач, будет находиться на вполне современном уровне. Последним достижением в этой области является создание, на базе бактериальных клеток, «двухядерных» клеточных процессоров, продемонстрировавших высокую эффективность обработки данных.

Ключевым преимуществом таких клеточных биокомпьютеров является возможность их выращивания, используя естественные механизмы деления клеток. Это – прорывная возможность, которая, в перспективе, может стать основой для широкого семейства самых различных технических решений. Фактически, производство сложных биологических компьютеров (а массивы в миллиарды клеток – процессоров могут выдать результаты, сопоставимые с современными суперкомпьютерами) не потребует строительства суперсовременной и очень дорогой фабрики. Достаточно будет «рассады» процессорных клеток и сравнительно несложного инкубатора для их выращивания. Такие решения отлично подойдут для малого бизнеса, для освоения труднодоступных территорий, для программ освоения космоса.

Ожидается, что магистральным направлением использования клеток – процессоров станет создание биоимплантов – органических и на 100% совместимых с организмом человека. Биокомпьютер может взять на себя самый широкий функционал – от мониторинга раковых маркеров до управления различными встроенными в организм устройствами – от кардиостимуляторов и вспомогательных насосов крови до искусственных «органов», например производящих инсулин для больных диабетом прямо внутри организма. Также, очень перспективное направление – это развитие интерфейса мозг – компьютер. Важно, что создание подобного интерфейса позволит значительно поднять качество жизни больных с параличами, ампутированными конечностями за счет создания нового поколения бионических протезов.

Естественный интерес ряда исследовательских групп (среди них Оксфордский и Техасский университеты, Массачусетский технологический институт, лаборатории Беркли, Санди и Рокфеллера) вызвали природные способы хранения и обработки информации в биологических системах. Итогом их изысканий явился гибрид информационных и молекулярных технологий, а также достижений биохимии – биологический компьютер.

Идут разработки нескольких типов биокомпьютеров, которые базируются на различных биологических процессах. Это, в первую очередь, находящиеся в стадии разработки ДНК-компьютеры и клеточные биокомпьютеры.

ДНК-компьютеры. В живых клетках генетическая информация закодирована в молекуле ДНК (дезоксирибонуклеиновой кислоты). ДНК – это полимер, состоящий из субъединиц, называемых нуклеотидами. Нуклеотид представляет собой комбинацию сахара (дезоксирибозы), фосфата и одного из четырех входящих в состав ДНК азотистых оснований: аденина (А), тимина (Т), гуанина (G) и цитозина (C). Молекула ДНК образует спираль, состоящую из двух цепей, объединенных водородными связями. При этом основание А одной цепи может соединяться водородными связями только с основанием Т другой цепи, а основание G – только с основанием С. Имея одну из цепей ДНК, всегда можно восстановить строение второй.

Благодаря этому фундаментальному свойству ДНК, получившему название комплементарности, генетическая информация может точно копироваться и передаваться от материнских клеток к дочерним клеткам. Репликация молекулы ДНК происходит за счет работы специального фермента ДНК-полимеразы. Этот фермент скользит вдоль ДНК и синтезирует на ее основе новую молекулу, в которой все основания заменены на соответствующие парные. Причем фермент начинает работать, когда к ДНК прикрепился коротенький кусочек – «затравка» (праймер).

В клетках существует также родственная молекуле ДНК молекула матричной рибонуклеиновой кислоты (РНК). Она синтезируется специальным ферментом, использующим в качестве образца одну из цепей ДНК, и комплементарна по отношению к ней. Именно на молекуле РНК, в клетке, как на матрице, с помощью специальных ферментов и вспомогательных факторов происходит синтез белков. Молекула РНК химически устойчивее, чем ДНК, поэтому экспериментаторам с ней работать удобнее. Последовательность нуклеотидов в цепи ДНК / РНК определяет генетический код. Единицей генетического кода – кодоном – является последовательность из трех нуклеотидов. Ученые решили попытаться, по примеру природы, использовать молекулы ДНК для хранения и обработки данных в биологических компьютерах.

Первым из них был Леонард Эдлмен из университета Южной Калифорнии, сумевший решить задачу гамильтонова пути. Суть ее в том, чтобы найти маршрут движения с заданными точками старта и финиша между несколькими городами, в каждом из которых разрешается побывать только один раз. «Дорожная сеть» представляет собой однонаправленный граф. Эта задача решается прямым перебором, однако при увеличении числа городов сложность ее возрастает экспоненциально (для цепочек ДНК число таких пунктов («городов») равно семи, т.е. n = 7). Каждый такой «город» Эдлмен идентифицировал уникальной последовательностью из 20 нуклеотидов.
Тогда путь между любыми двумя городами будет состоять из второй половины кодирующей последовательности для точки старта, и первой половины кодирующей последовательности для точки финиша (молекула ДНК, как и вектор, имеет направление).

Синтезировать такие последовательности современная молекулярная аппаратура позволяет очень быстро. В итоге последовательность ДНК с решением составит 140 нуклеотидов (7x20). Остается только синтезировать и выделить такую молекулу ДНК. Для этого в пробирку помещается около 100 триллионов молекул ДНК, содержащих все возможные 20-нуклеотидные последовательности, кодирующие города и пути между ними. Далее за счет взаимного притяжения нуклеотидов А–Т и G–C отдельные цепочки ДНК сцепляются друг с другом случайным образом, а специальный фермент лигаза сшивает образующиеся короткие молекулы в более крупные образования. При этом синтезируются молекулы ДНК, воспроизводящие все возможные маршруты между городами. Нужно лишь выделить из них те, что соответствуют искомому решению. Эдлмен решил эту задачу биохимическими методами, последовательно удалив сначала цепочки, которые не начинались с первого города – точки старта – и не заканчивались местом финиша, затем те, что содержали более семи городов или не содержали хотя бы один. Легко понять, что любая из оставшихся после такого отбора молекула ДНК представляет собой решение задачи.

Вслед за работой Эдлмена последовали и другие. Ллойд Смит из университета Висконсин решил с помощью ДНК задачу доставки четырех сортов пиццы по четырем адресам, которая подразумевала 16 вариантов ответа. Ученые из Принстонского университета решили комбинаторную шахматную задачу: при помощи РНК нашли правильный ход шахматного коня на доске из девяти клеток (всего их 512 вариантов).

Ричард Липтон из Принстона впервые показал, как, используя ДНК, кодировать двоичные числа и решать логические выражения. Имея такое выражение, включающее n переменных, нужно найти все комбинации значений переменных, делающих выражение истинным. Задачу можно решить только перебором 2n комбинаций. Все эти комбинации легко закодировать с помощью ДНК, а дальше действовать по методике Эдлмена. Липтон предложил даже способ взлома шифра DES (американский криптографический шифр), трактуемого как своеобразное логическое выражение.

Первую модель биокомпьютера в виде механизма из пластмассы в 1999 г. создал И. Шапиро из института естественных наук Вейсмана.
Модель имитировала работу молекулярной машины в живой клетке, собирающей белковые молекулы по информации с ДНК, используя РНК
в качестве посредника между ДНК и белком. В 2001 г. Шапиро удалось реализовать модель в реальном биокомпьютере, который состоял из молекул ДНК, РНК и специальных ферментов. Молекулы фермента выполняли роль аппаратного, а молекулы ДНК – программного обеспечения. В одной пробирке помещалось около триллиона элементарных вычислительных модулей. В результате скорость вычислений достигала миллиарда операций в секунду, а точность – 99,8 %.

В 2002 г. фирма Olympus Optical объявила о создании ДНК–компьютера, предназначенного для генетического анализа. Машина создана в сотрудничестве с биологом Акирой Тояма из Токийского университета. Компьютер имеет молекулярную и электронную составляющие. Первая осуществляет химические реакции между молекулами ДНК, обеспечивает поиск и выделение результата вычислений. Вторая – обрабатывает информацию и анализирует полученные результаты. Сейчас анализ генов выполняется вручную и требует много времени: при этом формируются многочисленные фрагменты ДНК и контролируется ход химических реакций. Когда ДНК-компьютинг будет использоваться для генетического анализа, то задачи, которые ранее выполнялись в течение трех дней, будут решаться за шесть часов. Технология генетического анализа на основе ДНК–компьютера находит применение в медицине и фармацевтике. Ученые планируют внедрять молекулярные наноустройства в тело человека для мониторинга состояния его здоровья и синтеза необходимых ему лекарств.

Возможностями биокомпьютеров заинтересовались и военные. Американское агентство по исследованиям в области обороны DARPA выполняет проект под названием BioComp. Его цель – создание мощных вычислительных систем на основе ДНК. Попутно исследователи надеются научиться управлять процессами взаимодействия белков и генов. Для этого планируется создать мощный симулятор BioSPICE, способный средствами машинной графики визуализировать биомолекулярные процессы.

Клеточные компьютеры. Еще одним перспективным направлением биокомпьютинга является создание клеточных компьютеров. Для этой цели идеально подходят бактерии, если бы в их геном удалось включить некую логическую схему, которая могла бы активизироваться в присутствии определенного вещества. Такие компьютеры очень дешевы в производстве. Им не нужна столь стерильная атмосфера, как при производстве полупроводников. И единожды запрограммировав клетку, можно легко и быстро вырастить тысячи клеток с такой же программой.

В 2001 г. в США были созданы трансгенные микроорганизмы (микроорганизмы с искусственно измененными генами), клетки которых могут выполнять логические операции И и ИЛИ. Учёные использовали способность генов синтезировать тот или иной белок под воздействием определенной группы химических раздражителей. Генетический код бактерий Pseudomonas putida был изменён таким образом, что их клетки обрели способность выполнять простые логические операции. Например, при выполнении операции И в клетку подаются два вещества (входные операнды), под влиянием которых ген вырабатывает определенный белок. Ученые создают на базе этих клеток более сложные логические элементы, а также ищут возможности создания клетки, выполняющей параллельно несколько логических операций.

Элементная база биологических компьютеров. Для разработки таких компьютеров нужно получить базовые элементы. Предложений поступает очень много. Так, исследователи израильского института «Технион» создали самособирающийся нанотранзистор, для разработки которого они использовали особенности структуры ДНК и электронных свойств углеродных нанотрубок. Сначала частицы молекулы ДНК покрыли белками бактерии «E. Coli», после этого связали с ДНК покрытые антителами нанотрубки, затем в процессе создания устройства использовали ионы золота и серебра. Получившаяся в результате конструкция работает как транзистор.

В 2004 году исследователи разработали микроскопические устройства, которые можно внедрять в кровоток. Они могут диагностировать онкологические заболевания и выпускать в нужном месте необходимую дозу лекарства. Устройства построены на базе синтетических ДНК, часть цепи служит для определения высокой концентрации РНК определенного вида, которые вырабатываются раковыми клетками, другая часть молекулярной цепи является хранилищем и управляющей структурой для еще одной нуклеотидной последовательности лекарства. Этот фрагмент ДНК, выпущенный в нужном месте, подавляет активность гена, вовлеченного в процесс развития рака. Ученые продемонстрировали несколько деталей биологической молекулярной машины, которая успешно идентифицировала в пробирке клетки, соответствующие раку простаты и раку легких. До полноценного устройства, которое можно было бы применять в борьбе с раковыми заболеваниями, еще далеко, однако ученые сделали важный шаг на пути создания молекулярных медицинских ДНК-роботов.

В том же году профессор Ричард Киль и его коллеги из университета штата Миннесота, США, разработали экспериментальные биоэлектронные схемы. Американские ученые использовали цепочки ДНК для создания плоской ткани, напоминающей застежку-липучку на уровне наноструктур. Проводимые опыты продемонстрировали, как искусственные фрагменты ДНК самостоятельно собрались в заранее рассчитанную наноструктуру. С регулярным шагом на этой структуре образовались липучки, которые способны принять другие сложные органические молекулы или различные металлы. Авторы проекта закрепляли такие молекулы на ткани, сформированной ДНК, будто радиодетали на пластмассовой плате.

Нанокомпоненты, собранные на основе ДНК, теоретически могут создать схему с характерным расстоянием между деталями в одну треть нанометра. А поскольку такие компоненты могут сохранять электрические или магнитные заряды, испытываемая в Миннесоте технология – это прообраз будущей технологии создания сверхбыстродействующих электронных схем с высокой плотностью упаковки информации. Они будут совмещать органические и неорганические компоненты.

В 2005 г. Юнсэон Чой из университета штата Мичиган, США, применил молекулы ДНК для построения наночастиц с заданными свойствами. Использовались так называемые дендримеры (крошечные разветвленные полимеры), концы которых могут содержать различные молекулы. Сначала были синтезированы отдельные звенья дендримеров, причём каждое звено снабжалось молекулой лекарства и небольшим фрагментом половинки ДНК. При смешивании всех этих ингредиентов, ДНК соединялись с дополнительными парами оснований. Короткие звенья полимера автоматически сшивались в длинные комплексы. Дендримеры могут избирательно поставлять пять отдельных лекарств пяти видам клеток. Синтез молекулы по методике Чоя занимает 10 шагов вместо 25, при использовании прежних технологий. Недостаток технологии состоит в том, что синтез нужных цепочек может занимать по несколько месяцев.

Исследователь Нью-Йоркского университета Нэд Симэн создал наномашину, производящую единственный полимер, повторяющий структуру самого устройства, с размерами 110x30x2 нм. Аппарат состоит из ДНК-машин, которые работают на основе определенных комбинаций цепочек молекул ДНК. У исследователя есть уверенность в том, что ему удастся создать ДНК-машину, работающую подобно молекуле РНК. Свое применение будущая искусственная рибосома найдет в синтезе новых материалов по заданной последовательности, закодированной в ДНК. В конце концов, можно научиться делать полимеры и новые материалы в больших количествах и за малый промежуток времени благодаря ДНК-машинам, уверен Симэн.

Билл Дитто из Технологического института штата Джорджия, США, провел эксперимент, подсоединив микродатчики к нескольким нейронам пиявки. Он обнаружил, что в зависимости от входного сигнала нейроны образуют новые взаимосвязи. Отсюда можно сделать вывод, что биологические компьютеры, состоящие из нейронно-подобных элементов (нейроэлементов), в отличие от кремниевых устройств, смогут самостоятельно искать нужные решения, посредством самопрограммирования. Исследователь намерен использовать результаты своей работы для создания искусственного мозга роботов будущего.

В настоящее время область ДНК-вычислений пребывает на этапе подтверждения концепции, когда возможность реального применения уже доказана. Можно утверждать, что в ближайшие десятилетия технология продемонстрирует свои реальные возможности. Сейчас происходит оценка того, насколько полезны или вредны ДНК-компьютеры для человечества. Применение в вычислительной технике биологических материалов позволит со временем уменьшить компьютеры до размеров живой клетки. Пока это выглядит как чашка Петри, наполненная спиралями ДНК, или как нейроны, взятые у пиявки и подсоединенные к электрическим проводам.

По существу, наши собственные клетки – это не что иное, как биологические машины молекулярного размера, а примером биокомпьютера служит наш мозг.

Если бы модель биологического компьютера Ихуда Шапиро, упоминавшаяся ранее, состояла из настоящих биологических молекул, то его размер был бы равен величине одного из компонентов клетки – 0,000 025 мм. По мнению исследователя, современные достижения в области сборки молекул позволяют создавать устройства клеточного размера, которое можно применять для биомониторинга. Более традиционные ДНК-компьютеры в настоящее время используются для расшифровки генома живых существ. Пробы ДНК применяются для определения характеристик другого генетического материала: благодаря правилам спаривания спиралей ДНК, можно определить возможное расположение четырех базовых аминокислот (A, C, T и G).

Потенциал биокомпьютеров очень велик. По сравнению с обычными вычислительными устройствами они имеют ряд уникальных особенностей. Во-первых, они используют не бинарный, а тернарный код (так как информация в них кодируется тройками нуклеотидов). Во-вторых, поскольку вычисления производятся путем одновременного вступления в реакцию триллионов молекул ДНК, они могут выполнять до 1015 операций в секунду. Правда, извлечение результатов вычислений предусматривает несколько этапов очень тщательного биохимического
анализа и осуществляется гораздо медленнее. В-третьих, вычислительные устройства на основе ДНК хранят данные с плотностью, в триллионы раз превышающей показатели оптических дисков. И, главное, ДНК-компьютеры имеют исключительно низкое энергопотребление.

Однако при разработке биологических компьютеров многие ученые столкнулись с целым рядом серьезных проблем. Первая связана со считыванием результатов вычислений – современные способы секвенирования (распознавания кодирующей последовательности) пока несовершенны: невозможно за один раз распознать цепочки длиной более нескольких тысяч оснований – это весьма дорогостоящая, сложная и трудоемкая операция. Вторая проблема – ошибки в вычислениях. Для химиков и биологов точность при синтезе и секвенировании оснований в 1 % считается очень хорошей. Но для информационных технологий она неприемлема: решения задачи могут потеряться, когда молекулы просто прилипают к стенкам сосудов; кроме того, нет никаких гарантий, что в ДНК не возникнут точечные мутации, и т.п.

Кроме того, молекулы ДНК с течением времени могут распадаться, и тогда результаты вычислений просто исчезают на глазах! Клеточные компьютеры, по сравнению с другими, работают довольно медленно, и их легко «сбить с толку», намеренно или ненамеренно нарушив вычислительный процесс. С этими проблемами ученые активно борются, но насколько им удастся преуспеть – покажет ближайшее время. В любом случае, для специалистов – биоинформатиков открываются большие перспективы. Однако биокомпьютеры на широкие массы пользователей не рассчитаны.

В перспективе нанокомпьютеры на основе ДНК смогут взаимодействовать с клетками человека, осуществлять наблюдение за потенциальными болезнетворными изменениями и синтезировать лекарства для борьбы с ними. С помощью клеточных компьютеров станет возможным объединение информационных технологий с биотехнологиями. Они смогут управлять биохимическими процессами, регулировать биологические реакции внутри человеческого организма, производить гормоны и лекарственные вещества, а также доставлять к определенному больному органу пациента необходимую дозу лекарств, и др.

Расшифровка структуры генома человека

асшифровка структуры генома сводится к выявлению последовательности символов отдельных структурных единиц и определению их функциональной нагрузки. Для описания сути и масштабов данной вычислительной задачи необходимо кратко рассказать об основах теории наследственности.

Генетика зародилась почти 150 лет назад, когда Грегор Мендель открыл существование дискретных частиц (названных впоследствии генами), передающих наследственные свойства. В начале XX века появилась хромосомная теория наследственности, согласно которой гены линейно расположены в ядерных хромосомах и их последовательность может быть расшифрована.

Позднее было установлено, что гены состоят из ДНК, а ДНК, в свою очередь, имеет структуру двойной спирали. Каждая нить этой спирали представляет собой линейную молекулу, состоящую из нуклеотидов, содержащих в своем составе те или иные азотистые основания: аденин (А), тимин (T), гуанин (G) и цитозин (С) (рис. 2).

Затем было открыто, что ДНК является матрицей для репликации, то есть для превращения информации, содержащейся в ДНК, в белковые молекулы. Таким образом, молекула ДНК, являющаяся носителем генетической информации, представляет собой биополимер, элементарным звеном которого служит нуклеотидная пара. Установление последовательности чередований этих оснований в генах означает раскрытие генетического кода генома. Появление быстрых методов компьютерной расшифровки последовательности нуклеотидных пар в геномах организмов позволило решить задачу расшифровки генома.

В геноме человека содержится около 3Ѕ109 оснований генетических «букв» (А, Т, G, С), составляющих десятки тысяч различных генов. Задача состоит в определении последовательности расположения 3,5 млрд. нуклеотидов, содержащих в своем составе те или иные азотистые основания. Такими генетическими «буквами» и написаны слова «книги жизни», определяющей образ рода человеческого. Если издать генетическую информацию только об одном человеке в виде книги, то получится фолиант в 750 тыс. страниц.

Задачей проекта «Геном человека» (Human Genome Project, HGP) было определение последовательности всех нуклеотидов в геноме человека с точностью до 0,01%. Инициатором этой работы стало Министерство энергетики США, которое в 1986 году выступило с идеей осуществить полную расшифровку генома человека. Проект был развернут Национальным институтом здоровья США и планировался к завершению в 2005 году. Двадцать стран мира имели свои национальные программы по изучению генома человека, а в России эту проблему изучали десятки исследовательских групп. В 1998 году была создана частная компания Celera Genomics, которая составила конкуренцию этому проекту и обещала завершить исследования к 2001 году, что изрядно подстегнуло ученых, занятых в общественном международном проекте.

В 2000 году конкурирующие коллективы — Celera Genomics и международный консорциум — объявили о том, что совместными усилиями в целом завершена работа над проектом HGP. В том же году премьер-министр Великобритании Тони Блэр и президент США Билл Клинтон заявили, что расшифровано 97% генома человека. На тот момент была расшифрована структура 50 тыс. генов, в которых идентифицирована последовательность расположения 3,5 млрд. генетических букв. Основная часть проекта была завершена намного раньше намеченных сроков, и сегодня последовательность ДНК человека раскодирована практически на 100%.

Одной из причин быстрого осуществления данного проекта явилось интенсивное развитие суперкомпьютерных мощностей ведущих исследовательских центров.

По словам руководителя отделения ДНК-последовательностей в Институте Сэнгера (учреждения, которое внесло наиболее весомый вклад в проект HGP) доктора Джейн Роджерса, «ученым удалось достичь намеченных результатов значительно раньше, сохранив при этом невероятно высокие стандарты качества. Эта работа позволяет исследователям немедленно приступить к целому ряду биомедицинских проектов».

Однако установление последовательности генетического кода — это только первый шаг на пути создания нового поколения так называемых молекулярных лекарств, предназначенных для коррекции конкретных генов. Директор Института Сэнгера профессор Алан Брэдли считает, что расшифровка генома человека открывает широчайшие перспективы для медицины: «Только одна часть нашей работы — последовательность хромосомы 20 — уже позволила ускорить поиски генов, ответственных за развитие диабетов, лейкемии и детской экземы. Не стоит ожидать немедленного прорыва, но нет сомнений в том, что мы завершаем одну из самых удивительных глав “книги жизни”».

Доктор Фрэнсис Коллинс, директор Национального института исследований генома США, приводит следующие данные: «Один из наших проектов предусматривал идентификацию генов предрасположенности к диабету II типа, которым страдает каждый 20-й человек старше 45 лет, и эта доля со временем только возрастает. При помощи общедоступной карты генетических последовательностей мы сумели отобрать один ген в хромосоме 20, наличие которого в геноме, похоже, увеличивает вероятность возникновения диабета II типа».

Зная практически всю последовательность миллиардов букв-нуклеотидов генетического кода нашей ДНК, ученые смогут вплотную заняться теми проблемами жизни человека, которые вызываются генетическими причинами.

Проект HGP обещает изменить наши представления о жизни на Земле (рис. 3). Новые технологии будут внедряться не только в биологии, но также в медицине и сельском хозяйстве. Генетические данные послужат основой для развития таких дисциплин, как судебная медицина и идентификационные методы в биологии, откроют новые перспективы в экологии и науках об окружающей среде, новые методы расщепления токсичных отходов, обеспечат создание новых биоэнергетических источников и индустриальных процессов, помогут разгадать тайны эволюции, антропологии, процессов миграции человека и т.д.

В то время как расшифровка первичной структуры молекул ДНК человека завершена, изучение ее пространственной структуры находится в начальной стадии. Для моделирования пространственной структуры фрагментов ДНК требуется учет всевозможных конфигураций как отдельных нуклеотидов, входящих в состав ДНК, так и большого числа молекул растворителей, окружающих макромолекулу. Процедура расчета энергии межмолекулярных взаимодействий занимает основную часть вычислительных ресурсов. Использование высокопроизводительных вычислений позволяет изучить пространственную организацию больших фрагментов ДНК, механизмы связывания лекарств и других биологически активных соединений с ДНК.

Суперкомпьютерный центр Oak Ridge National Laboratory

Национальная лаборатория Oak Ridge National Laboratory Департамента энергетики США (Department of Energy, DOE) предлагает уникальные расчетные мощности, которые превышают возможности любой другой организации в США. Oak Ridge National Laboratory (ORNL) имеет в своем распоряжении такие системы, как Cray X1 и IBM SP.

Имеющаяся в лаборатории Cray-система в сентябре этого года планируется к апгрейду, в результате чего количество процессоров будет увеличено до 256. Система на базе IBM SP состоит из 176 узлов Winterhawk II SMP, каждый — по четыре 375-МГц Power3-II процессора. Данный вычислительный комплекс используется в расчетах по программе «Геном человека» (рис. 6).

Управление экспрессией генов с помощью переключателей генов на основе модели, заимствованной из цифрового мира, долгое время было одной из главных проблем синтетической биологии. Цифровой метод использует логические элементы для обработки входных сигналов, создавая схемы, в которых, например, выходной сигнал C создаётся, лишь когда одновременно присутствуют входные сигналы A и B.

До настоящего времени биоинженеры пытались создать такие цифровые схемы с помощью белковых генных переключателей в клетках. Однако у них были серьёзные недостатки: они не были гибкими, могли понимать лишь простые программы и были способны обрабатывать лишь один ввод за раз, например, специфическую молекулу. Таким образом, более сложные вычислительные процессы в клетке были возможны лишь при конкретных условиях, ненадёжны и часто терпели неудачу.

Даже в цифровом мире схемы зависят от одного входа в форме электронов. Однако такие схемы компенсируют это своей скоростью, выполняя миллиарды команд в секунду. Клетки медленнее по сравнению с ними, но могут обрабатывать 100 000 различных молекул в секунду в качестве входных данных. И всё же прошлые клеточные компьютеры даже не приблизились к исчерпанию огромных вычислительных возможностей человеческой клетки.

Центральный процессор из биологических компонент

Команда исследователей во главе с Мартином Фуссенеггером, профессором биотехнологии и биоинженерии в Департаменте биологических наук и инженерии в ETH Zurich в Базеле, теперь нашла способ использовать биологические компоненты для создания гибкого центрального процессора, который принимает различные программы. Процессор, разработанный учёными ETH, основан на модифицированной системе CRISPR-Cas9 и может работать с любым количеством входов в виде молекул РНК.

Специальный вариант белка Cas9 образует ядро процессора. В ответ на ввод, осуществляемый направляющими РНК, процессор регулирует экспрессию гена, который, в свою очередь, производит определённый белок. Благодаря такому подходу исследователи могут программировать масштабируемые схемы в клетках человека — например, цифровые сумматоры, они состоят из двух входов и двух выходов и могут сложить два однозначных двоичных числа.

Компьютерный центр Bristol-Myers Squibb

Компания Bristol-Myers Squibb занимается разнообразными исследованиями в области биоинформатики и одновременно ведет работы для фармацевтической промышленности, опираясь на широкий диапазон научных исследований, проводимых в Израиле, США и Канаде. Спектр интересов компании охватывает различные аспекты медицины — от изучения наследственных заболеваний до детального анализа моделей генетических систем.

Группа исследователей в области биоинформатики Bristol-Myers Squibb использует в своей работе кластер Linux-серверов компании Incyte. Эта система обрабатывает результаты, получаемые в ходе выполнения проекта HGP, включая анализ ДНК и белковых цепочек, расшифровку профилей и протеомику.

Linux-кластер Incyte интегрирован с сервером семейства SGI 2000, который дает исследователям возможность выполнять специальные приложения в Linux-среде и высвобождает ресурсы сервера SGI 2000 для приложений, которые требуют интенсивного распараллеливания и разделяемой памяти большого объема. Это позволяет Bristol-Myers Squibb снизить нагрузку по администрированию передачи данных и вычислений между вычислительными платформами и повышает эффективность работы пользователей.

По словам руководителя группы биоинформатики Bristol-Myers Squibb, в лаборатории построена идеальная среда для биоинформационных вычислений.

Компания Incyte, являющаяся лидером среди поставщиков информации по исследованиям генома, располагает передовыми системами обработки, способными анализировать и управлять растущими объемами данных по геному, накапливающихся в процессе исследований. Кластер систем Linux, разработанный Incyte, предоставляет ученым из Bristol-Myers Squibb возможность анализировать большие объемы данных быстрее и с меньшими затратами, чем раньше. С помощью серверов SGI и Incyte Genomics значительно повысилась эффективность разработки новых биоинформационных решений.

Читайте также: