Что делается
В механике,
И в химии, и в биологии,
Об этом знают лишь избранники,
Но в общем пользуются многие…
Кодирование — это операция, позволяющая перейти от записи информации в одной системе условных обозначений к записи той же информации в другой системе. Обычно при кодировании уменьшается число используемых символов. Например, тридцатидвухбуквенный русский алфавит передается азбукой Морзе комбинациями всего двух знаков — точки и тире.
Как был расшифрован генетический код
Египетские иероглифы удалось расшифровать лишь после того, как был найден Розеттский камень, на котором один и тот же текст был записан и на древнеегипетском, и на греческом языках. Нечто подобное произошло в 1961 году в молекулярной биологии — науке, изучающей сокровеннейшие механизмы жизни.
Многие большие открытия обрастают легендами, порой исторически достоверными, порой — нет. Сомнительно, чтобы Исаак Ньютон открыл закон тяготения, глядя на падающее яблоко. Но совершенно точно известно, что грибок пенициллиум в лаборатории Александра Флеминга случайно попал на чашку с питательной средой и бактериями, и гибель этих бактерий обнаружила удивительные свойства пенициллина… Рассказывают, что сделанное в 1961 году открытие, тоже относится к числу «случайных».
Но сначала — о событиях более отдаленных.
К двадцатым годам нашего столетия было установлено, что передачей наследственных признаков потомству ведают крохотные продолговатые тельца, находящиеся внутри ядер половых клеток, — хромосомы, состоящие из нуклеиновых кислот и белка. Позднее химики нашли, что и нуклеиновые кислоты и белки — это полимеры, длинные цепные молекулы, состоящие из сотен и тысяч маленьких звеньев. У белков эти звенья, называемые аминокислотами, бывают двадцати различных разновидностей. А у нуклеиновых кислот полимерную цепь составляют азотистые соединения четырех различных типов.
В 1944 году стало известно, что язык наследственности находит свое вещественное, физическое выражение в молекулярных структурах нуклеиновых кислот. Наследственную информацию, зашифрованную в хромосомах, определяют детали расположения атомов в молекулах дезоксирибонуклеиновой кислоты (ДНК). Говоря иносказательно, «звуки» «языка наследственности» заключены в архитектуре молекул ДНК.
Но какова эта архитектура? Зимой 1953 года на этот вопрос сумели ответить Ф. Крик и Д. Уотсон — молодые ученые, работавшие в Кембриджском университете в Англии.
Одно из революционных открытий биологии было сделано в невзрачном домике, в котором едва помещались шкаф и два стола. И шкаф, и столы были забиты книгами, кристаллографическими моделями да стопками нега1ивов, на которых можно было увидеть темные пятна и полосы, — это были рентгенограммы молекул ДНК,
Со стороны могло показаться, что Крик и Уотсон занимаются какой-то детской игрой. Пользуясь вращающимися сочленениями, они соединяли небольшие металлические пластинки в сложные сооружения, наподобие абстрактных скульптур. Металлические пластинки имели разную форму и соответствовали шести компонентам, из которых строятся нуклеиновые кислоты: четырем азотистым основаниям — аденину, гуанину, цитозину и тимину, и группам, «склеивающим» остов полимера,— сахарной и фосфатной. Крик и Уотсон стремились расположить металлические модели всех этих компонентов таким образом, чтобы дифракция рентгеновских лучей, рассчитанная для модели, давала ту же картину, которую запечатлевали рентгенограммы реальной ДНК. Во всех вариантах учитывалось ограничение, известное благодаря исследованиям химиков: в ДНК любого организма количество адениновых оснований строго равняется количеству оснований тиминовых, а число гуаниновых — цитозиновым.
В конце концов Крик и Уотсон обнаружили, что всем требованиям удовлетворяет модель, представляющая собой двойную спираль. Если внимательно вглядеться в объемную схему молекулы ДНК (рис. 1), то можно увидеть, что две переплетающиеся молекулярные нити образуют нечто вроде винтовой лестницы. Остов каждой нити — чередующиеся сахарные и фосфатные группы. Через правильные промежутки от обеих нитей выступают боковые группы азотистых оснований. Азотистые основания прикрепленные к противоположным нитям, соединяются попарно, образуя «ступеньки» винтовой лестницы. Эти пары всегда совершенно определенны: аденин соединяется только с тимином, а гуанин — с цитозином. Секрет этой «взаимной склонности» заключается в том, что между такими парами оснований возникает особый тип химических связей — водородные (рис. 2). Между гуанином и цитозином образуются три водородные связи, а между аденином и тимином — две. Чтобы не прибегать к громоздким химическим формулам, дальше это условно изображается так, будто треугольные или овальные выступы, соответствующие аденину и гуанину, входят в выемки парных им или, как говорят, «комплементарных» оснований тимина и цитозина.
Представления об избирательном спаривании оснований позволяют четко разобраться в механизме основного процесса биологии — самовоспроизведения живого.
Представим себе, что в растворе, содержащем четыре компонента ДНК (под каждым компонентом понимается азотистое основание, соединенное химическими связями с сахарной и фосфатной группами, — то, что называют нуклеотидом), нити двуспиральной структуры молекулы ДНК в результате какого-то раскручивающего процесса отделились одна от другой. Благодаря возникновению водородных связей нуклеотиды из раствора начнут быстро «налипать» на свободные нити ДНК. Но так как адениновый нуклеотид из раствора может встать только против тиминового в нити, а гуаниновый — только против цитозинового и т. д., то понятно, что образовавшаяся в результате такого процесса новая нить будет точной копией старой. То же самое произойдет в растворе и со второй нитью; следовательно, там, где раньше была только одна молекула ДНК, появятся две новые совершенно идентичные молекулы. Эти удвоившиеся, «редублицировавшиеся» молекулы ДНК разойдутся в разные хромосомные наборы и живая клетка поделится (рис. 3).
Десятки опытов, в особенности эксперименты, в которых молекулы ДНК метили радиоактивными атомами, наглядно показали, что в действительности все именно так и происходит. В 1956 году американский биохимик А. Корнберг воспроизвел процесс редубликации в пробирке. Это удалось ему после того, как он выделил особый фермент — полимеразу ДНК. Несмотря на то, что в реакционной смеси присутствовали и необходимые компоненты и фермент, сам процесс синтеза не происходил до тех пор, пока в пробирку не вносили еще одно вещество — «затравочную» ДНК. Только появление «матрицы», «образца» для копирования заставляло энергично действовать всю систему. Химический анализ показал, что новые молекулы ДНК и по составу и по последовательности оснований тождественны молекулам ДНК «затравки». Если затравочная ДНК принадлежала вирусу, то и новые молекулы были вирусной ДНК, если крысе, то и новая ДНК оказывалась крысиной. При этом в полном соответствии с представлениями Крика и Уотсона наибольшей затравочной активностью обладала ДНК, заранее разделенная на две нити.
Но каким же способом эти наследственные свойства выявляют себя непосредственно в процессе жизнедеятельности? Каким образом структура молекул ДНК определяет структуру белковых молекул?
Мы уже говорили, что структура ДНК зависит от последовательности четырех азотистых оснований, чередующихся в длинной полимерной цепи. Точно так же структура белковых молекул определяется чередованием в их цепи двадцати аминокислот. О том, насколько важно, чтобы в цепи, состоящей иногда из нескольких сотен звеньев, каждая аминокислота находилась на своем месте, говорит, например, такой факт: замена одной единственной глютаминовой аминокислоты другой аминокислотой — валином в молекуле гемоглобина, белка, переносящего кислород в крови, приводит к тяжелейшему заболеванию — серповидной анемии.
Изменения наследственных признаков, так называемые мутации, очевидно, прежде всего выражаются в том, что изменяется структура соответствующего белка.
МЕХАНИЗМ БЕЛКОВОГО СИНТЕЗА
На всех стадиях процесса белкового синтеза огромную роль играет другой тип нуклеиновых кислот — рибонуклеиновые (РНК). РНК отличается от ДНК тем, что в ее сахарных группах имеется лишний атом
кислорода, а азотистое основание — тимин — везде заменено очень близким ему по химической структуре основанием урацилом (У), которое образует с аденином водородные связи. В принципе РНК может образовывать двойные спирали и выполнять наследственные функции подобно ДНК. Но в большинстве организмов свои основные функции РНК выполняет в виде однонитевых молекул. Благодаря тем же свойствам комплементарности оснований, РНК снимает копии, «рабочие шаблоны» с молекул ДНК, хранящихся в клеточном ядре. «Шаблоны» покидают ядро и направляются в другую часть клетки — цитоплазму. Здесь молекулы этой РНК, называемой обычно информационной, прикрепляются к особым тельцам— рибосомам, состоящим из белка и другого типа РНК — рибосомальной. (Функции рибосомальной РНК пока не ясны.) «Рабочий шаблон», если продолжать пользоваться механической аналогией, закреплен на месте. В цитоплазме существуют молекулы третьего типа РНК — транспортной. К этим небольшим молекулам прикрепляются аминокислоты, каждая к своей, строго определенной разновидности транспортной РНК. Один из участков транспортной РНК имеет группу оснований, комплементарную к определенной группе оснований в информационной РНК. Комплементарные группы образуют водородные связи, и аминокислоты, посаженные на транспортные РНК, выстраиваются в порядке, который в конечном счете задан последовательностью оснований в ДНК. При участии соответствующих ферментов между аминокислотами образуются химические связи. Аминокислоты отделяются от транспортной РНК, и готовый белок отходит от рибосомы (рис. 4).
В ряде опытов было доказано, что место на информационной РНК, около которого должна находиться аминокислота, «распознает» группа оснований транспортной РНК, а не сама аминокислота.
Постановка этих опытов стала возможной лишь после того, как белок тоже научились синтезировать вне организмов, в пробирке.
КОДОВЫЕ «СЛОВА»
Язык наследственности, записанный посредством четырехбуквенного алфавита азотистых оснований ДНК, определяет с помощью различных типов рибонуклеиновых кислот последовательность аминокислот в белковых цепях. Но какие «слова» строятся из этих букв и как складываются эти «слова» в «предложения»?
Если каждое «слово» должно соответствовать одной определенной аминокислоте и число букв в «словах» одинаково, то проще всего ответить на вопрос, сколько «букв» должно быть в таком «слове». Пользуясь четырехбуквенным алфавитом азотистых оснований, можно было бы составить четыре однобуквенных «слова», или (4 X 4) шестнадцать двухбуквенных «слов». Однако закодировать нужно двадцать аминокислот, и поэтому наименьшее число «букв» кодового «слова» должно равняться трем. Из четырех нуклеотидов — аденинового, тиминового, гуанинового и цитозинового можно составить шестьдесят четыре (4X4X4) трехбуквенных «слова». Такого количества для двадцати аминокислот более чем достаточно, и это наталкивает на мысль, что одну и ту же аминокислоту могут кодировать несколько таких трехбуквенных (или иначе — триплетных) «слова».
Код, в котором несколько нуклеотидных «слов» означают одну и ту же аминокислоту, называется вырожденным.
Первая «грамматика» языка наследственности была предложена в 1954 году физиком Г. Гамовым. Это был так называемый триплетный вырожденный перекрывающий код. В схеме Гамова кодовые «слова» (именуемые иногда «кодонами») различаются только по составу нуклеотидов, входящих в слово, но не порядком их расположения. Так, по Гамову, кодоны ЦЦА, АЦЦ и ЦАЦ должны означать одну и ту же аминокислоту. Этот способ разбивает 64 триплета на двадцать групп. Одна буква может участвовать сразу в трех словах. Например, в последовательности А Г Ц Г Т (аденин — гуанин — цитозин — гуанин — тимин) цитозино- вый нуклеотид участвует в кодировании сразу трех аминокислот. Кодирующие триплеты в такой системе наползают друг на друга, перекрывают один другой, поэтому такой код и называют перекрывающимся.
Гипотезу о перекрывающемся коде можно проверить, основываясь на опытных данных. Остроумным способом это проделал в 1957 году английский исследователь С. Бреннер. К этому времени уже было известно довольно большое число аминокислотных последовательностей в белковых цепях, которые и послужили Бреннеру материалом для анализа. Бреннер рассматривал перекрывающийся вырожденный код. В нем до или после определенного кодового «слова» могут быть только четыре различных триплета. Если в последовательности АГЦГТ мы будем считать исходным триплет ГЦГ, то слева от него могут стоять лишь триплеты АГЦ, ТГЦ, ГГЦ, ЦГЦ, а справа ЦГА, ЦГГ, ЦГЦ и ЦГТ. В аминокислотных последовательностях белков у каждой аминокислоты встречается определенное число соседей слева и справа, именуемых С- и N-соседями. С-соседи присоединяются к аминокислоте со стороны карбоксильной группы, а N-соседи со стороны аминной. Если проанализировать все известные белковые последовательности, то, например, для лизина можно насчитать 18 С- и 17 N-соседей, для тирозина —12 С- и 10 N-соседей, для триптофана — 3 С- и 3 N-соседа и т. д. Такое большое число соседей, например, для лизина возможно только в том случае, если перекрывающийся код вырожден и лизин кодируется по крайней мере пятью различными триплетами (уже четыре кодирующих триплета позволяли бы лизину иметь только 4×4 = = 16 различных соседей). В соответствии с тем же принципом тирозин должен был бы кодироваться тремя триплетами, а для триптофана хватило бы одного. Просуммировав минимальные числа триплетов, необходимых для каждой аминокислоты, Брениер обнаружил, что для того, чтобы закодировать уже известные последовательности аминокислот, понадобится по крайней мере 70 различных триплетов. Но так как в действительности существуют только 64 триплета, то этим доказывается невозможность простого перекрывающегося триплетного кода…
Остроумный и убедительный вывод, но с одной оговоркой. Так как проводились анализы аминокислотных последовательностей белков, выделенных из самых разных организмов — от бактерии до человека, то эти рассуждения справедливы только в том случае, если во всей живой природе действует один генетический код.
Тем с большим интересом были приняты результаты опытов с заменой одних аминокислот другими в результате мутаций, для которых подобная оговорка становится несущественной.
МУТАЦИИ И ЗАМЕНА АМИНОКИСЛОТ
Если в результате какого-то процесса (действия радиации, химических веществ и т. д.) в последовательности АГЦГТ вместо Ц появится А, то в неперекрывающемся коде это должно привести к изменению лишь одной аминокислоты. Вместо аминокислоты, кодировавшейся триплетом АГЦ, в белковой цепи появится аминокислота, кодируемая триплетом АГА. Но если код перекрывающийся, то замена Ц на А приведет к изменению сразу трех соседних аминокислот. Вместо будут триплеты
.
Мутациями называют любые изменения наследственного материала. Очевидно, самыми распространенными мутациями должны быть такие, в которых затрагивается элементарная единица — азотистое основание. И если код перекрывающийся, такая точковая мутация должна приводить к замене трех аминокислот. Удобным материалом для экспериментальной проверки этого вывода оказались молекулы гемоглобина. Однако анализ выяснил, что во всех изученных случаях в них происходит замена только одной аминокислоты.
Мутации можно получать искусственно. РНК, наследственный материал вируса табачной мозаики (рис. 5) — первого вируса, открытого наукой, при втирании в листья растений вызывает такую же инфекцию, как и зрелый вирус, обладающий белковой оболочкой. В результате заражения и болезни появляются новые вирусные частицы, имеющие внутренний стержень РНК и наружную белковую оболочку. На «обнаженную» вирусную РНК можно подействовать различными химическими агентами и получить разнообразные мутации. Втерев затем обработанную РНК в табачные листья, удается собрать «урожай» целых мутантных вирусов, одетых в белковые «шубы». Если белок этой «шубы» проанализировать и сравнить с нормальным, то можно определить характер случившихся в результате мутаций аминокислотных замен.
Биологи Френкель-Конрат и Цугита (США) и Витман (ФРГ) обрабатывали вирусную РНК азотистой кислотой. Среди примерно сотни разных мутантных вирусов, замены аминокислот в белке были обнаружены у тридцати трех. И ни в одном из этих тридцати трех случаев замена не затрагивала больше одной аминокислоты.
После этих опытов неперекрывающийся характер кода можно было считать обоснованным достаточно прочно.
Значит, кодовые «слова» не наползают друг на друга и должны читаться так же, как слова в обыкновенной газетной строке, одно за другим. Но кроме слов мы видим в любом тексте заглавные буквы, пробелы, разделяющие слова, запятые, и, наконец, точку в конце предложения. Очевидно, аналоги подобных грамматических элементов должны существовать и в «языке» наследственности.
Посмотрим, что должна представлять собой генетическая «фраза». Такой фразой можно считать участок ДНК, где находится информация, шифрующая одну белковую цепь. По современной терминологии этот участок называют цистроном.
ОБЩАЯ СТРУКТУРА КОДА
Ф. Крик и группа его сотрудников занимались исследованием двух цистронов (А и В) крохотного бактериального вируса (рис. 6). Бактериофаг Т4 заражает клетки кишечной палочки и уничтожает бактерии, выращивая свое потомство за счет их ресурсов. На чашке с питательной средой, на которой растут тонкой пленкой бактерии, вокруг фаговых частиц образуются светлые пятна, так как все микробы в этом месте оказываются «съеденными».
Стандартный, или, как говорят генетики, «дикий» тип фага Т4 может расти на бактериях разновидностей В и К. Но если в одном из двух (А или В) цистронов бактериофага произошла повреждающая мутация, то он теряет способность размножаться и образовывать стерильные пятна на бактериях разновидности К, сохраняя в то же время способность роста на разновидности В.
Среди миллиардов таких мутантных частиц можно обнаружить единичные фаги, по тем или иным причинам вновь получившие способность к росту на бактериях К. Если бактерии В одновременно заразить двумя различными мутантными фагами, то в потомстве таких «родителей» появятся и фаги, несущие сразу обе мутации, и фаги «дикого» типа.
Чтобы понять, как это происходит, обратимся к простой аналогии. Представим себе, что в двух изданиях «Преступление и наказание» Ф. Достоевского, в одной и той же фразе допущены две опечатки в разных местах:
1) Это я убрл тогда старуху чиновницу и сестру ее Лизавету топором и ограбил.
2) Это я убил тогда старуху чиновницу и сстру ее Лизавету топором и ограбил.
Ясно, что с помощью клея И НОЖНИЦ из этих двух фраз с опечатками можно сделать одну без опечаток, но тогда во второй фразе будут уже обе опечатки сразу.
В природе вместо клея и ножниц действует процесс генетической рекомбинации. При этом генетический перекрест тем более вероятен, чем больше расстояние между «опечатками» — мутациями (рис. 7).
Группа Ф. Крика изучала мутации фага> Т4 на очень небольшом участке цистрона В в сегментах В1 и В2. Однако эти мутации несколько отличались от тех, с которыми мы встретились, рассматривая аминокислотные замены в белках вируса табачной мозаики.
Во фразе из Достоевского, которой мы воспользовались, опечатки различаются по своему характеру. Если первая состоит в замене одной буквы на другую, неправильную, то вторая заключается в выпадении значащей буквы. Мутации в вирусе табачной мозаики были «опечатками» первого рода и заключались в замене одного азотистого основания другим. А группа Ф. Крика использовала мутации, которые заключались в выпадении основания из цепи ДНК или в добавлении одного лишнего основания.
Как происходят такие мутации, ясно еще не до конца, но известно вещество, которое их вызывает — акридин. Исследователи обрабатывали акридином фаговые частицы и скрещивали мутантов. В результате появлялся стандартный «дикий» тип фага, растущий на бактериях К, и мутант, несущий две «опечатки» Но в некоторых опытах на бактериях К росли оба потомка…
Чтобы понять, в чем тут дело, посмотрим, что происходит с информацией при вставке или исчезновении одного знака. Генетическая «фраза» — это цистрон. И проще всего считать, что она прочитывается, начиная с некоторой фиксированной точки подряд, «слово за словом». Если между ними нет пробелов или «запятых», то последующее «слово» отличается от предыдущего благодаря тому, что все «слова» состоят из трех «букв» и чтение начинается с первой «буквы» первого «слова».
Например:
Кот кот кот кот кот кот
Но если будет вставлена всего одна буква, то весь смысл текста исказится:
Кот око тко тко тко тко тко
Если буква выпадет, произойдет то же самое:
Кот кот кот ктк отк отк отк
А если вставку и выпадение скомбинировать вместе, то чтение информации будет неправильным только на небольшом участке между опечатками.
Кот око тко ткт кот кот кот
В этом и заключается секрет жизнеспособности некоторых двойных мутантов, хотя любая из двух мутаций в отдельности привела бы к гибельным последствиям. Очевидно, небольшой участок измененной информации между двумя мутациями в сегментах В1 и В2 не столь уж существен для роста фага на бактериях К.
Если любую произвольно выбранную мутацию мы обозначим как плюс, то, очевидно, мутацию, которая в комбинации с нею дает жизнеспособный фаг, следует обозначить знаком минус. Если ( + ) означает вставку основания, то (—) означает его нехватку, и наоборот. Понятно, что комбинация ( + ) с ( + ) или (—) с (—) всегда будет давать нежизнеспособную фаговую фастицу, а ( + ) с (—) «псевдодикий» фаг, растущий на бактериях К; однако это будет происходить далеко не во всех комбинациях ( + ) и (—).
Комбинации ( + ) и (—) дают жизнеспособные фаги только в тех случаях, когда мутации ( + ) и (—) лежат не слишком далеко друг от друга и участок неправильно прочитываемой информации не слишком велик.
В отдельных редких случаях даже близкорасположенные ( + ) и (—) дают нежизнеспособный фаг. Очевидно, в измененной последовательности между такими ( + ) и (—) встречается «бессмысленный» триплет. Ведь триплетов шестьдесят четыре, а аминокислот двадцать, и поэтому вполне вероятно, что один-два триплета не означают никакой аминокислоты, а говорят, например, о том, что здесь начало или конец «фразы». На таких триплетах «чтение» обрывается.
Малое число «бессмысленных» триплетов позволяет сделать важный вывод, что несколько триплетов могут кодировать одну аминокислоту, и следовательно, код вырожден. Естественно, что триплеты, начинающие или обрывающие чтение кодовой последовательности, должны находиться в начале и конце цистрона. А что, если попытаться срастить два цистрона, выбросив из генетического материала «точку» на конце цистрона А и «заглавную букву» в цистроне В?
Ф. Крик и его сотрудники проделали подобный эксперимент.
Существуют мутации, известные под названием делеций. Они представляют собой выпадения наследственного материала, иногда довольно значительных кусков ДНК. Делеция 1589 фага Т4 как раз затрагивает участок в «куске» цистрона А и маленький участок в начале цистрона В (рис. 8). Фаг с такой делецией неактивен, но специальным приемом можно обнаружить активность цистрона В.
Очевидно, теперь цистроны А и В должны прочитываться как одна «фраза». Действительно, Крик обнаружил, что мутация — безразлично (—) или ( + ), внесенная в цистрон А, полностью инактивирует цистрон В. В отсутствие делеции 1589 мутации в цистроне А никогда не оказывали влияния на активность цистрона В. Но если в цистроне А в присутствии делеции 1589 комбинировали ( + ) с (—), то активность цистрона В восстанавливалась.
Очевидно, картина выглядит так. На молекуле фаговой ДНК с делецией 1589 на двух А и В — цистронах синтезируется одна молекула информационной РНК. Если такая молекула РНК образует белок, то он должен быть «гибридом». С одной стороны белковая цепь будет иметь аминокислотную последовательность, кодируемую цистроном А, с другой стороны — цистроном В. Правильного «хвоста», зашифрованного В-цистроном, оказывается достаточно для успешного функционирования белка.
До сих пор мы все время говорили о триплетах оснований. Однако если снова внимательно проанализировать опыты группы Крика, то можно видеть, что результаты их не претерпели бы абсолютно никаких изменений, если бы кодовые «слова» были, например, четверками или пятерками оснований. Точно так же вставка или выпадение оснований расстраивали бы механизм считывания, а комбинация ( + ) и (—) мутаций при определенных условиях восстанавливала бы его. Блестящим решающим экспериментом группа Крика устранила и эту неясность. На небольшом участке цистрона В исследователи скомбинировали сразу три однотипные мутации. Это были либо ( + ) ( + ) ( + ). либо (—) (—) (—) мутации. Если участок, на котором они располагались, был достаточно мал, то функция цистрона В восстанавливалась. Что происходит при этом с генетической информацией, нетрудно увидеть на том же примере с триплетом КОТ.
Кот кко тко ктк отк кот кот кот кот
Начиная с третьей вставки, триплетная информация считывается нормально. Таким образом, прямое экспериментальное подтверждение получила и триплетность кода.
ПРАВИЛА ЯЗВЫКА НАСЛЕДСТВЕННОСТИ
В заключение рассказа об общей структуре генетического кода сформулируем, следуя Крику, основные правила языка наследственности.
1) Генетический код триплетен. Одну аминокислоту кодирует группа из трех азотистых оснований.
2) Код неперекрывающийся и кодовые слова прочитываются одно за другим без «пробелов» и «запятых».
3) Правильный выбор триплетов происходит благодаря тому, что считывание начинается с определенной точки цистрона.
4) Код вырожден, то есть одна аминокислота кодируется разными триплетами оснований, так как число «бессмысленных» триплетов мало.
РОЗЕТТСКИЙ КАМЕНЬ ГЕНЕТИКИ
Хотя мы уже подходим к концу статьи, но до сих пор не назвали ни одного «слова» своеобразного языка наследственности. Кодовые «слова» долго оставались загадкой для науки и еще, пожалуй, году в 1960 казалось, что день расшифровки этих «иероглифов жизни» совсем не близок.
Дело в том, что хотя последовательность аминокислот во многих белках была известна, никто не определил последовательность азотистых оснований хотя бы в одной молекуле ДНК.
И только в августе 1961 г. на V Международном биохимическом конгрессе в Москве прозвучало сообщение о том самом «случайном» открытии, с которого мы начали рассказ.
Молодые американские биохимики М. Ниренберг и Г. Маттеи работали с бесклеточной синтезирующей белок системой, выделенной из кишечной палочки. Из различных организмов они получали информационную РНК и следили за синтезом белка при добавлении ее в систему. При введении в систему «бессмысленного» полимера не должно было происходить белкового синтеза. Чтобы контролировать это, Ниренберг и Маттеи добавляли туда же полирибонуклеотид, синтезированный в пробирке из одних только адениновых нуклеотидов.
Однажды в лаборатории кончились по- лирибоадениловая кислота и ученые вместо нее добавили полиуридиловую кислоту. Внезапно оказалось, что система вырабатывает белок, состоящий из аминокислот только одного вида — фенилаланиновых (рис. 9).
Ниренберг и Маттеи начали добавлять в синтезирующую систему искусственные полирибонуклеотиды. «Текст» полирибонук- леотида был заранее известен. А после того как его «прочитывала» и строила белковый полимер синтезирующая система, можно было проанализировать получившийся продукт. «Розеттский камень», по сути говоря, всякий раз создавался заново руками экспериментаторов, работавших с рибосомной системой, которая выполняла «перевод» с нуклеотидного языка на язык аминокислотный.

Рис. 9. Синтез белковой цепи из фенилаланиновых аминокислот на матрице полиуридиловой кислоты (поли У)
В способе Ниренберга и Маттеи даже не требовалось трудоемкого анализа состава и аминокислотной последовательности белковых цепей. К синтетической системе, где роль информационной РНК играет определенный искусственный полирибонуклеотид, добавили сразу все двадцать аминокислот. Одна из них несла радиоактивную метку. Если радиоактивность обнаруживали в белковом продукте, то это означало присутствие в полирибонуклеотиде триплетов, кодирующих эту аминокислоту. Повторив эту операцию двадцать раз со всеми возможными аминокислотами, экспериментаторы узнали, какие аминокислоты кодируют тот или иной полирибонуклеотид.
Результаты дешифровки триплетов блестяще подтвердили справедливость правил, сформулированных Криком.
Код триплетен, так как ни разу для включения какой-либо аминокислоты не понадобился полимер, в котором присутствовали бы все четыре азотистых основания. Для кодирования любой аминокислоты хватало трех компонентов.
Код вырожден, и одну и ту же аминокислоту могут кодировать триплеты различного состава, иногда даже четырех разных видов.
Предсказание Гамова, что важен только состав триплета, не сбылось, и наряду с составом важнейшей характеристикой триплета следует считать порядок оснований в нем. Здесь и обнаруживается зияющий провал в нашем кодовом «словаре». Мы знаем какие буквы образуют те или иные слова, но не знаем, как они располагаются внутри «слова».
Однако на VI Международном биохимическом конгрессе в Нью-Йорке в августе 1964 года тот же Ниренберг сообщил, что он, по-видимому, нашел ключ к решению и этой проблемы.
Ниренберг вместе со своим сотрудником Лидером стал добавлять к рибосомальной системе искусственные полирибонуклеотиды, состоящие всего из трех звеньев. Для коротеньких молекул-триплетов можно полностью контролировать последовательность оснований. Как ни странно, но такие коротенькие информационные РНК закрепляются на рибосомах и, самое главное, они способны связать с рибосомой молекулы соответствующей транспортной РНК. Напомним, что тройка азотистых оснований транспортной РНК образует водородные связи с комплементарным кодовым триплетом информационной РНК. Аминокислоты, «садящиеся» на транспортную РНК, можно пометить радиоактивным атомом С14 и в серии опытов установить, какая именно аминокислота связывается через РНК с рибосомой. Когда Ниренберг и Лидер запустили в такую систему триплет УУУ, то, естественно, с рибосомой связался фенилаланин. Затем в систему запустили по очереди все три триплета состава 2У1Г, который соответствует валину. Транспортная РНК валина оказалась «равнодушной» к триплетам УГУ и УУГ, но в буквальном смысле слова «ухватилась» за триплет ГУУ. Значит, кодовое слово для валина ГУУ. Видимо, в ближайшее время исследователи наведут порядок и во всех остальных триплетах.
УНИВЕРСАЛЕН ЛИ ЯЗЫК НАСЛЕДСТВЕННОСТИ?
Последний вопрос, который мы постараемся выяснить в этой статье, насколько универсален язык наследственности? Пользуются ли одним генетическим кодом фаг кишечной палочки Т4 и высокоорганизованною организмы?
Сведения о коде, которыми мы располагаем, появились в основном в результате исследований микроорганизмов. Группа Крика работала с бактериофагами Т4, а Ниренберг — с синтезирующей белок системой кишечной палочки. Но оказалось, что бес- клеточные системы, синтезирующие белок, могут быть выделены и из тканей млекопитающих. Искусственные полирибонуклеотиды, введенные в такие системы, вызывают включение в белковую цепь тех же аминокислот, что и в системе кишечной палочки. Шесть кодовых триплетов, расшифрованных в таких системах, ничем не отличаются от общепринятых.
Информационная РНК, выделенная из разных организмов и введенная в систему кишечной палочки, вызывает синтез белков, характерных для того организма, из которого выделили РНК. Правда, по неизвестным пока причинам полной специфической активностью такие белки не обладают.
Однако в общем и целом генетический код, по-видимому, одинаков во всей живой природе. Даже в том случае, если некоторые виды организмов пользуются одними триплетами и избегают других, свойство вырожденности кода позволяет оставаться в пределах общей кодовой схемы.
Универсальность кода свидетельствует о том, что он появился на самых ранних ступенях зарождения жизни. Детальное понимание структуры генетического кода несомненно поможет в наших усилиях постигнуть этот величественный процесс.