Генетический код может быть прочитан: как дипептиды раскроют секрет возникновения языка жизни

6:40

Нас учат, что гены — "инструкции жизни", а генетический код — универсальный словарь, по которому клетка переводит ДНК в белки. Но откуда взялся этот словарь и почему он устроен именно так? Новая работа исследовательской группы Иллинойсского университета в Урбане-Шампейне предлагает неожиданный ответ: следы происхождения кода "вшиты" не только в нуклеиновые кислоты, но и в сами белки — точнее, в сочетания аминокислот, называемые дипептидами.

Этот взгляд объединяет филогеномику, биоинформатику и идеи синтетической биологии и подталкивает к более точной инженерии живых систем.

Что именно нашли исследователи

Команда сопоставила эволюционные деревья трёх уровней: структурных доменов белков, транспортных РНК (тРНК) и дипептидов — минимальных "кирпичиков" из двух аминокислот.

Выяснилось, что временные шкалы согласуются: порядок "подключения" аминокислот к генетическому коду отражается в том, какие дипептиды и белковые домены появлялись и закреплялись у архей, бактерий и эукариот. В огромной базе — 4,3 млрд дипептидных последовательностей из 1561 протеома — прослеживается общий ритм усложнения белкового мира и уточнения кода.

"Мы обнаружили, что происхождение генетического кода таинственным образом связано с дипептидным составом протеома — совокупности белков в организме", — сказал профессор Густаво Каэтано-Анольес.

Ключевая идея: дипептиды не случайны. Они возникали как структурные модули, помогающие белкам сворачиваться и работать, а параллельно закладывались правила "соответствий" между кодонами и аминокислотами — от раннего операционного кода тРНК/синтетаз до современного универсального генетического кода.

Два языка жизни и их "переводчик"

Жизнь держится на связке двух кодов: нуклеотидного (ДНК/РНК) и белкового. Между ними — рибосома и набор аминоацил-тРНК-синтетаз, ферментов-"корректоров", которые подбирают к каждой тРНК "свою" аминокислоту и исправляют ошибки. Работа показывает, что совершенствование этих ферментов шло рука об руку с расширением аминокислотного алфавита и появлением новых дипептидов.

"Почему жизнь основана на двух языках — одном для генов, а другом для белков?", — задался вопросом профессор Густаво Каэтано-Анольес.

Отдельный сюрприз — "двойственность" дипептидов: пары вида AL и LA (антидипептиды) часто возникали почти синхронно, будто отражаясь друг в друге на эволюционной шкале. Это намекает на древнюю комплементарность кодирования в двух цепях нуклеиновых кислот и "минималистичные" тРНК на заре белкового мира.

Как учёные "читают" код по белкам: пошагово

  1. Составляют выборки протеомов (археи, бактерии, эукариоты) и извлекают дипептиды.
  2. Строят филогенетические деревья по частотам дипептидов и по каталогам доменов.
  3. Сопоставляют их с "часами" тРНК и аминоацил-тРНК-синтетаз.
  4. Отмечают совпадения "пиков": когда добавлялись новые аминокислоты — какие дипептиды закреплялись.
  5. Проверяют согласованность выводов статистикой и моделями неопределённости.

"Мы обнаружили, что результаты согласуются друг с другом", — отметил профессор Густаво Каэтано-Анольес.

А что если…

А что если рассматривать дипептиды как "первичный белковый код", комплементарный раннему тРНК-коду? Тогда инженерия ферментов (CRISPR-систем, полимераз, шасси-организмов) сможет целенаправленно использовать эволюционно "закалённые" сочетания аминокислот, повышая стабильность, собираемость и точность катализа.

FAQ

Что такое дипептиды и зачем они важны?

Это пары аминокислот (400 вариантов). Их частоты в протеомах отражают отбор за структуру и функции и несут эволюционные сигналы.

Почему согласованность деревьев — сильный аргумент?

Независимые данные (домены, тРНК, дипептиды) совпали по порядку "включения" аминокислот — это снижает риск систематической ошибки.

Как это поможет биоинформатике и CRISPR-инженерии?

Даёт "библиотеку" устойчивых мотивов/дипептидов для более стабильных белков-редакторов, каналов и ферментов.

Мифы и правда

  • Миф: генетический код "заморожен" и не объясним.
    Правда: его история прослеживается по белкам и тРНК; видны этапы повышения специфичности.
  • Миф: всё объяснила только "РНК-мир" гипотеза.
    Правда: данные указывают на совместную эволюцию белков и тРНК/синтетаз.
  • Миф: дипептиды случайны и вторичны.
    Правда: они коррелируют со сворачиванием и функциями и несут древний сигнал отбора.

Три прикладных совета для инженеров

  1. При проектировании фермента начинайте поиск шаблонов с древних доменов и частых дипептидов ранних групп.
  2. Валидацию специфичности проводите через "операционный код": мотивы тРНК-распознавания и редактирования синтетаз.
  3. Для стабильности в шасси-организмах подбирайте аминокислотные составы, "родственные" древним узлам деревьев.

Исторический контекст

  • 3,8 млрд лет назад: зарождение жизни; позже — формирование "двух кодов" и рибосомного перевода.
  • XX век: расшифровка генетического кода, открытие тРНК и синтетаз-редактирования.
  • XXI век: филогеномика доменов, большие протеомные базы; сопоставление деревьев доменов, тРНК и дипептидов.

Три интересных факта

  • Из 400 дипептидов некоторые пары и их "зеркала" (антидипептиды) появляются почти синхронно — редкая эволюционная симметрия.
  • Ранние группы аминокислот связаны с появлением ферментного редактирования — "страховки" от неправильной загрузки тРНК.
  • Протеомы лучше "консервируют" раннюю историю кода, чем геномы: отбор по структуре сохраняет сигнал дольше.

"Синтетическая биология признаёт ценность эволюционной перспективы", — подчеркнул профессор Густаво Каэтано-Анольес.

Уточнения

Дипептиды (от греч. peptós — сваренный, переваренный) — органические соединения, состоящие из двух аминокислотных остатков, связанных пептидной связью. Дипептиды — наименьшие возможные по размеру олигопептиды, соединения, промежуточные между полипептидами и аминокислотами.

Биоинформа́тика — междисциплинарная область, объединяющая общую биологию, молекулярную биологию, кибернетику, генетику, химию, компьютерные науки, математику и статистику.  Главным образом включает в себя изучение и разработку компьютерных методов и направлена на получение, анализ, хранение, организацию и визуализацию биологических данных.

Автор Алексей Тимошкин
Алексей Тимошкин — внештатный корреспондент новостной службы Правда.Ру
Редактор Юлиана Погосова
Юлиана Погосова