пятница, 19 июня 2015 г.

23andme и первый миллион клиентов

Сегодня на почту пришло письмо, подписанное одной из основательниц 23andme Анне Войжитски, которое радостно сообщало, что на прошлой неделе 23andme провела генетический тест для своего миллионного клиента.
В письме меня поздравили, что я являюсь частью того миллиона, который способствует изменению мира. Было очень приятно.
Также сообщение приводило несколько фактов о времени когда еще не был протестирован ни один клиент 23andme.
Миллион протестированных клиентов назад участники конференции "American Society of Human Genetics" были шокированы сообщением о генетическом тесте, который бы давал информацию пациенту напрямую.
Миллион протестированных клиентов назад не было известно как люди прореагируют на информацию из генетических тестов. Как показывают исследования, пользователи тестов не реагируют на свои результаты слишком остро.
Миллион протестированных клиентов назад не было законов, регулирующих доступ к персональной генетической информации. Сейчас такие законы появились во многих странах.

Меня также порадовали, что в протестированном миллионе я стою по номером 794,981.


Кто находится под номерами от 1 до 100 пока загадка, единственное что известно - Анне Войжитски под номером 60.

пятница, 12 июня 2015 г.

От РНК к протеинам


После поста Подробнее об РНК, вы знаете, как организм получает РНК а также мРНК. мРНК это что-то вроде рецепта, который используют клетки для приготовления нужных им химических веществ - протеинов. В этом сообщении речь пойдет о том, как этот рецепт клетками читается и исполняется.
Чтобы что-то готовить нужны ингредиенты. Организм использует аминокислоты в качестве ингредиентов для протеинов. Все протеины в нашем теле получаются комбинацией из 20 различных аминокислот. Также как основными компонентами ДНК являются 4 нуклеотида A, T, G и С, основные составляющие протеинов - 20 аминокислот:
ГлицинGlyG
АланинAlaA
ВалинValV
ИзолейцинIleI
ЛейцинLeuL
ПролинProP
СеринSerS
ТреонинThrT
ЦистеинCysC
МетионинMetM
Аспарагиновая кислотаAspD
АспарагинAsnN
Глутаминовая кислотаGluE
ГлутаминGlnQ
ЛизинLysK
АргининArgR
ГистидинHisH
ФенилаланинPheF
ТирозинTyrY
ТриптофанTrpW
Таблица скопирована с википедии, как видите, у каждой аминокислоты есть два обозначения: из трех букв (второй столбец) и из одной буквы (последний столбец).
Но как сопоставить 4 буквы в коде РНК 20-ти аминокислотам?
Первая часть центральной догмы (о которой я писал тут) это транскрипция РНК из ДНК, вторая часть центральной догмы состоит в получении протеинов из мРНК и называется трансляцией. Трансляция в нашем организме осуществляется рибосомами. Рибосомы способны читать последовательность мРНК и создавать на основе прочитанного аминокислоты.


Одной из научных загадок XX века было понять как рибосома читает код мРНК. Если бы рибосома выдавала одну аминокислоту для одной буквы кода мРНК, то она могла бы создать только 4 различных аминокислоты, если бы одну аминокислоту кодировали 2 буквы генетического кода, то все различные комбинации дали бы нам 16 аминокислот, но рибосомы производят 20 разных аминокислот. Очевидно, чтобы закодировать 20 аминокислот 4 буквами необходимо, как минимум, использовать комбинацию из трех букв на одну аминокислоту. В действительности так и есть: чтобы создать одну аминокислоту, рибосома читает 3 буквы кода мРНК. Причем читает она по 3 буквы друг за другом. В начале изучения трансляции высказывались гипотезы, что имеет место перекрытие (overlaping) при чтении рибосомой мРНК. То есть последний или два последних нуклеотида в тройке, кодирующей аминокислоту, являются первыми в следующей тройке. Гипотеза оказалась неверной.



Тройка нуклеотидов, кодирующая аминокислоту, называется кодоном. Количество комбинаций, в которых можно расположить 4 нуклеотида в кодоне равно 4*4*4=64. Перед вами таблица, в которой для каждой комбинации A, U, G и C приведена кодируемая аминокислота:

Некоторые аминокислоты кодируются сразу несколькими кодонами, как, например, лейцин (Leu). Комбинация AUG является сигналом для рибосомы о необходимости начать кодирование аминокислот и одновременно о создании метионина (Met). Три кодона отвечают за остановку процесса трансляции - обозначены в таблице STOP (UAA, UAG и UGA), читая эти комбинации, рибосома никаких аминокислот не создает.
На поиск этой таблицы наука потратила многие годы, и сейчас вы за каких-то пару минут можете изучить результат этой долгой и кропотливой работы.
Со всеми определениями, которые я использовал в этом и предыдущем сообщениях об РНК очень легко запутаться. Поэтому, повторим:
Центральная догма молекулярной биологии гласит: сначала происходит транскрипция РНК из ДНК, а потом трансляция полученной РНК в протеины. Транскрипция РНК происходит в ядре клетки, где с необходимого гена ДНК создается копия в виде РНК, из которой в процессе сплайсинга удаляются интроны, а оставшиеся экзоны образуют матричную РНК (мРНК), участвующую в трансляции.
Трансляция происходит с помощью рибосом, которые считывают мРНК по 1 кодону за раз. Каждый кодон либо кодирует аминокислоту либо является сигналом для рибосомы прекратить трансляцию. Кодон, указывающий о необходимости начать кодирование аминокислот и, одновременно кодирующий метионин, имеет комбинацию AUG. Кодоны, указывающие на остановку трансляции, это UAA, UAG и UGA. То есть, если рибосома прочитает комбинацию UCU-AUG-GGA-UGA, на выходе будет протеин со следующими аминокислотами: Met-Gly.
Если вы поняли смысл последних предложений, поздравляю, вы знаете очень много определений, это большой повод для гордости.
Теперь немного цифр. Человеческий геном состоит из примерно 3-х миллиардов пар нуклеотидов. Ученых долго волновал вопрос: "А сколько генов, кодирующих протеины содержится в нашем геноме?" Некоторые делали догадки. Разброс во мнениях был очень приличным - минимальное предположенное количество генов было 25 тысяч, максимальное 250 тысяч. В конце концов, оказалось, что количество генов, кодирующих протеины, в человеческом геноме лежит между 20 и 25 тысячами. Это относительно не очень большое число, оно сравнимо с количеством генов у мух дрозофила и у круглых червей. Для сравнения у одного из видов тополя более 70 тысяч генов.


Но человеческий организм гораздо сложнее организмов ленточного червя, дрозофил и тополей, поэтому сложность организма определяется далеко не количеством генов, кодирующих протеины. Также сложность не определяется количеством пар нуклеотидов в геноме - у одноклеточных амеб около 650 миллиардов пар.
Менее двух процентов человеческого генома участвует в кодировании протеинов. Однако, примерно 80% генома переводится в РНК путем транскрипции. Некоторые, полученные транскрипцией, молекулы РНК в наших клетках также выполняют роль регуляторов, например, активности мРНК, еще некоторые виды РНК являются составляющими для строительства рибосом (рибосомная РНК - рРНК). Более того, в определенных клетках транскрипция РНК происходит с обеих составляющих спирали ДНК, при этом РНК, полученная с помощью одной части спирали ДНК, используется для трансляции, а полученная с помощью второй части - для регулирования каких-то процессов организма.
Короче говоря, принцип работы генома чрезвычайно сложен, и некоторые вопросы до сих пор не решены.

Проверь свои знания

1. Процесс создания клеткой РНК по ДНК называется
  • Трансляция
  • Транскрипция
  • Сплайсинг
  • Генотипирование
2. Процесс создания протеинов из мРНК называется
  • Трансляция
  • Транскрипция
  • Сплайсинг
  • Секвенирование
3. мРНК образовано
  • Экзонами
  • Интронами
  • Аминокислотами
  • Протеинами
4. Какая последовательность нуклеотидов мРНК создаст протеин из следующих аминокислот Met-Tyr-Pro-Leu?
  •  CGACUCAUGUAUCCUCUCUGAUGGUGU
  • ACUCGAUGUAUCCUCUCUGAUGGUGUС
  • ACUCGCAGUUAUCCUCUCUGAUGGUGU
  • ACUCGCAUCUAUCCUCUCUGAUGGUGU

Результат =

Правильные ответы:
Free JavaScripts provided