елементи
абстрактно
Изследвахме генно-генни взаимодействия (епистаза) в индекса на човешкото тяло (ИТМ) в четири европейски популации (n 5000). Заключваме, че анализът на епистазата в множество популации, обхващащи целия геном, е ефективен подход за придобиване на нови прозрения в генетичната регулация на ИТМ, но изисква допълнителни усилия за потвърждаване на констатациите.
Индексът на телесна маса (ИТМ) е най-често използваният антропометричен метод за определяне на човешкото затлъстяване. ИТМ е сложна черта, повлияна от много екологични фактори (напр. Диета, възраст, физическа активност) и генетични фактори, като оценките за наследственост варират от 40 до 80% при дублиращи се проучвания, 20 до 50% при семейни проучвания и 20 до 60% при семейни изследвания, проучвания в групата. ученето. 1 Неотдавнашни проучвания с голяма асоциация на генома (GWA) успешно идентифицираха многобройни еднонуклеотидни полиморфизми (SNP), които са силно свързани със свързаните със затлъстяването характеристики, включително ИТМ. 2, 3, 4 Те хвърлят светлина върху биологичната основа на затлъстяването и предполагат ролята на невроналните влияния в регулирането на апетита и/или енергийния баланс. Обаче генетичните варианти, идентифицирани заедно, обясняват само малка част от вариацията на признака и следователно имат ограничена прогнозна стойност за риска от затлъстяване. 5 Например, в неотдавнашен мета-анализ (249 796 индивида) от 32 идентифицирани и реплицирани SNPs, беше обяснено само 1,45% от вариацията на интензивния ИТМ, където най-силният SNP представляваше само 0,34% от вариацията. 3 32 BMP SNPs картографират 32 различни гена, наричани по-долу като BMI локуси.
Ген-генните взаимодействия (епистаза) се считат за потенциални източници на необясними генетични вариации, 6, 7, 8, но остават до голяма степен неизследвани в проучванията на GWA до момента за ИТМ. Основната пречка пред анализа на епистазата в проучванията на GWA е липсата на бързи методи за изчисляване на милиарди тестове за взаимодействие при цялостно сдвоено сканиране на геном за картографиране на различни видове епистаза (напр. Със или без големи ефекти), като същевременно се поддържат фалшиво положителни стойности. под контрол. 9, 10 Друга пречка пред изследването на епистазата е относително малкият размер на извадката в много съществуващи кохорти на GWA, което може да ограничи способността за откриване и възпроизвеждане на епистазни сигнали, освен ако епистатичните ефекти, които трябва да бъдат открити, са големи. Симулацията показа, че са необходими повече от 4000 двойки случаи и контроли, за да се постигне 80% способност за откриване на епистаза при необходимото съотношение 3.0 при сложни заболявания. За количествените признаци размерите на пробите трябва да бъдат значително (напр. 45%) по-големи от случаите и фенотипите за контрол на случая, за да се постигне подобна сила. 14.
С напредъка в изчислителните технологии, основното препятствие постепенно се освобождава и цялостното двойно сканиране на генома започва да се прилага поотделно към GWA популациите. Мета-анализът на епистазата, използван в проучванията на GWA 3, може да бъде добър начин за преодоляване на препятствието с размера на пробата, но изисква нови методи за адаптиране на вменените данни за генотипа на SNP. Различни подходи при намаляване на пространството за търсене (т.е. по-малко строги прагове на значимост поради много по-малък брой тестове) могат да бъдат използвани за подобряване на възможностите за откриване на епизоди в отделни популации на GWA. Тестовите взаимодействия, включващи значителни локуси (пределни ефекти) с широк спектър от геноми, с праг, коригиран за действителния брой тестове, са предложени 10, 17, 18 и успешно приложени в последните проучвания. 16, 19, 20, 21 Друг подход е да се избират SNPs въз основа на съществуващите биологични познания (например взаимодействия протеин-протеин) и да се тестват взаимодействията само между тях. Въпреки това трябва да се внимава при избора на SNP 12, тъй като биологичното познание може да не е пряко свързано с изследваната черта и всякакви предразсъдъци в предварително идентифицираните локуси могат да доведат до фалшиво положителни епистатични сигнали.
Тук демонстрираме различен подход за използване на стойността на епистазата чрез анализ на голяма популация. За първи път извършихме пълни сдвоени изследвания на генома за епизод на ИТМ в четири популации на GWA, до които имахме пряк достъп: шотландските ORCADES, 24 CROATIA-Vis 25 и CROATIA-Korcula, 26 и италианските проучвателни групи MICROS 27. Всяка от тези групи има сравнително малък размер на извадката и е взета проба от различни европейски региони с много различен начин на живот и диети. Второ, идентифицирахме общи и потенциално важни генно-генни взаимодействия, използвайки епистазни сигнали, открити във всяка кохорта и тяхното обогатяване в генната онтология (GO) в популациите. Освен това идентифицирахме и набор от взаимодействия, включващи локуси на ИТМ (както предишни констатации) в различни кохорти. Трето, тествахме идентифицираните взаимодействия във всяка кохорта на репликация и след това репликираните сигнали в родната кохорта от Северна Финландия 1966 (NFBC1966). 28 Нашата цел е да разгледаме въпроса дали анализът на епистазата е от значение за дисекцията на генетичната регулация на ИТМ в тези изследователски групи.
Материали и методи
Учебни групи и етична декларация
Четирите изследователски групи са описани подробно другаде. 24, 25, 26, 27, 29 Накратко, шотландската група ORCADES е приета от подгрупа от 10 острова на архипелага Оркни. Това проучване беше одобрено от Комитета по етика на NHS Orkney Research и от Северна Шотландия REC. Кохортите ХЪРВАТСКА-ВИСКА и ХЪРВАТСКО-КОРЧУЛСКА бяха приети на остров Вис и на остров Корчула. И двете проучвания са одобрени от Комитета по етика на Медицинския факултет, Университета в Загреб и Комитета по етика на мултикултурните изследвания в Шотландия. Италианската група MICROS е получена от села в изолиран планински район на Южен Тирол. Изследването е одобрено от комисията по етика на автономната провинция Болцано. Всички участници предоставиха писмено информирано съгласие и бяха измерени за броя знаци, включително теглото и височината, от които бяха изчислени стойностите на ИТМ.
Маса в пълен размер
Статистически анализ
Суровите данни за ИТМ във всяка от четирите проучвани групи бяха коригирани и нормализирани по възраст и пол, използвайки функцията за преобразуване, която е внедрена в пакета GenABEL, който извършва нормализиране на квантилните остатъци от генерализиран анализ на линеен модел. След това нормализирани BMI остатъци бяха анализирани с помощта на линеен смесен модел, за да се коригират полигенни ефекти поради свързаност, използвайки полигенната функция в опаковката GenABEL, и получените остатъци от околната среда (т.е. pgresidualY в GenABEL) бяха използвани като маркер за тестване на асоциацията. Полигенното наследяване беше оценено в стъпката на смесения модел. След първоначалното проучване на GWA, 28 пациенти от групата NFBC1966 бяха изключени от бременност и/или отделно докладвани измервания на ИТМ, а суровите стойности на ИТМ бяха коригирани за SexOCPG (изчислени по пол, статус на орална контрацепция и бременност) и след това нормализирани и коригирано за родство, както по-горе.
Сканирането на GWA, базирано на SNP, се извършва във всяка популация, като се използва метод за тестване на точки (базиран на адитивния модел), внедрен в функцията mmscore в пакета GenABEL. Консенсусният праг на GWA от 7, 3 е използван за идентифициране на значителни SNP на GWA (−log 10 (5, 0E-08)). 32 Извършихме също пълно сдвоено геномно сканиране, използвайки описаните по-долу регресионни модели. По отношение на двойката SNP, обозначени SNP 1 и SNP 2, бяха използвани следните генетични модели за откриване на епизаза, където генотиповете на всеки SNP (т.е. хомозигота на малки алели, хомозигота на основен алел и хетерозигота) бяха използвани като фиксирани фактори:
където y е знак за интерес, μ е константа на модела, SNP 1 (или SNP 2) е фиксиран фактор с три нива (класове на генотипа), SNP 1 * SNP 2 е термин за взаимодействие, e е термин за случайна грешка. Тестът за съотношение F на модел 1 спрямо модел 3 оценява ефекта на цялата двойка, включително взаимодействието (т.е. F двойка, 8 степени на свобода). Тестът за F съотношение на модел 1 спрямо модел 2 оценява взаимодействието между два SNP (т.е. F int, 4 степени на свобода). Стойностите на P се изчисляват въз основа на разпределението на F със съответните степени на свобода и се трансформират в скала -log 10 (т.е. -log 10 P двойка за теста F двойка, -log 10 P int за тест F int) . В това проучване се фокусирахме главно върху F int тестове .
Значителни прагове в целия геном (всички в скалата -log 10) са получени въз основа на корекцията на Bonferroni за множество тестове, т.е. 5% номинална стойност на P, коригирана от броя на извършените тестове. Като се вземат предвид 300 000 SNP, той извършва пълна двойна проверка на тестовете за асоцииране на геном 4, 5E + 10 и по този начин 5% геномната граница е 11,95 (т.е. −log 10 (0,05/4, 5E + 10)). След всяко сдвоено сканиране на геном, резултатите се оценяват с помощта на предварително дефиниран праг за идентифициране на значими сигнали за широко взаимодействие на генома. Всеки SNP в резултатите е анотиран до най-близкия ген в 20-килобазния прозорец, ограждащ SNPs (въз основа на физическото разстояние от началото или края на генната транскрипция; разстоянието се счита за нула, ако SNP е в гена).
Анализът за обогатяване на GO е извършен за всяка кохорта от изследването, като се използва режимът "Две несвързани списъка с гени" в Gorilla 33, базиран на стандартната хипергеометрична статистика, където анотирани епистатични гени са използвани като цел с пълен списък от човешки гени. като фон. За улеснение решихме да използваме същата стойност - log 10 P като прага на консенсуса на GWA (т.е. - log 10 P int> 7.3), за да изберем SNP двойките на всяка кохорта и да използваме техните генни анотации като вход за анализ на обогатяване на GO., Обогатените GO термини (P 7.3) във всяка изследвана група също бяха идентифицирани като потенциално важни сигнали за взаимодействие за репликационни анализи.
Значителни двойки геном на SNP и тези, идентифицирани като потенциално важни взаимодействия, бяха тествани за репликация в четири изследователски групи. Реплицирани двойки SNP бяха допълнително тествани за репликация в кохортата NFBC1966. Всеки тест за репликация се извършва на ниво SNP, както и в региона. На ниво SNP, всеки репликиран SNP е точно същият като съответния епистатичен SNP и следователно е използван праг от 5% номинална значимост (т.е. -log 10 (0,05) = 1,30), тъй като се изисква само един тест за репликация. На регионално ниво бяха тествани взаимодействията между всеки от 10-те съседни SNP (т.е. пет нагоре и пет надолу по течението) на първия епистатичен SNP и всеки от вторите епизатни SNPs, за да се приспособи ситуация, при която множество SNPs могат да маркират един и същ мутант мутант. ген. Пермутацията беше използвана за получаване на прагове на значимост за репликацията на всяка епистатична двойка на ниво регион, където фенотипите бяха пермутирани и анализите за взаимодействие с най-висок-log 10 Pint 121 (т.е. 11 × 11) бяха записани във всяка от 1000 итерации. Повторените двойки SNP бяха комбинирани в пълен модел, за да се изчисли делът на фенотипната дисперсия, обяснен във всяка изследвана група.
резултатът
Средният ИТМ е сходен в кохортите ХЪРВАТИЯ-Вис, ХЪРВАТИЯ-Корчула и ORCADES, но по-нисък в МИКРОС (Таблица 1) Оценките на полигенното наследяване варират от 0,356 (ХЪРВАТСКА-Вис) до 0,514 (ОРКАДИ). Конвенционалното сканиране с GWA не открива значими SNP в целия геном в нито една кохорта. Факторът на ламбда инфлация (изчислен чрез регресиране на наблюдаваните стойности на асоциация P спрямо очакваната стойност) на всяко GWA сканиране е много близо до 1 (Таблица 1), което показва, че семейната свързаност във всяка кохорта е добре отчетена. Само 8 от 32 ИТМ SNP, идентифицирани преди това, са 3 генотипизирани в четири изследователски групи и никой не показва силна връзка с ИТМ (допълнителна таблица S1).
Сканирането на геном с пълни двойки установи, че в нито една от четирите проучвани групи не е имало SNP двойки, които да са преминали широкия праг на генома (-log 10P int = 11, 95) (Фигура 1). Поради сигналите за взаимодействие с -log 10Pint> 7, 3, MICROS имаше най-малък брой двойки SNP и впоследствие най-малък брой анотирани гени, докато останалите три кохорти имаха относително подобен брой SNP двойки и анотирани гени (Таблица 2 ). Пет от 32-те BMI локуса (но не BMI SNP) бяха включени в 7 епистатични двойки в ХЪРВАТИЯ-Vis: FTO, KCTD15, LRP1B, NEGR1 и PRKD1. По същия начин, три BMI локуса (NEGR1, NRXN3 и PRKD1) бяха включени в ХЪРВАТСКА-Корчула, два (FTO и MTCH2) в ORCADES и два (FTO и LRP1B) в MICROS.
Сдвоете епистатични сигнали във всяка изследвана група. а ) сдвоени епистатични сигнали в ХЪРВАТИЯ-Vis. ( б ) сдвоени епистатични сигнали в ХЪРВАТСКА-Корчула. ( ° С ) сдвоени епистатични сигнали в ORCADES. ( д ) сдвоени епистатични сигнали в MICROS.
Изображение в пълен размер
Маса в пълен размер
GO термини, обогатени с епистатични гени (-log 10Pint> 7.3) във всяка кохорта бяха сравнени (допълнителна таблица S2) и идентифицирани 9 общи във всичките четири кохорти (таблица 3), които биха могли да посочат общи регулаторни механизми (напр. GO: 0008038 - неврони за разпознаване ). Сред епистатичните гени, обогатили термините 9 GO, открихме 19 епистатични гена, споделени от четири кохорти, 15 от които преди това бяха публикувани GWA локуси (предимно не геномно значими), свързани с различни фенотипи 34 (Допълнителна таблица S3). Повечето от 19-те споделени епистатични гени взаимодействат помежду си, въпреки че техните взаимодействия са относително слаби (-log 10P int 35 и SORCS2 (свързано с VPS10). Рецептор, съдържащ рецептор 2), свързан с циркулиращ инсулиноподобен растежен фактор 1 и протеин- 3 свързващ инсулинов растежен фактор-3, които са важни за антропометричните характеристики и риска от рак и сърдечно-съдови заболявания. 36
Маса в пълен размер
Маса в пълен размер
дискусия
Съзнавайки възможните шумове в тези потенциално важни взаимодействия, използвахме репликация, за да идентифицираме най-надеждните епистатични сигнали в рамките на изследваните групи. Осем епистатични двойки, съдържащи или BMI локуси, или два често срещани епистатични гена, показват репликация на ниво SNP в поне една кохорта (Таблица 4). Осемте епистатични двойки заедно могат наистина да обяснят голяма част от вариацията в ИТМ във всяка отделна кохорта. Независимо от това се препоръчва предпазливост, като се има предвид потенциалното надценяване на ефектите от „проклятието на победителите“. 39 В допълнение, нито една от осемте епистатични двойки не е репликирана във всичките четири изследователски групи или в кохортата за репликация NFBC1966. Допълнителни репликационни анализи в други популации и/или функционални анализи са полезни, за да се потвърди дали това са истински сигнали.
Статистическата репликация беше използвана като златно правило, за да се избегне докладването на фалшиви положителни резултати в проучванията на GWA. Обаче изглежда, че това е много по-трудно за епистатични сигнали, отколкото за отделни SNP сигнали по причини, включително производителност, промяна на честотата на по-малкия алел и дисбаланс на асоциация между епистатичния SNP и мутанта за двата локуса. Леки −log 10 Стойности на писта на епистатични двойки, тествани за репликация, предполагат, че дисбалансът на свързване между епистатичните SNP и мутантите не е висок, така че репликацията на тези двойки ще бъде трудна. Освен това различните среди могат да причинят различно разпределение на фенотипите в кохортите за откриване и репликация. Липсата на репликация в кохортата NFBC1966 може да се дължи на два важни фактора на околната среда на ИТМ: възраст 40 години (т.е. 31 спрямо диапазона между 18 и 90 в изследваните групи) и диета. 29
Подход, базиран на съвместни генно-генни взаимодействия в множество GWA популации, е ефективно решение на проблема с ограничената способност за откриване на епистаза. Това е само частично решение, тъй като някои игнорирани взаимодействия също могат да бъдат важни. Сравнението на значими епистатични сигнали в генома може да се извърши или на ниво SNP, или на ниво ген или път и може да се окаже по-плодотворно на ниво ген или път, отколкото на ниво SNP. Подходът може да стане по-полезен, ако по-добри методи за анотиране (като се вземат предвид само GWA сигнали без взаимодействия) 41 могат да бъдат адаптирани към епизода. Например, не всички епистатични SNP са били анотирани към гените в проучването и следователно не са допринесли за обогатяване. Този подход вероятно ще бъде важен дори когато в наборите от данни на GWA са налични нови инструменти за метаанализ на епистаза, за да се повиши ефективността на откриване на епистаза.
- Епидемията от затлъстяване в САЩ продължава да се разпространява - център за отслабване
- Hama Fit Track 5900, спортен часовник, пулс, калории, анализ на съня, крачкомер, GPS, цветен дисплей
- Спортен часовник HAMA Fit Track 1900 Pulse Calorie Sleep Analysis Pedometer Black 178600
- Генетичен анализ по време на бременност За здравето в iLive
- Екстремна трансформация - Отслабване за цял живот за 21 дни - Крис и Хайди Пауъл