секвенирането

  • елементи
  • абстрактно
  • Въведение
  • Предмети и методи
  • Избор на проби
  • Подготовка и събиране на ДНК
  • Точно секвениране
  • Последователно картографиране на четене, извикване на варианти и функционални анотации
  • Варианти на филтриране и обогатяване при затлъстяване
  • Валидиране на варианти според генотипирането
  • Статистически анализ на асоциацията
  • резултатът
  • Откриване на редки варианти чрез екзома секвениране
  • SNV валидиране и анализ на асоцииране
  • дискусия
  • Допълнителна информация
  • Word документи
  • Допълнителна информация

елементи

абстрактно

Затлъстяването е основен фактор за глобалната тежест на хроничните заболявания като диабет тип 2. 1 Доказано е силно генетично въздействие върху затлъстяването. Въпреки това, идентифицирането на специфични гени, участващи в често срещани форми на човешко затлъстяване, се оказа ненадминато, въпреки големите усилия, положени от различни подходи, включително генни изследвания на кандидати, изследвания на геномната връзка и асоцииране на геноми (GWA). 2, 3 Към днешна дата проучванията на GWA са идентифицирали около 50 генетични локуса, свързани със затлъстяването. Въпреки това, заедно тези локуси обясняват само около 1-2% от вариациите в индекса на телесна маса (ИТМ) в изследваните популации. 4 Основният въпрос, следователно, е как може да се обясни оставащото т. Нар. „Липсващо“ наследство. 5 Има две основни опасения по отношение на тълкуването на резултатите от GWA. Първо, подходът се основава на често срещано заболяване, обща вариантна хипотеза. Търговските полета с единичен нуклеотиден полиморфизъм (SNP), използвани в проучванията на GWA, са проектирани да покрият често срещани генетични варианти (честота на по-малките алели (MAF)> 5% в популациите). Поради тази причина не беше възможно директно да се оценят редки варианти, като се използват такива полета. Второ, за анализ на данни от GWA са използвани несъвършени статистически модели, които не отчитат взаимодействията ген-ген и ген-среда. 6

Наскоро разработената високопроизводителна технология за секвениране допълва SNP полетата и демонстрира способността да се откриват редки болестотворни варианти чрез дълбоко секвениране на всички известни екзони. 7, 8, 9 Тази революция в технологията обещава да изясни сложни заболявания, като даде възможност за търсене на нискочестотни и редки и на пръв поглед функционални варианти в целия геном. Точното секвениране може да бъде най-ефективно, когато се прилага при пациенти с по-екстремни форми на често срещани заболявания, като болестно затлъстяване; първо, увеличава вероятността да се получи значителна асоциация за редки варианти с висока проникваност; второ, генетичните варианти в кодиращата протеинова последователност могат да имат по-голям ефект върху фенотипа, отколкото вариантите в междугенните региони.

В това проучване използвахме секвенция на exom, за да открием нискочестотни и редки генни варианти, обогатени при възрастни със затлъстяване и ги потвърдихме срещу никога затлъстели възрастни хора. Преценихме, че по този начин ще обогатим гените на затлъстяването между отделните случаи и ще ги филтрираме в контрола. Тук представяме вариант с ниска честота, свързан със затлъстяването в кодиращата област на синаптофизин-подобния ген 2 (SYPL2).

Предмети и методи

Избор на проби

Кохортите за генетични изследвания са описани в Таблица 1. Субектите бяха наети чрез местна реклама за изследване на гени, регулиращи теглото, или във връзка с планирани посещения на болестно затлъстяване или сколиоза в нашите медицински или хирургични звена. Повечето от тях са описани. 10, 11 От подгрупата на затлъстели индивиди, ние избрахме измежду 10% с най-висок ИТМ 100 индивиди с екстремно затлъстяване при секвениране на екзома (69 жени, 31 мъже, възраст 41, 5 ± 11, 5 години, ИТМ 52, 2 ± 3, 8 kg/m 2)., Всички избрани пациенти са имали болестно затлъстяване, определено като ИТМ> 40 kg/m2. Като контроли за секвениране на екзома използвахме субекти, които вече са събрани за текущото генетично изследване на идиопатична сколиоза (76 жени, 24 мъже, възраст 24,5 ± 12,8 години, ИТМ 21,9 ± 4,3 kg/m2). За първото валидиране на генотипа, ние избрахме 494 пациенти със затлъстяване с най-висок ИТМ в голямото събиране на проби, описано по-горе, включително 100 индивида, които бяха използвани за секвениране на екзоми. Използвахме 496 лица с наднормено тегло на възраст> 40 години и ИТМ 2 като контроли. Във второто потвърждение генотипирахме останалите 1425 пациенти със затлъстяване със затлъстяване и 782 никога не са затлъстели контроли на възраст> 40 години и BMI 2 .

Маса в пълен размер

Контролите за секвениране на екзома без затлъстяване са имали сколиоза. В противен случай всички други контролни субекти са здрави според доклада. Имаше свръхпредставителство на жени в изследваните кохорти. Затлъстелите жени са по-склонни да търсят медицинска помощ заради затлъстяването си. Сколиозата е по-често при жените. Обектите са от европейски произход и живеят в Швеция. Изследването е одобрено от местните комисии по етика и всички субекти са дали информирано съгласие за участие.

Подготовка и събиране на ДНК

Геномната ДНК беше получена от PBMCs, използвайки QiAmp ДНК кръвен Maxi комплект (Кат. № 51194, Qiagen, Hilden, Германия). Чистотата и качеството на ДНК се потвърждава чрез съотношение A260/280 от 1,8 върху нанокапка (Thermo Fisher Scientific Inc., Waltham, MA, USA) и електрофореза в агарозен гел. Концентрацията на ДНК се измерва с помощта на Qubit (Life Technologies, Стокхолм, Швеция). Впоследствие взехме 0,8 μg от всяка ДНК проба и ги разпределихме на случаен принцип в 10 групи, всяка от които съдържа 10 проби от случаите със затлъстяване или контрола. Концентрациите на обединени ДНК проби бяха измерени с помощта на Qubit и пробите бяха анализирани на агарозен гел.

Точно секвениране

Точно секвениране беше извършено в лабораторията Science for Life (SciLifeLab), Стокхолм, Швеция. Всяка ДНК библиотека се приготвя от 3 μg обединена геномна ДНК. ДНК беше нарязана на 300 bp с помощта на инструмент Covaris S2 и обогатена с помощта на комплект SureSelectXT Human All Exon 50 Mb и работна станция Agilent NGS в съответствие с инструкциите на производителя (автоматизирано обогатяване на целите на SureSelectXT за двойно мултиплексиране на двойки Illumina, версия A, Agilent Technologies, Санта Клара, Калифорния, САЩ).

Клъстерирането беше извършено на система за генериране на клъстери cBot, използвайки сдвоен комплект за генериране на сдвоен краен клъстер HiSeq, съгласно инструкциите на производителя (Illumina, Сан Диего, Калифорния, САЩ). Пробите бяха секвенирани на Illumina HiSeq 2000, когато четенето на сдвоени краища достига до 100 bp/четене (Illumina). Всички ленти бяха обогатени с 1% phiX контролна библиотека, с изключение на лента 8, която имаше 2% phiX. Последователните цикли бяха извършени в съответствие с инструкциите на производителя. Базовото преобразуване е извършено с помощта на OLB v1.9 от Illumina (Illumina).

Последователно картографиране на четене, извикване на варианти и функционални анотации

Четенията на последователността бяха подравнени към текущата човешка референтна последователност (hg19 монтаж, NCBI сбор 37) (//hgdownload.soe.ucsc.edu/goldenPath/hg19/chromosomes/) с помощта на еквалайзер на Burrows-Wheeler (BWA версия 0.6.1,// bio -bwa.sourceforge.net/, Li и Durbin 12) с параметър за отрязване на четене - q 20. Вариантите на последователността бяха извикани с помощта на функцията за многократно натрупване samtools-0.1.18 (//samtools.sourceforge). net /), с минимално качество на картографиране 20 и минимална дълбочина на четене 5 × за филтриране. PCR дубликатите бяха премахнати с помощта на samtools преди разработването на варианта. За функционално анотиране на варианти на последователности използвахме annovar (//www.openbioinformatics.org/annovar/, Wang et al. 13) за интегриране на информация от различни бази данни в публични домейни, като препратка към гени (//hgdownload.soe ). ucsc.edu/goldenPath/hg19/database/refGene.txt, 2013), dbSNP (SNP135, //hgdownload.soe.ucsc.edu/goldenPath/hg19/database/snp137.txt.gz) и проект от 1000 генома (///www.1000genomes.org/).

Варианти на филтриране и обогатяване при затлъстяване

Използвахме следните критерии за филтриране, за да изберем нискочестотни и редки варианти на единичен нуклеотид (SNV) от данните за секвениране на екзома. Тези SNV, обогатени за болни със затлъстяване, бяха представени за валидиране (Фигура 1). Първо филтрирахме варианти с дълбочина 5 × и качество на картографиране (MQ) ≥20. След това търсихме привидно функционални варианти, т.е. варианти от екзонични райони, места за снаждане или 5 'противоположни региони. В следващата стъпка сравнихме появата на варианта между затлъстелите и контролните групи. В следващата стъпка на филтриране бяха използвани само варианти, извикани в ≥ 2 затлъстели средства, но без обаждане или извикани веднъж в контролни средства; тази стъпка беше използвана за предотвратяване на потенциални фалшиво положителни варианти. Последното филтриране се основава на честотата на алелите. Търсихме нискочестотни и редки SNV, т.е. варианти, които не бяха намерени в публични бази данни или известни SNP с MAF ≤ 5% в общата популация (проектът 1000 Genomes 2011 може да бъде публикуван).

Преглед на работните процеси. Непубликуван SNV: варианти, които не са включени в SNP135.

Изображение в пълен размер

Валидиране на варианти според генотипирането

Валидирането на вариантите беше фокусирано върху SNV, обогатени с горните стъпки за филтриране, които се вписват в управляем панел за генотипиране, и бяха извършени в два етапа. Първо, всички избрани варианти са генотипизирани при 494 индивиди със затлъстяване и 496 контроли (Таблица 1 и Фигура 1), като се използва анализ Illumina GoldenGate, извършен на технологичната платформа SNP/SEQ в Университета Упсала, Швеция (//www.molmed.medsci.uu) . se/SNP + SEQ + технология + платформа (генотипиране), Fan et al. 14). Второ, генотипизирани варианти, показващи номинално значима връзка със затлъстяването, са генотипизирани в други 1425 затлъстели и 782 контроли. Генотипизирането се извършва чрез лазерна десорбционна/йонизационна масспектрометрия с време на полет с използване на матрица (SEQUENOM, Agena Bioscience, Сан Диего, Калифорния, САЩ) в лабораторията за ядрена мутация (MAF) в Karolinska Institutet, Швеция. Проектирани са 15 мултиплексирани анализа с помощта на софтуера MassARRAY Assay Design v4.0 (Agena Bioscience). Протоколът за удължаване на алела, специфичен за алела, е извършен според препоръките на Agena Bioscience. Всички резултати от генетична асоциация в кохорти за валидиране 1 и 2 бяха подадени в GWAS Central.

Статистически анализ на асоциацията

Субектите се характеризират с ИТМ и стойностите се отчитат като средна стойност ± SD за затлъстяване и контроли поотделно. Анализът на генетичната асоциация и изчисляването на съотношението на вероятността бяха извършени с помощта на PLINK (//pngu.mgh.harvard.edu/

purcell, Purcell et al. 16). Харди-Вайнберговото равновесие (HWE) на честотите на генотипа между случаите и контролите се проверява отделно за всеки цикъл на валидиране преди анализа на асоциирането. Номиналната стойност на HWE P 0,01 за контролите беше използвана като гранична стойност, за да се изключат вариантите от по-нататъшен анализ. ИТМ се анализира, като се използва стандартна линейна регресия, приложена в PLINK. Пол и възраст са използвани като ковариати за оценка на ефекта им върху връзката на варианта с ИТМ.

резултатът

Откриване на редки варианти чрез екзома секвениране

За да идентифицираме потенциални функционални нискочестотни и редки варианти, свързани с екстремно затлъстяване, извършихме секвениране на екзома върху обща ДНК от 100 субекта (10 групи) с тежко морбидно затлъстяване и 100 контролни субекта (10 групи). По този начин има ДНК от 10 субекта във всяка група. Характеристиките на субектите за екзома секвениране са показани в Таблица 1. Субектите със затлъстяване са по-стари от контролните групи, докато разпределението на пола е сходно между кохортите, с прекомерно представителство на жените. Общо получихме> 100 милиона отчитания от всяка група (допълнителна таблица S1). След подрязване на изображенията с ниско качество и премахване на дублиращите се PCR, 95% от изображенията са картографирани в текущата референция на човешкия геном (сбор hg19, сбор NCBI 37), с изключение на една контролна група, която има малко по-ниска скорост на картографиране. По-голямата част от показанията са уникално картографирани върху една и съща хромозома и за двете сдвоени показания. Разминаването между сдвоените показания беше рядко. Показанията се сдвояват с по-висока честота (97%) в групите със затлъстяване, отколкото в контролните групи (80-95%) (допълнителна таблица S1). Повече от 92% от целевите региони бяха обхванати от 5 отчитания и> 80% от целевите региони бяха обхванати от 30 отчитания (допълнителна таблица S2).

Маса в пълен размер

SNV валидиране и анализ на асоцииране

Изключихме вариантите за вмъкване или изтриване от 1032 SNV, за да избегнем възможни технически проблеми с генотипирането. След това филтрирахме SNV, споделени от поне два от най-високодоходните затлъстели басейни. След ръчна проверка на подравняването на показанията, носещи варианти, използващи софтуер IGV (//www.broadinstitute.org/igv/) за изключване на потенциални артефакти, избрахме 144 SNV за генотипиране (142 dbSNP и 2 неизвестни SNV). Дълбочините на секвениране и броят на споделените пулове за затлъстяване 144 SNV са показани в допълнителна таблица S3. Повечето SNV са открити в две (83) или три (31) групи. Десет SNV имаха затруднения при проектирането на праймери за генотипиране и бяха заменени от единични SNV.

Маса в пълен размер

Значимостта на 5 SNV асоциации със затлъстяване или ИТМ в първия и окончателен анализ не е била засегната, когато изключихме 100 субекта, използвани в секвенирането на екзоме за анализи (допълнителни таблици S6 и S7).

За да се оцени допълнително всеки объркващ ефект на възрастта или пола, ние добавихме тези променливи като ковариати в регресионните модели и тествахме отделните им ефекти. rs62623713 поддържа силни връзки с ИТМ след корекция на възрастта или пола (допълнителна таблица S8). Връзката между rs35923425 и ИТМ изчезна след корекция на възрастта. Освен това проведохме различни тестове, за да модифицираме анализа на няколко генетични варианта. Асоциацията на rs62623713 с ИТМ все още е значителна при модифицирания от Bonferroni Pferaze 3.0 x 10-4 и при корекцията на генома на P геном с корекция от 0.05. Допълнителна таблица S9).

дискусия

Използвайки екзома секвениране, последвано от екстензивно генотипиране, идентифицирахме нискочестотен вариант на кодиране на rs62623713 (E99G) в екзон 4 на гена SYPL2, който последователно се свързва с болестното затлъстяване. rs62623713 има MAF от 2,9% за алела G в общите популации от 1000 генома. Вариантът е твърде представен сред нашите затлъстели субекти (MAF 8%). rs62623713 не е бил включен в генотипните полета Illumina или Affymetrix, използвани в предишни проучвания на GWA, и други варианти на тези полета не са в силна връзка с rs62623713.

Доколкото ни е известно, има само три съобщения за варианти, свързани със затлъстяването, открити чрез секвениране на екзома. 9, 17, 18 Albrechtsen et al. 17 анализира кохорта с метаболитен синдром и изследва няколко метаболитни фенотипа. Изследването на Huang et al. 18 са анализирали главно диабет тип 2. Gill et al. 9 идентифицираха нови варианти на LEPR при тежко детско затлъстяване чрез екзома секвениране.

Хипотезата, залегнала в основата на нашето проучване, е, че по-тежките форми на затлъстяване могат да бъдат причинени от нискочестотни или редки варианти с по-голямо въздействие върху фенотипа. Доказано е, че малка част от случаите със затлъстяване са причинени от генетични варианти с висока проникване. Вариантите в рецепторния ген на меланокортин 4 (MC4R) обясняват няколко процента от детското затлъстяване, 19 и повторенията на броя копия на хромозома 16 20 имат висока проникване при няколко процента от пациенти със затлъстяване с когнитивно увреждане. В нашите данни за последователността на екзомата не открихме никакви варианти в екзоничните или близките предни области на MC4R, което може да се дължи на малкия брой изследвани субекти. Нашите резултати, т.е.откриването на единичен SNP в SYPL2, който остава значително свързан със затлъстяването след корекция за многократно тестване, подкрепят мнението, че нискочестотните и редки варианти допринасят за болестното затлъстяване. Настоящото проучване обаче няма силата да оцени до каква степен редки генетични варианти причиняват болестно затлъстяване в популация.

В предишни доклади SYPL2 е свързан с голямо депресивно разстройство сред европейското население. 24 Връзката между затлъстяването и депресията многократно е установявана. Мета-анализ установи, че затлъстяването увеличава риска от депресия. Освен това е установено, че депресията предсказва затлъстяване. Друго проучване установи, че връзката на затлъстяването с депресията е ограничена главно до хора с тежко затлъстяване. 26

SYPL2 принадлежи към семейството на синаптофизините. Синаптофизинът регулира образуването на синапс в зависимост от активността в култивирани хипокампални неврони 27 и е необходим за кинетично ефективна ендоцитоза на синаптични везикули в култивирани хипокампални неврони. 28 Приемът на храна подлежи на сложна регулация от хипоталамуса и други мозъчни центрове, включително мозъчния ствол и хипокампуса. Следователно може да се приеме, че SYPL2 участва в централната регулация на приема на храна, което вероятно ще повлияе на централните системи за възнаграждение и хедоничните ефекти на храната.

И накрая, ние идентифицирахме вариант на кодиране с ниска честота, свързан със затлъстяване в гена SYPL2 чрез екзома секвениране с обща ДНК от 100 пациенти със затлъстяване и 100 лица със затлъстяване, последвано от валидиране на генотипа при 3197 контролни субекта. Нашите резултати предоставят доказателства за съществуването на кодиращ вариант, свързан със затлъстяването, въпреки че все още са необходими допълнителни функционални изследвания на този генетичен вариант.