елементи

абстрактно

Флоралните хомеотични транскрипционни фактори (TF) действат по комбинативен начин, за да определят идентичността на органите в разцвет. Архитектурата и функцията на генната регулаторна мрежа (GRN), регулираща спецификацията на цветните органи, все още е слабо разбрана. По-специално взаимовръзката на хомеотичните TF, микроРНК (miRNAs) и други фактори, които контролират инициирането и растежа на органа, не е систематично изследвана. Тук, използвайки комбинация от геномно широко TF свързване, mRNA и данни за експресия на miRNA, ние реконструираме динамичната GRN, регулираща развитието на флорални меристеми и диференциация на органи. Ние идентифицираме преобладаващи бримки (FFL), медиирани от флорални хомеотични TFs и miRNAs, които регулират общите цели. Експериментално валидиране на кохерентния FFL показва, че размерът на прозореца се контролира от регулирания от SEPALLATA3 модул miR319/TCP4. Освен това демонстрираме, че комбинаторното свързване на ДНК с хомеотични фактори и избрани други TFs е предиктор за специфични за органите модели на генна експресия. Нашите резултати предоставят ценен ресурс за изследване на молекулярните регулаторни процеси, които са в основата на спецификацията на флоралните органи в растенията.

Растежът и диференциацията на цветните органи се контролират допълнително от други видове TF, включително BELLRINGER (BLR) 22, JAGGED (JAG) 23, ETTIN (ETT) 24, 25 и REPRESSORA GIBBERELLIC киселина (RGA) 26. BLR кодира TF хомеодомена и играе централна роля в развитието на апикалната меристема на апикалната активност, като влияе върху активността на меристеми, филотакси и флорални модели на органи 22. JAG кодира TF с цинков пръст, който регулира образуването и растежа на границите на органите 27. ETT е реагиращ на ауксин TF, който регулира няколко аспекта на морфогенезата на цветята 24, 25 и RGA контролира развитието на съцветието чрез участие в сигналния път на гиберелин 26, 28 .

Хроматиновото имунопреципитация (ChIP), последвано от високопроизводително ДНК секвениране (ChIP-seq), улеснява идентифицирането на геномни региони, свързани с основните TF в развитието по време на развитието на цветя29. Биолозите започнаха да разбират моделите на свързване на геномните TF 30, 31 и сложните генни регулаторни мрежи (GRN), които контролират образуването на цветя в глобален мащаб 32. Въпреки това, систематичният анализ на целевите генни мрежи на тези основни регулатори все още е недостатъчен и следователно знанията ни за свързаните мрежови компоненти, които контролират развитието на флоралните органи, са непълни. В това отношение комбинацията от данни за геномно свързване и експресия дава възможност за изясняване на регулаторния „код“, който е в основата на спецификациите на цветята.

Много фактори, като микроРНК (miRNAs), играят роля в прехода на цветята и развитието на цветята. Например, доказано е, че зависимият от възрастта преход от вегетативен към репродуктивен растеж се регулира от MIR156, който постепенно намалява с възрастта, което води до повишена експресия на целите си, TF SQUAMOSA PROMOTER BINDING-LIKE (SPL), които от своя страна са активатори на гени нагоре по веригата. FM идентичности, LFY и AP1, както и MIR172 (справки 33, 34, 35). MIR172 е насочен към AP2 и неговите тясно свързани паралози, като по този начин контролира флоралния преход и специфичното активиране на флоралните хомеотични гени 16, 36. Други доклади показват, че MIR319 влияе върху размера на венчелистчетата чрез регулиране на гените TCP4 и TCP10 37. MIR159, MIR160, MIR164, MIR165, MIR166 и MIR167 също играят роля в морфогенезата на флоралните органи в Arabidopsis 38. Въпреки многото съобщения за miRNAs, които регулират прехода на цветя и развитието на цветя, все още липсва пълно разбиране на динамичния контрол на тези miRNA процеси. По-специално, имаме ограничени познания за това как самите miRNAs се регулират от входните регулатори.

В този случай извършихме интегративен анализ на данните за свързване на генома в целия геном на основните регулаторни TF, включително фактори, които контролират прехода на цветя (FLC, FLM, SVP и SOC1), TF FM/идентичност на органите (LFY, AP1, AP2, AP3, PI, SEP3, AG) и регулатори на морфогенезата на флоралните органи (BLR, JAG, ETT, RGA). Във връзка с новосъздадените специфични за етапа данни за mRNA и miRNA, GRNs, контролиращи репродуктивния растеж в Arabidopsis, са конструирани и изследвани с фокус върху активността на miRNA в мрежата. Интегрирахме цялата регулирана от miRNA информация за TF-свързване в системната регулаторна мрежа. Извършихме мрежов анализ, за ​​да търсим систематично обогатени мрежови мотиви в тази „мета-мрежа“ и да идентифицираме преобладаващите миРНК-медиирани обратни вериги (FFL). По-нататък потвърдихме важната роля на FFL, който се състои от MIR319a и неговите TF цели за медииране на растежа на венчелистчетата. И накрая, демонстрирахме, използвайки метода на машинното обучение, че комбинаторното свързване от хомеотични регулатори и други TF към общи целеви гени е важно за фазово и органно-специфично активиране на генни дейности.

резултатът

TF обвързваща земя по време на развитието на цветя

регулаторни

Изображение в пълен размер

Като цяло броят на местата за свързване на TF (TFBS; наречени "пикове") варира значително за различните регулатори или за един и същ регулатор на различни етапи (фиг. 1в; допълнителни данни 2). BLR, LFY и SEP3 показват най-голям брой места за свързване, което е в съответствие с факта, че тези TF имат многобройни и разнообразни роли в репродуктивното развитие 40, 41, 42. SEP3 придобива значителни места за свързване през етапите на развитие на цъфтежа, в съответствие с неговите роли по време на развитието на флоралните органи и нивата на експресия (фиг. 1в). От друга страна, AP1 губи места за свързване по време на периода на развитие, което е в съответствие с важната му роля като фактор за идентичност на FM в ранните етапи от развитието на цветята и по-ограничена експресия в по-късни моменти (намалена ефективност на ChIP).

Заетостта на множество TFs предсказва динамиката на генната експресия

Накратко, гените, свързани с множество TF, показват по-динамична експресия по време на развитието на цветето. Различните типове регулаторни гени и определен набор от miRNAs са сред целевите целеви гени в мрежата за развитие на цветя.

miRNA-медиирана GRN и обогатени мрежови мотиви

Сред целите на основните регулатори на цветята често са идентифицирани гени на miRNA (фиг. 1г) и често свързани с множество TF (фиг. 2д). Като се има предвид, че основната категория миРНК цели за растения се състои от TFs 48 и тези цели могат също да бъдат директно регулирани от регулаторите на цветя, е привлекателно да се изяснят GRN за развитието, които са свързани с флорални ключови регулаторни TF, гени miRNA и техните целеви гени В такава "мета-мрежа" може да се определи влиянието на различни регулаторни механизми и miRNAs, които действат като междинни играчи, могат да осигурят допълнителни слоеве на мрежова стабилност 49. Всъщност има общо 422 прогнозирани регулаторни взаимоотношения TF-miRNA и 273 post-транскрипционни взаимодействия miRNA-TF между 15-те основни регулатора, 144 експресирани miRNA гени и 674 експресирани TF гени (Фиг. 3а). Анализът на структурата на мрежовата структура на silico показа, че изтриването на гените-концентратори води до по-бърза загуба на взаимодействия в мрежата без регулиране на miRNA в сравнение с miRNA-медиирани мрежи (Фиг. 3b) Това наблюдение предполага, че miRNA-медиираната регулация увеличава топологичната стабилност на 50 флорални GRN.

Изображение в пълен размер

Изображение в пълен размер

GRN, специфичен за органа

Изображение в пълен размер

дискусия

Морфогенезата на цветята е силно стабилен и стандартизиран процес на разработване на моделиране, който се инициира от комбинация от екологични и ендогенни сигнални пътища. Въпреки че е добре проучено, че основните регулаторни TF, които действат на различни етапи от процеса на цъфтеж, образуват сложни регулаторни вериги, тяхното регулаторно взаимодействие е много по-малко ясно. По-специално, специфичните за органите GRN на флоралните хомеотични протеини остават загадъчни, тъй като само малка част от потенциалните директни целеви гени на тези фактори са идентифицирани като DE в развитието на цветя. Тук показахме, че систематичната комбинация от 15 TF данни за свързване на ДНК с регулаторни роли в развитието на цветя е в състояние да предскаже гени, които динамично се регулират по време на морфогенезата на цветята. Полученият GRN е обогатен с транскрипционни регулатори и локуси на miRNA. Структурата на мрежата показва специфично свръхпредставяне на добре изучения FFL мотив, който се медиира от комбинираната активност на TF и ​​miRNA.

В обобщение, систематичното интегриране на ДНК-свързващи данни с геномни mRNA и данни за експресия на miRNA ни позволи да идентифицираме ключови регулаторни свойства в GRN, които контролират ранните етапи на развитието на цветята, включително спецификации на цветните кори и диференциацията и растежа на органите. Също така идентифицирахме нов FFL, който контролира растежа на венчелистчетата надолу по веригата на флоралните хомеотични протеини и оцениха ролята на комбинаторната генна регулация чрез множество TF при определяне на специфични за домена модели на генна експресия. Използвайки тези мрежови подходи, ние идентифицирахме нови потенциални кандидат-гени, които отговарят за определянето на различни морфологии и размери на различните видове флорални органи. Бъдещите изследвания ще трябва систематично да изследват експериментално функциите на специфични регулаторни взаимодействия, напр. Използване на насочена към сайта мутагенеза на cis-регулаторни региони и TFBS.

методи

Растителни материали

PAP1: AP1-GR ap1 утайки се отглеждат в камера за растеж при условия на дълъг ден (16 часа светлина, 8 часа тъмнина) с интензивност на светлината 120 μmol/m 2/s, докато температурата се променя от 22 ° C по време на деня до 20 ° C през нощта. Съцветието е събрано от pAP1: AP1-GR ap1 утайки след завинтване (приблизително 2 cm височина) и 2, 4 и 8 дни след първото третиране с дексаметазон (ежедневно третиране с 2 μM дексаметазон, 0,01% (v/v) етанол и 0,01% Silwet L-77) за анализ на mRNA-seq и miRNA-seq.

Анализ на данни за RNA-seq и ChIP-seq

Подробната методология за анализ на RNA-seq и ChIP-seq е дадена в допълнителни бележки 1 и 2.

Анализ на miRNA и други генни експресии

Методът на RT-qPCR стволова верига, описан в Chen 76, се използва за измерване на експресията на miRNA с малка модификация. По-подробно, общата РНК се екстрахира с Trizol (Thermo Fisher Scientific, САЩ) и РНК се елуира с вода, третирана с DEPC, плюс 1 μl инхибитор на РНКаза (Epicenter, САЩ). Триста нанограма обработена с DNase РНК в комбинация с праймер със стволови цикли (100 μm), 10 mM dNTPs и вода без RNAase/DNase в краен обем от 13,5 μl бяха използвани за транскрипция на щам-верига. Реакционната смес се нагрява до 65 ° С за 5 минути и след това се охлажда върху лед за 1 минута. Ензимът Super Script III (Thermo Fisher Scientific, САЩ) е използван за извършване на обратна транскрипция. За да се открие експресия на mRNA ген, общата РНК се екстрахира с GenUP-Plant RNA Kit (Biozyme, USA) и се извършва синтез на cDNA, използвайки M-MuLV обратна транскриптаза (NEB, USA). Количествената PCR беше извършена с помощта на SsoAdvanced® Universal SYBR® Green Supermix (Biorad, САЩ), използвайки системата за откриване на PCR в реално време CFX96 Touch®. Последователностите на грундовете, използвани в този документ, могат да бъдат намерени в допълнителните данни 8.

Анализ с двойна луцифераза

Анализ на мрежата

За да оценим устойчивостта на мрежите, съдържащи miRNAs, анализирахме и сравнихме мрежовата структура на два вида мрежи: „мета-мрежата“, състояща се както от TF-насочена, така и от miRNA-медиирана регулация, и мрежата без miRNA регулация. По принцип по-здравата мрежа показва по-висока степен на толерантност срещу премахването на възли. Използвахме функцията swan_combinatory в пакета NetSwan в R, за да изчислим съпротивлението на мрежите поради премахването на възела, използвайки каскаден сценарий, за да премахнем възлите в намаляващия ред на тяхната междуоснова. Начертана е загубата на свързаност заедно с отстранената част от възлите (фиг. 3б).

След това систематично изследвахме обогатяването на мотиви в мета-мрежата. Ние се фокусирахме върху анализа на авторегулацията (1-възел), обратна връзка (2-възел) и 3-възлови мотиви, които имат специфични биологични последици 51. Мрежовите мотиви с 1 и 2 възела бяха търсени с персонализиран код, докато обогатяването на мотиви с 3 възли беше извършено от алгоритъма FANMOD 54. Значимостта на мотивите беше определена чрез сравняване на броя на наблюдаваните мотиви с броя, намерен в 1000 произволно размесени мрежи, както е приложено във FANMOD. За да се определи дали две цели в SIM имат възможни физически взаимодействия, данните за взаимодействието между протеин и протеин (PPI) са получени от реф. 79. За всеки главен регулатор беше изчислен процентът на неговите цели с потенциални PPI в свързаните SIM мотиви. Като контрола, от целия списък с целеви гени за всичките 15 главни регулатора бяха взети същия брой гени като изследвания главен регулатор и беше изчислена подобна процентна стойност, както по-горе. В резултат на това бяха получени два комплекта процентни стойности (n = 15) и сравнени с t-теста на Student (Фиг. 3е).

Определяне на специфични за домейн гени

Данните за транслатоми на AP1-, AP3- и AG-домейн (чрез TRAP-seq) на етапи 4 (S4) и 6 (S6) са получени от реф. 62. Специфични за домейн експресирани гени се определят чрез ANOVA с домейн ефект P-стойност 2 сред трите домена при S4 или S6. Общо на този етап са идентифицирани 6072 гена, 2311 (38,1%) от които са свързани с повече от един от 11 избрани TF (включително AG, AP1, AP2, AP3, BLR, PI, SEP3, LFY, JAG, ETT, и RGA) и се използва за по-нататъшен анализ. Генът се дефинира като AP1-специфичен (sepal), ако е силно експресиран (повече от двукратна промяна) в AP1 домейна, но не и в AP3 или AG домените. Подобно правило се прилага за гени, специфични за AG (карпел) или AP3. AP1/AP3-често срещаните (венчелистчести) гени бяха дефинирани, ако те показват висока експресия както в AP1, така и в AP3 домейните, но не и в AG домейна. По подобен начин бяха дефинирани AP3/AG-общи (тичиночни) гени. В резултат на това идентифицирахме 1013 специфични за органи гени и 678 от тях бяха свързани с повече от един от 11-те TF.

Моделиране на принос за свързване на TF и ​​генна експресия

Ние приехме модел, базиран на регресия, за да свържем динамиката на генната експресия (678 специфични за органи гени, както е описано по-горе) и свързването на TF (11 флорални регулатора), както е описано в предишни проучвания. По-конкретно, ние свързахме промяната на гънките (FC) на генната експресия между два органа с линейна комбинация от интензивността на свързване на 11 отделни TF и ​​приложихме логаритарен модел:

$$ \ log _2Y_i = \ mathop \ limit_ ^ \ beta _jx_ + \ varepsilon _i, $$

където Y i е средната стойност на FC на ген i в S4 и S6 между два сравнени органа. TF-свързващият резултат x ij за TF j в ген i е дефиниран като нормализиран пиков резултат. Данните за свързване с TF бяха нормализирани и средно центрирани преди моделирането. Ласо регресията беше извършена с помощта на пакета glmnet в R за изчисляване на директния принос (т.е. параметър β) на всеки TF към промяната на израза. Оптималният модел е избран чрез пет повторения на десетократно кръстосано валидиране с помощта на пакета карета в R. Горният анализ е извършен чрез приложението Shiny HTPmod 80 .

Статистически анализ и визуализация на данните

Ако не е посочено, всички статистически анализи и визуализация на данни са направени в R. t-SNE (t-разпределено стохастично съседно вграждане) анализ е извършен от библиотеката Rtsne и изходът е визуализиран от нашия HTPmod онлайн инструмент 80 (//www.epiplant .hu-berlin.de/shiny/app/HTPmod /). Графиките на кошерите са генерирани с помощта на библиотеката HiveR. Визуализацията на мрежата беше направена с помощта на библиотеката igraph.

Наличност на код

Конвейерът за анализ на данни ChIP-seq е адаптиран от //github.com/PlantENCODE/plantGRNs. Всички други персонализирани компютърни кодове са достъпни от съответните автори при разумна заявка.

Наличност на данни

Всички данни, подкрепящи констатациите от това проучване, са налични в статията или в файловете с допълнителна информация. mRNA-seq и miRNA-seq данни са депозирани в NCBI Gene Expression Omnibus (GEO) под номера за присъединяване GSE110539.

Благодаря

Бихме искали да благодарим на Йохана Мюшнер за нейната помощ с RNA-seq и на Лей Уанг от Аграрния университет в Хуажонг за помощта при експериментите с ген за репортер на луцифераза. Бихме искали да благодарим на Центъра за информационни технологии и управление на медиите (ZIM) към Университета в Потсдам за предоставянето на високопроизводителни изчислителни ресурси. KK иска да благодари на фондацията на Александър-фон-Хумболт и Федералното министерство на образованието и научните изследвания за подкрепата.