елементи

абстрактно

Характеризирането на йерархията на гръдните епителни клетки (MEC) и тяхното регулиране по време на развитието на възрастни е важно за разбирането на развитието на рак на гърдата. Тук докладваме използването на едноклетъчно РНК секвениране за определяне на профила на експресия на гена MEC на четири етапа на развитие; зародиш, средна бременност, кърмене и след инволюция. Нашият анализ на 23 184 клетки идентифицира 15 клъстера, няколко от които могат да бъдат напълно характеризирани с един маркер ген. Вместо това твърдим, че епителните клетки - особено в луминалното отделение - трябва да бъдат концептуализирани, а не част от непрекъснат диференциращ спектър. В допълнение, нашите данни подкрепят съществуването на обща луминална прогениторна клетка, която води до преходни, ограничени алвеоларни и хормонални предшественици. Това луминално отделение за предшественици претърпява промени в транскрипцията в отговор на пълна бременност, кърмене и инволюция. В обобщение, нашите резултати предоставят глобален, безпристрастен поглед върху развитието на млечните жлези при възрастни.

Тук използвахме едноклетъчно РНК секвениране (scRNAseq) за картографиране на клетъчната динамика на епителните клетки на гърдата в четирите етапа на развитие на възрастни; зародиш, умерена бременност, кърмене и отбиване (пълна естествена инволюция). Нашите данни от 23 184 отделни клетки идентифицират 15 различни клетъчни популации в жлезата и позволяват тяхната йерархична структура през точките на развитие.

резултатът

Едноклетъчното секвениране на РНК идентифицира 15 клъстера от епителни клетки на гърдата

епителните

Едноклетъчното секвениране на РНК идентифицира 15 клъстера от епителни клетки на гърдата. Схематична диаграма, подчертаваща експерименталната настройка за изолиране на РНК и секвениране на отделни клетки, използваща 10x хромова система. б Графиката t-SNE от 23, 184 клетки визуализира общата структура на данните. Клетките се оцветяват според четири точки за развитие, както следва: розово = NP, тъмно зелено = G, светло зелено = L, лилаво = PI. ° С Същото като б, но оцветяване на клетки с клъстери. д t-SNE оцветени с нормализиран логарифмично трансформиран израз на базален маркер Krt5 и луминален маркер Krt18

Изображение в пълен размер

За по-нататъшно характеризиране на клъстерите идентифицирахме диференциално експресирани гени и извлечени предполагаеми идентичности въз основа на известни маркери (фиг. 2а, б) Както е показано в Таблица 1, множество клъстери от клетки са присвоени на един и същ предполагаем тип клетки. Установихме, че в тези случаи клетките показват голямо сходство и изразяват едни и същи маркери, но идват от различни етапи на развитие (виж суфикса NP, G, L или PI на фиг. 2а), което предполага, че стадийът на жлезата има специфични ефекти върху страната на транскрипция на определени типове клетки.

Путативни идентичности на клъстери от епителни клетки на гърдата. Клъстерна дендрограма въз основа на трансформирани в дневника средни стойности на израз на 15 клъстера. Дървото е изчислено въз основа на корелацията на Спиърман с връзката на Уорд. б t-SNE с припокриваща се експресия на клъстер-специфични гени. ° С Топлинна карта, подчертаваща гените на ключови маркери, които са били използвани за извличане на предполагаеми идентичности. Цветовата скала представлява логаритмично трансформирани и нормализирани числа, намалени до максимум 1 на ред. Горните колони представляват разпределението на клъстера и степента на всяка клетка. За целите на визуализацията бяха показани само 100 произволно избрани клетки за големи клъстери

Изображение в пълен размер

Маса в пълен размер

Открихме две по-големи подгрупи в луминалното пространство (фиг. 2а). C1 - C5 показаха характеристики на хормон-чувствителните клетки (Hs), като високи нива на експресия на хормонални рецептори (Pgr, Esr1, Prlr) (Фиг. 2б, в). От предполагаемите Hs клетки открихме, че C1/C2 експресират прогениторни маркери (напр. Aldh1a3, Cd14, Kit) 18, което предполага ограничена прогениторна функция (Hsp) (Фиг. 2b, c), докато C3/4/5 показва по-диференцирана (Hsd) (Фиг. 2б, в; Таблица 1). Втората подгрупа в луминалното отделение (C6 - C11) изразява само ниски нива на хормонални рецептори. C6/7 изразява високи нива на прогениторни маркери, съобразени с фенотипа на луминалния прогенитор (Lp) (Фиг. 2б, в). За разлика от това, C8 - C11 експресират млечни протеини (напр. Wap, Csn2) и са съставени изключително от клетки от гестация и лактация, подкрепяйки хипотезата, че те са секреторни алвеоларни клетки (Av) (Фиг. 2b, c; Таблица 1). От предполагаемите алвеоларни клетки установихме, че C10/C11 експресират гени, свързани с ограничена алвеоларна прогениторна функция (Avp), докато C8/C9 изглежда е в по-диференцирано алвеоларно състояние (Avd) (Фиг. 2b, c).

В базалното отделение открихме, че клетките C14 показват характеристики на миоепителните клетки, като високи нива на Acta2, Oxtr и Krt15 (Фиг. 2b, c). В допълнение, базалното отделение съдържа и клетъчен клъстер, C15, който изразява високи нива на Procr, Gng11 и Zeb2, което предполага, че те представляват предварително идентифицирани Procr + базални клетки, за които е доказано, че са обогатени за единици за репопулация на млечните жлези 19. (Фиг. 2б, в).

Реконструкция на йерархията на луминалната диференциация

Ние се фокусирахме върху клетките от NP и G времевите точки, за да определим състоянията на диференциация на епитела на гърдата. Тези състояния на диференциация и преходите между тях могат да бъдат изчислени изчислително, като се използват дифузионни карти 20. Накратко, този метод съдържа данни в нискоразмерно пространство, където разстоянията между клетките представляват постепенен, но стохастичен процес, като диференциация. В дифузионните карти, генерирани от всички епителни клетки, наблюдаваме ясна сегрегация между луминални и базални клъстери, като на практика няма преходни процеси между двете групи (фиг. 3а). Това подкрепя хипотезата, че по време на нормалната тъканна хомеостаза двете линии са до голяма степен самоподдържащи се, в съответствие с повечето последващи изследвания от линия 21, 22, 23. За разлика от това, луминалното разделяне показва различна структура, с постепенен преход между различни клъстери и клетки с общ произход (фиг. 3б). Потвърдихме стабилността на тази бифуркация, като проверихме, че е налице, когато са използвани различни методи за избор на свойства, деривация на траектория и алгоритми за вземане на проби (Допълнителна фигура 5).

Изчислителна реконструкция на процесите на диференциация в млечната жлеза. дифузионна карта на епителните клетки от времеви точки NP и G, показваща първите три дифузионни компонента. б Траектории на диференциация на луминалното отделение въз основа на първите два дифузионни компонента. ° С Същата графика като в б, оцветени с нормализирани и намалени нива на експресия на различни гени

Изображение в пълен размер

Установихме, че експресията на предшественика маркер Aldh1a3 постепенно намалява, тъй като клетките се отдалечават от общия си произход (фиг. 3в), който до голяма степен се формира от клетки C6 (Lp). Освен това отбелязахме, че лявата ръка на диференциационната траектория завършва на C8 (Avd) и показва повишена експресия на Csn2 и Glycam1 (фиг. 3в), в съответствие с секреторния фенотип. Между C6 и C8 открихме клетки, които са получени главно от C10 (Avp, фиг. 3b). В дясното рамо на траекторията на диференциация клетките преминаха от C6 в C2 и C4/5 (Hsp и Hsd), по време на което експресията на Esr1 и Pgr се увеличи, което предполага, че този клон представлява диференциация към хормонално чувствителните луминални клетки (Фиг. 3в). ).

Подреждането на псевдотимите идентифицира гени, свързани с луминалната диференциация. Определение на клона на хормонално усещане и секреторна диференциация. Клетките се оцветяват от прогресията им през псевдовремето, където ниските стойности представляват недиференцирани клетки. б - д Примери за транскрипционни фактори с псевдо-време-зависим израз със същата обща тенденция и на двата клона ( б ) или специфични за сектора тенденции ( ° С, д ). д, е Топлинна карта на всички гени с клон-зависима експресия, псевдовреме зависима за хормоналната чувствителна линия ( д ) или секреторна линия ( е ). Псевдотаймът и разпределението на клъстера се коментират при нагряване. Стойностите в топлинната карта представляват намалени с z-скала, изравнени сплайн стойности. Гените в топлинните карти бяха групирани, използвайки йерархично групиране с динамично изрязване на дървета

Изображение в пълен размер

Паритетът подготвя луминалните предшественици към алвеоларната съдба

Влияние на паритета върху транскриптомния пейзаж на луминалното отделение на предшественика. Сравнение на множество промени от C6 срещу луминалното отделение и гънките се променят от C7 спрямо луминалните клетки. Гените представляват първите 500 диференциално експресирани гена между С6 и луминалните клетки. б Вулканична графика, илюстрираща диференциална експресия между C6 и C7, цветните точки представляват важни гени с известна функция в лактацията и имунитета, пунктирани линии подчертават прага на P-праг 0, 01 и промяна в логарита на 1. P-стойностите се коригират за множество тестове от Бенджамини - Хохберг. ° С, д Визуализация на разликата в експресията за гени, свързани с лактацията ( ° С ) или имунитет ( д ) за шест луминални клъстера в NP и PI. Стойностите на израза съответстват на нормализирания брой UMI. д PI клетки, проектирани на дифузионна карта от времевите точки NP и G. NP и G клетките са сиви

Изображение в пълен размер

дискусия

Накратко, нашите данни предоставят обективна представа за развитието на млечната жлеза. Този подход помага да се подкрепят някои предварително разработени хипотези в млечната жлеза и описва процесите на диференциация при висока клетъчна резолюция. Наборът от данни ще бъде полезен ресурс за бъдещи проучвания, за да се разбере връзката между различните типове клетки в жлезата и как се развива и напредва ракът на гърдата.

методи

Цялата експериментална работа върху животни е извършена в съответствие със Закона за научните процедури от 1986 г., Обединеното кралство и одобрена от Комитета по етика към Института Sanger. Мишките C57BL/6N бяха настанени в индивидуално проветрявани клетки в цикъл 12:12 h светло-тъмно, с налична вода и храна ad libitum. Експериментът е създаден, за да позволи събиране на всички времеви точки за развитие и обработка на тъкани едновременно. Мишките бяха умъртвени чрез терминална анестезия. Женските се чифтосвали с шиповете и били хвърляни. След това тъканите бяха събрани на 14.5 ден (G) от бременността, ден 6 на лактация (L) и ден 11 след естествено отбиване (PI). Тъкани от женски NP са събрани на 8-седмична възраст. В проучването са използвани две отделни мишки за време на развитие. Етапът на естрозния цикъл на животните от NP и PI времевата точка се определя чрез вагинална намазка (допълнителна фигура 8).

Дисоциация на млечната жлеза до суспензия от едноклетъчни клетки

Лимфните възли, лишени от млечни жлези (с изключение на цервикалната двойка), бяха отделени от мишките и механично дисоциирани. Фино смлената тъкан се прехвърля в храносмилателна смес, състояща се от DMEM/F12 (Gibco) + 10 mM HEPES (Gibco) + колагеназа (Roche) + 200 U ml - 1 хиалуронидаза (Sigma) + гентамицин (Gibco) за 3 часа при 37 ° C. ° C и се завърта на всеки 30 минути. След лизис на червените кръвни клетки в NH 4 Cl, клетките се усвояват за кратко с топъл 0,05% трипсин-EDTA (Gibco), 5 mg ml-1 диспаза (Sigma) и 1 mg ml-1 DNase (Sigma) и клетъчен филтър (BD Biosciences) се филтрира.

Клетъчно маркиране, последвано от поточна цитометрия и сортиране

Подготовка и последователност на библиотеката

Подготовката на библиотеката се извършва в съответствие с инструкциите в 10-кратен комплект с една клетка. След това библиотеките бяха обединени и секвенирани в шест ленти на HiSeq2500.

RNA-seq обработка на данни

Обработката на четенето беше извършена с помощта на 10X работен поток Genomics 17. Накратко, Cell Ranger Single-Cell Software Suite (//software.10xgenomics.com/single-cell/overview/welcome) беше използван за демултиплексиране, присвояване на баркод и количествено определяне на UMI. Показанията бяха приведени в съответствие с референтния геном mm10, като се използва предварително създаден пакет с анотации, получен от уебсайта 10X Genomics. Всички ленти на пробата бяха обработени с помощта на функцията "брой на клетъчни редици". След това изходът от различни пътища беше обобщен с помощта на 'cellranger aggr' с -normalise, зададено на 'none'.

Качествен контрол и предварителна обработка

клъстериране

$ config [ads_text16] не е намерен

Анализ на диференциална експресия

Анализът на диференциална генна експресия се извършва с помощта на edgeR 46. За двойни сравнения между клъстери гените със средно ниво на експресия под 0,1 бяха отстранени от анализа. Отрицателен биномиален генерализиран логаритарен линеен модел е монтиран на останалите гени с клъстерните назначения като ковариати. Функцията 'glmTreat' е използвана за идентифициране на гени, които имат значително по-голяма промяна в log пъти от 1 при FDR от 0,01. Маркерните гени, визуализирани на фиг. 2 бяха идентифицирани с помощта на функцията „findMarkers“ в scran с настройки по подразбиране за гени, които имаха средна експресия 1 в поне един клъстер 40 .

Дифузионни карти и извод за псевдовреме

За да изведем диференциалната траектория, използвахме дифузионни карти. Първо, ние избрахме всички клетки от NP и G времевата точка (Фиг. 3а) и открихме HVGs, както е описано по-горе. Тогава трансформираният в дневника (log2 (count + 1)) брой гени беше използван за изчисляване на дифузионните компоненти, използвайки функцията „DiffusionMap“ (параметри по подразбиране, както в съдбата 47). На фиг. 3b, след това се фокусирахме върху луминалното отделение и преизчислихме дифузионната карта, базирана само на луминалните клетки, като използвахме гореспоменатата процедура. Забележително е, че структурата, изведена от алгоритъма на дифузионната карта, е стабилна по отношение на избора на характеристики и вземане на проби от клетки (допълнителна фигура 5b). Структурата на общ произход и двата клона също могат да бъдат изведени с помощта на Monocle със стандартни настройки 48 (допълнителна фигура 5а). За да изведем подреждането на клоновете и псевдовремето, дефинирахме следните три съвета, клетката с най-голяма стойност за втория собствен вектор (който беше зададен като корен) и клетките с най-голямата и най-малката стойност за първия собствен вектор (сравнете фиг. 4а).

Зависим от псевдотим израз

Анализ на обогатяване на гени

Проведен е анализ на обогатяване на генен набор, базиран на термини за генна онтология (GO), за да се характеризират различни генетични набори в анализа. Интересните гени бяха сравнени с всички гени, които бяха тествани за диференциална експресия, използвайки topGO с настройки по подразбиране 49 .

Наличност на данни

Авторите декларират, че всички данни, подкрепящи констатациите от това проучване, са достъпни в статията и нейните допълнителни информационни файлове или от съответния автор при разумно искане. Данните за последователността на РНК са депозирани в базата данни на Gene Expression Omnibus (GEO) под код за присъединяване GSE106273. Данните могат да бъдат изследвани и на //marionilab.cruk.cam.ac.uk/mammaryGland. Всички изчислителни анализи бяха извършени в R (Версия 3.4.1), използвайки стандартни функции, освен ако не е посочено друго. Кодът е достъпен онлайн на //github.com/MarioniLab/MammaryGland.

Благодаря

Благодарим на Sanger Institute, Служба за научни изследвания (RSF) за помощта. Благодаря и на Dr. Аарон Т. Лун (CRUK CI) за полезни дискусии и коментари по ръкописа. KB се финансира от Центъра за рак на Кеймбридж. DA финансира CRUK и Wellcome Trust. SP се финансира от CRUK. JCM финансира CRUK и EMBL. WTK се финансира от наградата за кариера CRUK (C47525/A17348), Университет в Кеймбридж и колеж Магдалина, Кеймбридж.