- елементи
- абстрактно
- Обобщение на метаданните
- Предистория и резюме
- методи
- Получаване на информирано съгласие
- Избор на кохорта от OA
- Тумор и нормално събиране
- Цялото секвениране на екзома
- Подготовка на библиотеката
- Улавяне на екзоме
- последователност
- Последователност на целия геном
- Подготовка на библиотеката
- последователност
- Прочетете вариации на картографиране и извикване
- Наличност на код
- Записи на данни
- Техническо валидиране
- Бележки за употреба
- Повече информация
- Цитиране на данни
елементи
- Геномика на рака
- ДНК секвениране
- Генетични изследвания
- Медицинска геномика
абстрактно
Споделянето на геномни данни за рака е ограничено до агрегирани или управлявани инициативи за достъп за защита на поверителността на участниците в изследването. Ограничаването на достъпа до тези данни твърди, че автономността на лицата, избрали да участват в усилията за обмен на данни, е премахната и полезността на данните в инструментите за научни изследвания и образование е намалена. В финансиран от CPRIT пилотен проект за открит достъп (OA) на Тексас за изследване на рака в Тексас много пациенти с рак в Тексас бяха готови открито да споделят геномни данни от тумори и нормални двойки. За първи път генетичните данни от седем случая на рак при хора със сравним стандарт са свободно достъпни, без да е необходимо споразумение за използване на данни или големи ограничения, с изключение на това, че крайните потребители не могат да се опитват да идентифицират отново участниците .html). ).
Обобщение на метаданните
Изтеглете файла с метаданни
Достъпен за машината файл с метаданни, описващ отчетени данни (формат на ISA карта)
Предистория и резюме
Участниците предоставиха първоначално съгласие за участие в обмена на данни на OA. Тези, които са дали съгласието си, са били информирани за рисковете и ползите и след това са попитани дали тестват разбиране и са попитани дали искат да споделят с OA. След това бяха взети проби от тумор и нормална кръв от онези, които показаха разбиране и отново бяха потвърдени и преминаха през цялото секвениране на екзома.
Изображение в пълен размер
Усилията като Проект за личен геном в САЩ, Канада, Великобритания и Австрия публично споделят геномни и клинични данни от здрави участници 19. Доколкото ни е известно, наборът от данни за TCRB OA е първото издание на геномни данни на индивидуално ниво, което е насочено към рак на човека. Намаляването на бариерите пред достъпа увеличава възможността за злоупотреба с данни, но с адекватно информирано съгласие и подходящи стъпки за защита на поверителността на пациента, този набор от данни потвърждава, че много пациенти признават, че положителните бъдещи ползи могат да надвишат тези рискове. Това съгласие, заедно с публичния достъп до голям набор от лесно достъпни данни, е от решаващо значение за справяне с особено предизвикателните проблеми на рака при хората.
методи
Получаване на информирано съгласие
Избор на кохорта от OA
Приблизително 20% от 37-те участници (n = 7), които бяха интервюирани и въпреки това се съгласиха да споделят данни за ОА, бяха избрани за включване в набора от данни за ОА TCRB. За да се намали допълнително рискът от повторна идентификация, никой от участниците в ОА няма редки етнически или туморни типове, както е дефинирано в статистиката на SEER (Наблюдение на програмата, епидемиология и крайни резултати). Фигура 1 показва процедурата на този процес и следващите стъпки при създаването на този набор от данни.
Тумор и нормално събиране
Кръв се събира от участници в PAXgene кръвни ДНК епруветки и ДНК се изолира с помощта на PAXgene Blood DNA комплект (PreAnalytiX, Qiagen, Валенсия, Калифорния). Взети са проби от тумор на панкреатична тъкан скоро след резекцията и са поставени в разтвор на инхибитор на протеаза (Roche Applied Science, Indianapolis, IN), RNAlater (Qiagen) или бързо замразени и се съхраняват при -80 ° C. контрол. ДНК се изолира от 50 до 100 mg тъканни фрагменти с помощта на GentraPuregene kit (Qiagen). Качеството на ДНК пробите беше определено чрез електрофореза и беше определено като висококачествено (размер> 23 kb) без видимо разграждане в проби от кръв или тумор.
За да се приложат подходи за геномно секвениране в проби от „реалния свят“, е необходимо да се открият варианти в клинични проби, които имат намалена клетъчност на тумора, например поради неоадювантно или друго предварително лечение. Разработихме методологии за преодоляване на проблемите, свързани с обширното десмопластично дърво, характерно за повечето тумори на панкреаса, и тези стратегии улесниха откриването на нови молекулярни механизми в патофизиологията на това заболяване. Клетъчността на всяка първична проба беше оценена чрез патологичен преглед, дълбоко секвениране на KRAS екзони 2 и 3 (средна дълбочина 1000 ×) въз основа на ампликон и оценки на клетъчност на нуклеотиден полиморфизъм (SNP), използвайки новия алгоритъм qpure 20, Клинични и патологични анотации за всеки случай е посочен в таблица 1.
Маса в пълен размер
Цялото секвениране на екзома
Подготовка на библиотеката
Улавяне на екзоме
За улавяне на екзома, четирите библиотеки бяха обединени преди улавянето (
300 ng/проба, 1, 2 ug/пул) и хибридизирани в разтвор, използвайки VCRome 2.1 Design 21, предоставен от NimbleGen съгласно протокола на производителя NimbleGen SeqCap EZ Exome Library SR Ръководство за потребителя. (Версия 2.2) с незначителни ощипвания. ДНК на човешка COT1 и пълни блокиращи олигонуклеотиди, специфични за адаптера Illumina, бяха добавени към хибридизацията, за да блокират повтарящи се геномни последователности и адаптивни последователности. LM-PCR след амплификация се извършва с помощта на Phusion High-Fidelity PCR Master Mix с 14 цикъла на амплификация. След окончателно пречистване на зърната AMPure XP, количеството и размерът на библиотеката за улавяне бяха анализирани с помощта на Agilent Bioanalyzer 2100 DNA Chip 7500. Ефективността на улавянето беше оценена чрез извършване на базиран на qPCR контрол на качеството на четири стандартни вътрешни контроли на NimbleGen. Изчислено е, че успешното обогатяване на библиотеките за улавяне варира от 6 до 9 ΔCt стойности в сравнение с необогатените проби.
последователност
Библиотечните шаблони бяха подготвени за секвениране, използвайки системата за генериране на клъстери на Illumina с TruSeq PE Cluster Generation Kits (Cat. No. PE-401-3001). Накратко, тези библиотеки бяха денатурирани с натриев хидроксид и разредени до 6-9 рМ в хибридизационен буфер за постигане на плътност на натоварване.
800 K клъстери/mm2. Последователните пробези бяха извършени в сдвоен режим, използвайки платформата Illumina HiSeq 2000. Всеки набор от библиотеки беше зареден в една лента на поточната клетка HiSeq 2000 и към всяка лента беше добавена контролна библиотека от 2% phiX, за да се контролира качеството на изпълнение. След това пробните библиотеки претърпяха мостова амплификация, за да образуват клонални клъстери, последвана от хибридизация с последователност на праймера. Използвайки TruSeq SBS комплекти (кат. № FC-401-3001), реакциите на последователността на синтеза бяха удължени със 101 цикъла от всеки край, като се извадиха допълнителни 7 цикъла за индекса. Последователните цикли генерират приблизително 300-400 милиона успешни четения във всяка лента на поточната клетка, което води до 7 до 13 Gb на проба. В случай на изключителен добив от секвениране, пробите достигат средна дълбочина на покритие от 200x в екзонични региони.
Последователност на целия геном
Подготовка на библиотеката
В повечето случаи нямаше достатъчно биоспектива за извършване на цялостно геномно секвениране (WGS). За тези случаи съществуват само WEX данни. В два случая обаче беше възможно да се извърши WGS. Библиотечните шаблони бяха подготвени за секвениране, използвайки системата за генериране на клъстери на Illumina с TruSeq PE Cluster Generation Kits (Cat. No. PE-401-3001). ДНК (0,5 μg) в обем от 70 μl се нарязва на фрагменти от приблизително 500-700 базови двойки, използвайки системата Covaris S2 (Covaris, Inc. Woburn, MA). Накратко, тези библиотеки бяха денатурирани с натриев хидроксид и разредени до 6-9 рМ в хибридизационен буфер за постигане на плътност на натоварване.
800 K клъстери/mm2. Мултиплексиращи PE адаптери Illumina с баркод последователности бяха добавени към пробата по време на лигирането. PCR-медиирано лигиране преди улавяне (LM-PCR) се извършва в продължение на 6-8 цикъла, като се използва библиотека Amplification Readymix, съдържаща Kapa HiFi ДНК полимераза (Kapa Biosystems, Inc., Кат. № KK2612) и IMUX-P1.0 универсален двойка грунд. и IMUX-P3.0. 4) 0.8X AMPure XP (Beckman, Cat. No. A63882) беше използван за пречистване на фрагментирана ДНК, за разлика от използването на 1.8X за подготовка на WES библиотеки.
последователност
Туморните библиотеки бяха секвенирани в четири ленти, а нормалните библиотеки бяха секвенирани в две ленти на поточната клетка HiSeq 2000, което доведе до приблизително 60-кратно и 30-кратно покритие. Всяка лента беше обогатена с 2% библиотека за контрол phiX за контрол на качеството на изпълнението. След това пробните библиотеки претърпяха мостова амплификация, за да образуват клонални клъстери, последвана от хибридизация с последователност на праймера. Провежданията на секвениране бяха извършени в сдвоен режим, използвайки платформата Illumina HiSeq 2000. Използвайки комплекти TruSeq SBS (кат. № FC-401-3001), реакциите на последователността на синтеза бяха удължени със 101 цикъла от всеки край, като се извадиха допълнителни 7 цикъла за индекс. Последователните цикли генерират приблизително 300-400 милиона успешни четения във всеки поток на клетка на потока, осигурявайки
11 Gb на проба.
Прочетете вариации на картографиране и извикване
Наличност на код
Целият софтуер, използван за генериране на данни за последователността и за управление на биоспективи и клинични анотации, е свободно достъпен. Конкретни версии на софтуера и кодови връзки са предоставени по-горе.
Записи на данни
Показанията на FASTQ и записите на BAM за туморни (T) и нормални (N) проби от всеки отделен случай са свободно достъпни, заедно с условията за тяхното използване и са свободно достъпни на уебсайта на Biobank за изследване на рака в Тексас, //txcrb.org/open.html (Данни за цитиране 1: TCRB съхранение с отворен достъп TCRBOA1). Наличните клинични анотации за тези случаи са дефинирани в Таблица 1. Освен споразумението за кликване за признаване на условията за използване, изискването за създаване на акаунт за достъп за целите на одита и за включване на тези условия във всяко повторно споделяне на данни, там на този портал няма други пречки пред достъпа до данни. Потребителските акаунти са валидни 30 дни и могат да бъдат подновени. Всички или някои от тези данни могат да бъдат изтеглени, споделени и разпространени за изследователски и образователни цели в съответствие с условията за тяхното използване.
За да се осигури устойчива наличност на данни, те също се съхраняват в SRA. Създадохме проекта за споделяне на данни на Open Bank за споделяне на данни на Texas Cancer Research (присъединяване: PRJNA285925), който създаде два проекта, специфични за платформата - Проект за споделяне на данни за биологичен отворен достъп в Тексас: Проект Exome (Цитиране на данни 2: NCBI Sequence Read Archive PRJNA284596), който съдържа всички седем случая и подпроект, наречен Texas Cancer Research Biobank Open Access Data Sharing: Genome Project (Data Citation 3: NCBI Sequence Reading Archive PRJNA284598), за който е извършен достатъчен генетичен материал за цялостно геномно секвениране след екзомно секвениране и включва случаи 6 и 7.
NCI и други обмислят механизми, които ще внесат изчислителни възможности в данните, за да се избегне проблемът с прехвърлянето на големи файлове през мрежи. За крайните потребители, които нямат достатъчно локални изчислителни и/или възможности за съхранение или за които изтеглянето на данни може да е трудно, в облака DNAnexus се предлага трето копие на записите с данни, условията за тяхното използване и HGSC живачна тръбна система Условията за използване и данните за кликванията са достъпни на //dnanexus.github.io/tcrb-data/.
От тези случаи могат да се генерират допълнителни записи с данни, като цели геномни последователности, които да се добавят към всяко от тези хранилища.
Техническо валидиране
TCRB използва сигурна база данни, поддържана от уеб приложения, наречена Acquire 30, за да проследява мостри и техните анотации (кодът е достъпен на //github.com/BCM-DLDCC/Acquire). Чрез своите модули той поддържа целия жизнен цикъл на операциите на biobank, от колекции до тестове за контрол на качеството. Публичните изследователи могат да използват модула за искане на проби за електронно търсене и заявяване на налични мостри. Получете значително улеснено дарение на TCRB от производители, различни от OGA TCGA и ICGC.
Координаторите на изследванията преразгледаха медицинските записи на всеки участник в ОА спрямо данните, въведени в програмата Acquire, за да се уверят, че клиничните анотации са верни. Координаторът по придобиване съставя клинични и патологични анотации с номера за достъп до HGSC и други данни за всеки отделен случай.
За да се провери дали получените BAM файлове не са повредени и могат да бъдат преработени от FASTQ файлове в друга среда, BCM файловете са преработени с помощта на облачен екземпляр на тръбопровода Mercury 31 HGSC DNAnexus, със съответните алгоритми, описани в раздела Методи. Всички те преминаха през тази проверка за редактиране.
Маса в пълен размер
Вариантите са ограничени до кодиращата област, така че пробите WEX и WGS са сравними. Плътността на алелите (съотношението на вариантите към общата стойност) се начертава за всяка проба.
Изображение в пълен размер
Маса в пълен размер
Бележки за употреба
Чрез изтегляне или използване на която и да е част от този набор от данни, крайните потребители трябва да се съгласят със следните условия за използване:
Не се прави опит за идентифициране на конкретно лице, представено от такива данни или производни на такива данни.
Няма да се прави опит за сравнение и/или свързване на този публичен набор от данни или производни частично или изцяло с частна здравна информация.
Тези данни могат да бъдат частично или напълно свободно изтеглени, използвани при анализи и преопаковани в бази данни.
Преразпределението на която и да е част от тези данни или всеки материал, получен от данните, ще включва копие на това известие.
Данните са предназначени само за образователни и/или изследователски инструменти.
Този набор от данни не е предназначен за пряка печалба за всеки, който го получи и не може да бъде препродаден.
Потребителите могат да използват данни в научни публикации, ако доставчиците на данни (Texas Cancer Research Biobank и Baylor College of Medicine Human Genome Sequencing Center) са надлежно признати.
Внедряването на общи речници улеснява семантичната оперативна съвместимост и повторното използване на данните. Анотациите за случаите на ОА включват контролирана терминология за раса, пол и етническа принадлежност от NIH; патологична диагноза от ICD-O-3 на Световната здравна организация (Международна класификация на болестите-онкология версия 3); и данни за стадия и степента на тумора от Съюза за международен контрол на рака (UICC/AJCC). Използването на стандартни метаданни улеснява синтактичната оперативна съвместимост. TCRB използва стандартни елементи от данни, файлови формати и метаданни. Тъй като данните за OA могат да бъдат изтеглени и споделени повторно, при условие че условията за използване са включени и спазени, всички коментари също са включени като коментари в заглавките на BAM файла с препратка към условията за използване. Тези метаданни са включени, за да се гарантира, че клиничните и патологичните данни не могат да бъдат отделени от данните за последователността.
Повече информация
Как да цитирам тази статия: Becnel, LB et al. Пилот с отворен достъп, който свободно споделя данни за геномния рак от участници в Тексас. Sci. Данни 3: 160010 doi: 10, 1038/sdata.2016.10 (2016).
Цитиране на данни
Бекнел, И. TCRB хранилище с отворен достъп TCRBOA1 (2015)
Becnel, I. NCBI Четене на последователност Архив PRJNA284596 (2015)
Becnel, I. NCBI Четене на последователност Архив PRJNA284598 (2015)
- Данни за OTS ABOUND, представени на Световната конференция по рак на белия дроб - OTS
- Подходът на бичовете при рак на панкреаса е нов проблясък на надежда за лечение на неоперабилен рак
- Нека се оженим за отзивите на зрители и участници, годината, в която е създадена програмата, описание на сюжета -
- Пренатално програмиране нежелано сърдечно програмиране от гестационен излишък на тестостерон научен
- Пригответе джинджифила по този начин и предотвратете рак, ревматизъм и висок холестерол - Домашно